pandas数据分析书籍内容

针对Series和Pandas如果传入的列没有数据则默认全部为nan值

Series方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
s1.values
s1.index
s1.reset_index
s1.isnull
s1.notnull
s1.sort_values
s1.sort_index
df.reindex([]) 重造索引,不存在的值为nan,也可以使用fill_value=自己补值,也可以method向前向后填充
s1+s1会按照索引相加减,索引不同的值为nan
s1.index.is_unique
s1.rank()
s1.unique()
s1.value_counts()
s1.isin(容器)

###Pandas方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
df.字段名 == df ['字段名']
del 删除列 drop默认删除行,axis=1表示列
df.T
df3.index.name
df3.columns.name
df.reset_index 重置索引
df.sort_index() 里面加by可以针对某列效果同sort_values
df.sort_values()
df.rank(ascending,method)
df.columns/index/具体字段名.is_unique
df.sum\max\min\consum\describe
df['one'].unique()
df['one].isin(容器)
df.fillna()
fillna\dropna