pandas包常见使用整理

常用功能一、读入CSV

data = pd.read_csv('C:\\Users\\路径.csv'）

如果涉及中文标题，加入参数： data = pd.read_csv('C:\\Users\\路径.csv',encoding='GBK')

常用功能二、获取行名、列名、行数、列数

data.dtypes # 查看dataframe 的数据类型

data.columns # 列名列表

data.shape 获取行列，返回数组，可以在后面加[0] 行 [1] 列

dfname._stat_axis.values.tolist() # 行名称

dfname.columns.values.tolist() # 列名称

常用功能三、重命名

暴力重命名所有列 data.columns = ['A','B'] 按照顺序重新命名所有列

data.rename(columns={'A':'a', 'B':'b', 'C':'c', 'D':'d'}, inplace = True) 这种方式可以任意更改自己想修改的列明，且不用注意顺序。

常用功能四、新增列、删除行

data['e'] = data['d']- 1 新增列并赋值

data.drop['2'] 删除索引为2的行

常用功能五、筛选

a. 筛选行列： df.at、 df.ix、df.loc、df.iloc等用法

df['a']

df.ix 可以用数字也可以用列明来筛选如： data.ix[1,1] data.ix["a","B"]

df.loc 只能用行名和列名来筛选 data.loc["b","B"] data.loc['b':'c','B','C']

df.iloc 只能用数字 data.loc[1,1]

df.at 可以支持数字行序和列名的混合使用： data[1,'a'] 可支持变量序号如： for i in range(0,100): print(data.at[i,'shop_name'])

b. 筛选空值、等于某值：

单条件： df[df.D>0]

多条件： df[(df.D>0)&(df.C<0)]

包含多值： df.A.isin([‘重庆’,’成都’])