函数映射、运算操作等是pandas中非常用且重要的操作
1. numpy通用函数pandas
pandas是以numpy为基础进行扩展的,所以numpy的很多函数可以直接使用
>>> frame = pd.DataFrame([1,2,3])
>>> np.square(frame)
0
0 1
1 4
2 9
2. apply函数
可以自定义函数,按行或者列进行操作
>>> frame = pd.DataFrame(np.arange(6).reshape(3,2))
>>> frame
0 1
0 0 1
1 2 3
2 4 5
>>>
注意:因为没有定义index和coulnns,所以默认为0,1,2数字下标
这里我们定义一个f(x) = x.max()的函数
>>> def f(x):
... return x.max()
...
>>> frame.apply(f)
0 4
1 5
dtype: int64
>>>
如果想应用到行而不是列,需要将axis选项设置为1
>>> frame.apply(f, axis=1)
0 1
1 3
2 5
dtype: int64
3.统计函数
frame.sum() //按列求和
frame.mean() //均值
frame.describe() //多个统计量
4. 和series之间的运算
需要让series和DataFrame的列名保持一致
5. 算术运算
建议使用add() sub() div() mul()等方法