虽然说pandas里面确实有很多内置的函数了,但是也不可能满足所有的需求,所以有些时候我们也需要
自己定义一些函数来满足自己的需求:
那么该如何定义呢:定义之后又该如何用呢:
对于函数的定义就很简单了,python自定义函数一样,但是在使用他的时候就需要用到apply了:
如:算出每一列空值的个数:
def null_count(column):
column_null = pd.isnull(column)
null = column[column_null]
return len(null)
column_null_count = object(DataFrame).apply(null_count)
print(column_null_count)
当然不只是这些:
通过apply可以定义很多操作:
还可以将连续值离散化,比如年龄,小于18为未成年,大于18为成年等等