版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_22659021/article/details/80881879
read_table 函数:
功能: 从文件、url、文件型对象中加载带分隔符的数据,默认为'\t'。(read_csv默认分隔符是逗号)
可以通过制定sep 参数来修改默认分隔符。
读取没有标题的文件时,默认为第一行作为列标题,列索引(即行的标题)为0开始的数字,设置header=None, 则列索引也 变为0开始的数字,通过names=['a','b','c']可以自己设置列标题。
通过index_col可以设置列索引,默认使用0开始的整数为列索引。index_col的值是整数,代表第几列作为列索引。
获取行列的个数:
行:len(data.index), len(data)
列:len(data.columns)
或者直接data.shape
value_counts()计数: 对Series中出现的每个值进行计数并排序。
删除行和列:
两种方法:
df.drop(['B', 'C'], axis=1), 默认axis为0, 即默认删除行
或者使用df.drop(columns=['B', 'C']) inplace=True不加的话不会改变原数据