索引对象
pandas的索引对象负责管理轴标签和其他元数据。
构建Series或DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index
=====================================
Index对象是不可变的,因此用户不能对其进行修改
=====================================
不可变可以使Index对象在多个数据结构之间安全共享
用户不需要经常使用Index的功能,但是因为一些操作会生成包含被索引化的数据,理解它们的工作原理是很重要的。
=====================================
Index的功能也类似一个固定大小的集合。但是与python的集合不同,pandas的Index可以包含重复的标签。选择重复的标签,会显示所有的结果。
重新索引
=====================================
用该Series的reindex将会根据新索引进行重排。如果某个索引值当前不存在,就引入缺失值
=====================================
对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理。method选项即可达到此目的
=====================================
借助DataFrame,reindex可以修改(行)索引和列。只传递一个序列时,会重新索引结果的行
=====================================
列可以用columns关键字重新索引
丢弃指定轴上的项
丢弃某条轴上的一个或多个项很简单,只要有一个索引数组或列表即可。由于需要执行一些数据整理和集合逻辑,所以drop方法返回的是一个在指定轴上删除了指定值的新对象
=====================================
对于DataFrame,可以删除任意轴上的索引值
=====================================
通过传递axis=1或axis='columns’可以删除列的值
=====================================
可以就地修改对象,不会返回新的对象。小心使用inplace,它会销毁所有被删除的数据
索引、选取和过滤
Series索引(obj[…])的工作方式类似于NumPy数组的索引,只不过Series的索引值不只是整数
=====================================
用切片可以对Series的相应部分进行设置
=====================================
用一个值或序列对DataFrame进行索引其实就是获取一个或多个列
=====================================
索引方式还有特殊情况,通过布尔型DataFrame进行索引
++++++++++++++++++++++++++++++++++++