简介

pandas是 Python 的核心数据分析支持库，提供了快速、灵活、明确的数据结构。
pandas主要的两种数据结构为Series和DataFrame，分别用于处理一维和二维数据。

Series

Series 是一种类似于 Numpy 中一维数组的对象，它由一组任意类型的数据以及一组与之相关的数据标签（即索引）组成。

构造

abcd为索引，1234为数据
在这里插入图片描述也可以传入字典构造一个Series

DataFrame

DataFrame是类似表格的二维数据，每一行每一列都是一个Series。
在这里插入图片描述

构造

可传入一个由等长列表组成的字典，即字典里每个value都是列表且长度相等。
在这里插入图片描述

列的查改增删

查
在这里插入图片描述

改
在这里插入图片描述
增

删

axis=1意为操作列，inplace指是否修改原数据

在这里插入图片描述

填充默认值

在这里插入图片描述

用loc与iloc取数据

iloc：基于位置，用行号、列号进行索引，i 可以看着 int，因此 iloc 只能用整数来索引，例如data.iloc[0:2,:]

loc ：基于标签，用行名、列名进行索引，数据的index经常为整数，因此 loc 的使用范围要远高于iloc，loc可以使用整数切片、名称(index,columns)索引、也可以切片和名称混合使用。例如：data.loc[0:5,‘row1’:‘row2’]
在这里插入图片描述
Pandas中iloc、loc、ix、直接索引的用法和区别

条件选择

在这里插入图片描述

量化：pandas基础

文章目录

简介

Series

构造

DataFrame

构造

列的查改增删

填充默认值

用loc与iloc取数据

条件选择

猜你喜欢