一、Pandas基础操作
1、Pandas常用数据结构
Series和DataFrame常用属性:
Values:返回Series对象所有元素;
index:返回索引;
dtype:返回数据类型;
shape:返回Series数据形状;
ndim:返回对象的维度;
drop:删除数据;
append:增加数据;
size:返回对象的个数。
import pandas as pd
import numpy as np
# 创建一个Series(序列)对象
series1 = pd.Series([2.8,3.01,8.99,8.59,5.18],index = ['a','b','c','d','e'] ) # 更改序列索引
print(series1)
# 创建一个字典
series2 = pd.Series({'中国':'北京','美国':'纽约','英国':'伦敦','日本':'东京'})
series2.drop('美国', inplace=True) # 删除数据
print(series2)
print(series2.size)
print(series2[0:2])
import pandas as pd
import numpy as np
# 创建方法一,使用列表进行创建
list1 = [['张三',23,'男'],['李四',25,'女'],['王二',15,'男']]
df1 = pd.DataFrame(list1,columns=['姓名','年龄','性别']) # 返回列标签
print(df1)
# 创建方法二,使用字典进行创建
df2 = pd.DataFrame({'姓名':['张三','李四','王二'],'年龄':[23,25,15],'性别':['男','女','男']})
print(df2)
# 创建方法三,使用元组进行创建
array1 = np.array(list1)
df3 = pd.DataFrame(array1,columns=['姓名','年龄','性别'],index = ['a','b','c'])
print(df3)
运行结构展示: