pandas自学笔记（一）

用jupyter完成

import pandas as pd
data = pd.DataFrame([[1,2,3],[4,5,6]],columns=['a','b','c'])
data

在这里插入图片描述

data = pd.read_excel(r'C:\Users\acer\Desktop\666.xlsx')
data.head(5) #展示的是表中数据的前五行
data.tail(5)#查看最后五行
data = pd.read_excel(r'C:\Users\acer\Desktop\物料信息导出.xlsx',encoding='gbk',dtype={
    
    '物料代码':str})#把某一列的值改为某种格式
data.dtypes#查看每一列是什么数据格式
pd.__version__#查看pandas是哪个版本的
data = pd.read_excel(r'C:\Users\acer\Desktop\物料信息导出.xlsx',encoding='gbk',dtype={
    
    '物料代码':str},nrows=10)#展示表里的前十列数据
data = pd.read_excel(r'C:\Users\acer\Desktop\物料信息导出.xlsx',encoding='gbk',dtype={
    
    '物料代码':str},nrows=10,na_value=70)#缺失值标为70
data

必须要在地址前面加上r’，才能成功导入，表示的是即保持字符原始值的意思

series
1.创建序列

#第一种
series1=pd.Series([1.1,2.5,3.6],index=['a','b','c'])
#第二种
series2=pd.Series(np.array([1.1,2.5,3.6]),index=['a','b','c'])
#基于字典创建
series3=pd.Series({
    
    '北京':2.8,'上海':3.01,'广东':8.99})

结果：
在这里插入图片描述

2.series常见的属性

通过pandas.Series来创建Series数据结构：pandas.Series(data,index,dtype,name)。
data可以为列表，array或者dict。 index表示索引，必须与数据同长度，name代表对象的名称


values	返回Series对象所有元素
index	返回索引
dtypes	返回数据类型
shape	返回series数据形状
ndim	返回对象的维度
size	返回对象的个数

series1.drop('北京',inplace=Ture)#不创建新的对象,直接对原始对象进行修改

在这里插入图片描述
DataFrame

通过pandas.DataFrame来创建DataFrame数据结构。
pandas. DataFrame(data,index,dtype,columns)
上述参数中,data可以为列表,array或者dict。
上述参数中，index表示行索引,columns代表列名或者列标签

list1=[['张三',23,'男'],['李四',15,'女']]
list1
df1 = pd.DataFrame(list1,columns = ['姓名','年龄','性别'])
df1

在这里插入图片描述

2.向DataFrame传递字典的结构

df1=pd.DataFrame({
    
    '姓名':['张三','李四','王五','五六'],'年龄':[23,25,26,28],'性别':['男','女','男','女']})
df1

在这里插入图片描述

3.通过数组结构来创建

array=np.array(list1)
array
df3=pd.DataFrame(array,columns = ['姓名','年龄','性别'],index=['a','b'])
#index的个数要和数据的个数一样
df3

在这里插入图片描述

df2.coluans.tolist() 表示由哪几列组成

pandas自学笔记（一）

猜你喜欢