DataFrame概念与创建 - 代码天地

DataFrame概念与创建

其他 2018-06-02 09:12:27 阅读次数: 0

一 概念
Pandas是一个开源的Python数据分析库。Pandas把结构化数据分为了三类：
Series，1维序列，可视作为没有column名的、只有一个column的DataFrame；
DataFrame，同Spark SQL中的DataFrame一样，其概念来自于R语言，为多column并schema化的2维结构化数据，可视作为Series的容器（container）；
Panel，为3维的结构化数据，可视作为DataFrame的容器；

二 创建DataFrame
#  标准创建
df2 = pd.DataFrame(np.arange(16).reshape((4,4)),index=['a','b','c','d'], columns=['one','two','three','four'])
print "df2 =", df2

# 用传入等长列表组成的字典来创建(用DataFrame自带索引) 自带列名
data={'c':['1','2'],'a':['5','6']}
df=pd.DataFrame(data)
print "df =", df

# 传入嵌套字典（字典的值也是字典）创建DataFrame (使用字典内嵌索引) 自带列名
nest_dict = {'shanghai': {2015: 100, 2016: 101}, 'beijing': {2015: 102, 2016: 103}}
df1=pd.DataFrame(nest_dict)
print "df1 =", df1

# 传入Series (带大括号，另外需加列名)
list = ['1', '2', '3', '4']
s= pd.Series(list, index=['a', 'b', 'c', 'd'])
df1=pd.DataFrame({"A": s})
print "df1 =", df1
print df1

三

　　

猜你喜欢

转载自www.cnblogs.com/chengxin1982/p/9124320.html

DataFrame概念与创建

创建DataFrame

DataFrame的创建

DataFrame(4)：DataFrame的创建方式

从rdd创建dataframe

在DataFrame中创建MultiIndex

Pandas ， series 与 Dataframe的创建

Pandas 字典创建dataframe

pandas—DataFrame创建

创建DataFrame的几种方式

DataFrame创建方式

Spark创建空的DataFrame

Spark的DataFrame创建实例

Spark之DataFrame创建

DataFrame创建数据

SparkShell启动(DataFrame的创建)

pySpark创建空DataFrame

从RDD创建DataFrame（Sparksql）

DataFrame的几种创建方式

创建DataFrame的多种方式

快速创建dataframe

python创建dataframe

⑨SparkSQL-创建DataFrame

spark创建空dataframe

DataFrame创建程序&利用字典创建dataframe对象

PySpark DataFrame创建透视表

DataFrame对象的创建，修改，合并

Spark创建DataFrame的几种方式

sparkSql 创建dataFrame几种方式

python DataFrame创建及基本操作

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)