SQL方式打开pandas
pandas的数据类型可以让我们像处理数据表一样进行操作,比如数据表的增删改查,都是可以使用pandas工具来完成。不过由于pandas的函数及其相应的方法太多,很多时候我们很难记住,大多数情况下,需要去查询相应的文档。相比之下,可能对于SQL还是更加熟练,用SQL对数据表进行操作是最方便的。
pandasql
在python里可以直接使用sql语句来操作pandas
工具:pandasql
pandasql中的主要函数是sqldf,它接收两个参数:一个是SQL查询语句,还有一组环境变量globals()或locals()。这样的话,我们便可以在python中,直接使用sql语句对我们的Dataframe进行操作。
举个例子:
import pandas as pd
from pandas import DataFrame
from pandasql import sqldf, load_meat, load_births
df1 = DataFrame({
'name':['ZhangFei', 'GuanYu', 'a', 'b', 'c'], 'data1':range(5)})
pysqldf = lambda sql: sqldf(sql, globals())
sql = "select * from df1 where name ='ZhangFei'"
print pysqldf(sql)
运行结果:
data1 name
0 0 ZhangFei
lambda匿名函数
上面这个例子中,我们是对“name = ‘ZhangFei’ ”的行进行了输出。上面可以看到我们使用了lambda, lambda在python中的使用频率相对而言比较高,那么lambda是用来做什么的呢?实际上它是python中的一个匿名函数,具体的使用形式为:
lambda argument_list:expression
这里argument_list是参数列表,expression是关于参数的表达式,会根据expression表达式计算结果进行输出返回。
这里对于匿名函数做一个简要介绍,因为打算写一篇专门介绍匿名函数的文章。
对于panda中使用sql进行数据的处理,到这里就算是结束了。希望在记录学习过程、加强记忆的同时能帮助到其他的小伙伴!!!