Python数据处理:Excel文件的读取
处理Excel文件的主要三个库
- xlrd
读取Excel文件 - xlwt
向Excel文件写入,并设置格式 - xlutils
一组Excel高级操作工具(首先需要先安装xlrd和xlwt)
示例数据:https://cloud.189.cn/t/2ANNJraIrim2(访问码:5948)
"""
本次提取的是Excel文件中的child_labor和child_marriage统计数据
"""
import xlrd
# 打开的文件保存到book变量中
book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
# Excel工作簿中可以有多个标签或工作表,因此需要首先找到包含目标数据的工作表
sheet = book.sheet_by_name('Table 9 ')
data = {}
# 14是目标信息国家数据的起点,sheet.nrows返回工作表总行数
for i in range(14, sheet.nrows):
#每一行内容组成的列表保存到row变量中
row = sheet.row_values(i)
# 提取出遍历每一行国家名称
country = row[1]
#将国家设为data字典的键,对应的值保存在另一个字典
data[country] = {
'child_labor': {
'total':[row[4], row[5]],
'male':[row[6], row[7]],
'female':[row[8], row[9]],
},
'child_marriage':{
'married_by_15':[row[10], row[11]],
'married_by_18':[row[12], row[13]],
}
}
# 去除最后一个国家之后的无用内容
if country == 'Zimbabwe':
break
# pprint可在终端在美化输出数据,适用于复杂数据结构
import pprint
pprint.pprint(data)
运行结果:
参考:《data wrangling with Python》Jacqueline kazil