1、 创建表格、创建工作表
使用xlwt库
wb=xlwt.Workbook()
ws=wb.add_sheet(“新闻汇总1”)
wb.save(’./新闻汇总.xls’)
2、 打开表格,打开工作表
使用openpyxl库
方法1:
filename = ‘新闻汇总.xlsx’
wb = load_workbook(filename)
ws = wb.activewb.save(filename)
方法2:
filename = ‘新闻汇总.xlsx’
wb1 = load_workbook(filename)#打开工作薄
ws = wb1[‘Sheet1’]#打开工作表
3、 在单元格内输入内容
使用xlwt库
ws.write(0,0,“序号”)
ws.write(0,1,“5G新闻”)
ws.write(0,2,“5G新闻链接”)
4、 调整单元格格式(字体格式、行高、列宽、居中)
使用openpyxl库
表格字体的格式设置:
bold_itatic_24_font = Font(name=‘宋体’, size=14, italic=False, color=colors.BLACK, bold=True)
#表格表头字体格式
ws[‘A1’].font = bold_itatic_24_font
ws[‘B1’].font = bold_itatic_24_font
ws[‘C1’].font = bold_itatic_24_font
表格字体的居中设置:
ws[A1].alignment = Alignment(horizontal=‘center’, vertical=‘center’)
表格行高设置:
ws.row_dimensions[1].height = 30
表格列宽设置:
ws.column_dimensions[‘B’].width = 70
ws.column_dimensions[‘C’].width = 80
5、 删除行或者列
使用openpyxl库
删除列
ws.delete_cols(1,1)#删除第一列
ws.delete_cols(4, 1)#删除第三列
删除行
ws.delete_rows(1,1)#删除第一行
6、 删除表格中的重复项
使用pandas库
#读取Excel中Sheet1中的数据
t = pandas.read_excel(‘新闻汇总.xls’, ‘新闻汇总1’)
data = pandas.DataFrame(t)
#识别重复新闻,并删除重复新闻
re_row = data.drop_duplicates([‘5G新闻链接’])
re_row.to_excel(“新闻汇总.xlsx”)#创建一个新的新闻汇总文件
os.remove(’./新闻汇总.xls’)#删除原新闻汇总文件