pandas读取20W数据excel，每999行生成一个查询sql语句 - 代码天地

pandas读取20W数据excel，每999行生成一个查询sql语句

其他 2018-11-05 03:09:04 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/s740556472/article/details/83341395

前言

工作中遇到一个小问题，Oralce数据库的查询是不能大于1000条in查询的，所以需要对文件进行切割。数据源是20w的excel数据，于是想到用pandas对其进行读取，然后每998行生成一个新的sql文件。

代码实现

# coding = utf-8

"""
@author: sy

@file: readexcel.py

@time: 2018/6/15 10:11

@desc:

"""
import pandas as pd

#from multiprocessing.dummy import Pool as ThreadPool
#from functools import partial 本想试下多线程


def read_data():
    short_data = pd.read_excel('C:/Users/sy/Desktop/split/data.xlsx', sheet_name='Sheet1')
    short_data = short_data.fillna(-1)
    sql_str = 'select t.policyno from xxxxx t where t.policyno in ('
    sum_sql = ''
    # pandas 读取的类型为DataFrame,也是可迭代的对象
    for i, excel_policy_no in enumerate(short_data['保单号']):
        sum_sql += "'" + str(excel_policy_no) + "',"
        if i != 0 and i % 997 == 0:
            sum_sql += "'" + str(excel_policy_no) + "');"
            sql = sql_str + sum_sql
            thread_function(i, sql)
            sum_sql = ''


def thread_function(i, sql):
    write_sql('C:/Users/sy/Desktop/split/' + str(i) + '.sql', sql)


def write_sql(filename, content):
    with open(filename, 'a', encoding='utf-8') as f:
        f.write(content)


if __name__ == '__main__':
    read_data()

总结

耗时多数在读取20W数据的时候，读取excel时，一次全读到内存中了，所以比较慢，像pandas自带的csv读取，可以进行分块读取。excel我查阅了相关官方文档，并没有看到相应属性，若有更好的方式欢迎留言讨论！

猜你喜欢

转载自blog.csdn.net/s740556472/article/details/83341395

pandas读取20W数据excel，每999行生成一个查询sql语句

如何能快速的成为一个年薪20w的前端程序员？

excel中如何让每n行显示同一个数据

【Python-数据读取】读取txt文件每一行数据生成列表

访问20W了

本地MySQL与阿里云RDS MySQL 20W条数据查询速度对比

本地MySQL与阿里云RDS MySQL 20W条数据查询速度对比

Python读取Excel每一行为列表—大PK(openpyxl\pandas\xlwings\xlrd)看谁用时少？

一个sql查询语句

《哪吒》大火，爬取20W 评论数据，并用AI分析了一波，结果......

爬取 20W 猫猫数据，来了解一下喵喵~

22. 每读十行生成一个新文件

数据分析法宝，一个 SQL 语句查询多个异构数据源

sql查询当天,一周,一个月数据的语句

sql语句临时表删除，sql语句去重，sql语句从两个表中查询到数据放到同一个临时表输出

转：一个SQL查询出每门课程的成绩都大于80的学生姓名

一个SQL查询出每门课程的成绩都大于80的学生姓名

记一个实用的sql查询语句

(转)把excel数据生成sql insert语句

根据Excel数据生成sql语句

pandas读取excel并合并多个sheet到同一个文件中

Python读取txt文件应用---用python实现读取一个txt文档，并根据相应判断条件在txt文件中，每一行内写入指定数据。

oracle数据库里面查询昨天的时间--sql语句查询--一个面试题目

SQL练习55：分页查询employees表，每5行一页，返回第2页的数据

从Excel生成sql语句

Excel生成SQL语句

一个参数一个xlsx表，让你玩转Pandas中read_excel()表格读取！

java导出excel，每1000新建一个sheet

python pandas读取数据库sql导出excel

批量读取excel中每一行的值并分类赋值储存到csv文件中

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)