【Python】pandas读取sqlite，并处理缺测值 - 代码天地

【Python】pandas读取sqlite，并处理缺测值

业界资讯 2023-07-21 04:27:11 阅读次数: 0

def fix_data(engine, tb_name, stnm, stcd):
    df = pd.read_sql(tb_name, engine)
    df['tm'] = pd.to_datetime(df['tm']).dt.tz_localize('Asia/Shanghai')
    print(df['tm'].shape[0])  # 63653
    # 起止时间
    _start = df['tm'].loc[df.index[0]]
    _end = df['tm'].loc[df.index[-1]]
    full_range = pd.date_range(start=_start, end=_end, freq='60min', tz='Asia/Shanghai')
    print(full_range.shape[0])  # 63745
    # 设置原始数据索引为时间
    df = df.drop_duplicates(subset=['tm'], keep='last')  # 去除重复时间
    df['stamp'] = df['tm'].apply(lambda x: int(x.timestamp()))  # 获取原始数据时间戳
    df = df.set_index('tm', drop=True)  # 设置原始数据索引为时间
    # 查找缺测值
    df = df.reindex(full_range)
    na_index = df.index[df.val.isna()]  # 获取这缺测数据的行序号
    df = df.fillna({
    
    'val': 0, 'stnm': stnm, 'stcd': stcd})  # 填充缺测值
    df = df.reset_index(names='tm')  # 保留时间列，重新设置索引
    scale = 60 * 60  # 原始数据精度为逐小时
    df['stamp'] = df['tm'].apply(lambda x: int(x.timestamp()))
    df['ID'] = df['stamp'].apply(lambda x: int((int(x) - 1447344000) / scale) + 1)
    df = df.set_index('ID', drop=True)
    print(df)
    df.to_sql(tb_name, engine, if_exists='fail', index=True)

猜你喜欢

转载自blog.csdn.net/qq_25262697/article/details/131470850

【Python】pandas读取sqlite，并处理缺测值

pandas读取并处理csv文件

python读取文件并处理成行

Pandas读取.db数据库信息,并处理数据

python读取excel文件并处理日期格式(xlrd)

python dataframe如何设置并处理（删除、填充）空值

centos 5.5 升级python 2.4.3到python 2.6.6，并处理sqlite3库

python pandas空值与缺失值处理

gdal 读取HDF影像并处理

java读取大文件并处理

python 读取文件夹下的所有文件并处理重新分类写入

python批量读取文件夹的图片并处理成模型输入格式

Pandas教程06：DataFrame.merge数据的合并处理

python生成并处理uuid的方法

【python+opencv】批量读取一个文件夹下所有的图片并处理

用Python读取考勤机卡式报表并处理成常规的行式报表格式

OpenCV——读取摄像头并处理图像

Go1.9按行读取日志文件并处理

OpenCV读取并处理视频文件帧

ArcGIS使用arcpy读取并处理矢量数据的属性

C#读取CAD文件（dwg/dxf）并处理

python利用pandas读取.data文件并对nan进行处理

pandas缺失值处理

pandas 处理缺失值

pandas nan值处理

pandas 的空值处理

pandas 中空值处理

Pandas重复值处理

pandas空值处理

Pandas对缺失值的处理

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)