玩转Python之DataFrame

最近用python进行一些数据分析,发现许多问题用DataFrame很方便,决定每天总结一些基本用法或者小技巧。

# 从excel读取数据
df = pd.read_excel(input_path + "某表.xlsx")

# 写入excel,参数意义很明显了
df.to_excel(out_file, sheet_name='data', header=True, index=False, encoding='utf_8_sig')

# 从数据库读取数据
def get_db_data(con, sql):
    # 数据库连接字符串:con = 'oracle://<username>:<password>@IP:Port/SID'
    con = create_engine(con)
    # 这里是为了更好地支持中文
    os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE _CHINA.UTF8'
    # 取数据一句话搞定
    df = pd.read_sql(sql, con)
    return df

# 创建一个空DataFrame
df_empty = pd.DataFrame(columns=())
或者
df_empty = pd.DataFrame(columns=['A', 'B', 'C', 'D']) 
# 逐行添加数据df_empty = df_empty.append([{'A': va, 'B': vb, 'C': vc, 'D': vd}], ignore_index=True)
或者
df_empty = df_empty.append(pd.DataFrame({'A': [va], 'B': [vb], 'C': [vc], 'D': [vd]}), ignore_index=True)

猜你喜欢

转载自blog.csdn.net/baidu_23133489/article/details/107928367