Python实现疫情数据分析并可视化时出现了一个问题:
网页端的日期格式为xx.xx(eg:04.20,04.26),抓取下来的数据集显示的也是xx.xx(eg:04.20,04.26),但是再用pd.read_csv读取数据集时,显示的却是(eg:4.2,4.26),前后的0都会消失。
(网上也有说在后面加上"\t"可以解决这个问题,但是我加了没反应…)
我的解决方法是:
抓取数据时修改日期的格式,改成xx/xx(eg:04/20,04/26)
代码修改如下
while i < length_data:
# 修改前
# date = (s_data[i]["date"])
# 修改后
date = pd.Series(s_data[i]["date"])
for d in date:
n_date = str(d).replace('.', '/')
confirm = (s_data[i]["confirm"])
nowConfirm = (s_data[i]["nowConfirm"])
suspect = (s_data[i]["suspect"])
dead = (s_data[i]["dead"])
heal = (s_data[i]["heal"])
noInfect = (s_data[i]["noInfect"])
i += 1
tap = (n_date, confirm, nowConfirm, suspect, dead, heal, noInfect)
save_data(tap)