@R星校长
第3
关:读取CSV格式数据
读取CSV
# Reading a csv into Pandas.
# 如果数据集中有中文的话,最好在里面加上 encoding = 'gbk' ,以避免乱码问题。后面的导出数据的时候也一样。
df = pd.read_csv('uk_rain_2014.csv', header=0)
这里我们从csv
文件里导入了数据,并储存在DataFrame
中。这一步非常简单,你只需要调用read_csv
然后将文件的路径传进去就行了。header
关键字告诉Pandas
哪些是数据的列名。如果没有列名的话就将它设定为 None
。
数据导入pandas
之后,我们该怎么查看数据呢?
查看前n行
# Getting first x rows.
df.head(5)
查看后n行
# Getting last x rows.
df.tail(5)
查看总行数
# Finding out how many rows dataset has.
len(df)
修改列名
我们通常使用列的名字来在Pandas
中查找列。这一点很好而且易于使用,但是有时列名太长,我们需要缩短列名。
# Changing column labels.
df.columns = [‘water_year’,’rain_octsep’,’outflow_octsep’,’rain_decfeb’, ‘outflow_decfeb’, ‘rain_junaug’, ‘outflow_junaug’]
编程要求
根据提示,在右侧编辑器begin-end处补充代码:
- 将
test3/uk_rain_2014.csv
中的数据导入到df1
中; - 将列名修改为
['water_year','rain_octsep','outflow_octsep','rain_decfeb', 'outflow_decfeb', 'rain_junaug', 'outflow_junaug']
; - 计算
df1
的总行数并存储在length1
中。
开始你的任务吧,祝你成功!
# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import pandas as pd
def read_csv_data():
'''
返回值:
df1: 一个DataFrame类型数据
length1: 一个int类型数据
'''
# 请在此添加代码 完成本关任务
# ********** Begin *********#
df1 = pd.read_csv('test3/uk_rain_2014.csv', header=0)
df1.columns = ['water_year','rain_octsep','outflow_octsep','rain_decfeb', 'outflow_decfeb', 'rain_junaug', 'outflow_junaug']
length1= len (df1)
# ********** End **********#
#返回df1,length1
return df1,length1