1.如何将数据导入和导出csv文件
1.1 np.genfromtxt函数
导入数据的标准方法是使用np.genfromtxt函数,它可以从web URLs导入数据,处理缺失值,多种分隔符,处理不规则的列数等功能。一个不太通用的版本是用np.loadtxt函数导入数据,它假设数据集无缺失值.
# 关闭数字的科学表示方法np.set_printoptions(suppress=True)
# 从url的csv文件导入数据path = 'https://raw.githubusercontent.com/selva86/datasets/master/Auto.csv'
# delimiter:分隔符
# skip_header:从多少行开始读数据,以0开始
# filling_values:缺失值表示
# dtype:数据类型
# data = np.genfromtxt(path, delimiter=',', skip_header=1, filling_values=-999, dtype='float')
# data[:3] # 显示前3行数据
import numpy as np
path = 'https://raw.githubusercontent.com/selva86/datasets/master/Auto.csv'
data = np.genfromtxt(path,delimiter=',',skip_header=1,filling_values=-999,dtype='float')
print(data[:3])
若设置参数dtype为'object'或'None',np.genfromtxt在未设置占位符的前提下能同时处理具有数字和文本列的数据集.
1.2 np.savetxt()函数
最后,'np.savetxt'将数据保存为csv文件:
# 保存数据为csv文件np.savetxt("out.csv", data, delimiter=",")
(待更新。。。。。)