前面因为考试等不可抗力将近两个月没有玩python,现在重新拾起。这两个月间匆匆完成了百步梯攀登计划的中期汇报表,还拿到了华为的免面试通知,放假和高中同学出去浪时甚至还笑谈着说要考浙大(笑)
《数据分析与处理》是中国大学mooc上的一门经典课程,我之前刷了一遍没有通关,而这次是重头再来,很多函数与使用方法不好记,因此有了这篇笔记。
1.pandas 包的DataFrame
(之前做ricequant网站上量化投资时用过的)
import numpy as np
import pandas as pd
s = pd.Series([1,3,5,np.nan,6,8]); a = pd.DataFrame({"A":['abc138','abc306','sss400'], "B":['mid444','red406','siri460']});
df.dtype,df.columns,df.index等一系列使用方法;
2.数组矩阵的生成等(np库为主)
import tushare as ts import numpy as np
v=np.arange(15);生成1到15
x = np.ones((4,3,4));(全1矩阵,可以用x.shape输出的维度)
a= np.linspace(1,10,5);
3.np数组的重构
a = np.ones((2,3,4),dtype=np.int32);
a.reshape((3,8))改变形状
print(a.tolist());变成列表输出
4.文件读取
import numpy as np a = np.arange(100).reshape(5,20); np.savetxt('a.txt',a,fmt="%d"); c = np.loadtxt('a.csv'); print(c); d = np.arange(100).reshape(5,10,2); print(d); d.tofile("b.dat",format="%d"); e = np.fromfile("b.dat",dtype=np.int).reshape(5,10,2); print(e); np.save("a.npy",a);
5.random 包括np.random.randint
6.图像
from PIL import Image import numpy as np im = np.array(Image.open("D:/ssni/1.jpg")); print(im.shape,im.dtype);