1.pandas
pandas是用于处理和分析数据的python库,它基于一种叫做DataFrame的数据结构,简单来说,一个pandas dataframe就是一张表格,类似excel表格,pandas里面含有大量用于修改表格和操作表格的方法,尤其是可以像SQL一样对表格进行查询和连接,pandas强大之处在于可以从许多文件格式和数据库中提取数据,如SQL、EXCEL文件和逗号分隔值文件。下面是利用字典创建DataFrame的一个小例子。
第一步:输入代码
1 import pandas as pd 2 from IPython.display import display 3 #创建关于人的简单数据集 4 data={'Name':["Jone","Anna","Peter","Linda"], 5 'Location':["New York","Paris","Berlin","Londonn"], 6 'Age':[24,13,56,34] 7 } 8 data_pandas=pd.DataFrame(data) 9 #IPython.display可以在Jupyter Notebook中打印出“美观的”DataFrame 10 display(data_pandas)
第二步:点击Run查看结果
2.matplotlib
matplotlib是python的主要科学绘画图库,其功能是可发布的可视化内容,如折线图、直方图、散点图等。
第一步:输入代码
1 import numpy as np 2 import matplotlib.pyplot as plt 3 x=np.linspace(-10,10,100) 4 y=np.sin(x) 5 plt.plot(x,y,marker="x")
第二步:点击Run查看结果
3.numpy
numpy是python科学计算中的基础包之一,它的功能包括多维数组、高级数学函数(比如线性代数运算和傅里叶变换),以及为随机生成器。numpyi数组是基本数据结构,numpy的核心功能是ndarray,及多维数组。例如:
第一步:输入代码
1 import numpy as np 2 x=np.array([[1,2,3],[4,5,6]]) 3 print("x:\n{}".format(x))
第二步:点击Run查看结果
4.scipy
scipy是python中用于科学计算的函数集合,它具有线性代数高级程序、数学函数优化、信号处理、特殊数学函数、统计分布等多项功能。scipy中最重要的是scipy.sparce:它可以给出稀疏矩阵。如果想保存一个大部分元素都是0的二维数组,就可以使用稀疏矩阵。例如:
第一步:输入代码
1 from scipy import sparse 2 eye=np.eye(4) 3 print("Numpy array:\n{}".format(eye))
第二步:点击Run查看结果