数据分析之前奏
Anaconda IDE的使用方法
-
一个数据表达一个含义,一组数据表达一个或多个含义。
-
摘要
- 有损地提取数据特征的过程。
- 基本统计(含排序)。
- 分布/累计统计。
- 数据特征。
- 相关性、周期性等。
- 数据挖掘(形成知识)。
-
Anaconda(下载地址)
- 开源免费
- 支持近800个第三方库
- 包含多个主流工具
- 适合数据计算领域开发
- Win/Linux/OS X
- Anaconda是一个集成各类Python工具的集成平台。
- anaconda:一个集合,包括conda、某版本Python、一批第三方库等。
-
conda
- 用于包管理和环境管理的工具。
- 包管理与pip类似,管理Python第三方库。
- 环境管理能够允许用户使用不同版本Python,并能灵活切换。
- conda将工具、第三方库、 Python版本、 conda都当作包,同等对待。
- Win平台:cmd,执行 conda ‐‐version 获取conda版本。
- Win平台:cmd,执行 conda update conda 升级conda。
-
IPython
- 一个功能强大的交互式shell。
- 适合进行交互式数据可视化和GUI相关应用。
- 变量前或后增加?号,将显示一些通用信息,包括函数对应的源代码。
- %run用于运行.py程序,%run在一个空的命名空间执行%。
- IPython的%魔术命令
- %magic
- 显示所有魔术命令。
- %hist
- IPython命令的输入历史 。
- %pdb
- 异常发生后自动进入调试器。
- %reset
- 删除当前命名空间中的全部变量或名称
- %who
- 显示Ipython当前命名空间中已经定义的变量。
- %time statement
- 给出代码的执行时间, statement表示一段代码。
- %timeit statement
- 多次执行代码,计算综合平均执行时间。
- %magic