菠菜源码-下载[Python数据分析] 1-数据获取

1)数据仓库 菠菜源码-下载Q2152876294 论坛:diguaym.com
2) I.特点: 1.全部事实的记录 2.部分维度和数据的整理(数据集市) II.数据库与数据仓库的不同 1.数据库面向业务存储,数据仓库面向主题存储(主题:较高层次上对分析对象数据的一个完整并且一致的描述) 2.数据库针对应用,数据仓库针对分析 3.数据库组织规范,数据仓库数据量大且杂乱 2)监测与抓取直接解析网页、接口、文件的信息常用工具:Urllib,Urllib2,request,scrapy.... 3)填写、埋点、日志用户填写信息APP或网页埋点(特定流程的信息记录点)操作日志 4)计算通过已有数据计算生成衍生数据 5)学习网站 竞赛相关:Kaggle,天池 数据集网站:imageNet 各领域统计数据

猜你喜欢

转载自blog.51cto.com/13989646/2285651