数据分析固定流程 |
|
心智模型 |
|
观察研究法 | 被研究的人自行决定自己属于哪个群体的一种研究方法 |
拆分数据块 | 为了控制观察研究混杂因素,有时需将数据拆分为更小的数据块。这些数据块更具有同质性,即数据块不包含那些有可能扭曲你的分析结果及让你产生错误想法的内部偏差。 |
控制组 |
|
不可控因素; 可控因素 |
|
假设检验 | 证伪法:剔除无法证实的假设。可以克服人们专注于错误答案而无视于其他答案的天然倾向。通过强迫自己以完全正规的方式思考问题,会减少因忽视重要特征情况而犯错误的可能性。 满意法:选出看上去最可信的第一个假设。满意法的问题是当人们在未对其他假设进行透彻分析的情况下选取某种假设时,往往会坚持这个假设,即使反面证据堆积如山。 |
诊断性 | 是证据所具有的一种功能,能够帮助你评估所考虑的假设的相对似然。如果证据具有诊断性,就能帮助你对假设排序。 |
基础概率 | 事前概率:在根据试验结果单独分析前,就知道的概率 |
主观概率 | 如果用一个数字形式的概率来表示自己对某事的确认程度,所用的就是主观概率 是根据规律进行分析的巧妙方法,尤其是在预测孤立事件却缺乏从前在相同条件下发生过的可靠数据的情况下 |
启发法 | 心理学定义:用一种更便于理解的属性代替一种难理解的、令人困惑的属性 计算机科学定义:一种解决问题的方法,可能得出正确答案,但不保证得出最优化答案 |
快省树 | 快是指完成这个过程费时不多,省是指不需要大量认知资源 |
外插法 | 用回归方程预测数据范围以外的数值称为外插法,风险大。使用外插法需要指定附加假设条件,明确表示不考虑数据集外发生的情况。 用回归方程预测数据范围以内的数值称为内插法,准确。 |
机会误差 | 实际结果与预测结果之间的偏差,又叫残差 预测总是与机会误差同在 |
标准偏差 | 描述的是平均值周围的分布情况 这种度量方式描述的是一个变量 |
均方根误差 | 描述的是回归线周围的分布情况 指两个变量之间的关系 又称残差标准差 |
分割 | 将数据分析拆分为几个组。如果为几个分组分别创建预测模型比单独使用一个模型更能减小误差,则应进行分割。 回归线是与平均值图形重合程度最高的线条 |
深入浅出数据分析----- 学习笔记
猜你喜欢
转载自blog.csdn.net/mengjizhiyou/article/details/82970008
今日推荐
周排行