#Week8 Advice for applying ML & ML System Design - 代码天地

#Week8 Advice for applying ML & ML System Design

其他 2020-01-01 23:50:48 阅读次数: 0

一、Evaluating a Learning Algorithm

训练后测试时如果发现模型表现很差，可以有很多种方法去更改：

用更多的训练样本；
减少/增加特征数目；
尝试多项式特征；
增大/减小正则化参数\(\lambda\)。
那么该怎么去选择采用哪种方式呢？
一般将70%的数据作为训练集，30%的数据作为测试集。
先用训练集最小化\(J_{train}(\Theta)\)，得到一组参数值\(\Theta\)；
然后计算测试集误差\(J_{test}(\Theta)\)：
对于线性回归：

对于逻辑回归：

测试集的平均误差（分类错误的比率）：

假设要选择用几次多项式\(d\)去作为假设函数，那么做法就是不断尝试\(d\)，选择一个在测试集上损失最小的\(d\)，以此作为模型泛化能力的衡量。但是这样是有问题的，因为\(d\)相当于是被测试集训练的，再用测试集去测试，很不公平。所以一般将数据集分为3部分：60%训练集、20%交叉验证集、20%测试集：

二、Bias vs. Variance

看图：

正则化和Bias/Variance的关系：

训练集大小与Bias/Variance的关系：

## 三、Error Analysis
Andrew推荐的流程：

## 四、Handling Skewed Data
如果数据集中正负类的数据规模差距过大，只用误差衡量模型是不可靠的，此时需要查准率和召回率两个指标。

如何权衡这两个指标，一般使用\(F1\)得分：
\[F_1=2\frac{PR}{P+R}\]

猜你喜欢

转载自www.cnblogs.com/EIMadrigal/p/12130914.html

#Week8 Advice for applying ML & ML System Design

Machine Learning - Advice for Applying ML: Evaluating a hypothesis

ML-Week8

ML

Applying Traditional Data, Big Data, BI, Traditional Data Science and ML

Paper Reading_System for ML

【ML】Week 2

ML - Week6

ml_ex8

数据挖掘day34-CS229-WEEK6 Advice for Applying Machine Learning

ML8: 机器学习

introduction of ML

ML概念

ML相关

ML索引

【ML】总结

ML Resources

MS ML

ML术语

ML—EM

Uber ML

ML=PET

ML ToolBox

ml例子

ML -- Regression

ml 资源

Dive into ML

ML 算法

spark ml

Explainable ML

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)