一、引言:
机器学习(machine learning):从数据中提取知识。分为:监督学习(supervised learning)和无监督学习(unsupervised learning)。
二、监督机器学习应用:
1、识别信封上面的手写的邮政编码。
2、基于医学影像判断肿瘤是否为良性。
3、检测信用卡交易中的诈骗行为。
三、无监督机器学习应用:
1、确定一系列博客文章的主题。
2、将客户分成具有相似偏好的群组。
3、检测网站的异常访问模式。
四、构建机器学习解决方案过程中的思考:
1、要回答的问题是什么?已收集到的数据能够回答这个问题吗?
2、要将我的问题表示成机器学习问题,用哪种方法最好?
3、我收集的数据是否足够表达我想要解决的问题?
4、我提取了数据的哪些特征?这些特征能否实现正确的预测?
5、如何衡量应用是否成功?
6、机器学习解决方案与我的研究或商业产品中的其他部分是如何相互影响的?
五、编程环境Anaconda3.4.2+(python3.5+)
anaconda安装遇到的问题请查看
conda httperror http none none for url none Anaconda更新失败解决办法 https://www.jianshu.com/p/c74668743932
pandas==0.18.1
matplotlib==1.5.1
numpy==1.11.1
scipy==0.17.1
scikit-learn==0.18