Mahout学习笔记(一)

一.简介

  Mahout是apache下的一个机器学习库,单从名字来看(象夫),与hadoop的基情就一目了然,而它也的确是以hadoop作为运行环境的。刚开始Mahout是Lucene(搜索引擎的童鞋应该比较熟吧)的子项目,后来独立出来,成为了apache的顶级项目,由此大概可以窥见机器学习的广阔前景了。

 
              

二.构成

  Mahout主要关注3个部分:推荐系统(原taste),聚类和分类。

  推荐系统就不用说了,购物网站或者社交网站中用的已经非常普遍了。必须说明的是,Mahout中的一系列推荐实现,并不关注被推荐物的本身属性(例如一部电影的类型)。按照书上的说法,它的设计目标是实现一个通用的推荐系统,这一点也就不难理解了。

  聚类是非监督学习的一个典型,最常用的就是类似google的新闻分类之类的应用了。

  分类即模式识别,这个就没啥必要多说了。

猜你喜欢

转载自yaochitc.iteye.com/blog/1972461