版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zzw0221/article/details/84778101
1.下载mahout0.13.0
2.解压
3.配置环境变量
#MAHOUT_HOME
export MAHOUT_HOME=/opt/cdh5.15.0/mahout-0.13.0
export MAHOUT_CONF_DIR=$MAHOUT_HOME/conf
export PATH=$PATH:$MAHOUT_HOME/conf:$MAHOUT_HOME/bin
4. 下载数据集:http://archive.ics.uci.edu/ml/databases/synthetic_control/
5.Hadoop环境(略),具体查看前面的文章。
6.将数据文件上传到hdfs,/user/zuowei.zhang/testdata,注意:文件路径必须一样。
7.运行任务:
hadoop jar /opt/cdh5.15.0/mahout-0.13.0/mahout-examples-0.13.0-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
8.运行结果,会自动生成output路径: