Spark Mlib(六)用spark实现贝叶斯分类器 - 代码天地

Spark Mlib(六)用spark实现贝叶斯分类器

其他 2018-11-13 02:08:28 阅读次数: 0

贝叶斯分类器是各种分类器中分类错误概率最小或者在预先给定代价的情况下平均风险最小的分类器。下面是spark官网（http://spark.apache.org/docs/latest/mllib-naive-bayes.html）给出的例子

package alg
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.mllib.classification.{NaiveBayes, NaiveBayesModel}
import org.apache.spark.mllib.util.MLUtils
object naiveBayes {

  def main(args:Array[String]):Unit={


    val sparkConf = new SparkConf().setMaster("local").setAppName("testTansformition")
    val sc = new SparkContext(sparkConf)

    val data=MLUtils.loadLibSVMFile(sc, "data/mllib/sample_libsvm_data.txt")
    val Array(traning,test)=data.randomSplit(Array(0.6,0.4))

    val model=NaiveBayes.train(traning,lambda = 1.0,modelType ="multinomial")

    val predictAndLabel=test.map(p=>(model.predict((p.features)),p.label))


    val accuracy=1.0*predictAndLabel.filter(x=>x._1==x._2).count()/test.count()

    print("accuracy:"+accuracy)
    //save and load model
    model.save(sc, "target/tmp/myNaiveBayesModel")
    val sameModel = NaiveBayesModel.load(sc, "target/tmp/myNaiveBayesModel")

  }


}

猜你喜欢

转载自blog.csdn.net/fightingdog/article/details/83867577

Spark Mlib(六)用spark实现贝叶斯分类器

Spark Mlib(七)用spark实现LogisticRegression

Spark Mlib(四)用spark计算tf-idf值

Spark Mlib(五)用spark n元模型

Spark Mlib(三)用spark训练词向量

spark

spark：

【spark】

利用Spark MLIB实现电影推荐

spark mlib系列2

Spark Mlib(一) svm

【Spark】Spark六： Spark版本的WordCount

基于电影知识图谱的智能问答系统（五） --Spark朴素贝叶斯分类器

Spark基础：（六）Spark SQL

spark基础六 spark SQL

Spark（六）Spark编程进阶

【Spark】Spark七： Spark概述

Spark Mlib 数据类型总结

Spark Mlib(二)k-menas

spark官方文档Mlib学习（一）

毕业设计——基于SpringBoot+Neo4j+Spark实现的论文智能分析问答系统（采用朴素贝叶斯分类器）

spark-broadcast in spark

spark-hive on spark

Spark: Spark Streaming

Spark------Spark Streaming

spark杂记-初识spark

spark-spark集群

[Spark]-Spark streaming

Spark学习——初识spark

【SPARK】Spark Streaming简介

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)