使用sparkSQL2.x读取MySQL方法和配置问题 - 代码天地

使用sparkSQL2.x读取MySQL方法和配置问题

数据库 2018-10-17 13:35:13 阅读次数: 0

版权声明：本人版权所有，翻版必究！！！！！ https://blog.csdn.net/qq_36968512/article/details/82460859

读取数据之前需要你pc上有mysql，有了mysql之后你需要知道详细的配置信息例如账号和密码以及数据库下的表和表结构，你还有要连接驱动（点此下载https://download.csdn.net/download/qq_36968512/10471651）
1.首先你需要创建sparksession
2.设置一个map集合把JIDBC的链接配置放上去
3.使用SparkSession的方法读取mysql数据
4.使用action算子检查是否连接成功
本人案例如下：`

import org.apache.spark.sql
import org.apache.spark.sql.{DataFrame, SparkSession}

object source_data_mysql001 {
  def main(args: Array[String]): Unit = {
    val spark=new sql.SparkSession
      .Builder()
      .appName("source_data_mysql001")
      .master("local")
      .getOrCreate()
    val jdbc_conf: Map[String, String] = Map(
      "url" -> "jdbc:mysql://localhost:3306/table147",   //设置mysql的链接地址和指定数据库
      "driver" -> "com.mysql.jdbc.Driver",    //设置MySQL的链接驱动
      "dbtable" -> "people01",      //获取数据所在表的名成
      "user" -> "root",        //连接mysql的用户
      "password" -> "111111"   //连接用户的密码
    )
    val data_mysql: DataFrame = spark.read.format("jdbc")   //设置读取方式
      .options(jdbc_conf)    //放入jdbc的配置信息
      .load()

    data_mysql.show()   //使用一个action算子来检查是否能读取数据
  }
}

这里写图片描述
结果如下图（成功读取）：

因为读取的数据是结构化的(在mysql中读取)，所以开始获取的不是Dataset也不是RDD而是DataFrame ！！！

猜你喜欢

转载自blog.csdn.net/qq_36968512/article/details/82460859

使用sparkSQL2.x读取MySQL方法和配置问题

sparkSQL2.X

使用SparkSQL2.x的SQL方式实现WordCount

SparkSQL入门案例之四(SparkSQL2.x)

sparkSQL入门--1.x和2.x编程的区别

sparksql读取parquet格式hive表的配置

sparkSql-2.x读写hive操作

sparksql 2.x 写WordCount

sparksql 2.x demo I

使用SparkSQL 读取Phoenix4.5.2出现下面的问题

使用SparkSQL/DataFrame读取HBase表

使用idea, sparksql读取hive中的数据

MySQL和sparkSQL合并行

SparkSQL读取/写入MySQL/Oracle数据(分区并行读取)

SparkSQL 定义查询和使用

错误解决：使用SparkSQL进行MySQL插入操作出现的中文乱码问题

struts2.x配置路径问题

IDEA 开发 SparkSQL-配置与简单使用

sparksql和mysql性能比较

SparkSQL UDF使用方法与原理详解

SparkSQL On Hive和spark的内存分配问题

SparkSQL in Scala 简单实践(spark 2x)

sparksql(2)

Spark读取HBASE注册临时表使用sparkSQL查询计算

SparkSQL数据读取简单操作使用 DataFrames相关操作

MongoDB on SparkSql的读取和写入操作(Scala版本)

MongoDB on SparkSql的读取和写入操作(Python版本)

springcloud2.x 设置feign、ribbon和hystrix的超时问题（配置文件）

Asp.net core 2.x/3.x 的 Globalization 和 localization 的使用 (一) 使用方法

vue2.X使用axios的get,post方法跨域问题

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)