pyspark读取Mysql数据 - 代码天地

pyspark读取Mysql数据

业界资讯 2023-09-08 20:46:43 阅读次数: 0

pyspark读取Mysql数据：

样例code 1：

from pyspark.sqlimportSQLContext

sqlContext = SQLContext(sc)
dataframe_mysql = sqlContext.read.format("jdbc").options(url="jdbc:mysql://127.0.0.1:3306/spark_db", driver="com.mysql.jdbc.Driver", dbtable="spark_table", user="root", password="root").load()
dataframe_mysql.show()

样例code 2：

from pyspark import SparkContext,SQLContext
from pyspark.sql import SQLContext

sc = SparkContext("spark://train01:7077","LDASample")
sqlContext=SQLContext(sc)
jdbcDf=sqlContext.read.format("jdbc").options(url="jdbc:mysql://10.10.10.10:3306/adl",driver="com.mysql.jdbc.Driver",dbtable="(SELECT code,title,description FROM project) tmp",user="mouren",password="mouren").load()
print(jdbcDf.select('description').show(2))

前提：配置文件/etc/spark/conf/spark-env.sh

+export SPARK_CLASSPATH=$SPARK_CLASSPATH:/opt/mysql-connector-java/mysql-connector-java-5.1.40-bin.jar

扫描二维码关注公众号，回复： 16524903 查看本文章

这样的配置有时报错：

WARN spark.SparkConf: Setting 'spark.executor.extraClassPath' to ':/opt/mysql-connector-java/mysql-connector-java-5.1.40-bin.jar' as a work-around.

解决方案：

去掉上面的配置，编辑spark-defaults.conf

+spark.executor.extraClassPath /opt/mysql-connector-java/mysql-connector-java-5.1.40-bin.jar

猜你喜欢

转载自blog.csdn.net/victory0508/article/details/68067716

pyspark读取Mysql数据

pyspark 数据的读取与保存；pyspark的dataframe转化与展示

pyspark 读取mysql 数据库，返回类型是true和false

pyspark读取tidb数据库

Pyspark和MySQL建立连接，并插入数据

利用pyspark 读取 S3上数据

windows下用pyspark连接mysql数据库

pyspark将本地数据转化为方便在hdfs上读取的分布式数据

PHP MySQL 读取数据

python 读取mysql数据

Spark读取MySQL数据

pyspark进行操作mysql

pyspark学习系列（二）读取CSV文件为RDD或者DataFrame进行数据处理

CDH 集群机器上部署 Jupyter notebook 使用 Pyspark 读取 Hive 数据库

python中，用pyspark读取Hbase数据，并转换为dataframe格式

pyspark程序从hdfs上读取数据求其TopN，并将结果存回hdfs

pyspark数据准备

pySpark加载数据

使用PySpark处理数据

PySpark 数据操作

Presto查询数据，通过pyspark把数据存入mysql数据库

java mysql 读取blob 数据

java - mysql 读取blob 数据

mysql 读取不是最新的数据

从mysql读取数据写入mongo

pandas读取mysql中的数据

redis读取数据,写入mysql

读取HDFS数据写入MySQL

DataX之读取MySQL数据

powerbi如何读取mysql的数据

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)