Spark 增量操作 insertInto() 与 mode(SaveMode.Append).saveAsTable() 的区别

其他 2018-08-09 13:37:17 阅读次数: 0

前言

使用spark做增量操作的时候,会看到有2个方法都可以做:
- insertInto 和 mode(SaveMode.Append).saveAsTable()

区别:

insertInto()
- 无关schema,只按数据的顺序插入,类似hive导入csv.
mode(SaveMode.Append).saveAsTable()
- 如果表已存在,需要匹配插入数据和已有数据的format,partiton等参数的区别,如果有区别会插入出错.如:没有提供partitionBy.
- 使用已存在的表的schema的column进行数据插入匹配

参考链接:

猜你喜欢

转载自blog.csdn.net/lc0817/article/details/78211695

Spark 增量操作 insertInto() 与 mode(SaveMode.Append).saveAsTable() 的区别

mysql replaceinto VS insertinto

Learning Spark——client mode和cluster mode的区别

spark saveAsTable 太慢

【Spark】Spark基本操作

Spark 增量抽取 Mysql To Hive

Spark和MapReduce的区别

Hadoop和Spark的区别

Spark：map与flatMap区别

Storm与Spark区别

thriftserver与spark application的区别

spark和hadoop的区别

Hadoop和Spark区别

Spark常用算子的区别

spark和mr的区别

spark与Hadoop的区别

mapreduce与spark区别

flink和spark的区别

spark:reducebykey与groupbykey的区别

Spark 和与MR的区别

Spark和Flink的区别

MR与Spark的区别

Flink与Spark的区别

spark和flink区别

Spark是什么？Spark和Hadoop的区别

spark框架体系及spark和MR的区别

【Spark】Spark 与 Hadoop MR 之间的区别

关于spark core 和spark streaming 的区别

SPARK CONF,SPARK CONTEXT和SPARK SESSION的区别

spark core、spark sql、spark streaming 联系与区别

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)