spark：报错com.esotericsoftware.kryo.KryoException: Buffer underflow. - 代码天地

spark：报错com.esotericsoftware.kryo.KryoException: Buffer underflow.

其他 2020-09-21 11:25:41 阅读次数: 0

场景

spark-sql跑一个较大的任务（几亿条数据），数据落盘时报错：

com.esotericsoftware.kryo.KryoException: Buffer underflow.

探索

查看抛出这个报错的源码：https://github.com/apache/spark/blob/ebdf41dd698ce138d07f63b1fa3ffbcc392e7fff/core/src/main/scala/org/apache/spark/serializer/KryoSerializer.scala

  override def readObject[T: ClassTag](): T = {
    try {
      kryo.readClassAndObject(input).asInstanceOf[T]
    } catch {
      // DeserializationStream uses the EOF exception to indicate stopping condition.
      case e: KryoException
        if e.getMessage.toLowerCase(Locale.ROOT).contains("buffer underflow") =>
        throw new EOFException
    }
  }

是在将输入流转换成一个样例类时引发的报错，看注释应该是缺失终止符导致的异常。

当我把这个任务切分成两部分跑之后，就不会出现这个报错，猜测可能是因为数据量过大的缘故。spark的worker上的每个excutor的每个core，都有一个kryo的buffer 缓冲区，这个缓冲区默认初始大小是64KB，根据任务需要会提高buffer大小，默认最大可以提高到64m。

尝试提高最大buffer大小的参数（不晓得有没有用，暂且试试）：

--conf spark.kryoserializer.buffer.max=512m

再观察几天看问题会不会复现。

需要注意的是，spark.kryoserializer.buffer.max参数设定的值必须小于2048M.

猜你喜欢

转载自blog.csdn.net/x950913/article/details/108457064

spark：报错com.esotericsoftware.kryo.KryoException: Buffer underflow.

【Dubbo】序列化异常—— com.esotericsoftware.kryo.KryoException: Buffer underflow

com.esotericsoftware.kryo.KryoException: java.lang.IndexOutOfBoundsException的解决办法

buffer

CORBA、IDL、COM和Protocol Buffer

Spark 引用ProtoBuffer报错：Unable to find proto buffer class

【Flink】Flink报错OutofMemoryError : Direct buffer memory

python报错object supporting the buffer API required

LeetCode 报错解决 heap-buffer-overflow Heap-use-after-free Stack-buffer-overflow Global-buffer-overflow

报错：io.netty.buffer.PooledByteBufAllocator.metric()Lio/netty/buffer/PooledByteBufAllocatorMetric

Const Buffer,Texture Buffer

Spark2.3.0 报 io.netty.buffer.PooledByteBufAllocator.metric

运行时报错：network buffer size带宽问题

mysql启动报错cannot allocate memory for the buffer pool处理

Solr新建collection时报错 Caused by: Direct buffer memory

lr报错10055：No buffer space available Try changing the registry value

导入json文件报错，TypeError expected string or buffer

django运行报错TypeError: object supporting the buffer API required

nexus启动报错：java.lang.OutOfMemoryError: Direct buffer memory

MySQL 报错InnoDB: Cannot allocate memory for the buffer poo处理方法

【Flink】报错Could not forward element to next operator Buffer pool is destroyed

解决GateWay报错：Exceeded limit on max bytes to buffer : 262144

关于livy的 java api 报错org.apache.livy.shaded.kryo.kryo.KryoException: Unable to find class: com.xxx.wordcount.WordCountJavaSpark

NIO的buffer

protocol buffer

ring buffer

nio buffer

Frame Buffer

Buffer的使用

【Node】【Buffer】

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)