机器学习实践：TensorFlow最后一个epoch训练损失函数显著增大 - 代码天地

机器学习实践：TensorFlow最后一个epoch训练损失函数显著增大

其他 2021-12-12 02:46:22 阅读次数: 0

问题

10个epoch，运行到最后一个时，训练数据集的损失函数显著增大
在这里插入图片描述

解决步骤

检查learning rate，发现学习率平滑减小，符合预期没有问题
检查梯度截断是否有效。梯度上没有问题。
检查adam之外的优化方法。adam没有问题
检查数据集是否shuffle。

结论

事实证明问题确实出在tensorflow的数据流水线上。如果把epoch的部分增加到这里，则整体是平滑的

def __call__(self, annotations_dir, batch_size=8, shuffle=False):
        self.data_reader = DataReader(annotations_dir)
        dataset = tf.data.Dataset.from_generator(self.data_reader.iter,
                                                 output_types=(tf.float32, tf.float32),
                                                 output_shapes=([self.img_size, self.img_size, 3], [None, 5]))  # for distribute data
        dataset = dataset.repeat(10)

如果是写到自己的训练循环里，则有问题

for epoch in range(10):
        for image_data, target in trainset:
            train_step(image_data, target)
        model.save_weights("../weights/yolov5")

其实，如果是经验丰富，大概一开头就可以猜出大概的解决方案，不用像我到处检测。因为问题出在一个新的epoch开头时突然异样。由于对tf.data原理了解的不多，问题的实质还需要更多实验和理论才能搞清楚了。

猜你喜欢

转载自blog.csdn.net/weixin_38812492/article/details/111680101

机器学习实践：TensorFlow最后一个epoch训练损失函数显著增大

一个Epoch前几个batch正常训练，最后一个batch的数据不足报错

人工智能实践：Tensorflow笔记01：一个最简单的神经网络分析及前向传播，损失函数，梯度下降及学习率，tensorflow一些编程变量

[机器学习]利用TensorFlow训练一个简单的神经网络

机器学习之--损失函数（一）

在PyTorch训练一个epoch时，模型不能接着训练，Dataloader卡死

机器学习之路： tensorflow 自定义损失函数

机器学习损失函数

机器学习-损失函数

Python机器学习--训练一个分类器

用PyTorch训练一个简单的机器学习模型

tensorflow/keras 模型搭建以及第一个epoch速度极慢的问题

TensorFlow入门：第一个机器学习Demo

tensorflow学习笔记——损失函数

TensorFlow入门：第一个机器学习Demo TensorFlow入门：第一个机器学习Demo

机器学习（一）TensorFlow训练参数

机器学习最常用的5个回归损失函数

Tensorflow计算一个五层神经网络带L2正则化的损失函数

机器学习面试—损失函数

机器学习中的损失函数

机器学习常用损失函数

【机器学习】常用损失函数

【机器学习】各种损失函数

机器学习损失函数讲解

机器学习常用的损失函数

【机器学习】损失函数MAE

【机器学习算法】——> 损失函数

机器学习：Loss损失函数

[机器学习]损失函数DLC

机器学习之损失函数

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)