tensorflow分布式训练之同步更新和异步更新

编程语言 2019-01-21 20:23:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/lyq_12/article/details/86573035

1、同步更新

在同步更新的时候，每次梯度更新，要等所有分发出去的数据计算完成后，返回回来结果之后，把梯度累加算了均值之后，再更新参数。这样的好处是loss的下降比较稳定，但是这个的坏处也很明显，处理的速度取决于最慢的那个分片计算的时间。

2、异步更新

在异步更新的时候，所有的计算节点，各自算自己的，更新参数也是自己更新自己计算的结果，这样的优点就是计算速度快，计算资源能得到充分利用，但是缺点是loss的下降不稳定，抖动大。

3、如何选择

在数据量小的情况下，各个节点的计算能力比较均衡的情况下，推荐使用同步模式。数据量很大，各个机器的计算性能掺差不齐的情况下，推荐使用异步的方式。

猜你喜欢

转载自blog.csdn.net/lyq_12/article/details/86573035

tensorflow分布式训练之同步更新和异步更新

『TensorFlow』同步训练分布式TensorFlow程序运行逻辑

tensorflow分布式训练

tensorflow 分布式训练

四、Tensorflow的分布式训练

TensorFlow、PyTorch分布式训练

tensorflow 分布式数据并行同步训练 between-graph 实例

tensorflow 分布式数据并行同步训练 between-graph 实例 (1）

klock 分布式锁重大更新

Vue异步更新和nextTick的源码分析

tensorflow源码学习之五 -- 同步训练和异步训练

tensorflow 变量更新和控制依赖

分布式 - RPC同步和异步说明

Tensorflow cluster 异步分布式集群使用说明

Tensorflow（二）单机多卡分布式训练

Tensorflow Object Detection API分布式训练模型

【深度学习】初识tensorflow之分布式训练

Docker容器中实现Tensorflow分布式训练

TensorFlow分布式训练MNIST分类器

TensorFlow Distribution(分布式中的数据读取和训练)

【TF-2-5】Tensorflow-分布式训练

TensorFlow在推荐系统中的分布式训练优化实践

计算机视觉（十四）：Tensorflow分布式训练

[翻译] 使用 TensorFlow 进行分布式训练

分布式TensorFlow

分布式系统之缓存的微观应用经验谈（二）【待更新】

『TensorFlow』分布式训练_其三_多机分布式

cxf + spring 开发基于web服务的分布式异构数据同步更新应用技术研究

Redis分布式集群（5）——gearmand服务实现redis自动同步mysql数据更新（lnmp）

搞懂分布式技术15：缓存更新的套路

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)