实验一、将线程数量使用默认值12;进行训练二次,发现结果不一样,有细微差异;
本人猜想由异步随机梯度下降导致的;而异步的前提就是需要并行训练;
实验二、将线程数量值设置为1,进行训练二次,结果一样;
即可以证明其结果是由异步随机梯度下降导致的;
实验一、将线程数量使用默认值12;进行训练二次,发现结果不一样,有细微差异;
本人猜想由异步随机梯度下降导致的;而异步的前提就是需要并行训练;
实验二、将线程数量值设置为1,进行训练二次,结果一样;
即可以证明其结果是由异步随机梯度下降导致的;