简答来说,每一个类型都有出现的概率,而softmax就是想让和真实值相同的那个类的概率通过不断的迭代慢慢变大,这样整个损失函数就会慢慢变小。
请参考下面的博文;
https://www.cnblogs.com/wangyarui/p/8670769.html
https://blog.csdn.net/as472780551/article/details/86554478