通过数据集样本个数计算损失函数的权重 - 代码天地

通过数据集样本个数计算损失函数的权重

其他 2020-04-11 02:14:25 阅读次数: 0

大多数据集类别是不平衡的，可以通过调整损失函数的权重，来平衡各类别。
（1）神经网络每次训练过程中，给予不同的类别权重，选择最有的结果作为最优类别权重；但是这样花费的时间成本很高；因此可以通过如下策略进行训练：
1）首先训练不带权重的模型；
2）然后给予不同的类别权重参数，对网络进行微调，选取最优的权重参数；

（2）计算损失函数各类别权重的公式有：
假设有四类，对应类别数量为a,b,c,d
1）样本总数/(类别数量对应类别的个数)；
例如：类别a的权重为：(a+b+c+d)/(4a)
2）对应类别的个数/总类别数：
例如：类别a的权重为：（a+b+c+d）/a
3）T= 对应类别个数/类别总数 T1=1/(log(k+T))
其中k为大于一的常数，如果k小于1，那么权重可能会出现负数，常数k可以保证样本比例适中，log能够有效的控制增长率，防止差别太大时比例过大的问题。
例如：类别a对用的权重为：T = a/(a+b+c+d) T1_weight = 1/(log(k+T))

(3) 设计损失函数来解决样本不平衡和难易样本不平衡问题
1)focal loss
2）GHM（从梯度的角度解决正负样本间数量差异和easy、hard examples之间的矛盾）

Al小卒

发布了36 篇原创文章 · 获赞 1 · 访问量 6384

私信关注

猜你喜欢

转载自blog.csdn.net/qq_34291583/article/details/104436432

通过数据集样本个数计算损失函数的权重

CNN调参：利用损失函数权重处理不平衡数据集（二）

Pytorch实现多分类问题样本不均衡的权重损失函数 FocusLoss

CS231n 卷积神经网络与计算机视觉 6 数据预处理权重初始化规则化损失函数等常用方法总结

通过数组获取唯一指定几个数据

tensorflow 损失函数计算

Oracle通过数据泵网络导入另一个数据库，不生成DMP文件

通过数据库给文件加锁

如何通过数据进行网站分析

通过数据采集推动内容营销

通过数据看精细运营

使用Python计算每个分组的样本个数

多任务学习、多损失函数权重平衡

深度学习杂谈（调参、损失函数、trick、正负样本...）

c# 通过数值计算小数位数

R语言编写自定义函数以及sapply函数计算dataframe数据字段的描述性统计信息（Descriptive statistics、样本个数、均值、标准差、偏度skew、峰度kurtosis）

mysql通过数据文件恢复数据方法

oracle通过数据泵导出导入数据

Linux下通过数据链路层如何发送数据

Smartbi：通过数据导航实现企业的数据资源集成

如何通过数据接口解决数据来源的问题？

计算一个数据集的mean和std

ML之FE：基于波士顿房价数据集利用LightGBM算法进行模型预测然后通过3σ原则法(计算残差标准差)寻找测试集中的异常值/异常样本

js通过数据动态渲染无级树形菜单

mybatis 通过数据库反向工程

通过数据可视化来分析分类问题

myeclipse通过数据表生成jpa或hibernate实体

SEO优化通过数据分析起到什么作用？

易优cms通过数据修改密码

通过数据库连接工具连接到Impala

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)