伪标签半监督学习 - 代码天地

伪标签半监督学习

其他 2020-02-11 10:46:01 阅读次数: 0

对于每个机器学习项目而言，数据是基础，是不可或缺的一部分。在本文中，作者将会展示一个名为伪标签的简单的半监督学习方法，它可以通过使用无标签数据来提高机器学习模型的性能。

为了训练机器学习模型，在监督学习中，数据必须是有标签的。那这是否意味着无标签的数据对于诸如分类和回归之类的监督任务就无用了呢？当然不是! 除了使用额外数据进行数据分析，还可以将无标签数据和标签数据结合起来，一同训练半监督学习模型。

该方法的主旨思想其实很简单。首先，在标签数据上训练模型，然后使用经过训练的模型来预测无标签数据的标签，从而创建伪标签。此外，将标签数据和新生成的伪标签数据结合起来作为新的训练数据。具体步骤如下：

640?wx_fmt=png

将有标签部分数据分为两份：train_set&validation_set，并训练出最优的model1
用model1对未知标签数据(test_set)进行预测，给出伪标签结果pseudo-labeled
将train_set中抽取一部分做新的validation_set，把剩余部分与pseudo-labeled部分融合作为新的train_set，训练出最优的model2
再用model2对未知标签数据(test_set)进行预测，得到最终的final result label

一枚小码农

发布了74 篇原创文章 · 获赞 17 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_25394043/article/details/103593424

伪标签半监督学习

半监督学习之伪标签学习

伪标签（pseudo label）（半监督学习）

【半监督学习】4、Dense Teacher | 无需伪标签后处理的半监督目标检测

伪标签：教你玩转无标签数据的半监督学习方法

伪标签学习——一种半监督学习方法

使用伪半监督学习的无监督聚类

半监督学习实战——标注数据和伪标签数据混合训练

伪标签：用于深度神经网络的简单高效的半监督学习方法

【伪标签】半监督学习——如何将无标签数据与有标签数据放一起训练？

半监督学习

半监督学习综述

半监督学习总结

GAN半监督学习

半监督学习(转载)

半监督学习——LabelSpreading

sklearn半监督学习

浅谈半监督学习

半监督学习--TSVM

Paper Reading: (InPL) 不平衡半监督学习中的分布内伪标记优先

【半监督分类】（一）半监督学习概述

半监督学习（五）——半监督支持向量机

台湾老李--半监督学习(无标签数据远远大于有标签数据）

机器学习：监督学习、无监督学习、半监督学习、强化学习

【机器学习】半监督学习

半监督学习【机器学习】

机器学习（13） -- 半监督学习

半监督学习深度学习算法

半监督学习思路学习记录

机器学习之有监督学习,无监督学习,半监督学习

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)