Scaling Up Crowd-Sourcing to Very Large Datasets: A Case for Active Learning-笔记 - 代码天地

Scaling Up Crowd-Sourcing to Very Large Datasets: A Case for Active Learning-笔记

其他 2018-05-11 11:39:30 阅读次数: 1

通过Active Learning（AL）算法，找到最小的需要标注的数据进行训练，来标记未标记的数据。

AL必须满需下边的需求才能作为crowd-sourced database的默认的最优策略：

Generality：算法必须能够应用到任意的分类和标记任务。因为crowd-sourced systems应用广泛。

Black-box treatment of the classifer：意思是，能够自动化，不需要对分类器内部进行调节，因为并不是所有的人都是专家。

Batching：支持批处理。可以一次性处理多个数据。

Parallelism：能够并行执行现代的多核处理器和分布式集群。

Noise management：crowd-provided labels有很大噪声，错误，缺乏专业知识啥的。

本文是第一个满足上述所有条件的AL算法。本文主要贡献了两个AL算法，MinExpError 和Uncertainty，还有一个噪声管理技术partitioning-basedallocation(PBA)。这里主要介绍两个AL算法。
MinExpError 和Uncertainty决定哪些items被送入crowd。那么接下来就需要处理crowd-provided labels的内在噪声（PBA，基于整数线性编程），决定使用crowd返回的哪个label。
本算法的一个主要的新奇之处在于使用了bootstrap理论。主要优点有：1bootstrap可以对很多的评估器产生稳定的估计；2基于bootstrap的估计可以通过将分类器看作黑盒来得到；3bootstrap需要的计算可以独立进行，适合分布式系统。
Activate Learning(AL)
Ranker-AL
Bootstrap

猜你喜欢

转载自blog.csdn.net/sunyao_123/article/details/79973291

Scaling Up Crowd-Sourcing to Very Large Datasets: A Case for Active Learning-笔记

activate learning-Scaling Up Crowd-Sourcing to Very Large Datasets: A Case for Active Learning

Bootstrap-Scaling Up Crowd-Sourcing to Very Large Datasets: A Case for Active Learning

ranker-Scaling Up Crowd-Sourcing to Very Large Datasets: A Case for Active Learning

最短路径图：Query-by-Sketch: Scaling Shortest Path Graph Queries on Very Large Networks（文献综述）

[论文阅读] Active Class Incremental Learning for Imbalanced Datasets

超越 CLIP 的视觉-语言模型：Scaling Up Visual and Vision-Language Representation Learning

Backing Up Active Directory

阅读笔记：Very Deep Convolutional Networks for Large-Scale Image Recognition

论文阅读笔记--VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

Sampled Softmax 论文笔记：On Using Very Large Target Vocabulary for Neural Machine Translation

[深度学习] Very Deep Convolutional Networks for Large-Scale Image Recognition（VGGNet）阅读笔记

论文笔记《Very Deep Convolutional Networks for Large-Scale Image Recognition》

Very Deep Convolutional Networks for Large-Scale Image Recognition（VGG）笔记

经典论文阅读《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》简短阅读笔记

(VGG)Very Deep Convolutional Networks for Large-Scale Image Recognition阅读笔记

Alibaba Cloud TableStore: How to Store Large DataSets

1 Enabling Network Security Through Active DNS Datasets

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNTION（翻译）

VGG： VERY DEEP Convolutional Networks for large-sacle Image Recognition

Very Deep Convolutional Networks For Large-Scale Image Recognition(VGGnet)

VGG: Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG —— Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

Swin Transformer V2: Scaling Up Capacity and Resolution

端到端无人驾驶文献学习：End-to-end Learning of Driving Models from Large-scale Video Datasets

Datasets

AWS Auto Scaling (Amazon Auto Scaling)学习笔记

resilient distributed datasets 读后笔记

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)