Rasa课程、Rasa培训、Rasa面试、Rasa实战系列之Using Projections to Remove Bias from Word Embeddings
Using Projections to Remove Bias from Word Embeddings
-
构建 子空间 Identify Gender Subspace
一个词嵌入由数百个维度组成。为了消除性别偏见,我们首先需要识别在词嵌入中捕获偏见的维度(也称为子空间)或维度(可以有多个维度)
首先在数据中找到“gender”维度,可以使用的词对是girl - boy, queen - king, mother - father… -
向量投影
找到“gender”向量,“male”单词集合和“female”单词集合中的每个单词都会沿着这个方向投影(投影是gender向量与这个单词向量的点积) -
要查看一个词是否具有male或female偏见,我们可以执行相同的过程,看看它是否更接近male或female的单词