深度学习输入符号编码



对于一些符号数据,比如用户ID、字词等。可以通过通过以下方法进行编码。
step 1). one-host编码。
step 2). multi-hot编码。因为符号数据的one-hot是非常稀疏的,维度非常大,不利于训练。因此要用six-hot类似的编码,或是挂靠编码。
step 3). nn编码。即使是six-hot,维度也是非常大的, 通过神经网络来进行编码学习embedding,比如稀疏层, 即只有hot的地方采用连接。

猜你喜欢

转载自blog.csdn.net/mao_feng/article/details/73883249