word2vec公式推导及原理简记 - 代码天地

word2vec公式推导及原理简记

其他 2019-01-25 17:19:35 阅读次数: 0

https://www.cnblogs.com/pinard/p/7243513.html

http://www.cnblogs.com/pinard/p/7249903.html

word2vec区别于one_hot映射方法，将词向量赋予含义并映射到向量空间，通过向量减法、点乘表示两词相差、相关性。
两种预测模型：Cbow(周围词向量预测中间词向量)和skip-gram(中间词向量预测周围词向量)。
两种训练模型：Hierachical softmax（huffman树）和negtive sampling（权重采样负例）。

Hierachical softmax：(以Cbow为例, negative的区别只是一开始和误差叠加到一个向量。)
用huffman树代替传统神经网络，速度快。但是对出现频率少对词需要对路径较长，比较慢。

按照词频构建哈夫曼树。
先把周围词向量加和，然后 $\sigma \left (x_{i} \Theta^{T} \right )$ 为预测值。
顺着哈夫曼树走，与哈夫曼码比较。算梯度误差，累加误差给x，修正 $\Theta$ 。

推导过程：（人为规定左子树为负类0，右子树为负类1）

哈夫曼树往左走的时候，预测概率为1-sigmoid，往右走为sigmoid。

先求似然函数，也就是(根据dj为0和为1记住)

取对数求导，得到梯度为1-d-sigmoid()。对于sita偏导数乘xi，对于xi偏导数乘sita。

修正sita，累加x。

negtive sampling：以词频为依据赋权重建立单位线段。采用随机投影方式获取n个负样本。
将模型简化。

推导过程：假设上下文为y0=1，其他负例均为yi=0。

取对数求导得：采用梯度上升法，对sita导数为xi*(yi - sigmoid)，对x为sita(yi-sigmoid)求和。

猜你喜欢

转载自blog.csdn.net/silent_crown/article/details/84786404

word2vec公式推导及原理简记

word2vec算法原理公式推导

Word2Vec原理推导

word2vec原理推导与代码分析

word2vec的原理

word2vec原理

word2vec原理推导 word2vec原理(一) CBOW与Skip-Gram模型基础

Word2vec的推导及理解

Word2vec理解推导

Word2Vec原理解析

谈谈谷歌word2vec的原理

Word2Vec原理详解

Word2Vec原理分析

word2vec数学原理

word2vec的原理（一）

word2vec原理剖析

(六) word2vec原理

fasttext原理及与word2vec的差异

word2vec原理总结

NLP（一）Word2Vec原理

Word2Vec原理简单解析

word2vec的原理以及实现

Word2vec原理及参数详解

word2vec

Word2vec详细解释（内含推导）

Word2Vec的原理是什么，如何用训练Word2Vec

论文解惑《word2vec Parameter Learning Explained》1.1--CBOW模型中One-word context情况公式推导问题

embedding与word2vec

[NLP] word2vec

word2vec简介

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)