VSM（向量空间模型）构建流程

其他 2018-06-10 12:07:20 阅读次数: 2

VSM是一个比较经典的机器学习模型，有很多比较好的文章已经对这个模型进行了详细的介绍，在此就不在赘述相关的背景及其原理，个人将一些写的比较好的文章整理放在了参考资料：

构建流程：

数据预处理：将准备用于输入的文档进行去噪、分词、编码格式转换、以及去除停用词等等。
计算每个文档中每个term的TF值，然后使用公式进行归一化处理：
再分别计算每个文档中每个term的IDF值：
最后将每个term的tf值和idf值合并为tf-idf值，为了保证权值不偏向长文档，建议在tfidf值计算后再乘上文档长度的倒数进行归一化处理：
将每个文档按照权值排序后构建向量，并计算两两向量之间的余弦值（也就是文档相相似度）

最后，个人编写的样例工程：
VSM样例工程

参考资料

https://blog.csdn.net/quicmous/article/details/71263844

https://blog.csdn.net/flying_all/article/details/77152409

http://www.ruanyifeng.com/blog/2013/03/tf-idf.html

http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html

扫描二维码关注公众号，回复： 1548245 查看本文章

https://blog.csdn.net/aspirinvagrant/article/details/41250887

http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html

http://www.cnblogs.com/haippy/archive/2011/10/04/2199144.html

猜你喜欢

转载自blog.csdn.net/tron_future/article/details/80535206

VSM（向量空间模型）构建流程

向量空间模型VSM

经典检索模型——向量空间模型（VSM）的简单理解

NLP --- 文本分类（向量空间模型（Vector Space Model）VSM）

使用Scala实现VSM向量空间模型算法实现的简单实例

向量空间模型算法

VSM

tensorflow模型构建流程

向量空间模型(vector space model)

Vector Space Model （向量空间模型）

向量空间模型(Vector Space Model)的理解

Vector Space Model向量空间模型算法

向量空间模型（Vector Space Model）

数仓模型构建流程

ArcGIS 10.7 模型构建器Model Builder空间建模流程化作业案例----影像拼接与掩膜裁剪

向量空间

基于向量空间模型的文本聚类算法

Keras深度学习实战——使用GloVe模型构建单词向量

Keras深度学习实战——使用fastText模型构建单词向量

向量空间与线性子空间

浅谈向量空间

11 抽象向量空间

向量空间初步

正交向量与子空间

空间向量的余弦算法

几何向量：空间圆

极智AI | TensorRT API 构建模型推理流程

pytorch学习之pytorch构建模型的流程

向量空间模型与Lucene的打分机制以及影响打分的几种方式

lucene4.5源码分析系列：lucene的默认评分算法-向量空间模型（Vector Space Model）

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)