蚂蚁金服金融大脑的挑战赛的实现代码 NLP文本相似度计算 - 代码天地

蚂蚁金服金融大脑的挑战赛的实现代码 NLP文本相似度计算

其他 2019-04-20 17:50:56 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/duanshao/article/details/80970483

近期做了一些NLP的研究，并基于6月份蚂蚁金服金融大脑的挑战赛，完成了文本相似度计算的验证。

主要思路是基于word2vec来进行训练，并实现文本相似度的计算。

所使用的语料，包括了公开的wiki语料，网友收集的微信语料，以及此大赛中的语料。

其中微信语料的位置在https://spaces.ac.cn/archives/4304（可参考）。

注意，此次语料训练采用了增量训练的方式。

整体的代码位置在，https://github.com/renwoxing2016/nlp-ali，大家可参考。

使用方式：

1、下载此代码到本地。

2、下载训练的模型，参见模型的位置。

下载后放到models目录下。

3、运行python ali_wx_wiki_vec_compare.py ./input_test.txt ./temp/

扫描二维码关注公众号，回复： 5957677 查看本文章

4、结果在temp目录下。

训练：

1、下载数据到本地。拷贝到此代码大的根目录下。数据比较大有待上传后更新其网址。

2、运行如下脚本即可。

python word2vec_train.py

猜你喜欢

转载自blog.csdn.net/duanshao/article/details/80970483

蚂蚁金服金融大脑的挑战赛的实现代码 NLP文本相似度计算

Spark实现TF-IDF——文本相似度计算

NLP学习——文本相似度计算

使用余弦相似度实现文本相似度检测

用gensim doc2vec计算文本相似度，Python可以跑通的代码

机器学习算法Python实现：gensim里的similarities文本相似度计算

python实现机器学习中的各种距离计算及文本相似度算法

NLP文本相似度

nlp中文本相似度计算问题

【python 走进NLP】文本相似度各种距离计算

NLP学习（3）---计算文本相似度

NLP—小任务一：文本相似度计算

文本相似度-bm25算法原理及实现

Python实现简单的文本相似度分析

创新实训（13）——文本相似度算法的实现

python实现Simhash处理大规模文本相似度

基于word分词提供的文本相似度算法来实现通用的网页相似度检测

NLP之文本相似度

基于Lucene、TF-IDF、余弦相似性实现长文本相似度检测

【计算机视觉】使用 notebook 展示如何下载和运行 CLIP models，计算图片和文本相似度，实现 zero-shot 图片分类

文本相似度计算的常用方法

短文本相似度计算

文本相似度计算-编辑距离

python文本相似度计算

利用python计算文本相似度

DSSM算法-计算文本相似度

计算文本相似度方法

文本相似度计算工具类

使用simhash计算文本相似度

文本相似度计算与检索

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)