用Word2Vec来处理NLP问题 - 代码天地

用Word2Vec来处理NLP问题

其他 2018-09-12 15:34:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/shaoyou223/article/details/79639861

以下是主要代码，用word2vec来对词汇进行处理，只给了主要代码，其他读入和处理的代码在我博客里nlp处理的基础版和进阶版中都可以很容易查到。点击打开链接

#训练NLP模型

#先用最简单的Woed2Vec

from gensim.models.word.2Vec import Word2Vec

model = Word2Vec(corpus,size=128,windows=5,min_counts = 5,workers = 4)

#用NLP来表示

#先取全部的词汇

vocab = model.vocab

#得到任意text的vector

def get_vector(word_list):

扫描二维码关注公众号，回复： 3150733 查看本文章

res = np.zeros([128])

count = 0

if word in wordlist:

if word in vocab:

res += model[word]

count +=1

return res/count

wordlist_train = X_train

wordlist_test = X_test

X_train = [get_vector(x) for x in X_train]

X_test = [get_vector(x) for x in X_test]

#建立ML模型

from sklearn.svm import SVR

from sklearn.model_selection import cross_val.score

params = [0.1,0.5,1,3,5,7,10,12,16,20,25,30,35,40]

test_scores=[]

for param in params:

clf = SVR(gamma = param)

test_score = cross_val_score(clf,X_train,y_train,cv = 3,scoring = 'roc_auc')

test_scores.append(np.mean(test_score))

import matplotlib.pyplot as plt

plt.plot(params,test_scores)

plt.title('param vs sv AUC Score')

猜你喜欢

转载自blog.csdn.net/shaoyou223/article/details/79639861

用Word2Vec来处理NLP问题

[NLP] word2vec

NLP之——Word2Vec详解

NLP之word2vec

【NLP】Word2vec简介，入门

NLP（一）Word2Vec原理

NLP笔记(1)——word2vec

NLP之Word2Vec详解

NLP入门（三）word2vec

[NLP] 秒懂词向量Word2vec的本质+word2vec资源总结

NLP到Word2Vec 03 | Word2vec应用案例

NLP到Word2Vec 02 | Word2Vec理论基础

利用Tensorflow进行自然语言处理（NLP）系列之二高级Word2Vec

利用Tensorflow进行自然语言处理（NLP）系列之一Word2Vec

自然语言处理（NLP）：04 word2vec 入门介绍

自然语言处理（NLP）：06 word2vec训练中文模型-文本分类

自然语言处理（NLP）：04 word2vec 入门介绍

【自然语言处理（NLP）】基于Skip-gram实现Word2Vec

【自然语言处理（NLP）】基于Word2Vec的语言模型实践

NLP自然语言处理之Word2Vec(一）词向量

NLP系列2：Word2Vec理论及实战

word2vec

NLP - word2vec理论基础

不懂word2vec，还敢说自己是做NLP？

[NLP] 秒懂词向量Word2vec的本质

【NLP】【五】gensim之Word2Vec

NLP 相关算法 Word2Vec embedding

NLP：Gensim库之word2vec

NlP之word2vec的发展历程

NLP | Word2Vec之Huffman树与Huffman编码

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)