KeyedVectors python 从词向量文件中快速生成{词：词向量} - 代码天地

KeyedVectors python 从词向量文件中快速生成{词：词向量}

其他 2018-08-28 07:55:13 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/yangfengling1023/article/details/81705109

在做NLP的一些深度学习任务中，需要从提前训练好的词向量中读取词的向量表示，若自己写代码读取文件，代码相对长一些

可以利用KeyedVectors 进行向量的读取

文件的内容如下：

代码如下所示：

#coding:utf-8
import gensim
from gensim.models import KeyedVectors

word2vec_model_path = './data/data_vec.txt' ##词向量文件的位置
word2vec_model = KeyedVectors.load_word2vec_format(word2vec_model_path, binary=False,unicode_errors='ignore')
word2vec_dict = {}
for word, vector in zip(word2vec_model.vocab, word2vec_model.vectors):
    if '.bin' not in word2vec_model_path:
        word2vec_dict[word] = vector
    else:
        word2vec_dict[word] = vector /np.linalg.norm(vector) 
for each in word2vec_dict:
    print (each,word2vec_dict[each])

运行的结果如下所示：

如果不用KeyedVectors，则需要文件的读取，以及一行一行的读取文件的内容，分别截取出词以及词所对应的向量，这样做起来比较麻烦，搞不好还会使后续的代码出现编码问题，尤其在python2编码问题会经常出现

猜你喜欢

转载自blog.csdn.net/yangfengling1023/article/details/81705109

KeyedVectors python 从词向量文件中快速生成{词：词向量}

python基于词向量的古诗生成器

NLP----神经网络语言模型（NNLM），词向量生成，词嵌入，python实现

Python word2vec训练词向量，电子病历训练词向量，超简单训练电子病历的词向量，医学电子病历词向量预训练模型

Python Word2Vec使用训练好的模型生成词向量

Python3 利用openpyxl 以及jieba 对帖子进行关键词抽取 ——向量生成

使用Python进行文本分类（一）准备数据：从文本中构建词向量、训练算法：从词向量计算概率

极简使用︱Glove-python词向量训练与使用

Python Word2Vec训练和测试词向量

gensim的word2vec如何得出词向量（python）

python学习-103-word2vec训练词向量

Python生成词云

python生成词云图

python词云图的生成

python 生成词云

在Python中利用wordcloud生成词云

词向量

词向量及文本向量

python爬虫生成词云

用Python生成词云

python词云生成笔记

python生成《稻香》的词云图

NPL中什么是词向量

机器学习之路： python 实践 word2vec 词向量技术

Python实现根据评论评分信息预测 (协同过滤，LFM,词向量)

Python3 分词去掉文本标点(自主定义)并构建tfidf词向量

【python gensim使用】word2vec词向量处理中文语料

PaddlePaddle在执行词向量预测的是出现预测数据不能完全转换为Python ndarray的错误

python-keras文本分类：pretrain词向量+1D卷积神经网络

信息抽取Python算法总结:词库匹配,词向量,TFIDF,机器学习,深度学习（持续更）

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)