NLP（一）使用jieba、pyltp、pkuseg、nltk分词 - 代码天地

NLP（一）使用jieba、pyltp、pkuseg、nltk分词

其他 2021-03-03 01:58:18 阅读次数: 0

本文将介绍以下内容：

使用 jieba 分词
使用 pyltp 分词
使用 pkuseg 分词
使用 nltk 分词

通常，NLP无法一下子处理完整的段落或句子，因此，第一步往往是分句和分词。这里我们将介绍几种分词方法。

一，使用 jieba 分词

可参考我之前写过的文章：https://blog.csdn.net/TFATS/article/details/108810284

二，使用 pyltp 分词

可参考我之前写过的文章：https://blog.csdn.net/TFATS/article/details/108511408

三，使用 pkuseg 分词

可参考我之前写过的文章：https://blog.csdn.net/TFATS/article/details/108851344

四，使用 nltk 分词

nltk 工具一般在英文文本中作为词嵌入工具使用。这里只介绍 tokenize
方法，对于详细的使用方法可以参考：https://www.cnblogs.com/chen8023miss/p/11458571.html
http://www.pythontip.com/blog/post/10012/

注：在安装nltk时可能会产生一些问题，可以参考我之前分享的文章： https://blog.csdn.net/TFATS/article/details/108519904

from nltk import word_tokenize

sent1 = "I love sky, I love sea."
sent2 = "I like running, I love reading."

sents = [sent1, sent2]
texts = [[word for word in word_tokenize(sent)] for sent in sents]

# ------ output------
[['I', 'love', 'sky', ',', 'I', 'love', 'sea', '.'], ['I', 'like', 'running', ',', 'I', 'love', 'reading', '.']]

猜你喜欢

转载自blog.csdn.net/TFATS/article/details/108800919

NLP（一）使用jieba、pyltp、pkuseg、nltk分词

中文分词模型-pkuseg和jieba对比

【NLP】【一】中文分词之jieba

【NLP】Jieba中文分词

NLP之jieba分词

NLP-Jieba分词

NLP-分词、词性标注及命名实体识别（一）：概念及jieba使用解析

【python 走进NLP】pkuseg一个领域细分的中文分词工具包

pkuseg 和 jieba 分词对比测试，结果出乎意料...

python+nltk安装+jieba分词安装

NLP_中文分词/jieba分词原理

NLP系列（一）pkuseg-python：一个高准确度的中文分词工具包

常用中文分词工具分词&词性标注简单应用（jieba、pyhanlp、pkuseg、foolnltk、thulac、snownlp、nlpir）

实践：jieba分词和pkuseg分词、去除停用词、加载预训练词向量

中文分词（一）：jieba分词

Python使用jieba分词

jieba 分词使用入门

jieba 分词的使用

（一）jieba分词

jieba分词基础（一）

NLP之jieba中文分词官方文档

NLP之jieba分词原理简析

【NLP】【二】jieba源码分析之分词

NLP自然语言 - jieba分词库

Python 自然语言处理（基于jieba分词和NLTK）

jieba nltk 进行中英文分词

NLP入门（六）pyltp的介绍与使用

五款中文分词工具在线PK: Jieba, SnowNLP, PkuSeg, THULAC, HanLP

中文分词工具简介与安装教程（jieba、nlpir、hanlp、pkuseg、foolnltk、snownlp、thulac）

django中jieba分词的使用

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)