cut(sentence, cut_all=False, HMM=True)
1、创建【生成器】对象
import jieba
# 将要被切词的文本
sentence = '订单数据分析'
# 创建【生成器】对象
generator = jieba.cut(sentence)
print(generator)
print结果:
<generator object Tokenizer.cut at 0x000002474EF43EB8>
2、cut_all参数
精确模式:cut_all=False(默认)
全模式:cut_all=True
# 精准模式
unique = jieba.cut(sentence)
for i in unique:
print(i)
订单
数据分析
# 全模式
repeat = jieba.cut(sentence, cut_all=True)
for i in repeat:
print(i)
订单
订单数
单数
数据
数据分析
分析
cut_for_search(sentence,HMM=True)
# 搜索引擎模式
search = jieba.cut_for_search(sentence)
for i in search:
print(i)
订单
数据
分析
数据分析