nltk(一)

1.wsd模块

返回上下文中不明确单词的synset。

nltk.wsd.lesk(['I', 'went', 'to', 'the', 'bank', 'to', 'deposit', 'money', '.'], 'bank')

2.util模块

from nltk.util import *

choose这个函数是一种快速计算二项式系数的方法,通常称为nck,即一次取k的n个事物的组合数。

 bigram返回二项组合

trigrams以迭代器的形式返回从一系列项生成的三角图

 ngram以迭代器的形式返回从一系列项生成的ngrams。

 flatten把清单弄平。

 guess_encoding 尝试对字符串进行解码,返回正确的解码方式

猜你喜欢

转载自www.cnblogs.com/yangyang12138/p/12452868.html