1.1搜索文本和计数词汇常用的函数

最近在学《python自然语言处理》这本书,写博客就当做笔记

1.concordance函数
关键词语索引,显示某个词的出现情况和上下文

text1.concordance"monstrous")

2.similar函数
查询括号中相关词在上下文相似的词语

text1.similar("monstrous")

3.common_contexts函数
研究共用两个或者两个以上词汇的上下文

  text2.common_contexts([monstrous,very])  

4.generate函数
产生一些随机文本

text3.generate()

5.len函数
标识符是表示一组字符序列,len()计算的是这些序列出现的次数,而不是不同的单词的个数。
可通过set(text3)获取text3的词汇表,再len(set(text3))来获取词汇表的个数。
count()函数用来获得某个单词在文本中出现的次数

猜你喜欢

转载自blog.csdn.net/sinat_37386947/article/details/77913991