python 决策与控制

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_35774189/article/details/84564709
词汇比较运算符
函数 含义
s.startswith(t) 测试s是否以t开头
s.endswith(t) 测试s是否以t结尾
t in s  测试s是否包含t
s.islower() 测试s中所有字符是否都是小写字母
s.isupper() 测试s中所有字符是否都是大写字母
s.isalpha() 测试s中所有字符是否都是字母
s.isalnum() 测试s中所有字符是否都是字母或数字
s.isdigit() 测试s中所有字符是否都是数字
s.istitle() 测试s是否首字母大写(s中所有的词都首字母大写)

text7中满足条件:包含 "-" 且包含‘index’

text3中满足条件:wd中所有词首字母大写且wd的长度大于10

text2中满足条件:包含‘cie’或者‘cei’


                                                                    简单的语音对话系统的流程架构


NLP的局限性

尽管在很多如RTE(文本含义识别,Recognizing Textual Entailment)这样的任务研究中取得了进展,但在现实世界的应用中已经部署的语言理解系统仍不能进行常识推理或以一般的可靠的方式描述这个世界的知识。在等待这些困难的人工智能问题得到解决的同时,接受一些在推理和知识能力上存在严重限制的自然语言系统是有必要的。因此,从一开始,自然语言处理研究的重要目标一直是使用浅显但强大的技术代替无边无际的知识和推理能力,促进构建“语言理解”技术的艰巨任务不断取得进展。


深入阅读:

想咨询在线材料:http://www.nltk.org/,包括额外的背景资料的链接及在线NLP系统的链接。

http://wiki.python.org/moin/BeginnersGuide上有《Python初学者指南》


小结:

  • 在Pythonh中,文本用链表来表示:['Monty','Python']。我们可以使用索引、分片和len()函数对链表进行操作
  • 词"token"(标识符)是指文本中给定词的特定出现;词“type”(类型)则是指词作为一个特定序列字母的唯一形式。我们使用len(text)表示计数词的标识符,使用len(set(text))表示计数词的类型
  • 使用sorted(set(t))获得文本t的词汇表
  • 使用[f(x) for x in text]对文本的每一项目进行操作
  • 为了获得没有大小写区分和忽略标点符号的词汇表,可以使用set([w.lower() for w in text if w.isalpha()])
  • 使用for语句对文本中的每个词进行处理,例如for win t:或者for word in text:
  • 使用if语句测试一个条件:if len(word)<5:  
  • 频率分布是项目连同它们的频率计数的集合
  • 函数是指定了名字并且可以重用的代码块。函数通过def关键字定义,例如def mult(x,y)中x和y是函数的参数,起到实际数据值占位符的作用
  • 函数是通过指定它的名字及一个或多个放在括号里的实参来调用

猜你喜欢

转载自blog.csdn.net/qq_35774189/article/details/84564709