所谓“自然语言”,是指人们日常交流使用的语言。相对于编程语言和数学符号这样的人工语言自然语言随着一代代的传递而不断演化因而很难用明确的规则来确定。从广义上讲,“自然语言处理( Natural Language Processing,NLP)包含所有用计算机对自然语言进行的操作,从最简单的通过计词汇出现的频率来比较不同的写作风格到最复杂的完全“理解”人所说的话,或至少达到能对人的话语作出有效反应的程度,NLP的技术应用日益广泛。例如:手机和手持电脑对输入法联想提示和手写识别的支持:网络搜索引擎能搜索到非结构化文本中的信息:机器翻译能把中文文本翻译成西班牙文。在应用领域,包括从事人机交互、商业信息分析、Web软件开发。
教程基于 Python编程语言及名为自然语言工具包( Natural Language ToolkitNLTK)的开源库。