stanfordcorenlp 英文分词词性(Part-of-Speech)缩写
在做问答系统的时候,需要对句子的词汇拆分,进行分析。但是对于每一个词汇,有一个很重要的属性是,词性
例如:
pos_whp = "WP"
pos_number = "CD"
pos_common_noun = "NN"
//样例 每个词汇的词性如右
What : WP is : VBZ the : DT name : NN of : IN littlejun : NN ? : NN
What : WP is : VBZ the : DT age : NN of : IN chacha : NN ? : .
通过词性,我们可以把某一类词用一个词汇类表示就行,比如pos 设置为“WP” 的时候,表示what who 这一类词
“CD” 表示数字类的词
“NN” 表示普通名词
那么具体的每一种类型,详看下面的图片
对于中文分词,可以 采用结巴分词,详见GitHub