Name Entity Recognition(命名实体识别) - 知乎
特征除了人工的方式还可以用深度学习的方式提取
可尝试的特征:
1.Bag of word features
--当前词:Colin
--前后词:prefessor,proposed
--bigram: Prefessor Colin,Colin proposed
2.词性相关的
--当前词:名词
--前后词:名词,动词
3.前缀 or 后缀
当前词:Co,in
前后词:pr,ed,or
4.单词特点
--词长
--是否包含大写?
--统计多少个大写?
--是否包含"-"
--是否包含数字
5.stemming(可以先用统计的算法得到) + 单词特征
6.句法特征
--语法(句法分析 ,Parsing)
通过cky(动态规划)算法获取语法树
--依赖关系(Dependency Parsing)