层叠隐马模型下的音译人名和日本人名识别

层叠隐马模型下的音译人名和日本人名识别
命名实体中的人名识别包括中国人名,音译人名和日本人名。比如“北川景子参演了林诣彬导演,克里斯·摩根编剧的《速度与激情3》”“林志玲亮相网友:确定不是波多野结衣?”。以前用三层HMM做过中国人名的识别,取得了满意的效果。这次来实现另外两种人名的自动识别。音译人名常用字法音译人名按照地域又可以分为欧美人名和俄罗斯人名,两者的常用字差别较大。不过,由于翻译人名中使用的汉字相对固定,所以只需整理一个常用字库就可以实现基本的识别,比如:欧美人名常用字——·-—阿埃艾爱安昂敖奥澳笆芭巴白拜班邦保堡鲍北贝本比毕彼别波玻博...

继续阅读码农场 » 层叠隐马模型下的音译人名和日本人名识别

原文链接http://www.hankcs.com/nlp/name-transliteration-cascaded-hidden-markov-model-and-japanese-personal-names-recognition.html

转载于:https://my.oschina.net/hankcs/blog/343764

猜你喜欢

转载自blog.csdn.net/weixin_34348111/article/details/91780231