融入字典的医学命名实体识别模型 - 代码天地

融入字典的医学命名实体识别模型

其他 2020-04-04 10:39:16 阅读次数: 0

Incorporating dictionaries into deep neural networks for the Chinese clinical named entity recognition

总述

作者提出了融入字典信息的深度学习模型，用于解决中文医学命名实体识别问题。

融合了字典的深度模型主要的优点是，可以克服传统深度模型难以识别出现频率少，或者从未出现的实体。

具体得，作者基于BiLSTM拓展出两个深度模型框架，并且设计了五种特征

设计的五种特征

N-gram特征

具体的过程，首先提取出2-5gram字符串, 共有8个字符串(左右两边)，如上图一，所示xi的2-5gram字符串，

之后用独热编码表示各个字符串，如图二所示，腹壁属于body，所以编码是00001,8个字符串，每个字符

串用五维的独热编码表示，所以N-gram特征，共有40维

PIEF(Position-Independent Entity Type)特征

一句话概括就是，双向最大匹配算法(正向、逆向取最大长度)，对句子中的字符标注其属于的类别

如上图PIET特征所示
PDET(Position-Dependent Entity Type)特征

相比于PIEF融入了实体位置信息，如上图PDEF所示，S、single单个字符实体位置,B、begin实体的开始位置,E、end实体结束位置I、inter实体中间位置。

两个模型

model 1

嵌入向量和特征向量直接连接，输入到双向LSTM中
model 2

嵌入向量和特征向量分别输入到双向LSTM中，最后在CRF层前才连接

显然第一种是最好的方式

最后的结果

发布了176 篇原创文章 · 获赞 97 · 访问量 13万+

私信关注

猜你喜欢

转载自blog.csdn.net/zycxnanwang/article/details/102809443

融入字典的医学命名实体识别模型

命名实体识别

命名实体的识别

[Python人工智能] 二十七.基于BiLSTM-CRF的医学命名实体识别研究（下）模型构建

融入词汇信息的基于字的命名实体识别方法

命名实体识别（NER）

命名实体识别(NER)

学习：命名实体识别

命名实体识别NER

中文命名实体识别

基于CRF的中文命名实体识别模型

用BILSTM+CRF模型进行命名实体识别

Pytorch——XLNet 预训练模型及命名实体识别

基于深度学习的生物医学命名实体识别（知识点详解）

基于BiLSTM+CRF医学病例命名实体识别项目

HIT中文命名实体识别

HanLP笔记 - 命名实体识别

命名实体识别方法汇总

用CRF做命名实体识别

命名实体识别的阅读记录

命名实体识别相关算法

序列标注-命名实体识别

命名实体识别的难点与现状

电子病历命名实体识别NER

命名实体识别遇到的问题

词性标注与命名实体识别

命名实体识别（NER）全解析

NLP之中文命名实体识别

命名实体识别—NER——CRFPP

NLP 之命名实体识别

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)