基于深度学习的在线医疗咨询文本命名实体识别

发布时间:2024-04-10 02:47
  随着互联网技术的发展和普及,很多患者选择通过在线医疗网站,向医生咨询医疗健康相关的问题。利用信息抽取技术从患者的在线医疗咨询文本中自动地获取重要信息,然后从专业的医疗知识库中搜索答案,自动地为患者提供专业的医疗答复,这种方法能够有效地减轻医生的工作量。其中,命名实体识别是进行信息抽取工作的关键步骤。因此对在线医疗咨询文本进行命名实体识别的研究具有重要的现实意义。本文致力于基于深度学习的在线医疗咨询文本命名实体识别的研究,通过对相关研究现状的调研,发现当前存在以下问题:1)目前针对在线医疗咨询文本进行命名实体识别的研究,还处于空白阶段。2)在以字粒度进行实体标注的情况下,需要研究如何在模型中有效地融合字在句子中的局部特征和全局特征。3)目前鲜有同时使用双向语言模型和Mask语言模型的预训练特征,提高命名实体识别效果的工作。4)目前鲜有将语言模型预训练和多任务学习两种方法联合起来,提高命名实体识别效果的工作。针对当前存在的问题,本文进行了以下工作:1)构建了高质量的在线医疗咨询文本命名实体识别标注数据集,填补了当前针对该领域研究的空白。2)根据在线医疗咨询文本的特点,设计了MQNer模型。...

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

图2-1神经网络的典型结构

图2-1神经网络的典型结构

图2-1神经网络的典型结构示了一个三层的前馈全连接神经网络,可以看到,一个神经的神经元没有连接,而层与层之间的神经元存在着连接。其,该层主要负责接收输入的数据;中间的层一般叫隐藏层;该层输出的值即为神经网络的输出值。当隐藏层数比较多时经网络,我们常说的深度学习,指的就是使用深....


图2-2sigmoid函数的示意图

图2-2sigmoid函数的示意图

第二章深度学习相关技术介绍moid函数,其形式如公式(2-2)所示:()=11+ 函数在坐标轴上的图形如图2-2所示。可以看到其输出范围为征的优点,但是sigmoid函数容易产生梯度消失的问题,并


图2-3tanh函数的示意图

图2-3tanh函数的示意图

图2-2sigmoid函数的示意图h函数,其形式如公式(2-3)所示:()=+ 在坐标轴上的图形如图2-3所示。可以看到其输出范围为[,但是tanh函数同样存在梯度消失和计算代价大的问题。


图2-4relu函数的示意图

图2-4relu函数的示意图

华南理工大学硕士学位论文()=,>00,≤0 在坐标轴上的图形如图2-4所示。可以看到当≤0时,relu输出x本身。relu函数相对sigmoid函数和tanh函数,具有计算度消失问题的优点,但是relu函数会产生神经元死亡的现象....



本文编号:3950021

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3950021.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户eaf6a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]