面向决策支持的医学文本语义分析方法研究

发布时间:2024-02-13 18:09
  随着医疗信息化的快速发展,医疗信息系统中存储着各类医疗数据的体量不断增长,海量异构医疗数据的分析成为推动医疗健康领域管理决策支持的挑战。医学文本信息是推动该领域相关研究的重要数据基础。患者的电子病历中包含了大量症状、诊断、病程、会诊等文本信息,充分利用这些包含丰富临床医学知识的医学文本对医疗健康领域决策支持非常重要。然而,当前这些有价值的医学文本却难以有效地应用在实际医院管理、临床决策支持、个人健康管理、公共卫生决策等实际场景中,原因包括:非结构化医学文本无法精准结构化、医学文本丰富的语义信息致使难以分析、医学文本信息无法脱离具体的医学情境、不一致的医疗信息标准导致信息交换困难、不同医疗机构之间共享数据机制的缺失等。这些问题的根源在于医学文本是特殊的专业领域语言,不仅具有各类语义信息,还包含丰富医学领域知识。有效的医学文本语义分析成为解决这些难题的关键技术。当前语义分析研究更多地是研究面向通用领域的自然语言处理技术,相关技术虽然在方法上进行创新,却无法结合医学场景和领域知识推动医学文本语义的分析,致使无法为机器学习乃至深度学习模型提供高质量训练数据集,降低决策的质量。同时,海量医疗文本...

【文章页数】:179 页

【学位级别】:博士

【部分图文】:

图2-6精准率和召回率的关系[107]

图2-6精准率和召回率的关系[107]

北京交通大学博士学位论文28图2-6精准率和召回率的关系[107]Fig.2-6Relationshipbetweenprecisionandrecall[107]一种综合了P和R的评估方法可以通过计算F指标来实现。一般的,F指标定义为:221(1)11(1)PRFPRPR+==....


图2-7ROC曲线与误报率的关系[108]

图2-7ROC曲线与误报率的关系[108]

文献综述和相关方法29图2-7ROC曲线与误报率的关系[108]Fig.2-7RelationshipbetweenROCcurveandFalsePositiveRate[108]通过考虑和评估对相关文档的判断一致性非常重要,我们一般使用kappa统计量,定义为()(E)1()....


图3-2使用电子病历语料库的Turkey检验结果

图3-2使用电子病历语料库的Turkey检验结果

基于自然语言处理的医学文本结构化和标准化方法37不同的N-Gram模型训练中对最终的结果产生显著差异,而这些差异体现了医学文本中不同类型的巨大差异以及医学文本与通用领域文本特征的巨大差异。表3-5不同训练语料下N-Gram模型的困惑度比较Table3-5Comparisonofp....


图3-3使用超声检查报告语料库的Turkey检验结果

图3-3使用超声检查报告语料库的Turkey检验结果

北京交通大学博士学位论文38图3-3使用超声检查报告语料库的Turkey检验结果Fig.3-3ResultofTurkeytestusingacorpusofChineseultrasoundreports图3-4使用人民日报语料库的Turkey检验结果Fig.3-4Result....



本文编号:3897038

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3897038.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ab2fd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]