当前位置:主页 > 外语论文 > 小语种论文 >

融合多特征的老挝语人名地名命名实体识别

发布时间:2022-10-04 20:25
  本文依据老挝语人名地名语言学中句法与词法的相关特征,使用不同的算法进行特征间的实现与融合,形成特定的老挝语人名地名命名实体识别模型。首先,依据老挝语地名特征,将有限个省份和国家词语组建成词典。其次使用Word2vec在较大规模的老挝语训练语料中,训练具有上下文语义特征信息的词向量,依据老挝语人名地名的构词特征使用BLSTM进行词语字符级向量训练,将字符级特征向量和词向量组合拼接成组合向量。将老挝语地名做状语后置的句法特征,通过One-Hot算法进行向量化,和组合向量进行融合。再将完整的特征向量输入到最后一层CRF中进行命名实体识别训练,融合了多特征的老挝语命名实体识别模型,模型识别人名地名的准确率、F值得到4%左右的提高。 

【文章页数】:4 页

【部分图文】:

融合多特征的老挝语人名地名命名实体识别


老挝语地名的句法特征

融合多特征的老挝语人名地名命名实体识别


老挝语人名的句法特征

融合多特征的老挝语人名地名命名实体识别


老挝语人名地名命名实体识别模型

【参考文献】:
期刊论文
[1]基于迁移学习和BiLSTM-CRF的中文命名实体识别[J]. 武惠,吕立,于碧辉.  小型微型计算机系统. 2019(06)
[2]基于CRF和BI-LSTM的命名实体识别方法[J]. 柏兵,侯霞,石松.  北京信息科技大学学报(自然科学版). 2018(06)
[3]基于CRF和半监督学习的维吾尔文命名实体识别[J]. 王路路,艾山·吾买尔,买合木提·买买提,卡哈尔江·阿比的热西提,吐尔根·依布拉音.  中文信息学报. 2018(11)
[4]基于LSTM-CRF命名实体识别技术的研究与应用[J]. 张聪品,方滔,刘昱良.  计算机技术与发展. 2019(02)
[5]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯.  中文信息学报. 2018(01)
[6]基于BLSTM的命名实体识别方法[J]. 冯艳红,于红,孙庚,孙娟娟.  计算机科学. 2018(02)
[7]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英.  中文信息学报. 2015(05)
[8]基于层叠隐马尔可夫模型的中文命名实体识别[J]. 俞鸿魁,张华平,刘群,吕学强,施水才.  通信学报. 2006(02)
[9]一个统计与规则相结合的中文命名实体识别系统[J]. 向晓雯,史晓东,曾华琳.  计算机应用. 2005(10)

硕士论文
[1]汉老双语命名实体识别及对齐方法研究[D]. 韩锐.昆明理工大学 2018
[2]老挝语命名实体识别方法的研究[D]. 杨梦杰.昆明理工大学 2016



本文编号:3685702

资料下载
论文发表

本文链接:https://www.wllwen.com/waiyulunwen/zhichangyingyu/3685702.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户cf733***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]