汉语抽象语义表示体系、资源构建及其应用研究

发布时间:2023-10-02 00:54
  语义表示作为自然语言处理的重难点,一直是学界研究的热点问题。面对语言计算从句法向语义层面转型的大趋势,现有的语言资源包括概念语义、框架语义和情境语义方面都有不同程度的发展,将多层次多类型的语义资源融合,构建一个深层语义表示的语言知识库成为现阶段亟待解决的问题之一。目前对于语义表示的研究不论是从语言理论还是自动分析领域,研究方向都逐渐从句法走向了语义,句法结构的表示方法也由最初树形(tree)结构,到非投影树(non-project tree)结构,再到初步尝试和应用图(graph)结构,经历了由树到图的发展进程。而抽象语义表示AMR(Abstract Meaning Representation,AMR)作为一种全新的语义表示方法,将句子的语义抽象为一个单根有向无环图。这种抽象语义表示方法将句法和语义信息相结合,以图结构来表示语义,揭示树结构所无法表征的论元共享现象,给句子语义以更加清晰的表达。然而句子中的词语和AMR图的概念对齐信息缺失,一定程度上影响自动分析效果和语料标注质量,同时中文还未有较大规模的AMR语料库。本文借鉴英文AMR语义表示理念,结合汉语自身特点并融合概念对齐信息,...

【文章页数】:155 页

【学位级别】:博士

【文章目录】:
摘要
Abstract
引言
第一章 句法语义的理论发展及应用探索
    第一节 句法语义理论研究综述
    第二节 句法结构表示方法及资源建设概述
    第三节 英文AMR发展现状及应用研究
    本章小结
第二章 CA-CAMR表示体系
    第一节 英汉AMR表示体系
    第二节 CA-CAMR表示方法
    第三节 CA-CAMR标注体系
    第四节 CA-CAMR的特点
    本章小结
第三章 CA-CAMR语料库构建
    第一节 人机结合的CAMR语料标注方法
    第二节 语料标注一致性统计与问题分析
    第三节 语料标注不一致现象消解策略
    第四节 CA-CAMR语料标注规范完善
    本章小结
第四章 CA-CAMR语料库标注结果统计及分析
    第一节 CA-CAMR基本数据及图结构统计分析
    第二节 CA-CAMR论元共享统计分析
    第三节 CA-CAMR特殊句法结构表示及统计分析
    本章小结
第五章 CA-CAMR应用:语义省略研究
    第一节 相关研究
    第二节 基于CA-CAMR汉语语义省略研究
    第三节 基于CA-CAMR省略“的”字结构自动识别与补全
    本章小结
结语
附录 A
参考文献
在读期间相关成果发表情况
致谢



本文编号:3849775

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/rwkxbs/3849775.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户fef44***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]