当前位置:主页 > 社科论文 > 图书档案论文 >

面向绿色标准的知识图谱构建方法的应用研究

发布时间:2024-02-15 02:36
  绿色标准是规范企业用能、推动工业绿色发展的重要依据,绿色标准应用或执行越来越被重视。目前绿色标准信息检索主要依据关键词,标准中所隐含的关联和知识信息则无法进行有效检索,制约了绿色标准应用推广。本文以绿色标准为对象,分析标准文件的结构特点并结合非结构化文本内容主题特征,构建了基于内容主题的绿色标准数据抽取模型,对构建的标准实体进行融合处理,完成了面向绿色标准领域的知识图谱知识库构建。通过对700余份标准文件进行本体构建、数据抽取、数据融合和数据存储后,结果证明了面向绿色标准的知识图谱构建方法有效,为下一步面向绿色标准的知识问答系统开发奠定了数据基础。

【文章页数】:6 页

【部分图文】:

图1标准要素信息

图1标准要素信息

标准文件的基本内容[16]按要素划分可分为资科性要素、规范性要素,最终可将两大要素细分成封面、目录、前言、引言、参考文献等内容(如图1所示)。本文根据绿色标准文件特点,抽取前言、引言、参考文献、范围中隐含信息定义如下本体:标准、组织机构、术语、时间、人员、法律。然后使用Proté....


图2知识图谱模式层

图2知识图谱模式层

以上是绿色标准知识图谱的本体与语义的关系,根据本体、关系构建使用Protégé构建标准知识图谱的模式层(如图2所示)。2.2数据层构建


图3BERT-TCNN-LSTM模型

图3BERT-TCNN-LSTM模型

根据模式层定义,本文对绿色标准文本进行分析,其中所需抽取的关系和实体为一对多,即一个关系对应一个或多个实体。SuncongZheng[17]等人使用I(O)对BILSTM模型的标记类型进行分割,当I(O)为1时则为实体标记,当I(O)为0时关系标记。本文结合字特征和主题特征构建....


图4BERT结构示意图

图4BERT结构示意图

(1)输入。本文采用BERT预训练语言模型训练中文词向量。BERT将标准文本的字向量、位置向量和句子向量作为输入,通过12层Transformer双向编码结构来对文本进行建模,图4(a)展示BERT模型12层Transformer架构,图4(b)展示Transformer模型结构....



本文编号:3899051

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3899051.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户07487***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]