多表数据的不一致性检测与修复方法研究

发布时间:2024-03-28 04:37
  纵观数据质量的不一致性研究历程,条件函数依赖、条件包含依赖、微函数依赖及其扩展相继被提出,这些方法无法解决实际应用中多表不同属性之间整体或局部的不一致性问题。本文提出一种基于主数据和扩展微函数依赖的不一致性检测方法,以及基于置信度和熵的不一致性数据修复方法。为解决多表不同属性之间整体或局部的不一致性检测问题,本文提出扩展微函数依赖,该依赖是微函数依赖的扩展。并且引入主数据来明确其中的错误数据,解决多表不同属性之间的不一致性传播问题。本文提出的基于主数据和扩展微函数依赖的多表数据不一致性检测方法,是以主数据修复为导向的不一致性属性检测。该方法是将属性与主数据进行条件包含依赖检测,满足该依赖的记录才进行微函数依赖检测,不满足以上任意检测规则的数据即为不一致性数据。为解决扩展微函数依赖以时间代价换取检测准确性的问题,本文提出增量检测方法。该方法识别出受数据或检测规则增删改影响的数据,并对这些数据进行不一致性检测,可有效提高检测效率。本文不仅提出多表不同属性之间整体或局部的不一致性检测方法,还对扩展微函数依赖规则的自动挖掘及完整性检测方法进行了研究。为保证扩展微函数依赖规则的一致性、正确性、完...

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

图2-1扩展微函数依赖树结构图

图2-1扩展微函数依赖树结构图

哈尔滨工业大学工程硕士学位论文14的函数IsNull(),Field.value表示待检测的字段名称“姓名”。图2-1扩展微函数依赖树结构图双叶子树由一个父节点和两个叶子节点组成,主要适用于检测规则中涉及两个字段属性值或一个字段值与一个常量间的比较。例如检测公司职员的年龄是否大于....


图2-2单叶子树结构模板单叶子树结构的XML文件中,除了基本的数据库表信息外,规则部分标

图2-2单叶子树结构模板单叶子树结构的XML文件中,除了基本的数据库表信息外,规则部分标

哈尔滨工业大学工程硕士学位论文14的函数IsNull(),Field.value表示待检测的字段名称“姓名”。图2-1扩展微函数依赖树结构图双叶子树由一个父节点和两个叶子节点组成,主要适用于检测规则中涉及两个字段属性值或一个字段值与一个常量间的比较。例如检测公司职员的年龄是否大于....


图2-3双叶子树结构模板多叶子树模板与单叶子树模板和双叶子树模板不同,最里层含有多个

图2-3双叶子树结构模板多叶子树模板与单叶子树模板和双叶子树模板不同,最里层含有多个

哈尔滨工业大学工程硕士学位论文15图2-2所示。双叶子树结构的XML文件中,与单叶子树模板不同的是最里层含有两个<terminal>标签。检测公司职员的年龄是否大于“16”,对应的XML文件存储格式如图2-3所示。图2-3双叶子树结构模板多叶子树模板与单叶子树模板和双叶子树模板不....


图2-4多叶子树结构模板单叶子树、双叶子树、多叶子树均是对多表属性之间一致性的表达,通过

图2-4多叶子树结构模板单叶子树、双叶子树、多叶子树均是对多表属性之间一致性的表达,通过

哈尔滨工业大学工程硕士学位论文15图2-2所示。双叶子树结构的XML文件中,与单叶子树模板不同的是最里层含有两个<terminal>标签。检测公司职员的年龄是否大于“16”,对应的XML文件存储格式如图2-3所示。图2-3双叶子树结构模板多叶子树模板与单叶子树模板和双叶子树模板不....



本文编号:3941014

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3941014.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户8f10a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]