信息检索中基于反向学习和聚类的数据融合方法

发布时间:2023-05-27 01:56
  随着信息技术的不断发展,互联网技术已成为人们获取信息的主要途径。信息检索的首要问题是帮助用户从互联网大量信息中迅速、准确地获取用户需要的信息。数据融合技术的思路是将不同信息检索系统检索到的成员结果进行组合从而得到一个新的检索结果。之前的研究结果表明,数据融合技术能够有效地提高检索性能。线性组合法是一种常用的融合技术,其中权重分配是提升融合性能的关键问题。另一方面,融合性能不仅受到参与融合成员系统数目的影响,还与它们相互间的关系密切相关。当成员系统数目较多时,融合资源消耗增多,有必要选择出一部分合适的成员系统进行融合,使数据融合同时具有较高的有效性和实现效率,但是目前尚缺乏关于这方面的研究。本文分别从提高融合性能和实现效率两个方向着手来探索信息检索中的数据融合问题,以期改善融合时的效率。论文的主要工作如下:(1)线性组合法能够根据具体的情况对参与融合的成员系统赋予不同的权重,对成员系统进行合适的权重分配是决定线性组合法成功与否的关键因素。本文在分析了反向学习特点的基础上,首次将反向学习算法引入到数据融合中,提出了基于反向学习的权重分配策略。该方法利用和发挥反向学习算法简单、求解精度高、无...

【文章页数】:79 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景和意义
    1.2 研究现状
        1.2.1 数据融合的相关研究
        1.2.2 成员系统的选择算法研究
    1.3 本文主要研究内容
    1.4 论文的组织结构
    1.5 本章小结
第二章 相关理论及技术
    2.1 信息检索系统
    2.2 信息检索中的数据融合技术
    2.3 分数规范化与检索评价
        2.3.1 分数规范化
        2.3.2 信息检索评价
    2.4 反向学习
    2.5 相似度测定
    2.6 几何框架概述
    2.7 本章小结
第三章 基于反向学习的数据融合方法
    3.1 概述
    3.2 反向学习算法
        3.2.1 反向学习的变体
        3.2.2 反向学习算法介绍
    3.3 基于反向学习的权重分配策略
    3.4 基于遗传算法的权重分配策略
        3.4.1 遗传算法简介
        3.4.2 使用遗传算法优化线性组合法中的权重
    3.5 实验设置与结果
        3.5.1 实验数据及设置
        3.5.2 结果分析
    3.6 本章小结
第四章 基于聚类的成员系统选择算法
    4.1 问题描述
    4.2 变色龙聚类基本介绍
        4.2.1 变色龙聚类原理
        4.2.2 变色龙聚类的改进
    4.3 基于变色龙聚类的成员系统选择策略
    4.4 实验设置
        4.4.1 实验数据
        4.4.2 实验设计
    4.5 实验结果与分析
    4.6 本章小结
第五章 总结与展望
    5.1 工作总结
    5.2 进一步研究方向
参考文献
致谢
攻读硕士学位期间发表的学术论文



本文编号:3823674

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3823674.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户818ed***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]