当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于同义实体识别的Web信息集成

发布时间:2024-01-29 11:08
  准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识别算法FSE,并提出了一种基于同义实体识别的Web信息集成框架.在医院信息集成测试数据集上的实验结果表明,FSE算法效果优于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度计算的同义实体识别算法.

【文章页数】:8 页

【文章目录】:
1 引言
2 基于搜索引擎的同义实体识别
    2.1 基于搜索引擎的相似度计算
    2.2 基于搜索引擎的同义实体发现
3 基于同义实体识别的Web信息集成系统
    3.1 设计架构
    3.2 资源层:
    3.3 融合层
    3.4 服务层
4 实验与评估
    4.1 实验数据集
    4.2 评价标准
    4.3 实验结果
    4.4 讨论
5 总结与展望



本文编号:3888070

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3888070.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户e16f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]