当前位置:主页 > 科技论文 > 软件论文 >

基于文本相似度的版权保护系统的设计与实现

发布时间:2024-05-06 21:20
  随着网络时代的飞速发展,网络知识版权问题备受关注,互联网领域的侵权行为日益突出,在版权意识愈来愈强的今天,主动寻求为原创内容进行版权保护的解决方案尤为重要。设计有效的版权保护系统一方面有助于保护社区平台优质原创内容的安全,另一方面为优秀的原创用户提供更优秀的产品体验功能,突出社区重视原创保护的理念,促进原创用户的社区粘性和创作动力。本学位论文从文本内容方面进行文本相似度算法在文本版权保护方面的研究,设计了在版权保护领域下文本相似度的计算方法。文本相似度算法表示采用一定的策略来比较两个文本之间的相似程度,目前文本相似度算法的研究主要有两个方向:一种是语义词典法,通过构建语义词典,将文本中的最佳关键字与词典进行匹配,通过计算匹配对的相似度来表示文本的相似度,另一种是用向量表示文本内容,通过构建空间向量模型,计算向量之间的夹角即两个向量的余弦相似值,从而得到文本的相似度。目前学术界对于版权保护有很多贡献,但在具体文本相似度匹配时往往忽略了文本的上下文语义,为了解决这一不足,本文采用了将Word2vec和LSTM相结合的方法对文本相似度进行分析,提高了文本相似度分析的准确率。以长短期记忆网络(...

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
ABSTRACT
1 引言
    1.1 研究背景及意义
        1.1.1 课题背景介绍
        1.1.2 版权保护的研究意义
    1.2 研究现状
    1.3 研究内容
    1.4 结构安排
    1.5 本章小结
2 相关技术理论概述
    2.1 词向量表示
        2.1.1 Word2vec
        2.1.2 文本相似度计算
    2.2 长短期记忆网络
    2.3 系统平台架构
        2.3.1 TensorFlow
        2.3.2 SpringBoot
    2.4 长连接
    2.5 本章小结
3 系统需求分析
    3.1 系统目标
    3.2 功能需求
        3.2.1 预训练
        3.2.2 相似度计算
        3.2.3 在线服务
    3.3 非功能需求
    3.4 本章小结
4 系统概要设计
    4.1 系统体系结构
    4.2 系统功能组成
    4.3 数据存储设计
    4.4 本章小结
5 算法设计分析
    5.1 预训练算法
        5.1.1 数据预处理
        5.1.2 词向量训练
    5.2 长短期记忆神经网络算法
        5.2.1 数据采集
        5.2.2 特征工程
        5.2.3 模型训练
        5.2.4 结果分析
    5.3 本章小结
6 系统设计实现
    6.1 预训练
        6.1.1 数据预处理
        6.1.2 词向量模型构建
    6.2 相似度计算
    6.3 在线服务
    6.4 本章小结
7 实验与系统测试
    7.1 实验环境
    7.2 实验结果分析
    7.3 系统测试
        7.3.1 功能测试
        7.3.2 非功能测试
    7.4 本章小结
8 总结与展望
    8.1 工作总结
    8.2 展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集



本文编号:3966360

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3966360.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户47fe7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]