网络问答社区的问题分类及专家发现研究

发布时间:2023-05-31 04:13
  Web3.0与大数据时代的到来,为网络用户提供了更多交互的方式,随之也产生了一系列用户互动的社区平台,网络问答社区便是其中之一,用户可以在社区平台中提出问题,也可以回答其他用户的提问。知乎作为中国版Quora,自2013年开放注册,便受到了广大网络用户的关注,目前,知乎已发展为中国第一大网络问答社区。网络问答社区像一个巨型知识库,为用户提供了在线交流、经验分享的平台。网络问答社区中大量的用户生成内容蕴含着巨大的价值,如何发现用户的兴趣偏好,激发更多用户的积极性,提高用户发表内容的质量,对社区中知识传播,提高社区的平台影响力至关重要。本文通过构建问题分类和专家发现模型,实现了对问题的自动分类和领域专家的发现,使得用户提出的问题可以快速归类,进而发现所在领域的专家,推送给专家用户为提问者解答。主要完成了以下工作:(1)构建了多通道问题特征提取模型。在实现社区问题文本自动分类时,采用LDA主题模型、Doc2vec模型多通道进行问题文本特征提取,该方法有效解决了问题文本内容短,数据稀疏问题。(2)提出了网络问答社区问题集成分类方法。将多通道融合的问题文本特征分别输入到支持向量机和随机森林得到基...

【文章页数】:60 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
abstract
第一章 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 问题建模
        1.2.2 问题分类
        1.2.3 领域专家发现
    1.3 研究内容
    1.4 组织结构
第二章 相关理论与关键技术
    2.1 文本表示模型
        2.1.1 主题模型
        2.1.2 词向量模型
    2.2 文本分类算法
        2.2.1 朴素贝叶斯算法
        2.2.2 决策树算法
        2.2.3 K近邻算法
        2.2.4 集成分类算法
    2.3 链接分析法
        2.3.1 HITS模型
        2.3.2 Page Rank模型
    2.4 本章小节
第三章 网络问答社区问题文本建模
    3.1 问题分类及专家发现的模型设计
    3.2 问题文本的获取和预处理
    3.3 多通道问题特征建模
        3.3.1 LDA主题特征提取
        3.3.2 Doc2Vec文本特征提取
        3.3.3 多通道问题特征融合
    3.4 本章小节
第四章 网络问答社区问题文本分类模型
    4.1 问题文本分类器的选择与集成
        4.1.1 基于SVM的问题分类
        4.1.2 基于RF的问题分类
        4.1.3 集成分类方案设计
    4.2 基于n LD-SVM-RF的问题分类流程
    4.3 实验设计与分析
        4.3.1 实验设计与评价标准
        4.3.2 实验结果与分析
    4.4 本章小节
第五章 网络问答社区领域专家发现
    5.1 专家用户特征建模
        5.1.1 用户节点特征提取
        5.1.2 用户间关系提取
    5.2 基于LN-User Rank的专家发现模型
        5.2.1 专家发现方法流程设计
        5.2.2 构建概率转移矩阵
        5.2.3 领域专家得分计算
    5.3 实验设计与分析
        5.3.1 数据收集与处理
        5.3.2 实验设计
        5.3.3 实验结果
    5.4 本章小节
第六章 总结与展望
    6.1 工作总结
    6.2 工作展望
参考文献
攻读硕士学位期间的学术活动及成果情况



本文编号:3825663

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3825663.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户125e1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]