面向蛋白互作预测的序列数据特征识别研究

发布时间:2023-04-29 04:49
  蛋白质是所有生物体的基石,除少数以单体的形式发挥作用外,大部分都与其他蛋白质协同发挥作用。基于机器学习的蛋白互作预测结合蛋白序列特征提取方法和机器学习算法,采用大规模数据统计方式,从整体水平上揭示蛋白质功能、了解蛋白间相互作用机制以及发现新的蛋白结合规律,对“破译分子机制”、“构建蛋白相互作用网络”、“开发药物”和“治疗优化”等蛋白质研究领域具有非常重要的指导意义。蛋白序列特征提取是蛋白互作预测首要解决问题之一,其性能的优劣直接影响机器学习算法处理蛋白序列数据的性能。因此,如何改进特征提取方法和如何优化机器学习算法是目前机器学习在生物信息领域研究中亟待解决的问题。目前,人们在采用蛋白序列特征提取与机器学习模型训练分步开展的方式研究蛋白互作预测方面取得一系列的进展。但是,这种割裂蛋白序列特征提取与机器学习模型训练关系的方式,未能有效提取蛋白序列的全序信息及长距效应,导致难以提高蛋白互作预测性能。本文从改进蛋白序列特征提取方法、引进机器学习模型优化技术以及端对端蛋白互作预测等方面开展研究,以有效提高蛋白互作预测性能,促进蛋白互作预测技术在蛋白相互作用相关研究领域的应用推广。主要工作概括如下...

【文章页数】:154 页

【学位级别】:博士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景和意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 研究内容
    1.3 论文组织结构
第2章 蛋白互作预测概述
    2.1 引言
    2.2 技术挑战和未决问题
    2.3 蛋白互作预测方法分类
    2.4 基于统计的蛋白互作预测方法
        2.4.1 基于序列的统计方法
        2.4.2 基于结构的统计方法
    2.5 基于模板的蛋白互作预测方法
    2.6 基于机器学习的蛋白互作预测方法
        2.6.1 机器学习概述
        2.6.2 基于传统机器学习的蛋白互作预测
        2.6.3 基于深度学习的蛋白互作预测
    2.7 本章小结
第3章 序列数据特征提取方法
    3.1 引言
    3.2 生物序列数据及数据库
        3.2.1 生物序列数据
        3.2.2 生物序列数据库
    3.3 生物序列数据特征提取及编码
        3.3.1 生物序列数据特征提取
        3.3.2 生物序列数据编码方法
    3.4 基于序列矩阵的序列数据特征提取方法
        3.4.1 序列矩阵编码原理
        3.4.2 相关定义及性质
        3.4.3 序列矩阵算法
        3.4.4 序列矩阵编码过程
    3.5 实验
        3.5.1 蛋白质序列数据集
        3.5.2 蛋白质序列编码实验流程
        3.5.3 蛋白质序列编码实验结果
    3.6 本章小结
第4章 基于机器学习的蛋白互作预测性能研究
    4.1 引言
    4.2 蛋白互作预测模型构建方法
        4.2.1 数据集构造
        4.2.2 超参数选择
        4.2.3 性能评价指标
    4.3 基于传统机器学习的蛋白互作预测
        4.3.1 基于K-最近邻的蛋白互作预测
        4.3.2 基于决策树的蛋白互作预测
        4.3.3 基于随机森林的蛋白互作预测
    4.4 基于深度学习的蛋白互作预测
        4.4.1 基于联合三联体的DNN蛋白互作预测
        4.4.2 基于自协方差的DNN蛋白互作预测
        4.4.3 基于局部描述符的DNN蛋白互作预测
        4.4.4 基于序列矩阵的DNN蛋白互作预测
    4.5 结果及讨论
        4.5.1 模型性能比较
        4.5.2 外部数据集上的性能
        4.5.3 与现有方法比较
    4.6 本章小结
第5章 端对端蛋白互作预测
    5.1 引言
    5.2 端到端学习
    5.3 端对端蛋白互作预测方法
        5.3.1 模型设计
        5.3.2 数据预处理
        5.3.3 数据集划分
        5.3.4 超参数选择
        5.3.5 模型结构
    5.4 结果及讨论
        5.4.1 模型性能比较
        5.4.2 低相似性数据集上性能
        5.4.3 与现有方法比较
    5.5 本章小结
第6章 总结与展望
    6.1 研究工作总结
    6.2 未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果



本文编号:3805199

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3805199.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户dfc0f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]