基于深度神经网络的图像标注算法研究

发布时间:2023-10-15 15:38
  随着互联网平台全面智能化转型,作为图像检索、人机对话、视觉辅助等服务的基础,图像标注已成为各平台的必备功能,而如何实现准确的图像标注,成为了一项亟需解决的问题。人工标注数据能够获得准确的结果,但是由于标注过程耗时耗力,并且图像总量呈现爆发趋势,无法完全使用人工方式获得图像标注信息,由此催生出自动化的图像标注算法。近年来,基于深度神经网络的图像标注算法取得了巨大的成功,但是图像的底层视觉特征与高层语义之间存在的“语义鸿沟”,决定了图像标注算法还有很大的提升空间,包括如何利用图像辅助信息标注图像、如何由语义层面改进标注结果、如何快速训练深度图像标注模型等。本文围绕基于深度神经网络的图像标注展开研究,提出了基于隐特征学习的社交图像重标注算法和基于语义理解与描述的图像标注算法。从不同的角度审视任务核心,提出了多种基于深度神经网络的解决方案,并提出利用分布式GPU加速训练过程的方法。本文的主要创新性成果如下:1.提出一种基于噪声估计的图像重标注算法,利用柯西分布拟合图像的社会标签噪声,优化矩阵分解中隐特征学习,提升社会标签的应用效果。通过对比多种噪声分布假设,证实了柯西分布从理论与实践上都能够很...

【文章页数】:127 页

【学位级别】:博士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究工作的背景与意义
    1.2 国内外研究现状
        1.2.1 社会标签在图像标注中的应用
        1.2.2 图像语义在图像标注中的应用
        1.2.3 深度神经网络概述
    1.3 本文的主要工作与创新点
    1.4 论文章节安排
第二章 基于隐特征学习的社交图像重标注算法
    2.1 研究现状
    2.2 问题定义
    2.3 基于噪声估计的图像重标注算法
        2.3.1 概率矩阵分解
        2.3.2 柯西矩阵分解
        2.3.3 实验结果及分析
    2.4 基于隐特征维度相关性建模的图像重标注算法
        2.4.1 基于神经网络的图像标注框架
        2.4.2 基于卷积神经网络的图像标注框架
        2.4.3 实验结果与分析
    2.5 本章小结
第三章 基于语义理解与描述的图像标注算法
    3.1 研究现状
    3.2 问题定义
    3.3 基于多模态双向递归神经网络的图像标注算法
        3.3.1 递归神经网络
        3.3.2 多模态递归神经网络
        3.3.3 多模态双向递归神经网络
        3.3.4 实验结果与分析
    3.4 基于大规模语料库的图像标注算法
        3.4.1 基于描述匹配的图像标注算法
        3.4.2 基于哈希优化的图像标注算法
        3.4.3 实验结果与分析
    3.5 本章小结
第四章 深度图像标注算法训练加速架构
    4.1 研究现状
    4.2 卷积神经网络
    4.3 卷积神经网络及数据并行
    4.4 Wheel加速架构
        4.4.1 混合并行模式
        4.4.2 交替执行策略
        4.4.3 Wheel模块设计
        4.4.4 Wheel的资源利用
    4.5 实验结果与分析
        4.5.1 与经典方法比较
        4.5.2 GPU利用率
        4.5.3 通信效率
        4.5.4 实际训练情况
    4.6 本章小结
第五章 总结与展望
    5.1 全文总结
    5.2 后续工作展望
致谢
参考文献
攻读博士学位期间取得的成果



本文编号:3854185

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3854185.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户a3134***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]