基于深度特征的地标图像识别

发布时间:2024-01-23 18:21
  地标图像识别有着广泛的应用前景,当前最有效的方法是使用图像检索的方式查询相似图像位置。当前这些深度特征检索方法中依然存在以下几个问题:(1)模型多数使用单一特征,在卷积神经网络方法中仅使用全局特征或者局部特征,如何有效融合两种特征在当今是一个难题。(2)地标识别受限于数据集标注问题,依然无法完成先检测后识别分类这样的分段流程,准确性必然降低许多。(3)分类训练中标准交叉熵损失函数在类别数量远大于嵌入特征维度时表现欠佳,度量学习中三元组损失则因为三元组挖掘的效率使模型训练难以快速收敛。针对以上问题,本课题完成了以下工作:(1)探索GeM池化、注意力机制等模型结构。(2)研究对比损失的特性与其适用条件,给出科学的训练参数选取范围,结合模型结构和策略训练全局特征提取模型。(3)研究当前人脸识别中结果较优的增量角度域损失(Additive Angular Margin Loss,ArcFace损失),分析角度域参数选取条件,阐述该损失的特性并进行对比实验分析。在全局特征提取模型的基础上,提出一种高效并融合多特征且使用弱监督训练的地标识别模型(ArcMF)。本课题中,实验表明ArcFace损失能...

【文章页数】:64 页

【学位级别】:硕士

图3-7非地标图像

图3-7非地标图像


图5-1南京街景无效图像

图5-1南京街景无效图像


图5-2Recall@N效果图

图5-2Recall@N效果图



本文编号:3883145

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3883145.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户32875***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]