当前位置:主页 > 科技论文 > 自动化论文 >

基于学习率衰减的深度学习超参数优化方法的研究

发布时间:2024-04-21 19:22
  学习率衰减策略是深度学习算法优化中常用的学习率设定方法,好的学习率设定方式可以训练出更好的深度神经网络模型。因此,如何设定好的学习率衰减是深度学习领域的一个前沿问题,非常值得研究。在本论文中,我们详细研究了不同指数的多项式学习率衰减对深度神经网络模型性能的影响,并提出了一种对任意可导的衰减函数都适用的学习率衰减函数的调整方法——k-Decay方法。基于k-Decay方法可对原衰减函数的衰减变化率进行不同程度的加强或减弱,得到新的衰减函数,利用新函数训练出的模型其精度要优于原函数。在基于该方法的新衰减函数中引入新的超参数k,可以控制衰减函数的学习率的衰减程度,而原衰减函数恰好是新衰减函数在k=1时的特例。我们将k-Decay方法应用于多项式衰减、余弦衰减和指数衰减,分别给出了基于该方法的新衰减函数的解析表达式。为了验证k-Decay方法的有效性,我们采用了基于该方法得到的新多项式衰减函数作为学习率的设定方法,选用了当前最先进架构的几个深度神经网络(ResNet、Wide ResNet 和 DenseNet),在 CIFAR10和 CIFAR100 数据集上进行了广泛的测试,证明了该方法的...

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

图2-1:生物神经元??人工神经元(Artificial?Neuron)是神经网络的基本单元,它是一种模拟生物神??经元的结构和特性的数学模型,其作用是通过接收一组输入信号经过一系列变换并??

图2-1:生物神经元??人工神经元(Artificial?Neuron)是神经网络的基本单元,它是一种模拟生物神??经元的结构和特性的数学模型,其作用是通过接收一组输入信号经过一系列变换并??

硕士学位论文??MASTER'S?THESIS??第2章深度神经网络??深度学习中的’_深度”说明了输入数据经过不同的深度神经网络层进行非线性??变换的次数,这些网络层由许多的神经元组成,其中非线性变换主要来源于激活函??数,它们在一起构成了前馈神经网络。本章介绍了深度学习中的前....


图2-3:?Sigmoid函数曲线??

图2-3:?Sigmoid函数曲线??

zSm硕士学位论文??MASTER'S?THESIS???'??—^===^??—?Sigmoid??0.8?/?-??0.6?-?/??S??0.4?■??0.2?■?/??〇.〇?I??^Z??1???-10?-50?5?10??z??图2-3:?Sigmoid函数曲线??1....


图2 ̄4:?Tanh函数曲线??

图2 ̄4:?Tanh函数曲线??

以看出,它对输入进行了归一化操作,输出值在[〇,1]区间,不同于??Sigmoid函数的是,Softmax函数常用于多元分类(Multiclass?Classification)问题,??常用于多分类网络的最后一层。??10.?????I?-?A??一?ReLU??—Leaky?....


图2-5:?ReLU函数曲线??

图2-5:?ReLU函数曲线??

奸学位论文??MASTER'S?THESIS??2.3前馈神经网络??'??Input?Layer?£?R5?Hidden?Layer?£?R10?Hidden?Layer?£?R10?Hidden?Layer?G?R10?Output?Layer?£?R2??图2-6:前馈神经....



本文编号:3961346

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3961346.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户60a97***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]