应用于感知决策任务的策略算法研究
【文章页数】:102 页
【学位级别】:硕士
【部分图文】:
图1-2决策任务^??Figure?1-2.?Decision-making?task??
支持非理性决策的理论除了匹配律之外,还有概率匹配[56]。其中,概率学习??任务常用于检测人类的非理性行为。例如,2017年,SilvatM根据概率学习任务设??计了一个实验(如图1-2所示),要求被试童复地在黑色球会出现在左侧(按L键)??还是右侧(按R键)的框内做出选择,并且....
图1一论文组织结构图
鹰用予感知决策住务的策略算法研.究??H章,提出了一个受奖励调制的策略参数算法。该箅法从目标函数导得到,策略参数包括奖励和经验两个组成部分。利用该算法证明单阶段决策任务时,奖励会通过提取不同的经验值来形成决策。按的决策结果即可是获得最佳收益的理性决策,也可是获得次优的非四章,提出....
图2一时间差分预测误差与多巴胺能神经元发放的比较[l4州
浙江工业大学硕士学位论文得奖励后,这种多巴胺神经元的激活就停止了。类似地,囡为提示本励,所以在训练之前不应该导致预测误差。低是在训练之后,—且它值(即F(cwe)>0),这种意外出现的提示就应该会产生预测误差(?fF(cwe)?-?F(?ocwe)?=?fF(cwe)?>?0),....
图3-2单阶段决策任务的用例图??Figure?3-2.?Use?case?of?single-stage?decision-making?tasks??
化键?数数??图3-1单阶段决策任务的功能设计图??Figure?3-1.?Functional?design?diagram?of?single-stage?decision-making?tasks??根据上述的功能设计,以下将用用例图与活动图对该决策任务的主要功能进??行详....
本文编号:3947834
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3947834.html