当前位置:主页 > 经济论文 > 经济发展论文 >

随机决策中个体的信念调整模型与检验 ——以科技期刊网络文献检索行为为例的研究

发布时间:2021-01-13 15:21
  本文的研究源自这样一个现实的问题:以CNKI为代表的科技期刊网站为用户们提供了众多的资源产品,但多数产品却被用户很少用到,造成这种情况原因何在?本文认为应着力于研究用户的信息搜寻行为,而这一行为的特征与构成随机决策问题的要素可以一一对应起来,因此,使用决策理论或博弈理论中的分析方法应该是可行的。经过相关文献的消化和研究,本文确定的研究对象是一个问题的两个方面:(1)行为人在随机决策中经历的学习规则如何;(2)行为人的认知进化是以何种方式进行的。为此,本文通过用学习模型来拟合实验数据,目的在于检验实验被试检索网络文献的行为,是符合强化学习模型的收敛特征,还是可以由基于贝叶斯推断的信念学习模型来指导更好。在这里,学习模型的选择和构建是重要的环节,因为其涉及到对现实的抽象和实验的控制变量设计。解决这一问题,首先较容易的是在现有的学习模型中选择合适的模型。考虑场景特征和各种学习理论要求的最低信息条件,只有强化模型可以在本文中使用。由于强化模型是一个较弱意识的学习模型,为了对被试的主观信念和认知有一个更好的了解,所以本文还构建了一个模拟随机决策问题的信念学习模型(BBAM),同时这种建模的方法对... 

【文章来源】:南京理工大学江苏省 211工程院校

【文章页数】:155 页

【学位级别】:博士

【部分图文】:

随机决策中个体的信念调整模型与检验 ——以科技期刊网络文献检索行为为例的研究


1决策的学习过程算法框图

示意图,贝叶斯推断,决策模型,计算方法


(l一e)可(风)+(l一歹)刃(风)图3:21贝叶斯推断决策模型的评估计算方法示意图图3.2.1显示了通过对每个策略的预期值进行估算,模拟的被试就可以选择使每期检索的主观预期最大的策略,并能观察到是否命中目标文献。根据这些信息,条件概率‘。气就可以用来计算决策向量的后验概率。再据此修正得出先验概率的基础上,就可以选择下一期的策略,以此类推。这种认知一行为运算法则和客观随机过程之间的相互作用决定了每个决策任务的实际特征和所选策略作用的可能结果。图3.2.1中,影响被试选择的认知水平和场景的特定客观条件,应根据评价学习效果的目的加以说明。需要指出的是,个体对于学习过程的先验理解是否允许这些条件在决策周期集合中代表适当的准确性,对贝叶斯学习策略的最终成功至关重要.3.2.4.4模拟模型的现实基础74

序列,拟合,模型,数据


敛速度来说,模拟的路径直到第9期仍无法与前8期的模拟数据有显著差异。(2)试错次数的影响图4.2.1中的“预测偏差”按时间序列直观的给出了实际选择和模型模拟的偏差,这样显示了一个关键性的特征:强化模型在实验初期捕捉被试策略选择的能力强于实验后期。这应该与强化模型的信息条件有关,强化模型假设行为人只关心支付的历史记录,所以强化模型在低信息条件和变化的环境中能得以应用,同时也暗示了在高信息环境下行为人必须忽略其它信息。但是很多现实情况下—包括本文的实验场景—行为人可以得到的信息比强化模型所要求的条件要多,尤其是本文实验中只有两个备选策略,并且被试在事先明确奖励办法—即知道大致的支付函数,所以被试的收敛速度远比模型模拟的要快。从现有的强化学习模型文献来看,只有当被选策略得到强化时,强化学习模型能正确的预测学习的方向—这里对应的是被试能够学会52是一个优势策略,但模型模拟通常比不上实际的学习速度。强化学习的低估能直接归于这样一个事实:即在知悉所有支付信息的环境下

【参考文献】:
期刊论文
[1]个体决策与学习行为:有限理性建模综述[J]. 章平,戴燕.  南开经济研究. 2006(03)
[2]进化博弈模型中有限理性个体学习机制设计框架[J]. 赵晗萍,冯允成,蒋家东.  系统工程. 2005(09)
[3]基于价格的消费者信息搜寻过程研究[J]. 汪波,刘凤霞.  天津大学学报(社会科学版). 2005(03)
[4]经济学和认知科学[J]. 道格拉斯·C·诺思,张立波,邢荣.  北京大学学报(哲学社会科学版). 2004(06)



本文编号:2975098

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjifazhanlunwen/2975098.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ceb7c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com