美文网首页
日更-《模型思维》32

日更-《模型思维》32

作者: liumw1203 | 来源:发表于2023-01-27 07:10 被阅读0次

## 第26章 学习模型

学习模型介于理性选择模型与基于规则的模型之间。

- 理性选择模型假设人们会审慎考虑所处的环境和要完成的博弈,然后采取最优行动;

- 基于规则的模型则直接根据规则来指定行动。

学习模型假设人们会遵循规则,但是,正是这些规则使行为能够发生改变。

- 在某些情况下,行为会趋向最优行为;

- 在这些情况下,也可能生成循环或复杂的动态。

>强化学习模型

假设一个由N个备选方案组成的集合{A,B,C,D,…,N}、与各备选方案对应的奖励的集合{π(A),π(B),π(C),π(D),…,π(N)},以及一个严格为正的权重的集合{w(A),w(B),w(C),w(D),…,w(N)}。那么,选择备选方案K的概率如下:

在选中了备选方案K之后,w(K)会增大γ×P(K)×(π(K)-A),其中γ>0等于调整速率(rate of adjustment),A<maxKπ(K)等于渴望水平。

美国心理学家爱德华桑代克,用实验证明了:奖励比惩罚更有利于学习。

桑代克通过小猫的实验,发现两个规律。

- 第一规律,当小猫完成一个正确的动作后,你讲理的越多,他学的越快;

第二规律,如果你给小猫一个超出预期的奖励,他就学的更快。

相关文章

  • 日更-《模型思维》32

    ## 第26章 学习模型 学习模型介于理性选择模型与基于规则的模型之间。 - 理性选择模型假设人们会审慎考虑所处的...

  • 《深度思维》读书心得(十三)

    日期:2019年2月2日 阅读天数:32天 阅读内容:《深度思维》第五章:生态思维 第四节:衍生模型3:池塘模型 ...

  • 日更-《模型思维》02

    第1章 做一个多模型思考者 模型是对真实世界的抽象。只有抽象的东西,才是属于逻辑世界的。建立了模型,你才能做推演。...

  • 日更-《模型思维》01

    本书作者斯科特·佩奇,他是密西根大学政治学教授。《模型思考》出自佩奇开的一个“模型思维课”,最早是在大学,后来变成...

  • 日更-《模型思维》03

    第2章 模型的7大用途 构建模型的三种方法: 第一种方法是具身法(embodimentapproach)。用这种方...

  • 日更-《模型思维》04

    第3章 多模型思维 孔多塞陪审团定理多数投票正确的概率比任何人(模型)都更高;当人数(模型数)变得足够大时,多数投...

  • 日更-《模型思维》11

    第8章 非线性模型 凸函数的斜率是递增的:函数值随度量值的增加而增加,也是“微笑”曲线,是上凹下凸的图形,英文叫 ...

  • 日更-《模型思维》09

    第7章 线性模型 模型通常假定变量之间存在某种特定的函数关系。这种关系可以是线性的,也可以是非线性的,或者可以包括...

  • 日更-《模型思维》05

    第4章 对人类行为者建模 在每一个模型中,我们都必须对“人”做出假设:他们的目标是什么?他们是只关心自己的利己主义...

  • 日更-《模型思维》06

    第5章 正态分布 大多数物种的高度和重量都满足正态分布,它们围绕着均值对称分布,而且不会包含特别大或特别小的事件。...

网友评论

      本文标题:日更-《模型思维》32

      本文链接:https://www.haomeiwen.com/subject/vymshdtx.html