强化学习就是用多次的尝试, 不断更新自己的经验库
Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。
注意名词:
state, action, learning rate, discount ratio.
Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。
注意名词:
state, action, learning rate, discount ratio.
本文标题:Q Learning
本文链接:https://www.haomeiwen.com/subject/lzgcdqtx.html
网友评论