美文网首页
Q Learning

Q Learning

作者: 我是传奇lz | 来源:发表于2019-01-12 20:24 被阅读14次

强化学习就是用多次的尝试, 不断更新自己的经验库

Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。

注意名词:
state, action, learning rate, discount ratio.

相关文章

  • 实战深度强化学习DQN-理论和实践

    1、Q-learning回顾 Q-learning 的 算法过程如下图所示: 在Q-learning中,我们维护一...

  • RL[0] - 初见

    结构 背景 Q-Learning with table Q-Learning with network 后记 背景...

  • 莫烦强化学习笔记2- Q Learning

    Q-learning 决策: 根据Q表,选择reward较大的action. Q-learning 更新: 代码如下

  • 【5分钟 Paper】Deep Reinforcement Le

    论文题目:Deep Reinforcement Learning with Double Q-learning 所...

  • Q Learning

    强化学习就是用多次的尝试, 不断更新自己的经验库 Q learning 就是强化学习中的一种更新经验库的方法。把一...

  • RL

    Q-learning Sarsa Sara-lambda

  • 强化学习之Sarsa

    在强化学习中,Sarsa和Q-Learning很类似,本次内容将会基于之前所讲的Q-Learning的内容。 目录...

  • [Chapter 5] Reinforcement Learni

    Function Approximation While we are learning the Q-functi...

  • Q-learning

    一、介绍 Q-learning 算法本质上是在求解函数Q(s,a). 如下图,根据状态s和动作a, 得出在状态s下...

  • Q-learning

    今天,来说说q-learning.在我最近学习机相关资料后.首先关于q-learning 是一个马尔科夫决策的过程...

网友评论

      本文标题:Q Learning

      本文链接:https://www.haomeiwen.com/subject/lzgcdqtx.html