20 03 2010 Python machinelearning Tweet
強化学習
Machine Learning: An Algorithmic Perspective (Chapman & Hall/Crc Machine Learning & Patrtern Recognition)
Stephen Marsland
Chapman & Hall / ¥ 6,529 ()
通常2~3週間以内に発送
Stephen Marsland
Chapman & Hall / ¥ 6,529 ()
通常2~3週間以内に発送
- Sarsa Algorithm
- Q-Learning Algorithm
いくつかの問題点も指摘されている。例えば Q学習による理論的保証は値の収束性のみであり収束途中の値には具体的な合理性が認められないため学習途中の結果を近似解として用いにくい、パラメータの変化に敏感でありその調整に多くの手間が必要であるなどがある。