強化学習
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
2006/08/24(木) 18:55:33ID:D7h3TICi0入門書:
Reinforcement Learning: An Introduction
Richard S. Sutton and Andrew G. Barto
A Bradford Book
The MIT Press
Cambridge, Massachusetts
London, England
ttp://www.cs.ualberta.ca/%7Esutton/book/ebook/the-book.html
0117名無しさん@お腹いっぱい。
2010/07/20(火) 20:44:12ID:e2uKDuJe0なるほど、初めは盲目的に全探索(それに近いこと)をして強化学習をするのですね
ありがとうございます、ちょっとやってみます
0118名無しさん@お腹いっぱい。
2010/07/21(水) 16:51:38ID:UuoiHKdh0系統的に全数を探索すれば、n個の選択肢はn回の探索で探索し終わるけど、
単純にランダムで探索してたら、n個の選択肢を全て探索するのにかなりの回数が
かかる、ということ。
0119名無しさん@お腹いっぱい。
2010/07/23(金) 11:24:40ID:nLjKlgfR00120名無しさん@お腹いっぱい。
2010/07/23(金) 11:26:39ID:nLjKlgfR00121名無しさん@お腹いっぱい。
2010/07/24(土) 02:35:11ID:69ixE9nr0まず確実にゆっくり解く関数を作る。
予め上限を決めておいて、それを超える数まで探索したら
その関数を呼んで総手数を評価値として戻す。
■ このスレッドは過去ログ倉庫に格納されています