トップページinformatics
121コメント45KB

強化学習

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。2006/08/24(木) 18:55:33ID:D7h3TICi0
機械学習の一種,強化学習に関する話題.

入門書:
Reinforcement Learning: An Introduction
Richard S. Sutton and Andrew G. Barto
A Bradford Book

The MIT Press
Cambridge, Massachusetts
London, England
ttp://www.cs.ualberta.ca/%7Esutton/book/ebook/the-book.html
0117名無しさん@お腹いっぱい。2010/07/20(火) 20:44:12ID:e2uKDuJe0
>>116
なるほど、初めは盲目的に全探索(それに近いこと)をして強化学習をするのですね
ありがとうございます、ちょっとやってみます
0118名無しさん@お腹いっぱい。2010/07/21(水) 16:51:38ID:UuoiHKdh0
いやそういうことを言いたいのではなくて。

系統的に全数を探索すれば、n個の選択肢はn回の探索で探索し終わるけど、
単純にランダムで探索してたら、n個の選択肢を全て探索するのにかなりの回数が
かかる、ということ。
0119名無しさん@お腹いっぱい。2010/07/23(金) 11:24:40ID:nLjKlgfR0
単に1回やったルートを除外すればいいだけなのでは?
0120名無しさん@お腹いっぱい。2010/07/23(金) 11:26:39ID:nLjKlgfR0
あ、116に書いてあったわ。ごめん
0121名無しさん@お腹いっぱい。2010/07/24(土) 02:35:11ID:69ixE9nr0
15パズルなら最適解じゃなくていいなら簡単に解けるのだから
まず確実にゆっくり解く関数を作る。
予め上限を決めておいて、それを超える数まで探索したら
その関数を呼んで総手数を評価値として戻す。
■ このスレッドは過去ログ倉庫に格納されています