強化学習

**名無しさん＠お腹いっぱい。** · 2006/08/24(木) 18:55:33

機械学習の一種，強化学習に関する話題．

入門書：
Reinforcement Learning: An Introduction
Richard S. Sutton and Andrew G. Barto
A Bradford Book

The MIT Press
Cambridge, Massachusetts
London, England
ttp://www.cs.ualberta.ca/%7Esutton/book/ebook/the-book.html

**名無しさん＠お腹いっぱい。** · 2010/07/20(火) 20:44:12

>>116
なるほど、初めは盲目的に全探索（それに近いこと）をして強化学習をするのですね
ありがとうございます、ちょっとやってみます

**名無しさん＠お腹いっぱい。** · 2010/07/21(水) 16:51:38

いやそういうことを言いたいのではなくて。

系統的に全数を探索すれば、n個の選択肢はn回の探索で探索し終わるけど、
単純にランダムで探索してたら、n個の選択肢を全て探索するのにかなりの回数が
かかる、ということ。

**名無しさん＠お腹いっぱい。** · 2010/07/23(金) 11:24:40

単に1回やったルートを除外すればいいだけなのでは？

**名無しさん＠お腹いっぱい。** · 2010/07/23(金) 11:26:39

あ、116に書いてあったわ。ごめん

**名無しさん＠お腹いっぱい。** · 2010/07/24(土) 02:35:11

15パズルなら最適解じゃなくていいなら簡単に解けるのだから
まず確実にゆっくり解く関数を作る。
予め上限を決めておいて、それを超える数まで探索したら
その関数を呼んで総手数を評価値として戻す。