トップページinformatics
121コメント45KB

強化学習

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。2006/08/24(木) 18:55:33ID:D7h3TICi0
機械学習の一種,強化学習に関する話題.

入門書:
Reinforcement Learning: An Introduction
Richard S. Sutton and Andrew G. Barto
A Bradford Book

The MIT Press
Cambridge, Massachusetts
London, England
ttp://www.cs.ualberta.ca/%7Esutton/book/ebook/the-book.html
0002名無しさん@お腹いっぱい。2006/08/24(木) 19:15:12ID:D7h3TICi0
Truncated Temporal Differences を試した方いますか?

ttp://citeseer.ifi.unizh.ch/cichosz95fast.html

適格度トレースの計算量を減らすもののようなのですが,
論文を読みましたが何をどう操作するのか理解できず実装できません.
詳しい方がいましたら解説をお願いします.
0003名無しさん@お腹いっぱい。2006/08/26(土) 04:48:59ID:uabL9ug00
強化学習は人気薄なのか...
0004名無しさん@お腹いっぱい。2006/08/26(土) 15:03:13ID:jF6pHzBq0
というか,まだしばらくこの板は過疎り続けると思われ
下手な宣伝打てば板ごと消されかねないし,まったりチラシの裏として
使っていくしか.

で,教科書thx.おもろい論文もキボン
0005名無しさん@お腹いっぱい。2006/08/28(月) 01:44:27ID:bPH3hnny0
マルチエージェント学習に興味があるので,RoboCup Soccerで活躍されてる Stone さんの Survey を紹介します.

 Multiagent Systems: A survey from a machine learning perspective.
 Autonomous Robots, 8(3):345?, July 2000.
 ttp://www.cs.utexas.edu/~pstone/Papers/bib2html-links/MASsurvey.pdf

強化学習にもデータマイニングみたいな面白い応用があればいいのだけれど,
まだ理論的な研究の段階なのか私の寡聞に過ぎないのか,工学的な応用事例が
見付けられません.
0006名無しさん@お腹いっぱい。2006/09/03(日) 22:59:49ID:RmRwZ+t40
あ〜,強化学習のみのスレッドがあるのか.
どうせ過疎なんだから機械学習全般でスレッド立てたら良かったのに…….
000712006/09/04(月) 02:17:04ID:2CCqCT5l0
>>6
機械学習で作るか強化学習で作るか迷ったのですが,すでにGAや
ニューラルネットの単独スレがあったので.

もう少し育つようなら下のようなリンクをテンプレに持つスレを立てようかと思ってましたが,
どうやら計画倒れのようです.

■□■ 機械学習全般 ■□■

【ニューラルネットワーク】
 ■ニューラルネットワークについて@シミュレート板
  ttp://science4.2ch.net/test/read.cgi/sim/1015733653/

【遺伝的アルゴリズム】
 ■遺伝的アルゴリズムを学ぼう@シミュレート板
  ttp://science4.2ch.net/test/read.cgi/sim/1017102268/
 ■遺伝アルゴリズム使ってますか?@シミュレート板
  ttp://science4.2ch.net/test/read.cgi/sim/960616675/

【強化学習】
 ■強化学習@情報学板
  ttp://science4.2ch.net/test/read.cgi/informatics/1156413333/

【進化型計算】
 ■進化型計算@情報学板
  ttp://science4.2ch.net/test/read.cgi/informatics/1157274058/
0008名無しさん@お腹いっぱい。2006/09/05(火) 23:02:51ID:3rDcoTAo0
あげ
0009名無しさん@お腹いっぱい。2006/09/17(日) 00:42:09ID:75+7piY90
強化学習の応用製品ってどんなのがあるんでしょうか?
正直ロボットに対するいわゆるナビゲーションタスク的なものばかりな
気がしているんですが、どう思われますか?
0010名無しさん@お腹いっぱい。2006/09/17(日) 01:03:49ID:Mih5c51q0
>>9
AsynchronousなDPなんだから,DPの応用分野で
厳密解を要求されないようなものであれば使えるはず.
■ このスレッドは過去ログ倉庫に格納されています