強化学習
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
2006/08/24(木) 18:55:33ID:D7h3TICi0入門書:
Reinforcement Learning: An Introduction
Richard S. Sutton and Andrew G. Barto
A Bradford Book
The MIT Press
Cambridge, Massachusetts
London, England
ttp://www.cs.ualberta.ca/%7Esutton/book/ebook/the-book.html
0002名無しさん@お腹いっぱい。
2006/08/24(木) 19:15:12ID:D7h3TICi0ttp://citeseer.ifi.unizh.ch/cichosz95fast.html
適格度トレースの計算量を減らすもののようなのですが,
論文を読みましたが何をどう操作するのか理解できず実装できません.
詳しい方がいましたら解説をお願いします.
0003名無しさん@お腹いっぱい。
2006/08/26(土) 04:48:59ID:uabL9ug000004名無しさん@お腹いっぱい。
2006/08/26(土) 15:03:13ID:jF6pHzBq0下手な宣伝打てば板ごと消されかねないし,まったりチラシの裏として
使っていくしか.
で,教科書thx.おもろい論文もキボン
0005名無しさん@お腹いっぱい。
2006/08/28(月) 01:44:27ID:bPH3hnny0Multiagent Systems: A survey from a machine learning perspective.
Autonomous Robots, 8(3):345?, July 2000.
ttp://www.cs.utexas.edu/~pstone/Papers/bib2html-links/MASsurvey.pdf
強化学習にもデータマイニングみたいな面白い応用があればいいのだけれど,
まだ理論的な研究の段階なのか私の寡聞に過ぎないのか,工学的な応用事例が
見付けられません.
0006名無しさん@お腹いっぱい。
2006/09/03(日) 22:59:49ID:RmRwZ+t40どうせ過疎なんだから機械学習全般でスレッド立てたら良かったのに…….
00071
2006/09/04(月) 02:17:04ID:2CCqCT5l0機械学習で作るか強化学習で作るか迷ったのですが,すでにGAや
ニューラルネットの単独スレがあったので.
もう少し育つようなら下のようなリンクをテンプレに持つスレを立てようかと思ってましたが,
どうやら計画倒れのようです.
■□■ 機械学習全般 ■□■
【ニューラルネットワーク】
■ニューラルネットワークについて@シミュレート板
ttp://science4.2ch.net/test/read.cgi/sim/1015733653/
【遺伝的アルゴリズム】
■遺伝的アルゴリズムを学ぼう@シミュレート板
ttp://science4.2ch.net/test/read.cgi/sim/1017102268/
■遺伝アルゴリズム使ってますか?@シミュレート板
ttp://science4.2ch.net/test/read.cgi/sim/960616675/
【強化学習】
■強化学習@情報学板
ttp://science4.2ch.net/test/read.cgi/informatics/1156413333/
【進化型計算】
■進化型計算@情報学板
ttp://science4.2ch.net/test/read.cgi/informatics/1157274058/
0008名無しさん@お腹いっぱい。
2006/09/05(火) 23:02:51ID:3rDcoTAo00009名無しさん@お腹いっぱい。
2006/09/17(日) 00:42:09ID:75+7piY90正直ロボットに対するいわゆるナビゲーションタスク的なものばかりな
気がしているんですが、どう思われますか?
0010名無しさん@お腹いっぱい。
2006/09/17(日) 01:03:49ID:Mih5c51q0AsynchronousなDPなんだから,DPの応用分野で
厳密解を要求されないようなものであれば使えるはず.
■ このスレッドは過去ログ倉庫に格納されています