FIT2011 第10回情報科学技術フォーラム
抄録
F-042
複数の目標を持つタスクに対する適格度トレースを用いた強化学習
◎
小野寺道寛・鈴木輝彦・太原育夫(東理大)
現実世界のタスクには,複数の目標を持つものが多くある.目標が複数あるタスクの場合,通常の強化学習アルゴリズムでは所持する情報が多すぎ学習が収束するまで非常に時間がかかったり,メモリが不足し学習自体が不可能になったりする.本論文では,GM-Sarsa(0)に着目し,その学習速度を高速化するための方法として適格度トレースの適用を考え,その効果を実験によって検証した.