Ryukoku University
Faculty of Science and Technology
Department of Electronics and Informatics
Wataru UEMURA
Sitemap

Main Menu
矢印メインメニュー
矢印ログイン
ユーザ名:

パスワード:


パスワード紛失

新規登録
Informatiom

理工ジャーナル-「人工知能」の研究とは?: 強化学習  
執筆者: wataru
発行日付: 2006/12/14
閲覧数: 2239
サイズは 1019 バイト
印刷用ページ 友達に教える
 
私が着目した研究は,「強化学習」と呼ばれる分野です.強化学習とは,学習者であるエージェントが,試行錯誤を繰り返し,目標状態(=ゴール)に到達した経験を基に,今までの行動選択が正しかったかどうかを判断し,強化する方法です.例えば,ロボットの入力センサーから得られる離散情報を状態とし,その状態において選択できる行動群の中から一つを選択し(=状態における行動をルールと言います),実行することでロボットが移動したりして状態が変化するという枠組みです.このときの,各状態において,どのルールを選択するかという選択方法(=政策もしくは方策と言います)が,賢さを決めます.

現実世界での動作を考えると,行動を実行した際に,必ずしも同一の状態変化を期待できない場合もあります.その場合は,確率的な状態遷移となります.簡単なモデルとしては,状態遷移が決定的な場合となります.将棋やオセロゲームといったように,盤の駒の配置を状態とし,次にどの手を指すかが行動となる場合です.ある盤の状態で,決まった手を指せば,次の盤の状態は必ず同一です.このような簡単な場合でも,問題空間は大きくなり,最善手を知ることができない問題となります.
 
評価された記事: 0.00 (0 件の投票)
このファイルの評価
カテゴリに戻る | カテゴリの一覧に戻る




Powered by XOOPS Cube 2.0 © 2005-2006 The XOOPS Project