Ryukoku University
Faculty of Science and Technology
Department of Electronics and Informatics
Wataru UEMURA
Sitemap

Main Menu
矢印メインメニュー
矢印ログイン
ユーザ名:

パスワード:


パスワード紛失

新規登録
Informatiom

理工ジャーナル-「人工知能」の研究とは?: 人間らしい特徴  
執筆者: wataru
発行日付: 2006/12/14
閲覧数: 1729
サイズは 2.84 KB
印刷用ページ 友達に教える
 
さて,ここで,Profit Sharing法の持つ学習の性質を,「人間らしさ」という観点で見てみます.今現在,私が気づいている「人間らしさ」は,三点あります.

まず,一点目は最適解の学習が保証されない点です.最適性がある学習方法が存在する中で,最適性がないという特徴は,工学的にはデメリットです.しかし,「自律した人工知能」を考えるとき,この特徴は,かなり興味深いものとなります.計算機は,指示されたとおりにしか実行しません.
融通が利かないかわり,正確な解をだす能力を持っています.このような正確無比な計算機において,解を導出する際に,最適解よりも,そこそこの解を導出するというのは,聞いたことがありません*.計算機が,「曖昧さ」を持つことができるのです.どことなく,「人工知能」の実現の糸口が見えてきませんか?

二点目の「人間らしさ」は,「素早い学習」です.先ほどの最適解の学習が保証されない点と関連しますが,最適性を保証するためには,全パターンを知る必要があります.そのため,組み合わせが大きくなり状態空間が爆発すると,実時間では最適な解を計算できなくなります.しかし,Profit Sharing法では,過去の経験に基づいて行動を選択します.
今までに報酬を獲得できた行動を優先して選択するため,安定して報酬を獲得し続けることができます.結果として,学習の立ち上がりが早くなります.

そして,最近着目している三つ目の特徴は「報酬の期待値に合わない行動選択をする」ことです.この特徴も,工学的にはデメリットです.期待値に合わない行動選択をするため,性能評価的には悪い結果となります.原因は,Profit Sharing法では,報酬獲得時にのみ学習作業をするため,小さい確率で大きな報酬を得られる行動を学習初期に経験すると,その後の行動選択に大きな影響を与えます.例えば,最初の学習時に,p の確率で起こる状態遷移を経験したとします.Profit Sharing法では,過去の経験にのみ目を向けるため,自分の中では,1/1 の確率でその事象が起こっています.p が 1/10 であろうと,1/100 であろうと,起こった出来事であるため,違いがわからないのです.実は人間も,同様の計算ミスをすることがあります.競馬やパチンコといったギャンブルは,胴元が儲かっていることより,明らかに参加者の期待値はマイナスです.特に宝くじに関しては,参加者の実力の関係する要因がなく,全員平等に期待値がマイナスのゲームです.期待値が明らかにマイナスとわかっていながら,購入します.数学的には,説明がつかない行動選択です.「曖昧さ」を持つ「人工知能」の実現を考えると,この特徴は面白い特徴だと思います.しかし,実用化においては,活かすのが難しく,不要な特徴です.

以上のように,Profit Sharing法には,現段階で私が気づいているだけでも,三点の人間らしい曖昧さを持っています.そして残念ながら,工学的にはデメリットです.おそらくこれ以外にも,人間らしさを持っているとにらんでいます.今後は,それらを見つけ出すとともに,「人工知能」の実現の糸口として,提案していくことを考えています.

*山登り法なども,最適性を持たず,局所解へ収束する解法です.しかし,知的な作業の結果ではないので,私の中では単純に局所解にたどり着く手法は,「曖昧さ」を持つ手法に属していません.
 
評価された記事: 0.00 (0 件の投票)
このファイルの評価
カテゴリに戻る | カテゴリの一覧に戻る




Powered by XOOPS Cube 2.0 © 2005-2006 The XOOPS Project