私たちの研究室で取り組んでいる(いた)研究の一部を紹介します.

エージェントグループ

人とエージェント(CGキャラクタやロボット)の自然なインタラクションを通して,言葉の機能的な意味をコンピュータに獲得させようという研究です.左図に示した迷路にいる赤ちゃんエージェントを人間が音声でゴールまで誘導することを考えます.「うえ,うえ,うえ,そうそう,みぎ,いや,ちがう,ちがう」といった感じで赤ちゃんエージェントに話しかけます.とはいっても,「うえ」や「そうそう」といった言葉の(機能的な)意味を赤ちゃんエージェントが最初から知っているわけではありません.「フィッシャーの直接法」という手法を応用することで,「うえ」が「上に行く」という自分の行動と対応しているんだということを赤ちゃんエージェントが自然にわかるようになります.

ヒトの視覚的注意の計算モデルをエージェントに導入し,人と注意を共有することのできるエージェントを実現しようという研究です.左図に示したのは,赤っぽい色に注意を払うモデルの出力で,目の前にある桃色のオブジェクトから右上のより赤いオブジェクトに注意が移ったところです.モデルのパラメータを調整することで,桃色のオブジェクトに注意を払ったまま(集中している状態)にするかどうかが調整できます.そのほかにもパラメータを変化させることで注意の振舞いが様々に変化します.この制御機能を利用して,人と注意に関するやりとりを対話的に行えるロボットを実装し,語意獲得などの研究に援用することを目指しています.

ヒトの脳のように,複雑な行動を複数の機能に分けて学習するモジュール型学習モデルの研究です.左図のように,各機能を果たすモジュールがワーキングメモリを介して繋げられ,強化学習によって入力(外部の状態)と行動との関係を学習します.モジュールの組み合わせによって行動が変化するため,複雑で柔軟な行動を学習することが期待できます.本来,このようなモジュール型モデルは学習時間に問題が生じますが,この研究では人からの教示を組み込むことでこの問題に対応しています.現在は迷路のシミュレーションで研究を行っていますが,将来的には移動ロボットなどに応用することを目指しています.

MMIグループ

ウェブ上のデータとデータの間の意味関係を記述するセマンティックWebという枠組み(技術)を利用して,高度で自然な音声対話システムを構築しようという研究です.左の図は,このアイデアを使った地図検索システムのイメージです.現在のWeb検索では,自然な文章(たとえば,京工繊大に近くて1000円以内でパスタが食べられるイタリアン…とか)では検索できませんし,京都工繊と工繊大が同じものを指すことが分からず検索結果が違ったりします(「表記のゆれ」といいます).セマンティックWebならば,表記のゆれを吸収したり,自然な文章での検索するなどの知的な処理が可能になります.