人間による音声情報処理過程の分析と
それを応用した音声対話インターフェイスの構築

!!English version is under construction.!!

特定領域研究「ITの深化の基盤拓く情報学研究」
研究項目A03 人間の情報処理の理解とその応用に関する研究


研究代表者:峯松 信明 助教授 mine@gavo.t.u-tokyo.ac.jp
東京大学大学院情報理工学系研究科

研究分担者:広瀬 啓吉 教授 hirose@gavo.t.u-tokyo.ac.jp
東京大学大学院新領域創成科学研究科


研究目的

近年の目覚ましい計算機技術の進展に支えられ,大語彙音声認識システムやコー パスベース音声合成システムに代表される音声言語情報処理技術も大きく前進し た。しかし,これらの技術的進展にも拘らず,音声対話システムに対する利用者 からの不満の声は大きい。その原因の一つとして考えられるのが,現対話システ ムは,「場」を理解する能力が非常に貧弱である点であろう。従来の対話システムにおける音声メディアの処理 形式では,入力音声を音声認識システムによって文字化し,文字となった言語情 報を頼りに話者の意図を抽出するものが多い。一方,人と人が対話を行なう場合, 音声中に含まれる非語彙情報(広く解釈すれば「場」の情報)を積極的に利用し, 対話を円滑に遂行する様子が観測される。「場」の情報には,人間の五感に関す る様々なメディアが考えられるが,本研究では,音声・音響情報の一つと考えら れる「話者の年齢情報」及び「話者の精神状態(感情)」の推定とそれに基づく システム応答音声の脚色,及び,話し手・聞き手を取り巻く環境の情報(部屋のレイアウ ト,オブジェクトの配置など)に基づく効率的な対話進行の実現を目指す。


研究計画


関連リンク