♪本授業の狙い
- スマホやスマートスピーカーで広く使われるようになった音声認識や音声合成の技術(音声言語処理技術),更には,INTERNET のテキスト検索で広く使われるようになったテキスト解析の技術(自然言語処理技術)について,それらの基礎を学ぶ。これらの技術では,様々な機械学習アルゴリズムが用いられており,それらの応用と位置づけられる。2018年度の授業から,深層学習に基づく音声処理,言語処理についても扱っている。
- シラバス(音声言語処理)
- 音声の音響的分析の「いろは」(イントロ)
- 音声の音響的分析とそのモデル
- 音声の認識とそのモデル
- 音声の合成とそのモデル
- シラバス(自然言語処理)
- 前提とする知識
♪本授業で使用する教科書
- 音声言語処理と自然言語処理(コロナ社)
- 音声言語処理と自然言語処理を一冊の教科書にまとめた例は非常に少ない。その意味でお得。
- 本教科書をしっかり使うので購入することを,非常に,強く勧める。
- 毎回の授業の前に,当日授業で扱う部分に目を通しておくことを,強く勧める。
- 読めば分かることは,スキップする可能性が高い。
♪成績について
- 期末テスト点数+出席点,でつける。
- 1限のため,寒くなると人数的に寂しくなることが予想されるが,出席点をつけているので,是非聴講しましょう。
♪LECTURE-1
- いきなり宿題を出します。
- 人文系大学院授業(但し受講生の半数は,非電気系の工学系研究科院生)「音響音声学」をビデオ視聴の形式で(U-STREAM)提供しています。
- 第2回目の講義が(音声学会ビギナーズセミナー)「音声の音響分析のいろは・拡張版」です。
- この2回目の講義(約2時間)を視聴し,以下について回答して下さい。
- ビデオ視聴。スライド資料。ビデオ視聴のパスワードは hon5campus です。
- 宿題
- 上記講義は,ビギナーズセミナーであり,つっこみ所は結構,沢山ある。
- 説明を省いているのではないか,誤解されるのではないか,と思われる箇所を指摘し,文書化してメールで提出して下さい。
- なお,説明を省いている箇所の幾つかは,「音声を対象とするから(積極的に)省いている」箇所もある。
- 上記で指摘した箇所に関して,何故その部分は説明を甘くしてもよいと思われるのか,についても言及して下さい。
- 文書の中に,所属学科,学籍番号,氏名を明示すること。
- 提出先:mine _AT_ gavo.t.u-tokyo.ac.jp, 〆切:週末の日曜日の23:59
- 以下,非電気系学生で本講義を受講している学生むけ
♪LECTURE-2
♪LECTURE-3
♪LECTURE-4
♪LECTURE-5
- HMMのパラメータ推定のキモ(観測量 o_t がどの状態から出力されたのかは一意には決まらないが,どの状態からの出力なのか,その確率は推定できる。それを使った期待値計算へとなる)。
♪LECTURE-6
♪LECTURE-7
♪LECTURE-8
♪LECTURE-9
♪LECTURE-10
♪LECTURE-11
- フレーム問題の易しい解説はここ。ある行動を行なう場合に,注意しなければいけない事項としてどこまでの範囲,枠組み(フレーム)を設定しなければいけないのか,日常生活では,一般にそれは明示的には示されません。プログラムの通りにしか動けない計算機に対して,プログラマはフレームを明確に定義する必要がありますが,通常,我々が日常生活を送る上で,どこまでの範囲を意識的・無意識的に考慮して行動しているのか,簡単には答えられないですよね。言い換えれば,それと気付くことなく,様々な外界からの情報を「無視」している,とも言えます。
- 無視できないと,様々な情報を円滑に処理できなくなる「情報の便秘」状態になります。全ての可能性を考え,あーでもない,こーでもない,と判断できなくなります。発達障害の一つである自閉症の方の中には,そういう状況から抜け出せない方もいます。興味のある人は下記の本などが参考になるでしょう。
- POMDP のオリジナル論文はこれ
♪LECTURE-12