♪本授業の狙い
- スマホやスマートスピーカーで広く使われるようになった音声認識や音声合成の技術(音声言語処理技術),更には,INTERNET のテキスト検索で広く使われるようになったテキスト解析の技術(自然言語処理技術)について,それらの基礎を学ぶ。これらの技術では,様々な機械学習アルゴリズムが用いられており,それらの応用と位置づけられる。2018年度の授業から,深層学習に基づく音声処理,言語処理についても扱っている。NNによる処理系はよくブラックボックスと言われるが,中身のメカニズムを分かりやすく解説する。
- シラバス(音声言語処理)
- 音声の音響的分析の「いろは」(イントロ)
- 音声の音響的分析とそのモデル
- 音声の認識とそのモデル
- 音声の合成とそのモデル
- シラバス(自然言語処理)
- 前提とする知識
♪本授業で使用する教科書
- 音声言語処理と自然言語処理(コロナ社)
- 音声言語処理と自然言語処理を一冊の教科書にまとめた例は非常に少ない。その意味でお得。
- 本教科書をしっかり使うので購入することを,強く勧める。
- 本授業はハイブリッドで行います。履修学生の多くは,3年前期に信号処理工学を受講した学生なのだと思います。信号処理工学では,241講義室から教室のプロジェクタ,及び,Zoom を使ってハイブリッド配信しました。本授業でも同様の方法をとりますが,板書はあまりしません。逆に,教科書をみっちり使いますので,教科書を購入してください(峯松は執筆者の一人)。教科書に書ききれなかった内容など,行間を埋めるような,DVD の「オーディオコメンタリ」的な解説をする予定です。なので,事前にざっくり読んできてもらうと理解が早いかと思います。
- 毎回の授業の前に,当日授業で扱う部分に目を通しておくことを,強く勧める。
- 読めば分かることは,スキップする可能性が高い。
♪成績・出席について
- 期末テスト点数+出席点,でつける。
- 出席は ITC-LMS と,241講義室では出欠表を配ってとっている。ITC-LMS は9時以降の出血は遅刻扱いになるので,注意。
♪LECTURE-1
♪LECTURE-2
♪LECTURE-3
♪LECTURE-4
♪LECTURE-5
- HMMのパラメータ推定のキモ(観測量 o_t がどの状態から出力されたのかは一意には決まらないが,どの状態からの出力なのか,その確率は推定できる。それを使った期待値計算へとなる)。
♪LECTURE-6
♪LECTURE-7
♪LECTURE-8
♪LECTURE-9
♪LECTURE-10
♪LECTURE-11
- フレーム問題の易しい解説はここ。ある行動を行なう場合に,注意しなければいけない事項としてどこまでの範囲,枠組み(フレーム)を設定しなければいけないのか,日常生活では,一般にそれは明示的には示されません。プログラムの通りにしか動けない計算機に対して,プログラマはフレームを明確に定義する必要がありますが,通常,我々が日常生活を送る上で,どこまでの範囲を意識的・無意識的に考慮して行動しているのか,簡単には答えられないですよね。言い換えれば,それと気付くことなく,様々な外界からの情報を「無視」している,とも言えます。
- 無視できないと,様々な情報を円滑に処理できなくなる「情報の便秘」状態になります。全ての可能性を考え,あーでもない,こーでもない,と判断できなくなります。発達障害の一つである自閉症の方の中には,そういう状況から抜け出せない方もいます。興味のある人は下記の本などが参考になるでしょう。
- POMDP のオリジナル論文はこれ
♪LECTURE-12