音響音声学

♪本授業の狙い

スマホやスマートスピーカーで広く使われるようになった音声認識や音声合成の技術（音声言語処理技術），更には，INTERNET のテキスト検索で広く使われるようになったテキスト解析の技術（自然言語処理技術）について，それらの基礎を学ぶ。これらの技術では，様々な機械学習アルゴリズムが用いられており，それらの応用と位置づけられる。2018年度の授業から，深層学習に基づく音声処理，言語処理についても扱っている。
シラバス（音声言語処理）
- 音声の音響的分析の「いろは」（イントロ）
- 音声の音響的分析とそのモデル
- 音声の認識とそのモデル
- 音声の合成とそのモデル
シラバス（自然言語処理）
- 形態素解析
- 構文解析
- 意味解析
- 文脈解析
前提とする知識
- 信号処理
- 統計解析
- プログラミング

♪本授業で使用する教科書

♪成績について

♪LECTURE-1

♪LECTURE-2

♪LECTURE-3

♪LECTURE-4

♪LECTURE-5

HMMのパラメータ推定のキモ（観測量 o_t がどの状態から出力されたのかは一意には決まらないが，どの状態からの出力なのか，その確率は推定できる。それを使った期待値計算へとなる）。

♪LECTURE-6

♪LECTURE-7

OJAD講習会スライド（一部）
音声合成用 JEITA フォーマット
OJAD で入力文の JEITA 表記を表示させる方法
　ここをクリックし，JEITA ラベルの表示を ON にして，実行 → 作成，とクリックし，下の方にスクロールして下さい。
HMM音声合成用音響モデルの構築（VoiceMaker-1.1）

♪LECTURE-8

♪LECTURE-9

♪LECTURE-10

♪LECTURE-11

フレーム問題の易しい解説はここ。ある行動を行なう場合に，注意しなければいけない事項としてどこまでの範囲，枠組み（フレーム）を設定しなければいけないのか，日常生活では，一般にそれは明示的には示されません。プログラムの通りにしか動けない計算機に対して，プログラマはフレームを明確に定義する必要がありますが，通常，我々が日常生活を送る上で，どこまでの範囲を意識的・無意識的に考慮して行動しているのか，簡単には答えられないですよね。言い換えれば，それと気付くことなく，様々な外界からの情報を「無視」している，とも言えます。
無視できないと，様々な情報を円滑に処理できなくなる「情報の便秘」状態になります。全ての可能性を考え，あーでもない，こーでもない，と判断できなくなります。発達障害の一つである自閉症の方の中には，そういう状況から抜け出せない方もいます。興味のある人は下記の本などが参考になるでしょう。
- 「スルーできない脳。自閉は情報の便秘です。」
- 「発達障害／当事者研究」
POMDP のオリジナル論文はこれ

♪LECTURE-12