中国語学習者の発音評定に関する注意書き




本 web ページは,東京大学大学院情報理工学研究科電子情報学専攻峯松研究室で行われている外国語発音の自動評定技術の構築に必要な,語学教師・音声学者による発音評定作業に関する情報を提供しています。

現在,日本語を母語とする中国語学習者を対象として読み上げ音声の音声収録を行なうと同時に,各学習者の発音習熟度(pronunciation proficiency)に関する評定ラベリングを行なっています。下記に,作業内容について示します。ご協力頂ける場合は,是非,峯松研中国語発音評価チームまでご連絡下さい。




発音評定とその自動化に関して

学習者が発声した音声資料に対して,それを自動的に評定する技術は大きく二つに分けられます。一つ目は,各発声のどこに発音の誤りが存在するのかを自動的に検出し,教示するための技術です。もう一つは,幾つかの文を読み上げさせ,その発声よりその学習者の発音習熟度を自動的に推定し,提示する技術です。前者は学習者の日々の学習(独習)を助ける技術であり,後者は,学習者を分類する作業(例えば発音試験において,学習者をA/B/Cランクのいずれかに分類するなど)を助ける技術となります。
前者の技術を構築する場合,学習者の各音声に対して,どこに,どのような誤りがあるのか,を語学教師や音声学者が細かくラベリングした学習者音声コーパスが必要になります。一方後者は,学習者音声に対して「その学生は発音習熟度85点」のような学習者単位でのラベリングが必要になります。現在,検討しているのは後者の技術開発であり,語学教師や音声学者に,発音習熟度を学習者単位で与えてもらう必要があります。




現在収録している音声資料

現在,こちらのページで学習者音声の収録を行なっています。まずはこちらをご覧下さい。予定では,20〜30名の学習者音声が集まることになっています。




学習者単位での発音習熟度ラベリング

全学習者によって読み上げられた同一の共通の文セットがあった方が評定し易いと思われますので,音声収録は(各学習者のレベルにあった文セットを用意していますが),学習者のレベルに因らず,初級,及び,中級の文セット(の一部)は必ず読んでもらおうと思っています。評価作業ですが,凡そ下記のような手順になります。

  1. 評価ラベリングに使う音声資料とスコアシート(excelファイル)をダウンロードして頂きます。音声資料はWAV形式のファイルとして提供し,また,音声聴取のためのWEBインタフェースも提供する予定です。
  2. 共通文セットの最初の数文を全学習者を通して聞いていただきます。最終的には5段階評価してもらいますが,どのような発音が5で,どのような発音が1なのか,先生ご自身でモデル構築して頂きます。今回の作業では,こちらから「これが5の発音です」「これが2の発音です」という例は提示致しません。なお,学習者音声の中にはバイリンガルも含まれています。
  3. 共通文セットを再度,学習者単位で聞いていただき,学習者単位で5段階評価して頂きます。結果はスコアシートに記入して頂き,それをメールにて送付してもらうことになります。メールの宛先は峯松研中国語発音評価チーム(峯松,趙,王)となります。



評定作業の開始時期と〆切

ある程度学習者音声が集まってから評定作業に入って頂きますので,予定としては,連休明けに音声データやスコアシートをお渡しすることになります。なお,〆切は5/16(月)とさせて頂きます。




お支払いする謝金

評定者にお支払いするのは,評定作業に対する謝金となります。謝金は,時給5,000円として,実際にかかった時間に対して支払われます。なお,謝金の時給は文科省で定められた額となっています。
なお,タスクは学習者の5段階評価です。適切な難度を有する文を5文ほど聞けば,その学生の発音習熟度は推定できるのでは,と思っています。ですので,一学習者あたり2分として,全体で一時間ほどの作業になるかと思っています。




その他の情報

連絡先1:メールでの連絡は,峯松研中国語発音評価チーム(峯松,趙,王)までお願いします。なお,連絡時に使える言語は,峯松:日本語,英語,趙:中国語,英語,王:中国語,日本語,英語,となります。
連絡先2:電話での連絡は下記までお願いします。
 峯松研究室(趙&王):03-5841-6393
 峯松教員室(峯松) :03-5841-6662
 メールで連絡頂ければ,携帯番号をお伝えします。携帯の方が連絡は確実です。