• japan
  • english
  • indonesia
  • korean
  • china
  • china
  • vietnamese
  • deutsch
  • russian
  • thailand
  • polski
  • spanish
  • swedish
  • swedish
  • italian
  • french

テキスト読み上げに
ついての詳細

음성출력의 서포트에 관하여

スズキクンでは音声出力をサポートしています。幾つかの文章を用意しました。アクセント句境界推定=機械学習/文節,の両方で音声を聞いてみて下さい。下記のページでは,ピッチパタン,アクセント共に上級者用のものが表示されます(初級者用に変更しても,音声は上級者の韻律で出力されます)。無声化すべきモーラは網かけしています。

문장예 1(구경계 = 기계학습구경계 = 문절
문장예 2(구경계 = 기계학습구경계 = 문절
문장 예 3(구경계 = 기계학습구경계 = 문절
문장 예 4(구경계 = 기계학습구경계 = 문절
문장 예 5(구경계 = 기계학습구경계 = 문절
문장 예 6(구경계 = 기계학습구경계 = 문절
문장 예 7(구경계 = 기계학습구경계 = 문절
문장 예 8(구경계 = 기계학습구경계 = 문절
문장 예 9(구경계 = 기계학습구경계 = 문절
문장 예 10(구경계 = 기계학습구경계 = 문절
문장 예 11(구경계 = 기계학습구경계 = 문절
文章例12(구경계 = 기계학습구경계 = 문절

악센트구 경계추정 (기계학습 / 문절) 에 관해서

OJAD 강연회에서 설명하고 있습니다만, 악센트제어 (단어가 LH (low high) 로 시작될 경우, 악센트는 H 가 계속되고, 단어가 HL (high low) 일 경우, 악센트는 L 이 계속되는 악센트 법칙) 가 적용되는 단어의 악센트구라고 합니다. 일본어의 경우, 악센트구가 발성 스타일에 따라서, 짧아지거나, 길어지거나 합니다.

「기계학습에 따른 악센트구의 경계추정」이란, 수천개의 문장에 적용됩니다. 자연스러운 발화속도로 문장을 읽는 것을 전제로 하여, 악센트구경계데이터를 사용하여, 임의의 문장을 대상으로 악센트구경계를 추정하는 모드입니다. 이경우, 기계학습에의해, 적절한 악센트구를 추정하게 되지만, 악센트구경계의 위치추정 및 악센트 핵 위치추정이 틀릴경우도 있습니다. 반면에, 가장 짧은 악센트구는 문절이 됩니다. 문절의 경계는 추정이 간단합니다. 그렇기 때문에, [문절= 악센트구] 로 지정을 하는 모드가 「문절을 이용한 악센트구」입니다. 추정오류는 기계학습할 경우 조금은 오류가 작아지지만, 문장안에 있는 악센트 핵의 수는 최대화됩니다.

어떤 모드라도, 추정결과에 대해 악센트구를 연결하여, 각 구 (phrase) 를 하나로 연결한 것이, 「피치패턴=초급자」「악센트=초급자」모드입니다 (단, 3모라 이상의 1형 악센트(어두형) 구의 경우는 추정한 결과 그대로를 반영합니다). 악센트구를 그대로 연결할 경우, 원칙적으로는 에러가 발생하지 않습니다. 그렇기 때문에, 초급자 모드에서는 기계학습으로 나온결과나 문절을 나누어서 나온결과가 크게 다르지 않습니다.

합성음성의 발화의 자연스러움을 고려하여 학습을 원하는 경우, 전자 (前者) 를 추천합니다. 활용이나, 단어접속에 따른 악센트 결합을 학습하고 싶으신 경우라면, 후자(後者) 를 추전합니다.

기계학습과 문절의 차이를 나타낸 예 (구경계를 기계학습으로 자른 경우)
기계학습과 문절의 차이를 나타낸 예 (구경계를 문절로 자른 경우)

話者と話速の制御について

スズキクンでは音声合成時に,話者,話速を指定できますが,これらは音声合成時の「デフォルト話者」「デフォルト話速」として機能しており,テキスト読み上げにおいて,途中で話者や話速を変えることができます。

即ち,入力するテキストに,話者や話速を変えるコマンドを埋め込むことができます。コマンド行は,"//"(全角でもよい)で始めます。

// [話者]
// [話速]
// [話者]  [話速]

が可能です。なお,

// [話速]  [話者]

はできません。以下,具体的に例を示します。

// M2

話者を M2 に変更。

// S

話速を S (slow) に変更。

// F2 F

話者を F2 に,話速を F(fast) に変更。なお,大文字/小文字,全角/半角は区別しません。

[話者] = F1, F2, M1, or M2
[話速] = F, N, or S
(それぞれ,fast, normal, slow を意味します)

先生と学生の会話の例(句境界=機械学習)
先生と学生の会話の例(句境界=文節)

스즈키군의 약점에 대해서

스즈키군은 점차 개선되고 있습니다만, 아직도 약점이 있습니다. 다음과 같은 약점이 있음을 숙지하고 이해해주시길 바랍니다.

1. 악센트 추정 에러에 관해서

1-1) 히라가나로 표기된 표현에 대해서

히라가나로 표기하면 단어경계의 검출이나, 데이터 안의 단어를 검색을 할때 문제가 생깁니다 (예를들면, 동음이의어의 구분). 그 결과, 의도하지 않은 단어가 검색될 경우가 있습니다.

히라가나로 추정했을 때와 한자로 추정했을때의 결과가 다른 예 (경계구를 기계학습으로 했을 경우)
히라가나로 추정했을 때와 한자로 추정했을때의 결과가 다른 예 (경계구를 문절로 했을 경우)

1-2) 한자가 사용되고 있는 표현에 대해서

한자를 사용해도, 악센트경계구의 추정이나, 악센트의 핵위치가 틀릴 경우가 있습니다. 특히, 명사와 명사가 결합해 만들어진, 복합명사의 표현을 자주 틀립니다.

한자가나를 섞어쓰는 문장의 추정을 틀리는 경우 (경계구를 기계학습으로 했을 경우)
한자와 가나를 섞어쓰는 문장의 추정을 틀리는 경우 (경계구를 문절로 했을 경우)

1-3) 미지어 (未知語) 의 악센트에 대해서,

형태소분석의 결과, 미지어(未知語) 의 악센트를 추정할 경우, 악센트부여 원칙에 따라 악센트핵 위치를 정하지만, 추정하고 싶은 표현이 미지어일 경우 (예를들면, 유학생의 이름), 악센트 원칙를 원리대로 따르지 못하는 경우가 있습니다.

미지어의 올바른 분석의 예와 틀린 분석의 예 (경계구를 기계학습으로 했을 경우)
미지어에 관한 올바른 분석의 예와 잘못된 분석의 예 (경계구가 문절일경우)

2. 읽는방법 추정 에러에 대해서

2-1) 문맥에 의존해 읽는 방법이 변하는 어

스즈키군은, 문맥에 의존해 읽는 방법이 달라지는 단어를 잘 못 인식합니다. 이것은 음(音) 독/훈 (訓) 독의 애매함이 아닙니다. 기본적으로, 여러가지의 훈독이 있을 경우을 말합니다. 악센트핵 위치추정의 에러는 피치에디터로 수정하고 있지만, 읽는방법의 수정은 제공하고 있지 않습니다. 히라가나로 입력해 주십시오.

여러개의 훈독이 있는 경우의 예 (경계구가 기계학습일 경우)
여러개의 훈독이 있는 경우의 예 (경계구가 문절일 경우)

2-2) 수사 + 조수사

新スズキクンでは,数表現はかなり読めるようになりました。記号(#$%&=~@+〒¥£)も同様,読めます。ですが,数詞に助数詞が続く表現(数詞+助数詞)はまだ誤ることがあります。助数詞は,読みやアクセントが文脈に依存する典型例です。一本,二本,三本・・・一日,二日,三日・・・などです。数詞+助数詞の読み方は基本的に,形態素解析が出力する読みを後処理することで対応していますが,精度は不十分です。

多様な数表現や記号表現の例(間違う場合あり。句境界=機械学習)
多様な数表現や記号表現の例(間違う場合あり。句境界=文節)

3. 의미의 애매성과 인토네이션의 제어에 대해서

木のしたで雨宿りをしている女性を眺めた。
木のしたで,雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を,眺めた。

「木のしたで」라는 표현이 어디를 수식하는지에 따라서, 인토네이션 패턴은 조금씩 달라집니다. 각각의 구가 어디를 수식하는지를 적절한 콤마 (,) 를 넣어, 명시적으로 인토네이션을 지정해 주셔야 합니다.

雨宿り의 예(경계구가 기계학습일 경우)
雨宿り의 예(경계구가 문절일 경우)

きれいじゃない。

これは「きれいであることを感嘆する」場合も,「きれいではないことを主張する」場合も使う表現です。両者の違いはイントネーションの違いです。スズキクンは上記の文がどちらに解釈されるべきなのか,を前後のコンテキストから推定する,などといったことは出来ません。文単位で(前後の文とは独立に)読み上げるだけです。なので,このような高度なイントネーション制御を目的としたテキストを入力することは推薦できません。「出来ない」ものとお考えください(ピッチエディターで修正することは可能です)。

きれいじゃない例(句境界=機械学習)
きれいじゃない例(句境界=文節)