テキスト読み上げに
ついての詳細

ระบบการรองรับเอาท์พุตของเสียง

スズキクンでは音声出力をサポートしています。幾つかの文章を用意しました。アクセント句境界推定＝機械学習／文節，の両方で音声を聞いてみて下さい。下記のページでは，ピッチパタン，アクセント共に上級者用のものが表示されます（初級者用に変更しても，音声は上級者の韻律で出力されます）。無声化すべきモーラは網かけしています。

เกี่ยวกับการคาดคะเนขอบเขตวรรคชองการออกเสียง (Machine Learning และ วลี)

คณะผู้จัดทำได้เคยอธิบายให้ระหว่างการอบรมการใช้ OJADไปแล้วว่า เราจะเรียกการแบ่งคำตามารควบคุมการออกเสียงสูงต่ำ (ช่วงแรกทีเป็นLH เสียงจะขึ้นสูง ตามด้วยH จากนั้นเสียงจะตกลงมาที่HL และสุดท้ายจะจบที่L)ว่าวรรคเสียง ในภาษาญี่ปุ่น การออกเสียงอาจจะสั้นหรือยาวสลับกันไปแล้วแต่สไตล์การออกเสียง

"การคาดคะเนขอบเขตของการแบ่งวรรคเสียงโดยMachine Learning" คือกระบวนการคาดคะเนขอบเขตของวรรคเสียงให้กับประโยคที่ไม่มีรูปแบบตายตัว โดยใช้ข้อมูลการแบ่งขอบเขตของวรรคเสียงด้วยความเร็วในการออกเสียงอย่างเป็นธรรมชาติ ข้อมูลนี้ได้จากการป้อนข้อมูลประโยคหลายพันประโยคให้กับคอมพิวเตอร์ไว้ก่อน ในกรณีเช่นนี้ แม้ว่าคอมพิวเตอร์จะคาดคะเนความสั้นยาวที่เหมาะสมของวรรคเสียงได้ตามลำดับคำในประโยค แต่ก็มีความเป็นไปได้สูงที่จะคาดคะเนตำแหน่งของแกนพยางค์และตำแหน่งชองชอบเขตการแบ่งวรรคผิดไป ในที่นี้ วรรคเสียงที่สั้นที่สุดคือวลี การคาดคะเนขอบเขตของวลีนั้นทำได้ไม่ยากนัก "วรรคเสียงที่ใช้วลี"ก็คือวีธีการป้อนช้อมูลโดยให้หนึ่งวลีเท่ากับหนึ่งวรรคเสียงนั่นเอง วีธีการเช่นนี้แม้จะทำให้จำนวนแกนพยางค์ในประโยคเพิ่มขึ้นเป็นจำนวนมาก แต่ก็จะช่วยลดช้อผิดพลาดชองการคาดคะเนได้มากกว่าการวีธีMachine Learning

ไม่ว่าจะใช้งานในโหมดใด ผลของการคาดคะเนการเชื่อมวรรคเสียงนั้นจะอยู่ในรูปแบบ"Pitch Pattern = ผู้เรียนชั้นต้น" และ "การออกเสียง ＝ ผู้เรียนชั้นต้น" ในการรวมวรรคเสียงเป็นหนึ่งวลีเสมอ (อย่างไรก็ดี ถ้าวรรคเสียงนั้นมี 3 พยางค์เสียง (mora) ขึ้นไป ก็อาจมีพยางค์เสียงเหลือ) โดยปกติแล้วข้อบกพร่องจะไม่เกิดขึ้นในการเชื่อมวรรคเสียง เพราะฉะนั้นจึงไม่มีแสดงผลที่แตกต่างกันระหว่างMachine Learningกับการแบ่งวลี ในโหมดผู้เรียนชั้นต้น

ขอแนะนำให้ท่านใช้แบบแรกเพราะจะได้เสียงผสมที่เป็นธรรมชาติกว่า ส่วนท่านที่ต้องการศึกษาเรื่องการรวมกันของเสียงในการผันคำกริยาหรือการเชื่อมคำอย่างละเอียด ขอแนะนำให้ใช้แบบหลังที่จะพบความผิดพลาดในการคาดคะเนน้อยกว่า

ตัวอย่างที่แสดงความแตกต่างของMachine Learningกับวลี (ขอบเขตวรรค ＝Machine Learning)
ตัวอย่างที่แสดงความแตกต่างของMachine Learningกับวลี (ขอบเขตวรรค ＝วลี)

話者と話速の制御について

スズキクンでは音声合成時に，話者，話速を指定できますが，これらは音声合成時の「デフォルト話者」「デフォルト話速」として機能しており，テキスト読み上げにおいて，途中で話者や話速を変えることができます。

即ち，入力するテキストに，話者や話速を変えるコマンドを埋め込むことができます。コマンド行は，"//"（全角でもよい）で始めます。

// [話者]
// [話速]
// [話者] [話速]

が可能です。なお，

// [話速] [話者]

はできません。以下，具体的に例を示します。

// M2

話者を M2 に変更。

// S

話速を S (slow) に変更。

// F2 F

話者を F2 に，話速を F(fast) に変更。なお，大文字／小文字，全角／半角は区別しません。

[話者] = F1, F2, M1, or M2
[話速] = F, N, or S
（それぞれ，fast, normal, slow を意味します）

先生と学生の会話の例（句境界＝機械学習）
先生と学生の会話の例（句境界＝文節）

จุดบกพร่องของสึซึกิคุง

โปรแกรมสึซึกิคุงยังมีข้อบกพร่องอยู่มากแม้ว่าคณะผู้จัดทำจะพยายามปรับปรุงโปรแกรมการใช้งานให้ดีขึ้นเรื่อยๆ ข้อบกพร่องดังกล่าวมีดังต่อไปนี้

1. ข้อผิดพลาดชองการคาดคะเนการออกเสียง

1-1) กลุ่มคำที่เขียนด้วยตัวอักษรฮิระงะนะ

การถอดเสียงด้วยตัวอักษรฮิระงะนะจะทำให้เกิดปัญหาในการค้นหาขอบเขตของคำและปัญหาการบ่่งชี้คำ (ในคำที่เสียงเดียวกันแต่คนละความหมาย) ดังนั้นจึงอาจมีคำที่ไม่ได้ตั้งใจสืบค้นปรากฏขึ้นได้

ตัวอย่างความแตกต่างของผลการคาดคะเนด้วยฮิระงะนะและคันจิ (ขอบเขตของวรรค ＝Machine Learning)
ตัวอย่างความแตกต่างของผลการคาดคะเนด้วยฮิระงะนะและคันจิ (ขอบเขตชองวรรค ＝วลี)

1-2) กลุ่มคำที่เขียนด้วยตัวคันจิ

แม้ว่าจะใช้คันจิในการสืบค้น แต่ก็ยังอาจจะมีข้อผิดพลาดในการคาดคะเนตำแหน่งแกนพยางค์หรือขอบเขตของวรรคเสียงได้ โดยเฉพาะในการอ่านข้อความที่มีคำนามต่อเนื่องกันเป็นคำนามประสม

ตัวอย่างข้อผิดพลาดของการคาดคะเนประโยคที่มีคันจิผสมกับตัวอักษรคะนะ (ชอบเขตวรรคเสียง ＝Machine Learning)
ตัวอย่างข้อผิดพลาดของการคาดคะเนประโยคที่มีคันจิผสมกับตัวอักษรคะนะ (ชอบเขตวรรคเสียง ＝วลี)

1-3) การออกเสียงคำที่ไม่เคยปรากฏมาก่อน

การบ่่งชี้ว่าคำใดเป็นคำที่ไม่เคยปรากฏมาก่อนจากผลการวิเคราะห์หน่วยคำจะใช้วิธีกำหนดด้วยตำแหน่งของแกนพยางค์ตามหลักเกณฑ์ของการออกเสียง อาจมีคำหลายคำที่ต้องการกำหนดให้เป็นคำที่ไม่เคยปรากฏมาก่อน(เช่น ชื่อของนักเรียนต่างชาติ)แต่ระบบก็ไม่กำหนดให้เป็นเช่นนั้น

ตัวอย่างการวิเคราะห์แยกแยะที่ถูกและผิดของคำที่ไม่เคยปรากฏมาก่อน (ขอบเขตของวรรค ＝Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์))
ตัวอย่างการวิเคราะห์แยกแยะที่ถูกและผิดของคำที่ไม่เคยปรากฏมาก่อน (ขอบเขตของวรรค＝วลี)

2. เกี่ยวกับข้อผิดพลาดชองการคาดคะเนคำอ่าน

2-1) คำที่เปลี่ยนแปลงวิธีอ่านตามบริบท

สึซึกิคุงไม่ถนัดในการอ่านคำที่เปลี่ยนวิธีอ่านไปตามบริบท ปัญหาเหล่านี้ไม่ได้เกี่ยวกับการเลือกเสียงอ่านที่กำกวมกระหว่างวิธีอ่านแบบจีนหรือแบบญี่ปุ่น แต่เป็นปัญหาเกี่ยวกับการที่มีตัวเลือกเสียงอ่านแบบญ๊่ปุ่นหลายตัวเกินไป ถึงแม้ว่าท่านสามารถใช้Pitch editorในการแก้ไขคำแหน่งของแกนพยางค์ได้ แต่ ณ ปัจจุบันนี้ยังไม่มีวีธีการแก้ไชเสียงอ่าน เพื่อเป็นการแก้ปัญหานี้จึงขอแนะนำให้ใช้ตัวอักษรฮิระงะนะในการใส่ข้อมูล

ตัวอย่างของกรณีที่สามารถอ่านแบบญี่ปุ่น (kun-yomi) ได้หลายแบบ (ขอบเขตของวรรค ＝Machine Learning)
ตัวอย่างของกรณีที่สามารถอ่านแบบญี่ปุ่น (kun-yomi) ได้หลายแบบ (ขอบเขตของวรรค ＝วลี)

2-2) จำนวน ＋ลักษณนาม

新スズキクンでは，数表現はかなり読めるようになりました。記号（#$%&=~@+〒¥£）も同様，読めます。ですが，数詞に助数詞が続く表現（数詞＋助数詞）はまだ誤ることがあります。助数詞は，読みやアクセントが文脈に依存する典型例です。一本，二本，三本・・・一日，二日，三日・・・などです。数詞＋助数詞の読み方は基本的に，形態素解析が出力する読みを後処理することで対応していますが，精度は不十分です。

多様な数表現や記号表現の例（間違う場合あり。句境界＝機械学習）
多様な数表現や記号表現の例（間違う場合あり。句境界＝文節）

3. คำที่มีความหมายกำกวมและการควบคุมเสียงสูงต่ำท้ายประโยค

木のしたで雨宿りをしている女性を眺めた。
木のしたで，雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を，眺めた。

แบบแผนของเสียงสูงต่ำท้ายประโยคจะแตกต่างกันไปขึ้นอยู่กับว่า「木のしたで」ไปผูกอยู่กับกลุ่มคำไหน ระบบยังไม่สามารถกำหนดแบบแผนของเสียงสูงต่ำท้ายประโยคได้อย่างชัดเจนจากการพิจารณาข้อมูลว่าแต่ละวลีผูกติดอยู่กับกลุ่มคำไหน ดังนั้นจึงจำเป็นต้องใส่เครื่องหมายวรรคตอนให้เหมาะสมเพื่อให้ระบบแยกความแตกต่างได้

ตัวอย่าง雨宿り (ขอบเขตวรรค ＝Machine Learning)
ตัวอย่าง雨宿り (ขอบเขตวรรค ＝วลี)

きれいじゃない。

ประโยคนี้สามารถใช้ในทั้งกรณี "แสดงความชื่นชมในความงาม" และ "การเน้นย้ำในความไม่งาม" ความแตกต่างของสองกรณีนีจะปรากฏอยู่ในโทนเสียงสูงต่ำท้ายประโยค (intonation) สึซึกิคุงจะไม่สามารถตีความจากประโยคข้างต้นได้ด้วยการการคะเนจากบริบทโดยรอบ สิซึกิคุงจะทำได้แค่อ่านออกเสียงประโยคเดี่ยว (ที่มีความหมายเป็นอิสระจากประโยคก่อนหลัง)เท่านั้น เพราะฉะนั้น ทางคณะผู้จัดทำจึงขอแนะนำว่าไม่ควรใช้สึซึกิคุงในการอ่านช้อความที่มีความซับซ้อนในการควบคุมโทนเสียงสูงต่ำท้ายประโยค (อนึ่ง ผู้ใช้สามารถเข้าไปแก้ไขใน Pitch Editor ได้)

ตัวอย่างของきれいじゃない (ขอบเขตวรรค = Machine Learning)
ตัวอย่างของきれいじゃない (ขอบเขตวรรค = วลี)

กลับสู่หน้าหลัก

テキスト読み上げについての詳細