• japan
  • english
  • indonesia
  • korean
  • china
  • china
  • vietnamese
  • deutsch
  • russian
  • thailand
  • polski
  • spanish
  • swedish
  • swedish
  • italian
  • french

テキスト読み上げに
ついての詳細

ระบบการรองรับเอาท์พุตของเสียง

スズキクンでは音声出力をサポートしています。幾つかの文章を用意しました。アクセント句境界推定=機械学習/文節,の両方で音声を聞いてみて下さい。下記のページでは,ピッチパタン,アクセント共に上級者用のものが表示されます(初級者用に変更しても,音声は上級者の韻律で出力されます)。無声化すべきモーラは網かけしています。

ตัวอย่างประโยค 1(ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 2 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 3 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 4 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 5 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 6 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 7 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 8 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 9 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 10 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างประโยค 11 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)ขอบเขตของวรรค = วลี
ตัวอย่างที่ 12

เกี่ยวกับการคาดคะเนขอบเขตวรรคชองการออกเสียง (Machine Learning และ วลี)

คณะผู้จัดทำได้เคยอธิบายให้ระหว่างการอบรมการใช้ OJADไปแล้วว่า เราจะเรียกการแบ่งคำตามารควบคุมการออกเสียงสูงต่ำ (ช่วงแรกทีเป็นLH เสียงจะขึ้นสูง ตามด้วยH จากนั้นเสียงจะตกลงมาที่HL และสุดท้ายจะจบที่L)ว่าวรรคเสียง ในภาษาญี่ปุ่น การออกเสียงอาจจะสั้นหรือยาวสลับกันไปแล้วแต่สไตล์การออกเสียง

"การคาดคะเนขอบเขตของการแบ่งวรรคเสียงโดยMachine Learning" คือกระบวนการคาดคะเนขอบเขตของวรรคเสียงให้กับประโยคที่ไม่มีรูปแบบตายตัว โดยใช้ข้อมูลการแบ่งขอบเขตของวรรคเสียงด้วยความเร็วในการออกเสียงอย่างเป็นธรรมชาติ ข้อมูลนี้ได้จากการป้อนข้อมูลประโยคหลายพันประโยคให้กับคอมพิวเตอร์ไว้ก่อน ในกรณีเช่นนี้ แม้ว่าคอมพิวเตอร์จะคาดคะเนความสั้นยาวที่เหมาะสมของวรรคเสียงได้ตามลำดับคำในประโยค แต่ก็มีความเป็นไปได้สูงที่จะคาดคะเนตำแหน่งของแกนพยางค์และตำแหน่งชองชอบเขตการแบ่งวรรคผิดไป ในที่นี้ วรรคเสียงที่สั้นที่สุดคือวลี การคาดคะเนขอบเขตของวลีนั้นทำได้ไม่ยากนัก "วรรคเสียงที่ใช้วลี"ก็คือวีธีการป้อนช้อมูลโดยให้หนึ่งวลีเท่ากับหนึ่งวรรคเสียงนั่นเอง วีธีการเช่นนี้แม้จะทำให้จำนวนแกนพยางค์ในประโยคเพิ่มขึ้นเป็นจำนวนมาก แต่ก็จะช่วยลดช้อผิดพลาดชองการคาดคะเนได้มากกว่าการวีธีMachine Learning

ไม่ว่าจะใช้งานในโหมดใด ผลของการคาดคะเนการเชื่อมวรรคเสียงนั้นจะอยู่ในรูปแบบ"Pitch Pattern = ผู้เรียนชั้นต้น" และ "การออกเสียง = ผู้เรียนชั้นต้น" ในการรวมวรรคเสียงเป็นหนึ่งวลีเสมอ (อย่างไรก็ดี ถ้าวรรคเสียงนั้นมี 3 พยางค์เสียง (mora) ขึ้นไป ก็อาจมีพยางค์เสียงเหลือ) โดยปกติแล้วข้อบกพร่องจะไม่เกิดขึ้นในการเชื่อมวรรคเสียง เพราะฉะนั้นจึงไม่มีแสดงผลที่แตกต่างกันระหว่างMachine Learningกับการแบ่งวลี ในโหมดผู้เรียนชั้นต้น

ขอแนะนำให้ท่านใช้แบบแรกเพราะจะได้เสียงผสมที่เป็นธรรมชาติกว่า ส่วนท่านที่ต้องการศึกษาเรื่องการรวมกันของเสียงในการผันคำกริยาหรือการเชื่อมคำอย่างละเอียด ขอแนะนำให้ใช้แบบหลังที่จะพบความผิดพลาดในการคาดคะเนน้อยกว่า

ตัวอย่างที่แสดงความแตกต่างของMachine Learningกับวลี (ขอบเขตวรรค =Machine Learning)
ตัวอย่างที่แสดงความแตกต่างของMachine Learningกับวลี (ขอบเขตวรรค =วลี)

話者と話速の制御について

スズキクンでは音声合成時に,話者,話速を指定できますが,これらは音声合成時の「デフォルト話者」「デフォルト話速」として機能しており,テキスト読み上げにおいて,途中で話者や話速を変えることができます。

即ち,入力するテキストに,話者や話速を変えるコマンドを埋め込むことができます。コマンド行は,"//"(全角でもよい)で始めます。

// [話者]
// [話速]
// [話者]  [話速]

が可能です。なお,

// [話速]  [話者]

はできません。以下,具体的に例を示します。

// M2

話者を M2 に変更。

// S

話速を S (slow) に変更。

// F2 F

話者を F2 に,話速を F(fast) に変更。なお,大文字/小文字,全角/半角は区別しません。

[話者] = F1, F2, M1, or M2
[話速] = F, N, or S
(それぞれ,fast, normal, slow を意味します)

先生と学生の会話の例(句境界=機械学習)
先生と学生の会話の例(句境界=文節)

จุดบกพร่องของสึซึกิคุง

โปรแกรมสึซึกิคุงยังมีข้อบกพร่องอยู่มากแม้ว่าคณะผู้จัดทำจะพยายามปรับปรุงโปรแกรมการใช้งานให้ดีขึ้นเรื่อยๆ ข้อบกพร่องดังกล่าวมีดังต่อไปนี้

1. ข้อผิดพลาดชองการคาดคะเนการออกเสียง

1-1) กลุ่มคำที่เขียนด้วยตัวอักษรฮิระงะนะ

การถอดเสียงด้วยตัวอักษรฮิระงะนะจะทำให้เกิดปัญหาในการค้นหาขอบเขตของคำและปัญหาการบ่่งชี้คำ (ในคำที่เสียงเดียวกันแต่คนละความหมาย) ดังนั้นจึงอาจมีคำที่ไม่ได้ตั้งใจสืบค้นปรากฏขึ้นได้

ตัวอย่างความแตกต่างของผลการคาดคะเนด้วยฮิระงะนะและคันจิ (ขอบเขตของวรรค =Machine Learning)
ตัวอย่างความแตกต่างของผลการคาดคะเนด้วยฮิระงะนะและคันจิ (ขอบเขตชองวรรค =วลี)

1-2) กลุ่มคำที่เขียนด้วยตัวคันจิ

แม้ว่าจะใช้คันจิในการสืบค้น แต่ก็ยังอาจจะมีข้อผิดพลาดในการคาดคะเนตำแหน่งแกนพยางค์หรือขอบเขตของวรรคเสียงได้ โดยเฉพาะในการอ่านข้อความที่มีคำนามต่อเนื่องกันเป็นคำนามประสม

ตัวอย่างข้อผิดพลาดของการคาดคะเนประโยคที่มีคันจิผสมกับตัวอักษรคะนะ (ชอบเขตวรรคเสียง =Machine Learning)
ตัวอย่างข้อผิดพลาดของการคาดคะเนประโยคที่มีคันจิผสมกับตัวอักษรคะนะ (ชอบเขตวรรคเสียง =วลี)

1-3) การออกเสียงคำที่ไม่เคยปรากฏมาก่อน

การบ่่งชี้ว่าคำใดเป็นคำที่ไม่เคยปรากฏมาก่อนจากผลการวิเคราะห์หน่วยคำจะใช้วิธีกำหนดด้วยตำแหน่งของแกนพยางค์ตามหลักเกณฑ์ของการออกเสียง อาจมีคำหลายคำที่ต้องการกำหนดให้เป็นคำที่ไม่เคยปรากฏมาก่อน(เช่น ชื่อของนักเรียนต่างชาติ)แต่ระบบก็ไม่กำหนดให้เป็นเช่นนั้น

ตัวอย่างการวิเคราะห์แยกแยะที่ถูกและผิดของคำที่ไม่เคยปรากฏมาก่อน (ขอบเขตของวรรค =Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์))
ตัวอย่างการวิเคราะห์แยกแยะที่ถูกและผิดของคำที่ไม่เคยปรากฏมาก่อน (ขอบเขตของวรรค=วลี)

2. เกี่ยวกับข้อผิดพลาดชองการคาดคะเนคำอ่าน

2-1) คำที่เปลี่ยนแปลงวิธีอ่านตามบริบท

สึซึกิคุงไม่ถนัดในการอ่านคำที่เปลี่ยนวิธีอ่านไปตามบริบท ปัญหาเหล่านี้ไม่ได้เกี่ยวกับการเลือกเสียงอ่านที่กำกวมกระหว่างวิธีอ่านแบบจีนหรือแบบญี่ปุ่น แต่เป็นปัญหาเกี่ยวกับการที่มีตัวเลือกเสียงอ่านแบบญ๊่ปุ่นหลายตัวเกินไป ถึงแม้ว่าท่านสามารถใช้Pitch editorในการแก้ไขคำแหน่งของแกนพยางค์ได้ แต่ ณ ปัจจุบันนี้ยังไม่มีวีธีการแก้ไชเสียงอ่าน เพื่อเป็นการแก้ปัญหานี้จึงขอแนะนำให้ใช้ตัวอักษรฮิระงะนะในการใส่ข้อมูล

ตัวอย่างของกรณีที่สามารถอ่านแบบญี่ปุ่น (kun-yomi) ได้หลายแบบ (ขอบเขตของวรรค =Machine Learning)
ตัวอย่างของกรณีที่สามารถอ่านแบบญี่ปุ่น (kun-yomi) ได้หลายแบบ (ขอบเขตของวรรค =วลี)

2-2) จำนวน +ลักษณนาม

新スズキクンでは,数表現はかなり読めるようになりました。記号(#$%&=~@+〒¥£)も同様,読めます。ですが,数詞に助数詞が続く表現(数詞+助数詞)はまだ誤ることがあります。助数詞は,読みやアクセントが文脈に依存する典型例です。一本,二本,三本・・・一日,二日,三日・・・などです。数詞+助数詞の読み方は基本的に,形態素解析が出力する読みを後処理することで対応していますが,精度は不十分です。

多様な数表現や記号表現の例(間違う場合あり。句境界=機械学習)
多様な数表現や記号表現の例(間違う場合あり。句境界=文節)

3. คำที่มีความหมายกำกวมและการควบคุมเสียงสูงต่ำท้ายประโยค

木のしたで雨宿りをしている女性を眺めた。
木のしたで,雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を,眺めた。

แบบแผนของเสียงสูงต่ำท้ายประโยคจะแตกต่างกันไปขึ้นอยู่กับว่า「木のしたで」ไปผูกอยู่กับกลุ่มคำไหน ระบบยังไม่สามารถกำหนดแบบแผนของเสียงสูงต่ำท้ายประโยคได้อย่างชัดเจนจากการพิจารณาข้อมูลว่าแต่ละวลีผูกติดอยู่กับกลุ่มคำไหน ดังนั้นจึงจำเป็นต้องใส่เครื่องหมายวรรคตอนให้เหมาะสมเพื่อให้ระบบแยกความแตกต่างได้

ตัวอย่าง雨宿り (ขอบเขตวรรค =Machine Learning)
ตัวอย่าง雨宿り (ขอบเขตวรรค =วลี)

きれいじゃない。

ประโยคนี้สามารถใช้ในทั้งกรณี "แสดงความชื่นชมในความงาม" และ "การเน้นย้ำในความไม่งาม" ความแตกต่างของสองกรณีนีจะปรากฏอยู่ในโทนเสียงสูงต่ำท้ายประโยค (intonation) สึซึกิคุงจะไม่สามารถตีความจากประโยคข้างต้นได้ด้วยการการคะเนจากบริบทโดยรอบ สิซึกิคุงจะทำได้แค่อ่านออกเสียงประโยคเดี่ยว (ที่มีความหมายเป็นอิสระจากประโยคก่อนหลัง)เท่านั้น เพราะฉะนั้น ทางคณะผู้จัดทำจึงขอแนะนำว่าไม่ควรใช้สึซึกิคุงในการอ่านช้อความที่มีความซับซ้อนในการควบคุมโทนเสียงสูงต่ำท้ายประโยค (อนึ่ง ผู้ใช้สามารถเข้าไปแก้ไขใน Pitch Editor ได้)

ตัวอย่างของきれいじゃない (ขอบเขตวรรค = Machine Learning)
ตัวอย่างของきれいじゃない (ขอบเขตวรรค = วลี)