テキスト読み上げに
ついての詳細
ระบบการรองรับเอาท์พุตของเสียง
スズキクンでは音声出力をサポートしています。幾つかの文章を用意しました。アクセント句境界推定=機械学習/文節,の両方で音声を聞いてみて下さい。下記のページでは,ピッチパタン,アクセント共に上級者用のものが表示されます(初級者用に変更しても,音声は上級者の韻律で出力されます)。無声化すべきモーラは網かけしています。
ตัวอย่างประโยค 1(ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 2 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 3 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 4 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 5 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 6 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 7 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 8 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 9 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 10 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างประโยค 11 (ขอบเขตของวรรค = Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์)/ขอบเขตของวรรค = วลี)
ตัวอย่างที่ 12
เกี่ยวกับการคาดคะเนขอบเขตวรรคชองการออกเสียง (Machine Learning และ วลี)
คณะผู้จัดทำได้เคยอธิบายให้ระหว่างการอบรมการใช้ OJADไปแล้วว่า เราจะเรียกการแบ่งคำตามารควบคุมการออกเสียงสูงต่ำ (ช่วงแรกทีเป็นLH เสียงจะขึ้นสูง ตามด้วยH จากนั้นเสียงจะตกลงมาที่HL และสุดท้ายจะจบที่L)ว่าวรรคเสียง ในภาษาญี่ปุ่น การออกเสียงอาจจะสั้นหรือยาวสลับกันไปแล้วแต่สไตล์การออกเสียง
"การคาดคะเนขอบเขตของการแบ่งวรรคเสียงโดยMachine Learning" คือกระบวนการคาดคะเนขอบเขตของวรรคเสียงให้กับประโยคที่ไม่มีรูปแบบตายตัว โดยใช้ข้อมูลการแบ่งขอบเขตของวรรคเสียงด้วยความเร็วในการออกเสียงอย่างเป็นธรรมชาติ ข้อมูลนี้ได้จากการป้อนข้อมูลประโยคหลายพันประโยคให้กับคอมพิวเตอร์ไว้ก่อน ในกรณีเช่นนี้ แม้ว่าคอมพิวเตอร์จะคาดคะเนความสั้นยาวที่เหมาะสมของวรรคเสียงได้ตามลำดับคำในประโยค แต่ก็มีความเป็นไปได้สูงที่จะคาดคะเนตำแหน่งของแกนพยางค์และตำแหน่งชองชอบเขตการแบ่งวรรคผิดไป ในที่นี้ วรรคเสียงที่สั้นที่สุดคือวลี การคาดคะเนขอบเขตของวลีนั้นทำได้ไม่ยากนัก "วรรคเสียงที่ใช้วลี"ก็คือวีธีการป้อนช้อมูลโดยให้หนึ่งวลีเท่ากับหนึ่งวรรคเสียงนั่นเอง วีธีการเช่นนี้แม้จะทำให้จำนวนแกนพยางค์ในประโยคเพิ่มขึ้นเป็นจำนวนมาก แต่ก็จะช่วยลดช้อผิดพลาดชองการคาดคะเนได้มากกว่าการวีธีMachine Learning
ไม่ว่าจะใช้งานในโหมดใด ผลของการคาดคะเนการเชื่อมวรรคเสียงนั้นจะอยู่ในรูปแบบ"Pitch Pattern = ผู้เรียนชั้นต้น" และ "การออกเสียง = ผู้เรียนชั้นต้น" ในการรวมวรรคเสียงเป็นหนึ่งวลีเสมอ (อย่างไรก็ดี ถ้าวรรคเสียงนั้นมี 3 พยางค์เสียง (mora) ขึ้นไป ก็อาจมีพยางค์เสียงเหลือ) โดยปกติแล้วข้อบกพร่องจะไม่เกิดขึ้นในการเชื่อมวรรคเสียง เพราะฉะนั้นจึงไม่มีแสดงผลที่แตกต่างกันระหว่างMachine Learningกับการแบ่งวลี ในโหมดผู้เรียนชั้นต้น
ขอแนะนำให้ท่านใช้แบบแรกเพราะจะได้เสียงผสมที่เป็นธรรมชาติกว่า ส่วนท่านที่ต้องการศึกษาเรื่องการรวมกันของเสียงในการผันคำกริยาหรือการเชื่อมคำอย่างละเอียด ขอแนะนำให้ใช้แบบหลังที่จะพบความผิดพลาดในการคาดคะเนน้อยกว่า
ตัวอย่างที่แสดงความแตกต่างของMachine Learningกับวลี (ขอบเขตวรรค =Machine Learning)
ตัวอย่างที่แสดงความแตกต่างของMachine Learningกับวลี (ขอบเขตวรรค =วลี)
話者と話速の制御について
スズキクンでは音声合成時に,話者,話速を指定できますが,これらは音声合成時の「デフォルト話者」「デフォルト話速」として機能しており,テキスト読み上げにおいて,途中で話者や話速を変えることができます。
即ち,入力するテキストに,話者や話速を変えるコマンドを埋め込むことができます。コマンド行は,"//"(全角でもよい)で始めます。
// [話者]
// [話速]
// [話者] [話速]
が可能です。なお,
// [話速] [話者]
はできません。以下,具体的に例を示します。
// M2
話者を M2 に変更。
// S
話速を S (slow) に変更。
// F2 F
話者を F2 に,話速を F(fast) に変更。なお,大文字/小文字,全角/半角は区別しません。
[話者] = F1, F2, M1, or M2
[話速] = F, N, or S
(それぞれ,fast, normal, slow を意味します)
先生と学生の会話の例(句境界=機械学習)
先生と学生の会話の例(句境界=文節)
จุดบกพร่องของสึซึกิคุง
โปรแกรมสึซึกิคุงยังมีข้อบกพร่องอยู่มากแม้ว่าคณะผู้จัดทำจะพยายามปรับปรุงโปรแกรมการใช้งานให้ดีขึ้นเรื่อยๆ ข้อบกพร่องดังกล่าวมีดังต่อไปนี้
1. ข้อผิดพลาดชองการคาดคะเนการออกเสียง
1-1) กลุ่มคำที่เขียนด้วยตัวอักษรฮิระงะนะ
การถอดเสียงด้วยตัวอักษรฮิระงะนะจะทำให้เกิดปัญหาในการค้นหาขอบเขตของคำและปัญหาการบ่่งชี้คำ (ในคำที่เสียงเดียวกันแต่คนละความหมาย) ดังนั้นจึงอาจมีคำที่ไม่ได้ตั้งใจสืบค้นปรากฏขึ้นได้
ตัวอย่างความแตกต่างของผลการคาดคะเนด้วยฮิระงะนะและคันจิ (ขอบเขตของวรรค =Machine Learning)
ตัวอย่างความแตกต่างของผลการคาดคะเนด้วยฮิระงะนะและคันจิ (ขอบเขตชองวรรค =วลี)
1-2) กลุ่มคำที่เขียนด้วยตัวคันจิ
แม้ว่าจะใช้คันจิในการสืบค้น แต่ก็ยังอาจจะมีข้อผิดพลาดในการคาดคะเนตำแหน่งแกนพยางค์หรือขอบเขตของวรรคเสียงได้ โดยเฉพาะในการอ่านข้อความที่มีคำนามต่อเนื่องกันเป็นคำนามประสม
ตัวอย่างข้อผิดพลาดของการคาดคะเนประโยคที่มีคันจิผสมกับตัวอักษรคะนะ (ชอบเขตวรรคเสียง =Machine Learning)
ตัวอย่างข้อผิดพลาดของการคาดคะเนประโยคที่มีคันจิผสมกับตัวอักษรคะนะ (ชอบเขตวรรคเสียง =วลี)
1-3) การออกเสียงคำที่ไม่เคยปรากฏมาก่อน
การบ่่งชี้ว่าคำใดเป็นคำที่ไม่เคยปรากฏมาก่อนจากผลการวิเคราะห์หน่วยคำจะใช้วิธีกำหนดด้วยตำแหน่งของแกนพยางค์ตามหลักเกณฑ์ของการออกเสียง อาจมีคำหลายคำที่ต้องการกำหนดให้เป็นคำที่ไม่เคยปรากฏมาก่อน(เช่น ชื่อของนักเรียนต่างชาติ)แต่ระบบก็ไม่กำหนดให้เป็นเช่นนั้น
ตัวอย่างการวิเคราะห์แยกแยะที่ถูกและผิดของคำที่ไม่เคยปรากฏมาก่อน (ขอบเขตของวรรค =Machine Learning (กระบวนการเรียนรู้และคาดคะเนผลลัพท์ของคอมพิวเตอร์ที่เลียนแบบจากมนุษย์))
ตัวอย่างการวิเคราะห์แยกแยะที่ถูกและผิดของคำที่ไม่เคยปรากฏมาก่อน (ขอบเขตของวรรค=วลี)
2. เกี่ยวกับข้อผิดพลาดชองการคาดคะเนคำอ่าน
2-1) คำที่เปลี่ยนแปลงวิธีอ่านตามบริบท
สึซึกิคุงไม่ถนัดในการอ่านคำที่เปลี่ยนวิธีอ่านไปตามบริบท ปัญหาเหล่านี้ไม่ได้เกี่ยวกับการเลือกเสียงอ่านที่กำกวมกระหว่างวิธีอ่านแบบจีนหรือแบบญี่ปุ่น แต่เป็นปัญหาเกี่ยวกับการที่มีตัวเลือกเสียงอ่านแบบญ๊่ปุ่นหลายตัวเกินไป ถึงแม้ว่าท่านสามารถใช้Pitch editorในการแก้ไขคำแหน่งของแกนพยางค์ได้ แต่ ณ ปัจจุบันนี้ยังไม่มีวีธีการแก้ไชเสียงอ่าน เพื่อเป็นการแก้ปัญหานี้จึงขอแนะนำให้ใช้ตัวอักษรฮิระงะนะในการใส่ข้อมูล
ตัวอย่างของกรณีที่สามารถอ่านแบบญี่ปุ่น (kun-yomi) ได้หลายแบบ (ขอบเขตของวรรค =Machine Learning)
ตัวอย่างของกรณีที่สามารถอ่านแบบญี่ปุ่น (kun-yomi) ได้หลายแบบ (ขอบเขตของวรรค =วลี)
2-2) จำนวน +ลักษณนาม
新スズキクンでは,数表現はかなり読めるようになりました。記号(#$%&=~@+〒¥£)も同様,読めます。ですが,数詞に助数詞が続く表現(数詞+助数詞)はまだ誤ることがあります。助数詞は,読みやアクセントが文脈に依存する典型例です。一本,二本,三本・・・一日,二日,三日・・・などです。数詞+助数詞の読み方は基本的に,形態素解析が出力する読みを後処理することで対応していますが,精度は不十分です。
多様な数表現や記号表現の例(間違う場合あり。句境界=機械学習)
多様な数表現や記号表現の例(間違う場合あり。句境界=文節)
3. คำที่มีความหมายกำกวมและการควบคุมเสียงสูงต่ำท้ายประโยค
木のしたで雨宿りをしている女性を眺めた。
木のしたで,雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を,眺めた。
แบบแผนของเสียงสูงต่ำท้ายประโยคจะแตกต่างกันไปขึ้นอยู่กับว่า「木のしたで」ไปผูกอยู่กับกลุ่มคำไหน ระบบยังไม่สามารถกำหนดแบบแผนของเสียงสูงต่ำท้ายประโยคได้อย่างชัดเจนจากการพิจารณาข้อมูลว่าแต่ละวลีผูกติดอยู่กับกลุ่มคำไหน ดังนั้นจึงจำเป็นต้องใส่เครื่องหมายวรรคตอนให้เหมาะสมเพื่อให้ระบบแยกความแตกต่างได้
ตัวอย่าง雨宿り (ขอบเขตวรรค =Machine Learning)
ตัวอย่าง雨宿り (ขอบเขตวรรค =วลี)
きれいじゃない。
ประโยคนี้สามารถใช้ในทั้งกรณี "แสดงความชื่นชมในความงาม" และ "การเน้นย้ำในความไม่งาม" ความแตกต่างของสองกรณีนีจะปรากฏอยู่ในโทนเสียงสูงต่ำท้ายประโยค (intonation) สึซึกิคุงจะไม่สามารถตีความจากประโยคข้างต้นได้ด้วยการการคะเนจากบริบทโดยรอบ สิซึกิคุงจะทำได้แค่อ่านออกเสียงประโยคเดี่ยว (ที่มีความหมายเป็นอิสระจากประโยคก่อนหลัง)เท่านั้น เพราะฉะนั้น ทางคณะผู้จัดทำจึงขอแนะนำว่าไม่ควรใช้สึซึกิคุงในการอ่านช้อความที่มีความซับซ้อนในการควบคุมโทนเสียงสูงต่ำท้ายประโยค (อนึ่ง ผู้ใช้สามารถเข้าไปแก้ไขใน Pitch Editor ได้)
ตัวอย่างของきれいじゃない (ขอบเขตวรรค = Machine Learning)
ตัวอย่างของきれいじゃない (ขอบเขตวรรค = วลี)