• japan
  • english
  • indonesia
  • korean
  • china
  • china
  • vietnamese
  • deutsch
  • russian
  • thailand
  • polski
  • spanish
  • swedish
  • swedish
  • italian
  • french

Ulteriori dettagli sulla
lettura ad alta voce

Informazioni sull’output dell’audio

Suzuki-un supporta l’output dell’audio. Sono stati preparati diversi testi. Provate ad ascoltare la lettura delle voci con la segmentazione in sintagmi accentuali nella modalità “algoritmo (apprendimento automatico)” e “bunsetsu ”. Nella pagina in basso, viene mostrata la curva melodica con i marcatori della caduta dell’accento per gli utenti più esperti (la lettura delle voci del livello principiante è identica a quella del livello avanzato). Vengono altresì segnalate le more che prevedono la desonorizzazione della vocale.

Testo esempio 1 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 2 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 3 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 4 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 5 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 6 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 7 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 8 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 9 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 10 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 11 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )
Testo esempio 12 (Segmentazione in sintagmi=algoritmo (apprendimento automatico)/Segmentazione in sintagmi=bunsetsu )

Informazioni sulla segmentazione in sintagmi accentuali (algoritmo/bunsetsu )

Come viene spiegato nei workshop sull’OJAD, chiamiamo sintagma accentuale il gruppo di parole che costituiscono un’unità prosodica (cioè se la sequenza di altezza tonale iniziale prevede LH [basso-alto] e la mora successiva ha un tono H [alto], dopo la sequenza HL [alto-basso] la mora successiva avrà un tono L [basso]). Nel caso del giapponese, in base allo stile del parlante il sintagma accentuale può essere più o meno lungo.

La “predizione del sintagma accentuale basata sull’algoritmo” è realizzata stimando i confini dei sintagmi accentuali della frase inserita usando un database contenente alcune migliaia di frasi lette ad una velocità di eloquio naturale. In questa maniera, verrà predetto il sintagma accentuale appropriato, ma trattandosi di una rilevazione automatica basata su un un database limitato, potrebbero verificarsi errori nella predizione dei confini del sintagma e del luogo della caduta dell’accento. D’altro canto, il sintagma accentuale più breve è il bunsetsu (unità prosodica minima della frase giapponese), che è di facile identificazione. La modalità “predizione del sintagma accentuale basata sui bunsetsu” considera ogni bunsetsu un sintagma accentuale. Rispetto alla predizione basata sull’algoritmo, con questa modalità gli errori diminuiranno leggermente, ma allo stesso tempo verrà massimizzato il numero di cadute dell’accento presenti nella frase.

Sarà comunque possibile collegare i sintagmi accentuali predetti ad altri sintagmi accentuali nelle modalità “Curva melodica=principiante” e “Accento=principiante”. Tuttavia, verranno lasciati i sintagmi accentuali in cui sono presenti parole di più di tre more con caduta dell’accento dopo la prima mora. Di regola, collegando i sintagmi accentuali non si verificheranno errori. Pertanto nella modalità principiante non fa molta differenza se il sintagma viene predetto in base all’algoritmo o ai bunsetsu.

Considerando la naturalezza della voce sintetizzata, sarebbe preferibile utilizzare la prima modalità. Suggeriamo invece di usare la seconda modalità a chi è interessato ad apprendere i pattern accentuali delle forme coniugate e dei composti di parole, in quanto la probabilità di errore è ridotta.

Esempio che mostra la differenza tra le due modalità (sintagma accentuale=algoritmo)
Esempio che mostra la differenza tra le due modalità (sintagma accentuale=bunsetsu)

Regolazione della velocità di eloquio

Con Suzuku-kun è possibile selezionare il parlante e la velocità di eloquio. Durante la sintesi vocale saranno utilizzati i parametri di default che possono però essere modificati anche durante la lettura del testo.

In altre parole, l’utente potrà scegliere il parlante e la velocità di eloquio con cui sarà letto il testo inserito. La riga dei comandi comincia con “//“ (sono ammessi anche caratteri 全角).

//[Parlante]
//[Velocità di eloquio]//[Parlante]  [Velocità di eloquio]

sono possibili.

//[Velocità di eloquio]  [Parlante]

non sono possibili. Si veda l’esempio in basso.

// M2

Selezionare il parlante M2.

// S

Selezionare la velocità di eloquio S (lento)

//F2 F

Selezionare il parlante F2 e la velocità di eloquio F (veloce). Il sistema non differenzia i caratteri maiuscoli e minuscoli o 全角/半角.

[Parlante] = F1, F2, M1, o M2
[Velocità di eloquio=F, N, o S (rispettivamente veloce, normale, lento).

Esempio: dialogo tra un insegnante e uno studente (sintagma accentuale=algoritmo)
Esempio: dialogo tra un insegnante e uno studente (sintagma accentuale=bunsetsu)

Punti deboli di Suzuki-kun

Suzuki-kun migliora giorno dopo giorno ma ha ancora diversi punti deboli. Ve ne mostriamo qualcuno.

1. Errori nella predizione della caduta dell’accento

1-1) Espressioni scritte in hiragana

Se il testo viene inserito in hiragana sarà difficile per il sistema effettuare la segmentazione in parole a causa dell’eventuale presenza di parole omografe. Pertanto è possibile che alcune parole non vengano riconosciute.

Esempio di diversa predizione tra hiragana e kanji (sintagma accentuale=algoritmo)
Esempio di diversa predizione tra hiragana e kanji (sintagma accentuale=bunsetsu)

1-2) Espressioni scritte in kanji

Anche inserendo la frase usando i kanji è possibile che si verifichino errori nella segmentazione in sintagmi accentuali e nella predizione del luogo di caduta dell’accento. Questo problema si verifica principalmente nelle sequenze di nomi composti.

Esempio di errore di predizione in una frase scritta in kanji e kana (sintagma accentuale=algoritmo)
Esempio di errore di predizione in una frase scritta in kanji e kana (sintagma accentuale=bunsetsu)

1-3) Accento della parole sconosciute

Nel caso in cui come risultato dell’analisi morfologica venga rilevata una parola sconosciuta, il luogo della caduta dell’accento sarà attribuito seguendo la regola generale. Sono numerosi i casi in cui una parola viene riconosciuta dal sistema, sebbene si tratti di una parola non riconoscibile (per esempio il nome di uno studente straniero).

Esempio di analisi morfologica corretta e errata di una parola sconosciuta (sintagma accentuale=algoritmo)
Esempio di analisi morfologica corretta e errata di una parola sconosciuta (sintagma accentuale=bunsetsu)

2. Errori di lettura

2-1) Parole la cui lettura varia a seconda del contesto

Suzuki-un ha difficoltà con le parole la cui lettura varia a seconda del contesto. Si fa riferimento non tanto all’ambiguità data dalla diversa lettura dei kanji (on'yomi e kun'yomi), quanto piuttosto alla presenza di più possibili letture kun'yomi. È possibile modificare con il pitch editor il luogo della caduta dell’accento predetto. Non è possibile invece modificare la lettura ad alta voce. In questi casi inserite la parola in hiragana.

Esempio di parola con diverse letture kun'yomi (sintagma accentuale=algoritmo)
Esempio di parola con diverse letture kun'yomi (sintagma accentuale=bunsetsu)

2-2) Numerali + classificatori

Il nuovo Suzuki-kun riesce adesso a leggere varie espressioni numeriche, come anche i simboli #$%&=~@+〒¥£. Tuttavia, commette ancora errori nella lettura dei numerali quando sono seguiti da un classificatore (numerale+classificatore). I classificatori sono il classico esempio di parole che variano la lettura e l’accento in base al contesto, come per esempio 一本,二本,三本・・・一日,二日,三日. La lettura dei numerali+classificatori viene sostanzialmente elaborata a partire dalle letture fornite dall’analizzatore morfologico e la loro precisione risulta ancora insufficiente.

Esempio di frase contenente numerali e simboli (presenza di errori. sintagma accentuale=algoritmo)
Esempio di frase contenente numerali e simboli (presenza di errori. sintagma accentuale=bunsetsu)

3. Ambiguità di significato e controllo dell’intonazione

木のしたで雨宿りをしている女性を眺めた。
木のしたで,雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を,眺めた。

In base al significato che si vuole dare all’espressione “木のしたで”, l’intonazione potrebbe leggermente variare. Ciò non significa che Suzuki-kun possa determinare l’intonazione considerando le relazioni tra i vari sintagmi. Per rendere chiare queste relazioni si prega dunque di inserire la punteggiatura necessaria.

Esempio 雨宿り (sintagma accentuale=algoritmo)
Esempio 雨宿り (sintagma accentuale=bunsetsu)

きれいじゃない。

Questa espressione può avere due significati: 1) il parlante esprime la propria meraviglia nei confronti di qualcosa o qualcuno che è きれい “bello”; 2) il parlante esprime con enfasi il fatto che qualcosa o qualcuno non è きれい “bello”. L’andamento intontivo varia dunque in base al significato che si vuole attribuire alla frase. Suzuki-kun non può determinare il significato dato a una frase che dipende dal contesto: le frasi inserite verranno dunque lette isolate dal loro contesto. Pertanto, suggeriamo di non inserire testi che richiedono un livello sofisticato di intonazione. Occorre tenere in considerazione i limiti del sistema (è pur sempre possibile apportare modifiche con il pitch editor).

Esempio きれいじゃない (sintagma accentuale=algoritmo)
Esempio きれいじゃない (sintagma accentuale=bunsetsu)