Détails à propos de
la lecture à voix haute

À propos du résultat audio

La fonctionnalité "Suzuki-kun" permet la synthèse vocale du résultat. Nous avons prévu un certain nombre de phrases d'exemple. Essayez de les écouter avec la prédiction des démarcations de l’unité accentuelle configurée sur "Machine learning" puis sur "Bunsetsu". Plus bas, vous pouvez voir les accents et la courbe mélodique pour apprenant avancé (Le résultat sera le même si vous paramétrez pour apprenant débutant). Les mores devant être dévocalisées sont indiquées avec un fond rayé.

À propos de la prédiction de la démarcation d’unité accentuelle (Machine learning/Bunsetsu)

Comme il est expliqué lors des ateliers OJAD, un groupe de mots avec un contrôle d'accentuation (commençant par LH, puis continuant en H, retombant en HL puis continuant en L) est appelé comme une unité accentuelle. En fonction du style d'élocution, ces unités peuvent être plus ou moins longues.

La prédiction de la démarcation de l’unité accentuelle basée sur le Machine learning, est une prédiction faite de la position des démarcations d’unité accentuelle à partir de plusieurs milliers d’unités accentuelles étiquetées en fonction d'une lecture considérée comme naturelle. Dans ce cas, les unités accentuelles sont prédits sur une chaîne de mots donnée. Avec ce paramétrage, il peut y avoir quelques erreurs sur la position des noyaux accentuels ou des démarcations d’unité accentuelle. En effet, l’unité accentuelle la plus courte correspond à le Bounsetsu. La démarcation du Bunsetsu est plus facile d’être détectée. Vous avez alors le mode Bunsetsu, qui part du principe que chaque démarcation d’unité accentuelle correspond à la fin du Bunsetsu. Ce mode réduit le nombre d'erreurs mais maximise le nombre de noyau accentuel par phrase.

Dans les deux modes, il est possible de regrouper les unités accentuelles prédits en une seule unité accentuelle avec les paramètres "Courbe mélodique = Débutant" et "Accent = Débutant". Toutefois, s'il y a un mot d'accent de type 1 de plus de 3 mores, l'accent est laissé tel quel. De manière générale, si vous regroupez en une seule unité accentuelle, il n'y a pas d'erreur. Pour cette raison, il n'y a pas de grande différence entre Machine learning et Bunsetsu en mode débutant.

Pour une élocution plus naturelle, nous vous conseillons le premier mode. Pour ceux qui souhaitent avoir l'accent correct pour toutes les conjugaisons et mots composés, nous conseillons le deuxième mode.

Exemple montrant la différence d'accentuation entre Machine learning et Bunsetsu. (Démarcation = Machine learning)
Exemple montrant la différence d'accentuation entre Machine learning et Bunsetsu. (Démarrcation = Bunsetsu)

À propos du paramétrage du locuteur et de la vitesse d'élocution

Suzuki-kun permet de paramétrer le locuteur et la vitesse d'élocution. Pendant la synthèse, tout est paramétré par défaut. Lorsqu'on active la lecture à voix haute il est possible de changer le locuteur et la vitesse à mi-parcours.

Il est donc possible de changer le locuteur ou la vitesse d'élocution en ligne de commande. Cette ligne commence par "//" (pleine chasse également permise).

// [Locuteur]
// [Vitesse d'élocution]
// [Locuteur] [Vitesse d'élocution]

est également.

// [Vitesse d'élocution] [Locuteur]

n'est pas possible. Voici un exemple plus concret ci-dessous.

// M2

Change le locuteur à M2.
// S

Change la vitesse à S ("slow", lent).

// F2 F

Change le locuteur à F2 et la vitesse à F ("fast", rapide). Le système ne fait pas la différence entre les minuscules et majuscules et entre les pleines et demies chasses.

[Locuteur] = F1,F2,M1, ou M2
[Vitesse d'élocution]=F,N, ou S (fast, normal, slow)

Exemple de dialogue entre un enseignant et un élève (Démarcation = Machine learning)
Exemple de dialogue entre un enseignant et un élève (Démarcation = Bunsetsu)

Points faibles de Suzuki-kun

Suzuki-kun évolue de jour en jour, mais a toujours un certains nombre de points faibles.

1. À propos des erreurs de prédiction d'accent

1.1. À propos des mots écrits en hiragana

Il arrive que Suzuki-kun n'arrive pas découper correctement les mots en hiragana, comme il n'y a ni espace ni kanji, il est difficile d'identifier le bon mot à cause de l'homonymie.

Exemple de prédiction différente entre une recherche en hiragana et en kanji (Démarcation = Machine learning)
Exemple de prédiction différente entre une recherche en hiragana et en kanji (Démarcation = Bunsetsu)

1.2. À propos des expressions en kanji

Même lorsqu'on écrit en kanji, il arrive qu'il y ait une erreur dans la démarcation de l’unité accentuelle ou la position du noyau accentuel. C'est surtout le cas pour les noms composés.

Exemple d'une erreur produite avec une phrase mélangeant kanji et kana (Démarcation = Machine learning)
Exemple d'une erreur produite avec une phrase mélangeant kanji et kana (Démarcation = Bunsetsu)

1.3. À propos de l'accent des mots inconnus

Dans le cas où l'analyse morphologique tombe sur un mot inconnu, Suzuki-kun prédit la position du noyau accentuel à partir de règles d’accentuation. Toutefois, vous pouvez parfois souhaitez qu'un mot soit traité comme mot inconnu, pour le nom d'un étudiant non japonais par exemple, mais ce n'est malheureusement pas le cas.

Exemple d'analyses morphologiques correcte et incorrecte (Démarcation = Machine learning)
Exemple d'analyses morphologiques correcte et incorrecte (Démarcation = Bunsetsu)

2. À propos des erreurs de prédiction de lecture

2.1. Mots dont la lecture change en fonction du contexte

Suzuki-kun n'est pas très fort pour choisir la bonne lecture d'un mot en fonction du contexte. Cela n'est pas dû aux ambiguïtés entre lectures on et kun, mais plutôt lorsqu'il y a plusieurs lectures kun possibles. On peut corriger la position du noyau accentuel dans l'éditeur de mélodie, mais il est impossible d'éditer la lecture des mots. Nous vous conseillons donc d'écrire en hiragana.

Exemple d'un mot a plusieurs lectures kun possibles (Démarcation = Machine learning)
Exemple d'un mot a plusieurs lectures kun possibles (Démarcation = Bunsetsu)

2.2. nombre + compteur

La nouvelle version de Suzuki-kun est capable de lire bon nombre d'expressions numérales, ainsi que les symboles spéciaux suivants : #$%&=~@+〒¥£. Pourtant, il arrive encore de trouver des erreurs lorsqu'un compteur suit un nombre. La lecture et l’accent des compteurs varient en fonction du nombre qui précède. 一本，二本，三本... 一日，二日，三日... Le traitement des expressions nombre+compteur est effectué par post-processing, mais les performances sont encore insuffisantes.

Exemples d'expressions numérales ou avec symboles spéciaux (parfois avec erreur. Démarcation = Machine learning)
Exemples d'expressions numérales ou avec symboles spéciaux (parfois avec erreur. Démarcation = Bunsetsu)

3. Ambiguïté de sens et contrôles de l'intonation

木のしたで雨宿りをしている女性を眺めた。
Sous l’arbre, j’ai regardé une femme qui s’est abrité de la pluie.
J’ai regardé une femme qui s’est abrité de la pluie sous l’arbre.

En fonction de ce dont dépend "木のしたで", l'intonation peut être légèrement différente. Cela ne veut pas dire que Suzuki-kun est conscient des dépendances syntaxiques de la phrase et qu'il prédit l’intonation en fonction de celles-ci. Pour simuler une intonation plus naturelle, il est nécessaire d'utiliser une ponctuation appropriée.

Exemple de "雨宿り" (Démarcation = Machine learning)
Exemple de "雨宿り" (Démarcation = Bunsetsu)

きれいじゃない。

Cette phrase peut signifier que vous êtes en admiration devant quelque chose de beau, ou bien totalement le contraire. La différence est faite avec l'intonation, et Suzuki-kun est malheureusement incapable de déterminer le sens de cette phrase en fonction du contexte du texte. Il ne fait que lire phrase par phrase, indépendamment du texte. C'est pourquoi nous ne pouvons vous recommander d'utiliser Suzuki-kun sur ce genre de phrases ambiguës. Considérez que la lecture de ce genre de phrases est impossible avec Suzuki-kun (vous pouvez toutefois modifier l'intonation avec l'éditeur).

Exemple "きれいじゃない" (Démarcation : Machine learning)
Exemple "きれいじゃない" (Démarcation : Bunsetsu)

Retourner à la page d'accueil d'OJAD

Détails à propos dela lecture à voix haute