• japan
  • english
  • indonesia
  • korean
  • china
  • china
  • vietnamese
  • deutsch
  • russian
  • thailand
  • polski
  • spanish
  • swedish
  • swedish
  • italian
  • french

Detalhes da
leitura do texto em voz alta

Sobre o suporte do output de áudio

O Suzuki-kun suporta output de áudio. Diversos textos foram preparados. Escute a estimativa da fronteira do sintagma acentual nos modos "Aprendizado de Máquina" e "Bunsetsu” . A página abaixo exibe a curva de pitch juntamente com as marcações de acento destinadas a aprendizes avançados (o modo de exibição não mudará mesmo no modo para iniciantes). As moras desvozeadas estão hachuradas.

Texto-exemplo 1 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 2 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 3 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 4 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 5 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 6 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 7 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 8 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 9 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 10 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 11 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)
Texto-exemplo 12 (Fronteira de sintagma=aprendizado de máquina/Fronteira de sintagma=bunsetsu)

Sobre a predição de fronteira do sintagma acentual (Aprendizado de máquina/Bunsetsu)

Como explicado nos workshops do OJAD, chamamos uma série de palavras possuidora de uma sequência de acentos (uma série de palavras começando com LH, seguida por H, caindo com HL e então continuando com L) de sintagma acentual. Dependendo do estilo de fala, o sintagma acentual pode se tornar mais longo ou mais curto.

A "Predição da fronteira de sintagma acentual baseada em aprendizado de máquina" é realizada se estimando onde as fronteiras acentuais devem ser colocadas com base em milhares de sentenças. Tais sentenças tiveram suas fronteiras etiquetadas por humanos, assumindo uma leitura natural. Desta maneira, sintagmas acentuais apropriados são preditos para uma série de palavras. Contudo, erros referentes ao núcleo acentual e predição de fronteiras podem ser encontrados. Por outro lado, o sintagma acentual mais curto é o bunsetsu, que é de fácil identificação. Levando isso em consideração, o modo “bunsetsu=sintagma acentual” assume que o bunsetsu corresponde ao sintagma acentual. Apesar de este modo apresentar menos erros, ele maximiza o número de frases acentuais, o que pode ser indesejável.

Em ambos os modos, é possível conectar os sintagmas acentuais a outros sintagmas acentuais nos modos “Padrão de pitch = Iniciante” e “Acento=Iniciante”. Contudo, se houver uma palavra do Tipo de Acento 1 com mais de três moras, o acento será deixado como é. Como regra geral, se você conectar os sintagmas acentuais, não haverá erros. Assim, no modo iniciante não há diferença se a fronteira do sintagma foi determinado pelo modo Aprendizado de Máquina ou pelo modo Bunsetsu.

Levando em consideração a naturalidade da voz sintetizada, recomendamos o primeiro modo. Para interessados em aprender os padrões acentuais das conjugações dos sufixos, recomendamos o segundo modo.

Exemplo mostrando a diferença entre os modos "Aprendizado de Máquina" e "Bunsetsu" (Fronteira de sintagma=Aprendizado de Máquina)
Exemplo mostrando a diferença entre os modos “Aprendizado de Máquina” e “Bunsetsu” (Fronteira de sintagma= “Bunsetsu” )

Controlar velocidade de fala e falante

Ao sintetizar a fala, o Suzuki-kun é capaz de definir o falante e a velocidade de fala. Durante a síntese, "Falante Padrão"e "Velocidade Padrão" serão executados. Enquanto o texto está sendo lido, pode-se mudar o falante e a velocidade.

Isto é, é possível definir o falante e a velocidade com que o texto inserido será lido. A linha de comandos começa com "//" (全角 também é permitido).

//[Falante]
//[Velocidade de Fala]//[Falante]  [Velocidade de Fala]

são possíveis.

//[Velocidade de Fala]  [Falante]

não são possíveis. Veja um exemplo abaixo.

// M2

Mudar falante para M2.

// S

Mudar velocidade para S (devagar)

//F2 F

Mudar falante para F2 e velocidade de fala para F (rápido). O sistema não diferencia maiúsculas/minúsculas ou 全角/半角 .

[Falante] = F1, F2, M1, ou M2
[Velocidade=F, N, ou S (Rápido, Normal, Devagar, respectivamente).

Exemplo de conversa entre professor e aluno (Fronteira de sintagma = Aprendizado de máquina)
Exemplo de conversa entre professor e aluno (Fronteira de sintagma = Bunsetsu)

Pontos negativos do Suzuki-kun

Estamos melhorando o Suzuki-kun diariamente, mas ainda há diversos pontos negativos. Procuramos deixar isso claro.

1. Sobre erros de predição de acento

1-1) Sobre expressões escritas em hirgana

Se o texto for inserido em hiragana, será difícil detectar a palavra e suas fronteiras devido à existência de homônimos. Assim, há a possibilidade de uma palavra diferente da inserida ser reconhecida.

Exemplo de diferenças de predição entre hiragana e kanji (Fronteira de sintagma = Aprendizado de Máquina)
Exemplo de diferenças de predição entre hiragana e kanji (Fronteira de sintagma = Bunsetsu)

1-2) Sobre expressões em kanji

Mesmo com o uso do kanji, pode haver problemas na predição de fronteiras de sintagma acentual e de núcleo acentual. Este problema tende a ocorrer principalmente em sequências de substantivos compostos.

Exemplo de erro no uso de hiragana e kanji (Fronteira de sintagma = Aprendizado de Máquina)
Exemplo de erro no uso de hiragana e kanji (Fronteira de sintagma = Bunsetsu)

1-3) Sobre acentos de palavras desconhecidas

Caso o resultado na análise morfológica resulte numa palavra desconhecida, o núcleo acentual será deduzido a partir de regras de atribuição do mesmo. Contudo, há diversos casos em que não é desejável que uma palavra seja detectada como não conhecida, como o nome de um estudante estrangeiro.

Exemplo de análise morfológica correta e incorreta de uma palavra não conhecida (Fronteira de sintagma = Aprendizado de Máquina)
Exemplo de análise morfológica correta e incorreta de uma palavra não conhecida (Fronteira de sintagma = Bunsetu)

2. Erros na leitura

2-1) Palavras cuja leitura muda dependendo do contexto

O Suzuki-kun tem dificuldades na leitura de palavras cuja pronúncia muda dependendo do contexto. Isso não está relacionado às diferentes leituras entre on'yomi e kun'yomi. A dificuldade usualmente ocorre quando há múltiplas leituras em kun'yomi. É possível mudar as predições realizadas para núcleos acentuais com o editor de pitch, mas não fornecemos uma maneira de corrigir a leitura. Note caso, insira a palavra em hiragana.

Exemplo de palavra com diversas leituras em kun'yomi (Fronteira de sintagma = Aprendizado de Máquina)
Exemplo de palavra com diversas leituras em kun'yomi (Fronteira de sintagma = Bunsetsu)

2-2) Numeral + Contadores

O novo Suzuki-kun aprendeu a ler uma variedade de expressões numéricas. O mesmo é válido para os símbolos #$%&=~@+〒¥£. Contudo, pode haver erros quando o número é seguido por contador (número + contador). Contadores são típicos exemplos de uma palavra em que a leitura é dependente do contexto, tais como 一本,二本,三本・・・一日,二日,三日, etc. Usualmente a leitura de números + contadores é tratada pelo pós-processamento da análise morfológica, mas ainda é insuficiente.

Exemplo de variedade de símbolos e expressões (erros incluídos. Fronteira de sintagma = Aprendizado de Máquina)
Exemplo de variedade de símbolos e expressões (erros incluídos. Fronteira de sintagma = Bunsetsu)

3. Ambiguidade de significado e controle de intonação

木のしたで雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を眺めた。

Dependendo de qual expressão "木のしたで" está relacionada, sabe-se que intonação muda um pouco. Isso não significa que o Suzuki-kun processou explicitamente cada oração e decidiu a intonação. Para expressar tais diferenças, faz-se necessário pontuar apropriadamente.

Exemplo 雨宿 (Fronteira de sintagma = Aprendizado de Máquina)
Exemplo 雨宿 (Fronteira de sintagma = Bunsetsu)

きれいじゃない。

Esta expressão se refere a casos em que o indivíduo está impressionado com algo que é きれい (「きれいであることを感嘆する」) e também a casos em o indivíduo enfatiza o fato de algo não ser きれい (「きれいではないことを主張する」). Em ambos os casos a intonação é diferente. O Suzuki-kun não pode determinar a interpretação da frase acima baseado no contexto. Ele apenas lê cada sentença individualmente, isolada do contexto. Desta maneira, não se recomenda inserir textos que requerem um nível sofisticado de intonação do Suzuki-kun. Favor levar em consideração as limitações dele (é possível realizar mudanças no editor de pitch).

Exemplo きれいじゃない (Fronteira de sintagma = Aprendizado de Máquina)
Exemplo きれいじゃない (Fronteira de sintagma = Bunsetsu)