
Texto a voz en 6 idiomas
- Elhuyar ofrece agora a posibilidade de utilizar voces automáticas en 6 idiomas: eúscaro, castelán, francés, inglés, catalán e galego.
- Introducimos un cadro de texto no sitio web ttsneuronala.elhuyar.eus, que permite converter en voz calquera contido: escribe o texto en devandito cadro, elixe o idioma e escoita o contido.
Seis meses despois da creación de voces automáticas (TTS) baseadas en redes neuronais, Elhuyar presenta dúas novidades significativas. En primeiro lugar, a conversión de texto a voz en 6 idiomas, e en segundo lugar, a posibilidade de escoitar calquera contido utilizando o cadro de texto.
Por tanto, en diante, o sistema de síntese da fala de Elhuyar poderá utilizarse en 6 idiomas: eúscaro, castelán, francés, inglés, catalán e galego. Dese modo, os usuarios contarán con máis opcións para converter en voz tantos textos soltos como documentos completos.
A segunda novidade é o cadro de texto que se ofrece na web, o que permite escoitar calquera contido coa voz que se desexe. Unha vez accedas á web ttsneuronala.elhuyar.eus, pulsa o botón Proba o TTS, e mostrarase o cadro de texto. É moi fácil de usar: escribe o texto, selecciona o idioma e a voz, e obterás de inmediato o audio do texto. Tamén podes subir directamente un documento á plataforma e recibirálo logo convertido en voz.
Aínda que as voces TTS parecen reais, foron creadas mediante tecnoloxía baseada en redes neuronais; é dicir, trátase de sistemas creados a partir de gravacións específicas de voces utilizando para iso técnicas baseadas na intelixencia artificial. Elhuyar, ademais de pór a disposición do usuario as súas voces TTS, ofrece tamén a posibilidade de crear voces personalizadas.
En canto á súa integración, as voces TTS de Elhuyar poden incorporarse a calquera aplicación a través da REST API dispoñible para os clientes.
Tecnoloxía desenvolvida por Orai
Estas tecnoloxías de conversión de texto en voz foron creadas polo centro de intelixencia artificial Orai, e este novo servizo mostra o avance na investigación no campo da síntese de voz. Orai aborda tamén outras liñas de investigación, entre as que cabe destacar as seguintes: a síntese da fala sen marcas de xénero, a síntese da fala emocional e os sistemas de imitación de voz a partir de pequenas mostras. Orai é un centro especializado na área NLP (Natural Language Processing), que ofrece investigación de alto nivel e solucións tecnolóxicas intelixentes a empresas e institucións.