Ir o contido principal

A tradución xerouse de maneira automática  (elia.eus)

Testua ahots bihurtzeko aukera 6 hizkuntzatan

Texto a voz en 6 idiomas

2023 | Xullo 19
  • Elhuyar ofrece agora a posibilidade de utilizar voces automáticas en 6 idiomas: eúscaro, castelán, francés, inglés, catalán e galego. 
  • Introducimos un cadro de texto no sitio web ttsneuronala.elhuyar.eus, que permite converter en voz calquera contido: escribe o texto en devandito cadro, elixe o idioma e escoita o contido.

Seis meses despois da creación de voces automáticas (TTS) baseadas en redes neuronais, Elhuyar presenta dúas novidades significativas. En primeiro lugar, a conversión de texto a voz en 6 idiomas, e en segundo lugar, a posibilidade de escoitar calquera contido utilizando o cadro de texto.

Por tanto, en diante, o sistema de síntese da fala de Elhuyar poderá utilizarse en 6 idiomas: eúscaro, castelán, francés, inglés, catalán e galego. Dese modo, os usuarios contarán con máis opcións para converter en voz tantos textos soltos como documentos completos. 

A segunda novidade é o cadro de texto que se ofrece na web, o que permite escoitar calquera contido coa voz que se desexe. Unha vez accedas á web ttsneuronala.elhuyar.eus, pulsa o botón Proba o TTS, e mostrarase o cadro de texto. É moi fácil de usar: escribe o texto, selecciona o idioma e a voz, e obterás de inmediato o audio do texto. Tamén podes subir directamente un documento á plataforma e recibirálo logo convertido en voz. 

Aínda que as voces TTS parecen reais, foron creadas mediante tecnoloxía baseada en redes neuronais; é dicir, trátase de sistemas creados a partir de gravacións específicas de voces utilizando para iso técnicas baseadas na intelixencia artificial. Elhuyar, ademais de pór a disposición do usuario as súas voces TTS, ofrece tamén a posibilidade de crear voces personalizadas. 

En canto á súa integración, as voces TTS de Elhuyar poden incorporarse a calquera aplicación a través da REST API dispoñible para os clientes. 


Tecnoloxía desenvolvida por Orai

Estas tecnoloxías de conversión de texto en voz foron creadas polo centro de intelixencia artificial Orai, e este novo servizo mostra o avance na investigación no campo da síntese de voz. Orai aborda tamén outras liñas de investigación, entre as que cabe destacar as seguintes: a síntese da fala sen marcas de xénero, a síntese da fala emocional e os sistemas de imitación de voz a partir de pequenas mostras. Orai é un centro especializado na área NLP (Natural Language Processing), que ofrece investigación de alto nivel e solucións tecnolóxicas intelixentes a empresas e institucións.