Elhuyar ha creado voces automáticas basadas en redes neuronales (TTS)
- Las voces automáticas (TTS) que ofrece Elhuyar están a disposición de la sociedad y de los clientes.
- Permite crear TTS personalizados a partir de sistemas basados en la voz de una persona y la imiten.
- Las voces automáticas de Elhuyar se pueden utilizar a través de la barra lectora de los sitios web o a través de REST API.
Elhuyar ha dado un paso más en el campo de las tecnologías de la lengua y la inteligencia artificial, con el objetivo de seguir dando respuesta a los retos de la sociedad en el ámbito de la digitalización. En esta ocasión ha creado sistemas neuronales que permiten convertir el texto en voz y los ha puesto a disposición de la sociedad.
Aunque las voces TTS parecen reales, se generan mediante una tecnología basada en redes neuronales. Además de poner sus propias voces TTS a disposición de la sociedad, Elhuyar ofrece a sus clientes la posibilidad de crear voces TTS personalizadas.
Elhuyar ha puesto a disposición de los usuarios una gama de voces sintéticas que parecen reales, tanto en euskera como en castellano, y ha creado una barra lectora que mejora la accesibilidad de los sitios web.
Si se inserta la barra lectora en un sitio web, los usuarios podrán escuchar los contenidos de la web mediante las voces sintéticas. Basta con pulsar el botón play para escuchar el contenido del sitio web y, al mismo tiempo, se muestra resaltada la parte del texto que está leyendo la voz TTS. La barra lectora se puede insertar fácilmente en los sitios web de los clientes; a modo de ejemplo, Elhuyar la ha insertado en estos dos sitios: elhuyar.aldizkaria.eus y zientzia.eus.
Las voces TTS de Elhuyar pueden incorporarse a cualquier aplicación a través de la REST API disponible para los clientes. Es así como se han integrado las voces en el sitio web hiztegiak.elhuyar.eus.
Elhuyar ofrece también la posibilidad de crear voces TTS personalizadas. Es decir, ofrece la posibilidad de crear un sistema basado en la voz de una persona a la cual el sistema imita. Las voces son personalizadas y únicas. Con este tipo de voces TTS personalizadas, las empresas pueden crear voces propias que les permitan, entre otras muchas opciones, reforzar su marca y su estrategia de branding. Por ejemplo, las empresas pueden utilizar una voz TTS personalizada en su comunicación digital con sus clientes: contestador automático, recursos audiovisuales… Además, estas voces personalizadas cuidarán de su privacidad y solo podrán ser utilizadas por el cliente. Más información: ttsneuronala.elhuyar.eus
Tecnología desarrollada por Orai
Estas tecnologías de conversión de texto en voz son creadas por la iniciativa de inteligencia artificial Orai, y este nuevo servicio muestra el avance en la investigación en el campo de la síntesis de voz. Orai aborda también otras líneas de investigación, entre las que cabe destacar las siguientes: la síntesis del habla sin marcas de género, la síntesis del habla emocional y los sistemas de imitación de voz a partir de pequeñas muestras. Orai es una iniciativa especializada en el área NLP (Natural Language Processing), que ofrece investigación de alto nivel y soluciones tecnológicas inteligentes a empresas e instituciones.