
Text a veu en 6 idiomes
- Elhuyar ofereix ara la possibilitat d'utilitzar veus automàtiques en 6 idiomes: basc, castellà, francès, anglès, català i gallec.
- Hem introduït un quadre de text en el lloc web ttsneuronala.elhuyar.eus, que permet convertir en veu qualsevol contingut: escriu el text en aquest quadre, tria l'idioma i escolta el contingut.
Sis mesos després de la creació de veus automàtiques (TTS) basades en xarxes neuronals, Elhuyar presenta dues novetats significatives. En primer lloc, la conversió de text a veu en 6 idiomes, i en segon lloc, la possibilitat d'escoltar qualsevol contingut utilitzant el quadre de text.
Per tant, d'ara endavant, el sistema de síntesi de la parla d'Elhuyar podrà utilitzar-se en 6 idiomes: basc, castellà, francès, anglès, català i gallec. D'aquesta manera, els usuaris comptaran amb més opcions per a convertir en veu tant textos solts com documents complets.
La segona novetat és el quadre de text que s'ofereix en la web, la qual cosa permet escoltar qualsevol contingut amb la veu que es desitgi. Una vegada accedeixis a la web ttsneuronala.elhuyar.eus, prem el botó Prova el TTS, i es mostrarà el quadre de text. És molt fàcil d'usar: escriu el text, selecciona l'idioma i la veu, i obtindràs immediatament l'àudio del text. També pots pujar directament un document a la plataforma i el rebràs després convertit en veu.
Encara que les veus TTS semblen reals, han estat creades mitjançant tecnologia basada en xarxes neuronals; és a dir, es tracta de sistemes creats a partir d'enregistraments específics de veus utilitzant per a això tècniques basades en la intel·ligència artificial. Elhuyar, a més de posar a la disposició de l'usuari les seves veus TTS, ofereix també la possibilitat de crear veus personalitzades.
Quant a la seva integració, les veus TTS d'Elhuyar poden incorporar-se a qualsevol aplicació a través de la REST API disponible per als clients.
Tecnologia desenvolupada per Orai
Aquestes tecnologies de conversió de text en veu han estat creades pel centre d'intel·ligència artificial Orai, i aquest nou servei mostra l'avanç en la recerca en el camp de la síntesi de veu. Orai aborda també altres línies de recerca, entre les quals cal destacar les següents: la síntesi de la parla sense marques de gènere, la síntesi de la parla emocional i els sistemes d'imitació de veu a partir de petites mostres. Orai és un centre especialitzat en l'àrea NLP (Natural Language Processing), que ofereix recerca d'alt nivell i solucions tecnològiques intel·ligents a empreses i institucions.