
LINGUATEC IA, un proxecto para avanzar na dixitalización do aragonés, catalán, euskera e occitano, mediante a intelixencia artificial
- Este proxecto europeo transpirenaico e transfronteirizo sentou as bases para desenvolver coñecemento en intelixencia artificial aplicable ás linguas con poucos recursos de ambos os lados do Pirineo
- Cofinanciado por FEDER a través do Programa POCTEFA 2021-2027 e liderado por Elhuyar (a través do seu centro de intelixencia artificial Orai), ten o obxectivo de aplicar novos modelos de linguaxe xenerativos nestas linguas
O procesamiento da linguaxe é unha poderosa ferramenta para as comunidades con linguas con escasos recursos, que axuda a revitalizar a lingua e a promover efectivamente o seu uso. É de vital importancia para estas linguas subirse á onda da intelixencia artificial, para non quedar atrás. A calidade alcanzada no procesamiento da linguaxe natural non está ao alcance de todas as linguas, e a colaboración resulta fundamental para desenvolver novos recursos e ferramentas lingüísticas. É preciso incrementar o esforzo en innovación, apostando pola investigación aplicada en intelixencia artificial no procesamiento da linguaxe natural.
O obxectivo do proxecto europeo EFA 104/01-LINGUATEC IA (Intelixencia Artificial), cofinanciado polo Fondo Europeo de Desenvolvemento Rexional a través da 1ª convocatoria INTERREG POCTEFA 2021-2027, é desenvolver coñecemento en intelixencia artificial sobre novos modelos de linguaxe xenerativos aplicables a linguas con poucos recursos e a súa utilización para avanzar na dixitalización do aragonés, do catalán, do eúscaro e do occitano (linguas do territorio POCTEFA) e na construción dunha infraestrutura lingüística e intelixente transfronteiriza que facilite a comunicación entre os falantes das distintas linguas e o acceso multilingüe a información.
O consorcio deste proxecto transfronteirizo —liderado por Elhuyar (a través do seu centro de intelixencia artificial Orai) e composto polO Congrés Permanent da Lenga Occitana, HITZ zentroa (UPV/EHU), Universidade Jean Jaures de Toulouse, Universidade de Perpiñán, IKER-CNRS de Baiona, Goberno de Aragón e Universidade de Lleida— sentou as bases de traballo na súa reunión inicial celebrada o 15 de xaneiro en Usurbil (Gipuzkoa). O consorcio está formado por “entidades de alto nivel que compoñen unha comunidade científica ao redor das seis linguas do Pirineo, co obxectivo de recuperalas e revitalizalas”, afirma Josu Aztiria, coordinador do proxecto LINGUATEC. Este proxecto, “contribúe á articulación social e cultural do territorio transfronteirizo, reforzando un elemento clave da cultura local, as linguas”, engade.
Nese sentido, as entidades participantes no proxecto traballan xa en diferentes ámbitos relacionados co procesamiento da linguaxe, como é o desenvolvemento de novos algoritmos e arquitecturas neuronais adaptados a situacións de cómputo e recursos lingüísticos limitados. Así mesmo, “queremos mellorar os sistemas de transcrición, tradución automática neuronal e síntese de voz do euskara, catalán, occitano, aragonés e as súas variantes dialectais, que combinen co francés e o español —sinala Aztiria—, así como desenvolver unha plataforma lingüística multilingüe de subtitulado e dobraxe automática”. Ademais, “previmos crear unha plataforma ou repositorio online con todos os recursos, tecnoloxías e aplicacións que desenvolvamos para as linguas dos Pireneos”, engade.
As entidades que compoñen este proxecto cren que o seu traballo será de gran axuda “tanto para a comunidade investigadora e profesional que traballa no ámbito das linguas e a súa dixitalización, como para as entidades públicas e privadas que poderán mellorar os seus servizos e facelos accesibles en diferentes idiomas”, e se enorgullecen de “proporcionar á cidadanía recursos e ferramentas válidas que axuden a comunicarse máis fácil nunha contorna multilingüe”.
O proxecto LINGUATEC IA non é un proxecto que nace agora. Trátase dun proxecto que recolle a testemuña de LINGUATEC, proxecto previo cofinanciado con fondos POCTEFA, finalizado xa, no que tras tres anos de andaina e o alto nivel de desenvolvemento alcanzado, as entidades socias deron un paso de carácter estratéxico e consolidaron unha rede de excelencia en intelixencia artificial para a construción dunha infraestrutura lingüística transfronteiriza.
Proxecto cofinanciado polo Fondo Europeo de Desenvolvemento Rexional (FEDER)