Aller au contenu principal

La traduction a été créée automatiquement (elia.eus)

Lincuatec IA proeiktua martxan da

LINGUATEC IA, un projet pour progresser dans la numérisation de l'aragonais, du catalan, de l'euskera et de l'occitan, par l'intelligence artificielle

2024 | janvier 29

 

  • Ce projet européen transpyrénéen et transfrontalier a jeté les bases pour développer des connaissances en intelligence artificielle applicables aux langues peu peuplées des deux côtés des Pyrénées.
  • Cofinancé par le FEDER dans le cadre du programme POCTEFA 2021-2027 et dirigé par Elhuyar (via son centre d'intelligence artificielle Orai), il vise à mettre en œuvre de nouveaux modèles de langage génératif dans ces langues

 

 

Le traitement du langage est un outil puissant pour les communautés avec des langues à faibles ressources, qui aide à revitaliser la langue et à promouvoir efficacement son utilisation. Il est d'une importance vitale pour ces langues de monter à la vague de l'intelligence artificielle, pour ne pas rester en arrière. La qualité atteinte dans le traitement du langage naturel n'est pas à la portée de toutes les langues, et la collaboration est essentielle pour développer de nouvelles ressources et outils linguistiques. Il faut intensifier les efforts en matière d’innovation en misant sur la recherche appliquée en intelligence artificielle dans le traitement du langage naturel.

L'objectif du projet européen EFA 104/01-LINGUATEC IA (Intelligence artificielle), cofinancé par le Fonds européen de développement régional à travers le 1er appel INTERREG POCTEFA 2021-2027, est de développer des connaissances en intelligence artificielle sur de nouveaux modèles de langage génératif applicables aux langues avec peu de ressources et leur utilisation pour avancer dans la numérisation de l'aragonais, du catalan,

Le consortium de ce projet transfrontalier — dirigé par Elhuyar (via son centre d'intelligence artificielle Orai) et composé de Lo Congrés Permanents de la Lenga Occitana, HITZ zentroa (UPV/EHU), Université Jean Jaures de Toulouse, Université de Perpignan, IKER-CNRS bases de Baiurone Le consortium est composé d’« entités de haut niveau qui composent une communauté scientifique autour des six langues des Pyrénées, dans le but de les récupérer et de les revitaliser », déclare Josu Aztiria, coordinateur du projet LINGUATEC. Ce projet « contribue à l’articulation sociale et culturelle du territoire transfrontalier, en renforçant un élément clé de la culture locale, les langues », ajoute-t-il.

À cet égard, les entités participant au projet travaillent déjà dans différents domaines liés au traitement du langage, tels que le développement de nouveaux algorithmes et architectures neuronales adaptés aux situations de calcul et aux ressources linguistiques limitées. De même, « nous voulons améliorer les systèmes de transcription, de traduction automatique neuronale et de synthèse vocale de l’euskara, du catalan, de l’occitan, de l’aragonais et de ses variantes dialectales, qui combinent français et espagnol, souligne Aztiria, ainsi que développer une plateforme linguistique multilingue de sous-titrage et de doublage automatique ». De plus, « nous avons prévu de créer une plateforme ou un référentiel en ligne avec toutes les ressources, technologies et applications que nous développons pour les langues des Pyrénées », ajoute-t-il.

Les entités qui composent ce projet estiment que leur travail sera d’une grande aide « tant pour la communauté de recherche et de professionnels travaillant dans le domaine des langues et de leur numérisation, que pour les entités publiques et privées qui pourront améliorer leurs services et les rendre accessibles dans différentes langues », et elles sont fières de « fournir aux citoyens des ressources et des outils valables qui aident à communiquer plus facilement dans un environnement multilingue ».

Le projet LINGUATEC IA n'est pas un projet qui naît maintenant. Il s'agit d'un projet qui rassemble le témoin de LINGUATEC, projet antérieur cofinancé par des fonds POCTEFA, déjà achevé, au cours duquel, après trois ans de route et le haut niveau de développement atteint, les entités sociales ont franchi un pas de caractère stratégique et ont consolidé un réseau d'excellence en intelligence artificielle pour la construction d'une infrastructure linguistique transfrontalière.

Projet cofinancé par le Fonds européen de développement régional (FEDER)