Vés al contingut

Portem molts anys treballant en la creació de corpus. Hem creat corpus monolingües, bilingües i multilingües; aquests corpus s'han convertit en una eina imprescindible per a completar i actualitzar contínuament els diccionaris.
Per a crear els corpus utilitzem una tecnologia pròpia, fruit dels treballs de recerca que duem a terme en l'àmbit de les tecnologies de la llengua.

Heus aquí una mostra dels nostres corpus principals:

  • Corpus monolingüe (eu) Lexikoaren Behatokia. És un projecte d'Euskaltzaindia, desenvolupat en col·laboració amb UZEI i el grup de recerca IXA de la UPV/EHU. A la fi de 2020 el corpus comptava amb 77.958.327 formes textuals i continuarà creixent cada any.
  • Corpus paral·lel (en-és/eu) EHUskaratuak, creat per a la UPV/EHU. Es tracta d'un corpus multilingüe compost per 18.048.431 formes textuals.
  • Corpus de ciència i tecnologia (ZTC), creat per Elhuyar, en col·laboració amb el grup de recerca IXA de la UPV/EHU: Es tracta d'un corpus etiquetat compost per 8,5 milions de formes textuals.
  • Corpus paral·lel multilingüe Consumer, realitzat per a la Fundació Eroski:

Si vols més informació, emplena el formulari

Responsable: Elhuyar

Objectiu: Gestió de les sol·licituds i les consultes realitzades.

Legitimació: Permisos obtinguts, interès legítim i compliment de la normativa.

Destinataris: Terceros prestadores de servicios, incluyendo transferencias internacionales.

Drets: Drets d'accés, rectificació i supressió de les dades i de limitació i oposició al seu tractament, incloent-hi el dret d’oposar-se a ser objecte de decisions individuals automatitzades.

Origen: Usuari.

Mostra la política de privadesa