Pasar al contenido principal
DABILENA, Interneten dabilen euskara aztertzeko ataria

DABILENA, el portal de análisis del euskera utilizado en Internet

2021 | Julio 15
  • La web que consulta textos reales como si fueran diccionarios

Elhuyar ha elaborado el portal de corpus Dabilena, disponible para todo el público en dabilena.elhuyar.eus. Este portal permite hacer búsquedas en gran parte de los textos escritos en euskera en los últimos años en Internet, es decir, búsquedas sobre el uso real del euskera.
 

El sitio web Dabilena cuenta con tres secciones principales: ‘Non erabili da?’(¿Dónde se ha utilizado?), ‘Nola itzuli da?’ (¿Cómo se ha traducido?) y ‘Zer hitzekin konbinatzen da?’ (¿Con qué palabras se combina?').

En el apartado ‘Non erabili da?’, podremos ver en qué web y en qué contexto ha aparecido la palabra que buscamos.

 

Dabilena_Non erabili da

 

En el apartado ‘Nola itzuli da?’, se puede consultar el corpus bilingüe. De este modo, las búsquedas se pueden hacer tanto en euskera como en castellano y Dabilena nos mostrará ejemplos de ambos. En primer lugar, nos mostrará una relación de las traducciones de la palabra consultada y, debajo, los ejemplos de los dos idiomas en su contexto.

 

Dabilena_Nola itzuli da

 

El apartado ‘Zer hitzekin konbinatzen da?’ sirve para consultar con qué palabras se utiliza una palabra determinada. Por ejemplo, podemos consultar con qué palabras se utiliza más el sustantivo aurrerapen.

Dabilena_Zer hitzekin konbinatzen da

 

También se pueden hacer búsquedas comparativas, es decir, comparar el uso de dos variantes en el portal Dabilena. Así podemos consultar, por ejemplo, cuál de estas dos palabras tiene más presencia en Internet: boluntario o bolondres.

Dabilena_Konparazio-bilaketak

 

No podemos dejar de mencionar otra herramienta muy útil que hemos incluido en el portal. El portal Dabilena permite, con su apartado ‘Corpus gehiago’, consultar simultáneamente varios corpus disponibles en Internet.

 

Dabilena_Corpus gehiago

 

Dabilena es la herramienta perfecta para profesionales de la lengua como traductores, lingüistas o profesores de euskera, así como para aquellos que crean recursos lingüísticos y desarrollan tecnologías lingüísticas para dichos profesionales.


Corpus de texto
Este portal tiene como objetivo la recopilación automática de los textos necesarios para el análisis del euskera utilizado en Internet (corpus de web) y, una vez procesados con herramientas de tecnología lingüística, ponerlos a disposición de los usuarios para su consulta.


Los corpus de textos son, hoy en día, la herramienta indispensable para varios de los ámbitos y actividades relacionados con la lengua, como la lexicografía, la traducción, la enseñanza de idiomas, la lingüística y el desarrollo de tecnologías lingüísticas.


Han transcurrido nueve años desde que Elhuyar iniciara la de elaboración de corpus web en euskera y, desde entonces, no ha cejado en el desarrollo de tecnologías de recopilación y explotación de corpus. Además, Internet ha visto incrementado notablemente el volumen de textos en euskera, que son cada vez más diversos. De ahí que Dabilena haya incorporado corpus de mayor tamaño, nuevas funcionalidades y sistemas de consulta innovadores.

 

Colaboradores y patrocinadores
Para acabar, queremos hacer mención a los colaboradores que nos han acompañado en este proceso. Destacar, por un lado, la labor realizada por el Grupo IXA en el procesamiento del corpus y, por otro, los patrocinadores que han hecho posible este trabajo: Laboral Kutxa y la Diputación Foral de Gipuzkoa.