Uso de cookies. Este sitio web utiliza cookies, para facilitar su navegación. Si continúa navegando, entenderemos que está usted dando su consentimiento para la utilización de dichos cookies. Para mayor información, consulte nuestra política de cookies.

Hizkuntza-baliabideak eta -tresnak

Lexiko elebidunak/eleaniztunak ezinbestekoak dira hainbat hizkuntza-teknologiaren aplikazioan: itzulpen automatikoan, itzulpen-memorien bidezko sistemen datu-base terminologikoetan eta glosarioetan, informazioa bilatzeko sistema eleaniztunetan, Euskal WordNet eta antzeko ezagutza-base eleaniztunak elikatzerakoan, hiztegigintza orokorrean zein teknikoan…

Lexikoi elebidun/eleaniztunak testuetatik erdiautomatikoki eratzeko bi arrazoi nagusi daude:

Lexikoiak eratzea kostu handiko lana da, eta hizkuntza-teknologien bidez erauzte-prozesua automatiza daiteke
Datu linguistikoak testuetan daude, eta testu-masa handiak behar dira lexikoi adierazgarriak eraikitzeko; tamaina horretako testuak prozesatzeko, ezinbestekoa da hizkuntza-teknologien laguntza

Erauzterm

Helburua: Euskarazko testuetatik edo corpusetatik terminoak automatikoki erauzteko teknikak ikertuz eta garatuz, Erauterm tresna garatu dugu.

Argitalpenak:

Gurrutxaga A., Saralegi X., Ugartetxea S., Alegria I. 2005."Erauzterm: euskarazko terminoak erauzteko tresna erdiautomatikoa". Mendebalde Kultur Alkartea, IX. Jardunaldiak: Euskera zientifiko-teknikoa. Bilbao.
Alegria I., Gurrutxaga A., Lizaso P., Saralegi X., Ugartetxea S., Urizar R. 2004. "Linguistic and Statistical Approaches to Basque Term Extraction". GLAT 2004: The production of specialized texts.Barcelona.
Alegria I., Gurrutxaga A., Lizaso P., Saralegi X., Ugartetxea S., Urizar R. 2004. "An Xml-Based Term Extraction Tool for Basque". 4th International Conference on Language Resources and Evaluations (LREC). Lisbon.

ElexBI

Helburua: Gaztelania-euskara itzulpen-memorietatik termino baliokideen bikoteak automatikoki erauzteko tresna garatu dugu. Helburu hori ikertze-alor zabalago baten baitan kokatuta dago: corpus paraleloetatik baliokidetza lexikalak erauztea.

Argitalpenak:

Alegria I., Gurrutxaga A., Saralegi X., Ugartetxea S. 2006. "ELeXBI, A Basic Tool for Bilingual Term Extraction from Spanish-Basque Parallel Corpora".12th EURALEX International Congress. Torino.
A. Gurrutxaga, A. Pagoaga, X. Saralegi, S. Ugartetxea, I. Alegria. 2005."Euskara-gaztelania terminologia Elebidunaren Erauzle Automatikoa". EHU. Bilbo.

AzerHitz

Helburua: corpus konparagarrietatik lexiko elebidunak era erdiautomatikoan erauzteko teknikak ikertu eta garatzea. Erauzterm eta ELexBIproiektuetan egindako lana hartu da abiapuntutzat. 

Argitalpenak:

X. Saralegi, I. san Vicente, M. López de Lacalle, 2008. "Mining Term Translations from Domain Restricted Comparable Corpora". SEPLN 2008. Madril.
X. Saralegi, I. San Vicente, A. Gurrutxaga. 2008. "Automatic Extraction of Bilingual Terms from Comparable Corpora in a Popular Science Domain". 6th International Conference on Language Resources and Evaluations (LREC) - Building and using Comparable Corpora workshop.Marrakech.