Skip to main content
VIGICOVID sistema sortu dugu

COVID-19ari buruzko artikulu zientifikoetako informazioa automatikoki erauzteko sistema

2022 | Martxoak 24

Galderak hizkuntza naturalean eginez COVID-19 eta SARS-CoV-2ari buruzko informazio-oldetik erantzunak lortzeko sistema da VIGICOVID.

VIGICOVID sistema sortu dute UPV/EHUko, UNEDeko eta Elhuyarreko ikertzaileek lankidetzan, CRUEren Fondo Supera COVID-19 funtsa baliatuz. Pandemiaren inguruan mundu mailan egindako ikerketek sortutako informazio-oldean erantzunak bilatzeko beharrari erantzuten dio, eta adimen artifizialaren bidez, argitalpen zientifikoz osatutako bilduma batetik erantzunak bistaratzen dizkio erabiltzaileari era antolatu batean, hizkuntza naturaleko galdera-erantzunak erabiliz.

Mundu osoko ikertzaile biosanitarioak ahalegin handia ari dira egiten COVID-19aren eta SARS-CoV-2aren inguruko ezagutza sortzen. Ahalegin horren ondorioz, argitalpen zientifiko asko eta asko sortzen dira, oso azkar, eta horrek zaildu egiten du informazio hori guztia kontsultatzea eta aztertzea. Horregatik, informazio-sistemak eman behar zaizkie adituei eta erabakiak hartu behar dituzten agintariei, behar duten ezagutza eskuratzeko.


Horixe ikertu dute VIGICOVID proiektuan UPV/EHUko HiTZ zentroko, UNEDeko NLP & IR taldeko eta Elhuyarreko Adimen Artifiziala Hizkuntzan unitateko ikertzaileek, CRUEk emandako Fondo Supera COVID-19 funtsa baliatuz. COVID-19ari eta SARS-CoV-2ari buruz mundu osoko ikertzaileek argitaratutako artikulu zientifikoen bilduma eguneratu batetik hizkuntza naturaleko galdera-erantzun bidez informazioa erauzten duen prototipo bat sortu dute, UNEDeko ikertzaileek koordinatuta. 


“Bilaketak egiteko paradigma aldatzen ari da adimen artifizialari esker —dio Eneko Agirre UPV/EHUko HiTZ zentroaren zuzendariak—. Orain arte, sarean informazioa bilatzean, galdera bat sartu, eta bistaratzen diren dokumentuetan bilatu behar izaten da galdera horren erantzuna. Paradigma berriaren arabera, ordea, gero eta zabalduago daude galdera egin eta zuzenean erantzuna ematen duten sistemak, dokumentu osoa irakurri beharrik gabe”.


Sistema honetan, “erabiltzaileak informazioa ez du gako-hitzen bidez eskatzen, baizik eta zuzeneko galdera bat eginez”, dio Xabier Saralegi Elhuyarko ikertzaileak. Sistemak bi pausotan bilatzen ditu galdera horren erantzunak: “Lehenbizi, galderaren erantzuna izan dezaketen dokumentuak berreskuratzen ditu bildumatik, gako-hitzak eta zuzeneko galderak konbinatzen dituen teknologia bat erabiliz. Horretarako, arkitektura neuronalak aztertu ditugu”, dio Saralegi doktoreak. Adibideekin elikatutako arkitektura neuronal sakonak erabili dituzte: “Horrek esan nahi du bilaketa egiteko modeloak eta galderei erantzuteko modeloak ikasketa automatiko sakonaren bitartez entrenatzen direla”. 


Dokumentu-sorta bat erauzi ondoren, berriro prozesatzen dira dokumentuak galdera-erantzuneko sistema baten bidez, erantzun zehatzak lortzeko: “Galderak erantzuten dituen motorra egin dugu, zeina gai baita galdera eta dokumentu bana emanda esateko erantzuna dokumentu horretan dagoen edo ez, eta erantzuna dokumentuan baldin badago, esateko zehazki non dagoen”, dio Agirre doktoreak. 


Erraz merkaturatu daitekeen prototipoa


Ikertzaileak pozik daude ikerketan lortu dituzten emaitzekin: “Esperimentu horietan aztertu ditugun teknika eta ebaluazioetatik emaitzarik onenak eman dituztenak erabili ditugu prototipoan”, dio Elhuyarko ikertzaileak. Oinarri teknologiko sendoa ezarri dute ikertzaileek, eta zenbait argitalpen zientifiko argitaratu dituzte horrekin lotuta. “Premiazko informazio-beharrak daudenean bilaketak egiteko beste modu bat lortu dugu, informazioa kontsumitzeko prozesua errazten duena. Ikertzaile gisa frogatu dugu guk proposatzen dugun teknologia posible dela, eta sistemak emaitza onak ematen dituela”, adierazi du Agirrek.


“Oinarrizko ikerketa-proiektu bateko emaitza-prototipo bat lortu dugu, ez da produktu komertzial bat”, azpimarratu du Saralegik. Baina horrelako prototipoak erraz eta denbora gutxian molda daitezke, merkaturatu eta jendearen esku jarri ahal izateko. Ikertzaileek nabarmentzen dute adimen artifizialari esker gero eta tresna ahaltsuagoak izango direla eskura dokumentu-base handiekin lan egiteko. “Arlo honetan oso azkar ari gara aurrera egiten. Eta, gainera, ikertzen den hori erraz iristen da merkatura”, dio UPV/EHUko ikertzaileak.


Erreferentzia bibliografikoa


Arantxa Otegi, Iñaki San Vicente, Xabier Saralegi, Anselmo Peñas, Borja Lozano, Eneko Agirre
Information retrieval and question answering: A case study on COVID-19 scientific literature
Knowledge-Based Systems
DOI: 10.1016/j.knosys.2021.108072
 

ARGAZKIA: 123rf argazki-basetik hartua da.