Testuen meatzaritza
Testuen meatzaritza (text mining eta text analytics izenez ere ezaguna) testuetatik informazio egituratua edo ezagutza erauzteko teknikak biltzen dituen alorra da. Teknika horien bidez, erraz eta eraginkortasunez azter daiteke testu-bildumetan (batzuetan, big data motakoak) kodetuta dagoen informazioa, eta horrek nabarmen errazten ditu erabakiak hartzeko prozesuak. Alor zabal horretan, askotariko atazak daude: testuak sailkatzea, testuak multzokatzea, entitate izendunak erauztea, iritziak erauztea, dokumentuak laburtzea eta informazioa berreskuratzea, besteak beste. Gaur egun, testuen meatzaritzako teknologiak arrakastaz erabiltzen dira gobernuen, ikerkuntzaren zein merkatuen hainbat beharri erantzuteko. Hauek dira gure ikerketa-lerro nagusiak:
- Bilaketa elebakarren emaitza eleaniztunak.
- Hizkuntza-sailkapena.
- Iritzien polaritate-sailkapena.
- Albisteetarako gai-etiketen sorkuntza.
- Kronologien sorkuntza.
