Informatika eta euskara uztartzen ditu Itziar Aldabek (Beasain, 1979) Ixa taldean. Europa mailako News Reader proiektuan ere lanean ari da. Ordenagailuari gauzak ulertarazten saiatzen da.Informatikan doktoratua zara? Zein tesi landu zenuen?Hizkuntzaren...
Informatika eta euskara uztartzen ditu Itziar Aldabek (Beasain, 1979) Ixa taldean. Europa mailako News Reader proiektuan ere lanean ari da. Ordenagailuari gauzak ulertarazten saiatzen da.
Informatikan doktoratua zara? Zein tesi landu zenuen?
Hizkuntzaren prozesamenduko tresnak erabiliz ariketen sorkuntza automatikoa tesia egin dut. Irakasleentzat test erako ariketak egiteko baliabideak ematea izan da tesiaren helburua. Hau da, testu bat emanda, test erako ariketak automatikoki sortzea. Hizkuntza bat ikasteko, hiztegi bat lantzeko, aukera anitzeko ariketak sortzeko, EGAren azterketako sarrerako proba…. Tesian erakutsi genuen tresna adituentzat edo irakasleentzat lagungarria dela. Finketa bat behar du, aditu batek hau ondo dago eta bestea ez esatea, alegia. Euskararako eta ingeleserako baliabidea da.
Gaur egun, Ixa taldeko kidea zara. Zertan zabiltza?
Hautazko ikasgai bat hartu nuen, eta karrera bukaerako proiektua Ixan egin nuen, eta gaur arte. Karrera bukatu nuela 12 urte pasa dira. Informatikariak eta hizkuntzalariak gaude Ixan. Azkenean guk, hizkuntzalaritza konputazionala egiten dugula esaten dugu. Ordenagailuari, hizkuntza bat erakustea da gure helburua; kasu honetan, euskara. Makina batek hizkuntza bat ulertu dezan hainbat teknika aplikatzen ditugu.
Xuxen zuzentzailea adibideetako bat da.
Ixak eta Elhuyarrek egindakoa da Xuxen. Hasieran Ixan garatu zen, baina azken urteetan Elhuyarrekin elkarlanean garatu den tresna bat da. Oraintxe atera dute Xuxen 5. Azkeneko hiztegi batuko azken sarrerak eguneratu egin dira. Hainbat erregela gramatikal ere sartu dituzte.
Itzulpen automatikorako aukerak ere badaude. Fidagarriak al dira?
Ezin duzu pentsatu makina batek %100ean ondo egin behar duenik itzulpen bat. Hitz batek esan nahi bat baino gehiago eduki baditzake, edo esaldi baten testuinguru falta batekin esan nahi bat baino gehiago eduki baditzake, arazoak izan ditzake ordenagiluak. Beraz, ahalik eta zuzenen asmatzeko makina batek hori dena ikasi beharra dauka. Hainbat egoeratan informazio nahikorik ez badu makinak ziurrenik ez du ondo egingo. Makinak ohikoena den erantzuna esango du.
Hanka sartze handiak ikusten dira askotan. Azken aldian sarean badabiltza adibide batzuk: ixila anbulantzia (reservado ambulancia), goiko meloia (melon superior)…
Horrelakoetan argia da akatsa zein den: seguruenera, sistema horrek ez dauka nahiko informazio bi hitzen artean erabaki ahal izateko. Hitz batek esan nahi bat baino gehiago daukanean, erabiliena aukeratzen du normalean. Itzulpen automatikoko sistema guztiz automatiko bat filtraketa bat pasa gabe erabiltzea ez da egokia. Baina hori ez da euskararen kasua bakarrik; hizkuntza guztietan daude akatsak. Teknologia hauek laguntza bezala ikusi behar dira.
Euskarak zer moduzko egoera du teknologia berrietan?
Normalean baliabideak behar dira. Ixa horregatik sortu zen, duela 27 urte. Badaude teknika batzuk, hizkuntzarengandik independenteak; baina kontuan hartu behar da hizkuntza bakoitzak bere ezaugarriak dituela. Makinak ikas dezan, ezaugarri horiek formulatu edo adierazi behar zaizkio. Batzuetan, gramatika ezaugarriak, hiztegiak… horrelako baliabideekin eta informatikako teknika desberdinak erabiliz, sortzen dira teknologia edo tresna horiek. Edo corpusarekin. Euskarazko gero eta testu bilduma handiagoa daukagu, eta zenbat eta corpus gehiago eduki, ordenagailuak hobeto ikasiko du. Zer den ohikoena, nola adierazten diren gauzak… ikasiko du. Euskara hor dago, eta ingelesarekin konparatzen bada, gauza batzuetan ez dago maila berean, baina beste gauza batzuetan bai.
Hizkuntza gutxituen artean, zer moduzko tokian dago euskara?
Ondo dago kokatuta, Ixa taldeari eta beste erakunde batzuei esker, Elhuyarri adibidez. Hizkuntza gutxituen artetik esango nuke, ondoena posizionatuta dagoena dela. Hemen urteak daramatzate baliabideak sortzen edo biltzen.
Garai batean esaten zen euskarak ez zuela fisika erakusteko balio.
Bai, balio du, gainera, normalizazio horren bila baldin bagoaz, teknologietan ere euskarak egon beharra dauka. Azkenean, gaztedia hor dago. Gazteak euskaraz komunikatu daitezen nahi badugu, baliabideak eman behar zaizkie. Euskarak presentzia izan behar du teknologia berrietan normalizazioari begira.
Euskararekin zer ikusirik ez duen Europako beste proiektu batean ere ari zara lanean.
Bai, News Reader proiektua da. Beste bi unibertsitaterekin eta hiru enpresekin ari gara lanean. Proiektu europarra da. Helburu nagusia finantza eta ekonomiako erabakiak hartzen laguntzeko gertaeren antzematea eta egituratzea burutzea da.
Adibideren bat jar dezakezu?
Pentsa, enpresa bateko kargudun batek erabaki bat hartu behar duela; adibidez, beste enpresa bat erosi, bai ala ez erabaki behar duela. Enpresa horri bu- ruzko informazioa egunkari eta iturri desberdinetatik jaso daiteke. Informazio hori gainera hizkuntza desberdinetan egongo da. Baina pertsona batek ezin ditu milioika albiste irakurri. Gu, informazio horren guztiaren kronologia eta laburpena egingo duen tresna bat sortzen ari gara. Informazio guztia automatikoki prozesatzeko edo irakurtzeko gai den eta modu kronologiko batean zer gertatzen ari den modu bisualean agertuko duen tresna.
Zein hizkuntzatarako ari zarete tresna hori prestatzen?
Lau hizkuntzatarako ari gara lanean: ingelesa, gaztelera, italiera eta nederlandera, proiektuaren liderra bertakoa delako.
Ordenagailuak hezten eta elikatzen aritzen zarela esan daiteke?.
Bai, ordenagailuak gauzak ulertu ditzan erakusten. Ideia da guk pentsatzen duguna makinak pentsatzea. Ez guk pentsatzen dugun moduan baina bai mekanismo batzuekin, bera ere arrazonatzeko gai izan dadila. Eta hori da zaila. Baina horregatik da interesgarria.
Lan garrrantzitsua da zurea.
Nik sinesten dut egiten dugun horretan. Horrelako gauzetan ikerketa bat egitea garrantzitsua da, gero teknologia hori enpresek aplikatu ahal izateko beraien produktuak garatzeko.
Ikerkuntza arlo honetan ere beharrezkoa al da?
Ikerkuntza garrantzitsua da arlo guztietan, eta beharrezkoa da. Ikerkuntzarik gabe ez goaz inora. Topikoa ematen du baina herri baten garapenerako beharrezkoa da ikerkuntza. Batzuetan ikerkuntza aplikatua eta beste batzuetan ikerkuntza basikoa deitzen den hori. Hemen, hainbeste industria egonda, gurea urrutirago bezala gelditzen da.