«Bertso sorkuntza automatikoan ebaluazio objetiboak egitea oso zaila da»
Manex Agirrezabal - Informatikaria
Tesia amaitu eta entregatu berri du Manex Agirrezabalek (Zumarraga, 1988), eta hilabete barru defendatuko du. Lau bat urtez aritu da poesiaren metrika automatizatzen.
Zergatik aukeratu zenuen informatika ikastea?
Betidanik gustuko izan dut. Txikitan ordenagailuarekin ibiltzen nintzen eta pasioa sentitzen nuen. Hasieratik arlo horretara jo nuen, nahiz eta behin ikasketak hasita ez nuen jakin zein eremutik tiratuko nuen. Informatikaren unibertsoa zabala da oso.
Mundua hizkuntza bitarrean ikusten al duzu?
[Barreak] Bitarrean baino gehiago algoritmikoan. Alegia, modu automatizagarrian. Gure jardunean egin beharreko lanak ataza automatizagarrian banatzen saiatzen gara.
Zer esan nahi du automatizagarri?
Gauzak ordenagailuak modu automatikoan bakarrik egin ahal izatea. Adibidez, lantegietan egoten diren prozesuak milaka aldiz errepikatzen dira. Alegia, lan zail bat modu sinpleagoetan banatzen da ordenagailuak egin dezan.
Informatikak alor asko dituela aipatu duzu eta nondik tiratu aukeratu behar izan zenuela. Nondik jo zenuen?
Hizkuntzalaritza konputazionalaren bidea hartu nuen eta hizkuntzalaritza zein informatika uztartzen jarduten dut.
Hizkuntzalaritza ere betidanik interesatu zaizu. Bertsozalea zara.
Bai. Karrerako azken urtean bertsoekin lanean hasteko aukera izan nuen eta horrek bide bat ireki zidan. Karrera bukaerako proiektuan bertsolaritza eta informatika lotu nituen eta oso gustura aritu nintzen. Bertsotan ikasteko arbel digital bat sortu genuen; egun eskuragarri dago bertso-eskolak.eus atarian.
Eta ikasten jarraitu zenuen…
Hizkuntzaren azterketa eta prozesamendua Masterra egiteko aukeraz hitz egin zidan karrera amaierako proiektuko zuzendariak. Animatu egin ninduen eta masterra egitea erabaki nuen. Urtebetean bertsolaritza ikasten laguntzeko tresnak sortzen aritu ginen, bertso sorkuntza automatikorako bideak urratzen. 2012an robot bertsolariarekin lehenengo saioa egin genuen. Gero masterra amaitu eta doktoregoarekin hasi nintzen.
Robot bertsolariaren eskutik?
Hasieran bertso sorkuntza automatikoaren inguruan egin nahi nuen, baina bide zaila zela jabetu ginen eta lorpen handirik erdietsi ez genuenez, poesiaren analisi metriko automatikoari heldu genion, hau da, poesiaren eskantsio automatikoari.
«Ikerlariarentzat egonkortzea ez da ezinezkoa, baina zaila da, bai ekonomikoki eta baita leku aldetik ere» «Modu sinple bat badago bertsoak automatikoki sortzeko, baina bertso onak sortzea ez da posible» «Milaka poema jaso eta automatikoki katalogatu ahal badituzu lagungarria izan daiteke»Zergatik bihurtu zen zaila bertsolaritzaren automatizazioaren bidea? Modu sinple batzuk badaude bertsoak automatikoki sortzeko, baina bertso onak sortzea oso zaila da. Azken finean, guk egiten ditugun lan guztiak munduari kontatu behar dizkiogu, hau da, ongi funtzionatzen duen ala ez adierazi, eta bertso sorkuntza automatikoan ebaluazio objektiboa egitea oso zaila da. Esate baterako, bertso hori ona da ala ez da esatea zaila da. Bertso onak sortzeko pertsonak behar dira? Oraindik ez dakit seguru, baina hala dirudi. Eta poesiatik zer automatizatu daiteke? Guk poemak automatikoki analizatu ditugu. Ingelesezko poemak aztertzen hasi ginen. AEB etako Virginiako Unibertsitatean bildutako corpus bati heldu genion. Hor zeuden Shakespeareren, Miltonen edota Dickinsonen poemak, besteak beste. Poema horietan eskuz markatu zituzten azentuak eta gure helburua izan da ordenagailuak lan hori automatikoki egitea. Adibide bat? Shakespeareren soneto bat hartuta, lerro gehienetan badago ta-tan moduko soinu bat; sekuentzia bat da, ingelesez irakurrita errepikatzen dena. Ia lerro bakoitzean bost ta-tan soinuen sekuentzia aurkitu daiteke. Ta-tan horrek esan nahi du poema ianbikoa dela eta bost egonda, pentametro ianbikoa. Shakespearek jakingo al zuen hori? Bai, soneto guztiak hala idatzita daude. Miltonen poemak ere halakoak dira. Praktikan zertarako balio du? Ummm… Ikerlariok beti entzuten dugun galdera da. Poemak katalogatzeko, adibidez. Milaka poema jaso eta automatikoki katalogatu ahal badituzu lagungarria izan daiteke. Edota poemak nola irakurri behar diren, enfasiak non egin behar diren jakiten lagundu dezake. Zure tesiaren gaia da? Guk lan hori gaztelerara eta euskarara estrapolatu dugu. Ingelesezko lanaren aplikagarritasuna ikusteko beste bi hizkuntzatan esperimentuak egin ditugu. Poema ‘corpusak’ zuek sortu dituzue? Gaztelerazko poemak Interneten eskuragarri dagoen bilduma batetik hartu ditugu. Urrezko Aroko poeten olerkiak dira Cervantes, Lope de Vega, Quevedo, Gongora…. eta metrikoki etiketatuta zeuden. Eta euskaraz? Patrizio Urkizuren antologia batetik hartu ditugu. Poemok guk geuk markatu ditugu soinuak eskuz gure sentsazioen arabera. Etxepare, Aita Meagher, Lauaxeta, Lizardi, Sarrionandia… daude poeten artean. Kasu batzuetan metrika harrapatzea oso zaila izan da eta poema metrikoenak aukeratu ditugu. Euskaraz ez dago ‘ta-tanik’? Gure hipotesia baietz zen, baina azterketa egin eta gero, zalantza asko ditugu. Euskarazko poesian ondorio argirik ez dugu atera, akaso, gure jakinduria faltagatik. Orduan euskarazko poesiaren eskantsioa zaila da? Bai, momentuz bai. Ingelesezko poesia azentual silabikoa da, euskarazkoa bakarrik silabikoa eta zailtasunekin egin dugu topo. Tesia egiteko prozesuak atzerrira eraman al zaitu? Bai, AEBetan zortzi hilabete egin nituen Delawereko Unibertsitatean hizkuntzalaritza departamentuan. Finantziaziorik izan al duzu? Ikerlari gazteak, zortea badu, mila euro inguruko beka bat lortu dezake. Nik halako bat izan dut eta Ixa ikerlari taldeak ere babestu nau. Eta behin tesia eginda? Orain beka postdoktorala eskatzen ari naiz tarte batez kanpora joan eta ikertzen jarraitzeko. Ikertzaileak kanpotik pasatu beharra dauka, han ikasi eta itzultzeko. Ikerlariaren maleta beti al dago prest? Bai. Ikerlariarentzat bizitza egonkorra izatea zaila da, bai ekonomikoki eta baita leku aldetik ere. Mugitu beharra eta prekarietatea dira ikerlariaren ahuleziak. Egonkortzea ez da ezinezkoa, baina zaila da.