Gorka Labaka Intxauspe
Lanpostua
Puesto de trabajo
Lengoaia eta Sistema Informatikoak Saileko irakasle atxikia
Formakuntza eta ibilbidea
Formación y trayectoria
Informatikan Ingeniaritzako ikasketak bukatu nituenerako (2004ean) fakultateko IXA taldearekin lankidetzan hasia nintzen, eta gradu ikasketak bukatu bezain laisten, doktoretza egiten hasi nintzen ikerketa talde berean. Doktore titulua 2010ean lortu nuen euskarazko itzulpen automatiko estatistikoa lantzen zuen tesi batekin. Tesia bukatutakoan, itzulpen automatikoko proiektu desberdinetako zenbait doktorego ondorengo kontratu izan nituen, 2018. urtean Bilboko Ingeniaritza Eskolan irakasle atxiki plaza bat lortu nuen arte. Urte horietan zehar, hainbat ikerketa egonaldi motz egiteko aukera izan dut: Dublineko DCUn, New Yorkeko Columbia unibertsitatean edo Pragako Charles Unibertsitatean, besteak beste.
Bokazioa / motibazioa
Vocación / motivación
Ikerkuntzan lan egiteko ditudan motibazio nagusiak bi dira. Alde batetik, beste lan batzuetan egon daitekeen monotoniarekin alderatuz, ikerkuntzak etengabe gauza berrietan lan egiteko aukera eskaintzen du. Beti zaude gauza berriak ikasten eta probatzen, ez dago aspertzeko aukerarik. Horretaz gain, zure lanean sortutako berrikuntzek gizartean izan ditzaketen onurak ere ikerketan lan egiteko motibazioaren parte handi bat dira.
Ikerketa-taldea eta ikerketa-lerroak
Grupo de investigación y líneas de investigación
Nire ikerketa ibilbide osoa Ixa taldearen baitan egin dut, gradua ikasten nengoela lankidetza beka bat lortu nuenetik, gaur arte. Ixa taldean hizkuntzaren prozesamenduaren alor guztiak lantzen ditugu. Hizkuntzaren prozesamenduak ordenagailuak hizkuntzekin lan egitea ahalbidetzen dituzten teknika guztiak hartzen ditu bere baitan: Google bezalako interneteko bilatzaileak (informazioaren berreskurapena), Siri bezalako elkarrizketa bidezko laguntzaileak edo itzultzaile automatikoak, besteak beste.
Arlo guzti horien artean, nire ikerketa itzulpen automatikoan eta eleaniztasunean zentratu da, batez ere. Hau da, ordenagailuak testuak itzultzeko gai izatea, eta hizkuntza batean funtzionatzen dituzten tresnak hainbat hizkuntzetarako funtzionatzea ahalbidetzea da nire ikerketaren helburu orokorra.
Alderdi aipagarriak
Aspectos destacables
Guztiok nabaritu dugun bezala, azken urteotan itzulpen automatikoak aurrerapen nabarmenak egin ditu. Aurrerapen horien arrazoi nagusia ikasketa sakonaren (edo deeplearning-aren) erabilera izan da. Hala ere, ikasketa sakonean oinarritutako itzultzaile automatikoak, aldez aurretik itzulitako milioika esaldi bikote behar ditu bertatik itzultzen ikasi ahal izateko.
Gure taldean aurrera eramandako ikerketa batek, ordea, lehen aldiz erakutsi zuen itzuli gabeko testu handiekin ere itzultzaile bat ikasteko aukera badagoela (gainbegiratu gabeko itzulpen automatikoa). Hau da, bata bestearen itzulpena diren milioika esaldi bikote izan beharrean, nahikoa da hizkuntza bakoitzean independenteki sortutako milioika esaldiekin. Ikerketa honek, baliabide gutxi dituzten hizkuntza bikoteetan kalitatezko itzulpena sortzeko aukera emateaz gain, hizkuntzen arteko unibertsaltasun bat badagoela ere erakusten du.
Europako proiektuak
Proyectoseuropeos
MT4All Europako proiektuko koordinatzailea naiz. Proiektu hau CEF deialdikoa da, zeinen eta Europa mailako azpiegiturak sortzeko deialdi bat den. Proiektuaren helburu nagusia baliabide gutxiko hizkuntzetarako baliabide elebidunak sortzea da. Horretarako, gure taldeak aurretik sortutako itzulpen automatiko gainbegiratu gabeko tekniketan oinarrituz. Proiektuan baliabide elebidun gutxi dituzten Europako hizkuntza bikoteak aukeratu ditugu, eta itzulpen automatiko gainbegiratu gabea erabiliko dugu hizkuntza horietarako hiztegi elebidun eta itzulpen automatikoko sistemak sortuko ditugu.
Proiektuan Espainiako hiru erakunde publiko (EHU bera, koordinatzaile modura, BarcelonaSupercomputingCenter eta Administrazio Digitaletarako Estatu Idazkaritza), eta Europa mailako beste hiru enpresa hartzen dugu parte: Unbabel (Lisboa), Iconic (Dublin) eta Tilde (Riga). Partaide horien artean, EHUk eta BSCk baliabideak sortuko ditugu, beste lau erakundeak sortutako baliabide horiek erabilgarritasuna balidatuko duten bitartean.
Etorkizunari begira…
Mirando al futuro…
Azken urteetan hizkuntza idatzian aurrerapen handiak egin dira, eta ikerketa multimodalitatera mugitzen ari da. Hau da, formatu desberdinetan dagoen informazioa (testu idatzia, audioak eta irudiak) tratatzeko aukera ematen duten teknikak lantzera. Hori itzulpen automatikora ekarrita, gure hurrengo erronka nagusia itzultzaile automatikoak ahozko hizketa eta seinu-hizkuntzak barneratzea litzateke.