Edukira joan

Mikel Artetxe Zurutuza

Wikipedia, Entziklopedia askea
Mikel Artetxe Zurutuza

Bizitza
JaiotzaZarautz, 1992 (31/32 urte)
Herrialdea Gipuzkoa, Euskal Herria
Hezkuntza
HeziketaEuskal Herriko Unibertsitatea
Donostiako Informatika Fakultatea
Tesi zuzendariaEneko Agirre
Gorka Labaka
Hizkuntzakeuskara
ingelesa
gaztelania
Jarduerak
Jarduerakikertzailea eta informatikaria
Enplegatzailea(k)Euskal Herriko Unibertsitatea
Google
Meta Platforms
Google DeepMind
Lan nabarmenak
KidetzaIxa taldea
Udako Euskal Unibertsitatea
Association for Computational Linguistics
Sociedad Española para el Procesamiento del Lenguaje Natural

mikelartetxe.com
Inguma: mikel-artetxe-zurutuza GitHub: artetxem
Artikulu hau informatikariari buruzkoa da; beste esanahietarako, ikus «Mikel Artetxe».

Mikel Artetxe Zurutuza (Zarautz, 1992) informatikaria eta ikertzailea da Facebook AI Research ikerketa-zentroan. Bere ikerketa-gai nagusiak hizkuntzaren prozesamendua eta ikasketa automatikoa dira orokorrean, eta hor barruan baliabide urriko hizkuntzen arteko eszenatokiak, hizkuntza arteko errepresentazioen ikasketa eta itzulpen automatiko gainbegiratu gabea bereziki.[1]

Ibilbidea ikasketetan eta ikerkuntzan

[aldatu | aldatu iturburu kodea]

Facebooken ikerketa-zentroan hasi aurretik Euskal Herriko Unibertsitateko IXA taldean aritu zen, eta oraindik mantentzen du lankidetza talde horrekin.

2012an, informatikako gradua ikasten zuen bitartean, Apertium itzultzaile automatikoaren komunitatearekin lankidetzan aritu izan zen, Google Summer of Code udako ekimenean ere.[2] Ikasleek software libreko proiektuetan parte hartzeko ekimen bat da hori.

Geroago, 2014an, oraindik graduko ikaslea zela, Hizkuntzaren Prozesamendua irakasgaian aurkeztu zuen praktika bat geroago mugikorrerako Mitzuli app ospetsua bihurtu zen.[3] Testua, audio eta irudiak ere itzultzen zituen 50 hizkuntza-bikoteetarako, software librea zen eta 30.000 mila deskarga lortu zituen. Garai hartan Googlek bakarrik eskaintzen zuen zerbitzu hori eta Google-rena ez zen librea.[4][5][6][7][8][9]

"Adimen Artifiziala eta euskara" hitzaldian Mikel Artetxe, Gorka azkune eta Nora Aranberri (EHU, 2020-12-03)

2014an bertan aurkeztu zuen gradu-amaierako proiektuan ("Itzulpen-sistema hibridoen eraikuntza EBMT bidezko itzulpen partzialak erabiliz") beste urrats bat egin zuen itzulpen automatikoan. Lanaren helburua itzulpenak hobetzea zen, hainbat testu itzulitan agertzen ziren adibideak erabiliz (ingelesez Example Based Machine Translation, EBMT). Testuko entitateak (pertsona, erakunde edo tokien izenak) eta esaldia baino txikiagoak diren unitate sintaktikoak identifikatu, eta orokortzen zituen hasieran, eta gero datu horiek aurreprozesatu nddoren itzulpen partzial haiek esaldi mailan txertatzen zituen. Itzulpenak egiteko zeuden beste teknikekin (estatistikoekin edota erregeletan oinarritutakoekin) hibridatzeko mekanismo bat ere garatu zuen.[10][11] HAP/LAP masterra egin zuen gero, eta Ixa taldearen lankidetza-beka batekin aritu zen QTLeap proiektu europarrean.

2015an euskarazko eta gaztelaniazko izen+aditz konbinazioei buruzko informazioa biltzen duen Konbitzul datu-basea sortzen parte hartu zuen.[12]

2016an aurkeztu zuen master-tesian Itzulpen Automatikoa hobetzeko helburuarekin aztertu zuen nola txertatu hitzen adierazpen distribuzionala (word embedding) eta ikasketa automatikoa.[13][14][15] Geroago bere ikasketetan zehar Google, DeepMind eta Facebooken[16] bertan egonaldiak egin zituen eta 2020an defendatu zuen Ixa Taldearekin eginiko doktorego-tesia, zuzendariak Eneko Agirre eta Gorka Labaka izan zirela.[17] Doktore-tesiak Espainiako eta Europako tesirik onenaren saria jaso zuen 2021ean. [18][19][20][21]

Itzulpen automatiko gainbegiratu gabea

[aldatu | aldatu iturburu kodea]

Sekuentziatik sekuentziarako eredu neuronalaren etorrerak aurrerapen izugarria ekarri zuen itzulpen automatikoan. Horrek hobekuntza handia ekarri zuen itzulpen-sistema estandarretan eta horrela zenbait ingurunetan giza-itzulpenen kalitatearen maila lortu zuten lehenengoz. Hala ere, gaur egun dauden sistemek datu asko behar dute (gainbegiratze sakona), corpus paralelo gisa normalean milioika perpaus behar izaten dituzte. Baina harrigarria da, gizakiak ez du baldintza hori behar hizkuntza bat ikasteko. Eta gainera baldintza horrek arazo praktiko garrantzitsu bat planteatzen du euskara bezalako baliabide gutxiko hizkuntzekin itzulpenak egiteko.

Artetxeren tesiaren helburua datu paraleloen menpekotasun hori guztiz ezabatzea izan zen, corpus elebakarra baino beharko ez zuten “gainbegiratu gabeko itzulpen automatiko”ko sistemak eratzeko. Horretarako, lehenengo urrats batean bi hizkuntzatarako sortutako hitz-bektoreak (word embedding-ak) lerrokatzen zituen, beren arteko egitura-antzekotasunean oinarrituta.[13] Gero, bigarren urrats batean, lerrokatze horren emaitzak erabiltzen zituen itzulpen-sistema neuronal bat edo itzulpen-sistema estatistiko bat hasieratzeko, azken urratsean back-translationaren bidez hobetzen joango dena.[17]

Sariak eta errekonozimenduak

[aldatu | aldatu iturburu kodea]
  • Ikertzaile gazteentzako Espainiako Informatika Saria, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman zion nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[23][24] Mikel Artetxek saria jasotzeagatik eman zituen esker-hitzetan jolas dialektiko bat egin zuen teknologiak artean zituen mugak azpimarratzeko.[25]
  • 2021: Ikertzaile gazteentzako Espainiako Informatika Saria, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman zion nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[23]
  • 2019: Hizkuntzaren prozesamenduko elkarte ospetsuena den ACL kongresuan (Association for Computational Linguistics) artikulu onenerako izendapena jaso zituen.
  • 2018: CoNLL nazioarteko kongresuan artikulu onenaren saria.[26][27] Saritutako artikuluaren izenburua hau da: “Uncovering Divergent Linguistic Information in Word Embeddings with Lessons for Intrinsic and Extrinsic Evaluation”. Euskaraz: “Informazio linguistiko dibergentea azaleratzen hitzen bektore-errepresentazio distribuzionaletan, ebaluazio intrinseko eta estrinsekorako zenbait ikasgairekin”.
  • 2017: Science aldizkariak albiste moduan jaso zuen Mikel Artetxe, Eneko Agirre and Gorka Labaka Ixakideek 2017ko urrian argitaratu zuten ikerketa bat: Artificial intelligence goes bilingual—without a dictionary. [28][29][15]
  • 2014ko SWERC txapelketa. EHUko Informatika Fakultateko taldeak domina bat lortu zuen Jesús Ibañez, Adrián Nuñez, Eneko Pinzolas, Jon Mediero, Asier Mujika, Iván Matellanes eta Mikel Artetxe.
    2017: Bigarren saria Bartzelonan antolatu zen Hizkuntza Teknologietako Hackatoian. Antolatzailea Red.es izan zen, eta SESIAD agentziaren babesa izan zuen. Mikel Artetxe Linguee moduko aplikazioak sortzeko programa bat garatu zuen; testu-corpus batetik abiatuta hiztegi elebidunak sortzeko aplikazio harek testu errealetako adibide errealak eskaintzen zituen hitzaren erabilera zelakoa den hobeto erakustearren. Software librea zen aplikazio hura hainbat hizkuntzatarako erabili ahal da, tartean euskararako.[30]
  • 2013-2014 ikasturteko karrera bukaerako sari nazionala ere jaso zuen, estatu mailakoa.[31][32]
  • 2014: Mikel Artetxek hirugarren postua lortu zuen Tuenti challange programazio-txapelketan.[33]
  • 2014: Domina bat eta 6. postua nazioarteko SWERC programazio-lehiaketan. Donostiako Informatika fakultateko taldeko kideak hauek ziren: Iván Matellanes, Asier Mujika, Mikel Artetxe, Adrián Nuñez, Jon Mediero, eta Eneko Pinzolas. Entrenatzailea Jesus Ibañez Conde irakaslea zen.[34][35]
  • 15 artikulu baino gehiago argitaratu ditu punta-puntako nazioarteko kongresu eta aldizkarietan.[36]

Erreferentziak

[aldatu | aldatu iturburu kodea]
  1. (Ingelesez) Mikel Artetxe. «Mikel Artetxe» www.mikelartetxe.com (Noiz kontsultatua: 2020-12-02).
  2. (Ingelesez) Artetxe, Mikel. (2012). Google Summer of Code 2012. Application. User. Apertium.
  3. «6 ikasle ohiren ikuspuntua // 6 ex-alumn@s: ¿Cómo trabajo en informática?» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
  4. Artetxe Zurutuza, Mikel. (2014). Mitzuli app. .
  5. Informatika Fakultateko HP hautazko ikasgaia. Lan praktiko batzuk – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  6. Mitzuli itzultzaileak 10.000 deskarga – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  7. Euskal Irrati Telebista. (2015-05-09). «Mitzuli, mugikorra itzultzaile bihurtzeko aplikazioa, sortu dute» www.eitb.eus (Noiz kontsultatua: 2020-12-02).
  8. «Mitzuli eta Mikel Artetxe» Zientzia.eus 2015-06-01 (Noiz kontsultatua: 2020-12-02).
  9. «https://twitter.com/hashtag/mitzuli» Twitter (Noiz kontsultatua: 2020-12-02).
  10. Artetxe Zurutuza, Mikel. (2014-07-30). Itzulpen-sistema hibridoen eraikuntza EBMT bidezko itzulpen partzialak erabiliz. (Noiz kontsultatua: 2020-12-02).
  11. Gradu bukaerako proiektuak 2014/15 ikasturtean. – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  12. Euskarazko eta gaztelaniazko izen+aditz konbinazioak lantzen – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  13. a b Artetxe, Mikel. (2018). Hizkuntzen mapa birtualak. Elhuyar.
  14. Bideoa: HAP/LAP master-tesia (Mikel Artetxe) – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  15. a b ACL. (2017-09-21). Learning bilingual word embeddings with (almost) no bilingual data --- Mikel Artetxe, Gorka Labaka and Eneko Agirre. (Noiz kontsultatua: 2020-12-03).
  16. UPV/EHUko doktoregai Mikel Artetxek Facebook beketako bat jaso du. . Campus UPV/EHU.
  17. a b Tesia: Itzulpen automatiko gainbegiratu gabea (Mikel Artetxe, 2020-07-29) – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-04-24).
  18. Uriarte Atxikallende, Alex. (2021-10-12). ««Batzuetan, merezi du ideia eroak planteatzea»» Berria (Noiz kontsultatua: 2022-04-24).
  19. a b «Adimen Artifizialerako Europar Elkarteak Mikel Artetxeren tesia saritu du» sustatu.eus (Noiz kontsultatua: 2022-04-24).
  20. a b «Mikel Artetxeren doktore tesia saritu dute Europan» El Correo 2021-08-18 (Noiz kontsultatua: 2022-04-24).
  21. SLU, Herritar Berri. (2021-05-24). «Eneko Agirre eta Mikel Artetxe ikertzaileen ibilbideak sarituak Estatu mailan» GAUR8 (Noiz kontsultatua: 2022-04-24).
  22. Mikel Artetxeri Europako tesien saria Adimen Artifizialean – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-04-24).
  23. a b (Gaztelaniaz) «Fallados los Premios de Investigación Sociedad Científica Informática de España (SCIE) – Fundación BBVA» FBBVA 2021-05-21 (Noiz kontsultatua: 2021-05-21).
  24. (Gaztelaniaz) [https://www.fbbva.es/galardonados/mikel-artetxe-zurutuza/ «Mikel Artetxe Zurutuza. PREMIO DE INVESTIGACIÓN SOCIEDAD CIENTÍFICA INFORMÁTICA DE ESPAÑA-FUNDACIÓN BBVA. Investigadores Jóvenes Informáticos, 2021»] FBBVA (FBBVA) (Noiz kontsultatua: 2021-11-19).
  25. Espainiako Informatika-Ikerketako Sari bana eman diete Eneko Agirre eta Mikel Artetxeri (elkarrizketak eta esker-hitzak, 2021-11-18) – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2022-04-24).
  26. Artikulu onenaren saria CoNLL2018 biltzarrean – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  27. Artetxe, Mikel; Labaka, Gorka; Lopez-Gazpio, Iñigo; Agirre, Eneko. (2018-10). «Uncovering Divergent Linguistic Information in Word Embeddings with Lessons for Intrinsic and Extrinsic Evaluation» Proceedings of the 22nd Conference on Computational Natural Language Learning (Association for Computational Linguistics): 282–291.  doi:10.18653/v1/K18-1028. (Noiz kontsultatua: 2020-12-02).
  28. Science aldizkariak: ‘Hiztegirik gabeko itzulpen automatikoa, Ixa taldeak zabaldu duen ikerlerroa’ – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  29. «Science journal: Machine Translation without a dictionary?» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
  30. Mikel Artetxe-k saria jaso du Bartzelonako HP Hackatoian – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-12-02).
  31. «Duque ministroak beren karrera amaierako sariak eman zizkien Mikel Artetxe eta Josué Tonelliri» UPV/EHU (Noiz kontsultatua: 2020-12-02).
  32. Informatika, EHUko. «Mikel ARTETXE Karrera Amaierako lehenengo Sari Nazionala / Premio Nacional de Fin de Carrera» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-02).
  33. «Mikel Artetxe 3. Tuenti txapelketan» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
  34. «Lortu dugu domina bat SWERC txapelketan» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
  35. «Mintegia: SWERC programazio-txapelketako kontuak (2015/02/24)» DIFusio@, EHUko Informatika (Noiz kontsultatua: 2020-12-03).
  36. «Mikel Artetxe» scholar.google.com (Noiz kontsultatua: 2020-12-03).

Ikus, gainera

[aldatu | aldatu iturburu kodea]

Kanpo estekak

[aldatu | aldatu iturburu kodea]
Gai honi buruzko informazio gehiago lor dezakezu Scholian