ChatGPT eta antzeko eredu itxien pare edo hobeto dabilen euskarazko tresna irekia sortzea du helburu EHUko HiTZ zentroak.
Euskal Herriko Unibertsitateko HiTZ zentroa Latxa euskarazko hizkuntza-eredua txatbot bihurtzeko lanean ari da, eta aldi berean txatboten kalitatea neurtzeko bide berriak irekitzen. Azaldu dutenez, “hizkuntza-ereduak adimen artifizialeko ereduak dira, giza hizkuntza ulertu eta sortzeko ikaskuntza automatikoko teknikak erabiltzen dituztenak”. OpenAI edo Google bezalako enpresa handien ChatGPT eta antzeko eredu itxien pare edo hobeto dabilen euskarazko txatbot irekia sortzea da HiTZ zentroaren helburua. Enpresa horiek milioika dolarrekin eraiki dutenaren zati bat auzolanean egin nahi du HITZ-ek. Parte hartzeko ebaluatoia.hitz.eus webgunean sartu beharko da, galdera edo eskaera egin, eta aukeratu beharko da zein den erantzun hoberena. “Ebaluatoiaren lehen fase arrakastatsuan bezala, bigarren fase honetan ere lehiaketa eta sariak egongo dira”. Gaurtik apirilaren 2ra egongo da Ebaluatoian parte hartzeko aukera.
Zentroak adierazi duenez, “hizkuntza-ereduen garapenak aurrerapauso nabariak egin ditu azken urteotan. Gaur egun, ChatGPT edo antzeko elkarrizketarako txatbotek erabiltzaileen galderei erantzuteko eta eduki berriak sortzeko gaitasun aurreratuak dituzte. Horiek eraikitzea enpresa handien esku dagoela dirudi, baina Zentroan beste bide bat aukeratu dugu: existitzen den txatbot ireki on bat aukeratu eta horri euskaraz irakastea”.
Eneko Agirre HiTZ-eko zuzendariak dioenez, “euskarazko txatbota eraikitzeko bidean ikerkuntzako hainbat galdera berri planteatu zaizkigu. Gure helburua ez da bakarrik euskarazko txatbot hoberena eraikitzea, eta euskaraz gazteleraz bezain ondo ibiltzea. Hori lortzeko bidean ikerketa egiten ari gara, eta ikasten duguna argitalpen zientifikoetan kaleratuko dugu, jorratzen ari garen metodologia eta ikasten duguna beste hizkuntza askotarako ere baliogarria da eta”.
Agirreren arabera, “horregatik abiatzen da ebaluatoia.hitz.eus, ezinbestekoa baita erabiltzaile euskaldunek txatbotak erabili eta hoberena zein den aukeratzen laguntzea. Ebaluatoian, erabiltzaileak eskaera bat egingo du webgunean, eta honek bi txatbot ezberdinen erantzunak emango dizkio bata bestearen ondoan, erabiltzaileak erantzunen artean onena aukeratu dezan. Alborapenak ekiditeko, erabiltzailearen bozka itsua izango da, hau da, erabiltzaileak ez du jakingo zein bi txatbot ari den epaitzen. Txatboten sailkapena osatzeko xakean baliatzen den ELO ebaluazio-sistema erabiltzen da. Ereduak hasierako puntuazio arbitrario batetik abiatzen dira, eta partidak irabazi, galdu edo berdindu ahala puntuazioa aldatuz joango da, aurkarien puntuazioaren arabera”.
Naiara Perez HiTZeko ikertzaileak dioenez “ebaluazio mota honi arena deritzo, hizkuntza-ereduak elkarrekin lehiatzen direlako, eta txatbotak eszenatoki errealista eta praktikoan ebaluatzea ahalbidetzen du. Zentzu horretan ohikoa bihurtu da enpresa beraiek eredu hoberenak Ingeleserako Chatbot Arena delakoan lehiatzera bidaltzea. Guk nahiago izan dugu Ebaluatoia deitzea”.
Ebaluatoian HiTZek eraikitako 18 txatbot probatuko dira, baita txatbot komertzial hoberenak ere. Denetarik dago, txatbot oso onak, ez hain onak, eta baita txarrak direnak ere, ikerketa zientifikoan ondorioak atera ahal izateko. Oscar Sainz HiTZeko ikertzailearen esanetan, “tartean egongo da Estatu espainiarrean inoiz eraiki den txatbot handiena ere, 70B parametroko Latxan oinarritutako txatbot erraldoia”.