EJIE – AAn oinarritutako hizkuntza-tresnak produktibo egitea
EJIE
Sektorea: Zerbitzuak
Negozio-kasua
Nola ustiatu daitezke +1 egunean funtzionatzen duten itzulpen-, transkripzio- eta laburpen-tresnak?
Helburuak
Teknikoak: beharren eta autorecoveryren araberako zerbitzuaren eskala. Funtzioak: Eta itzulpena hobetu baldin badaiteke, nola hauteman eta zuzendu dezakegu?
Erabilera-kasua
Ereduak edukiontzi-moduan daude zabalduta onpremise irtenbide baten (openshift de Red Hat) gainean, eta baliabide grafiko birtualak dituzte (V100s txartelen 4gb slotak). Ereduak esleitutako memoria-grafikoan sartu behar dira eta edukiontziak “health” funtzioak izan behar ditu (liveness, kubernetes hizkeran).
Azpiegitura
On Premise
Erabilitako teknologiak
Irudiak hautematea/prozesatzea Ikaskuntza Automatikoa edo Sakona Testuen meatzaritza
Erabilitako datuak
Itzulpena: bitartekoen (publikoa) datuak eta hizkera administratiboa dituen hizkera orokorra, IVAPen itzulpen-zerbitzuaren % 100 datuekin. Transkripzioa: oinarri-eredua + prozesatutako datua (epaiak + eitb). Laburpena: 4 ahots (3eu+1es) sortutako datuarekin + 2 datu inet (fr,en)
Erabilitako baliabideak
Taldea Vicomtecheko langileek eta EJIEko Berrikuntza Taldeko kideek osatzen dute, eta irtenbidea Eusko Jaurlaritzaren CPDetan dago hedatuta. Beharrezkoa izan da kontratazioak egitea, bai datua aberasteko (transkripzioa), bai datua hutsetik sortzeko (laburpena).
Zailtasunak eta ikaskuntza
Alderdi teknikoan, beharrezkoa izan da baliabide grafikoekin (GPU) lan egiteko garaian dinamikak barneratzea: eskuratzea, birtualizazioa, tamaina finkoa duten sloten ereduen dimentsionamendu egokia… Ereduen hobekuntza eta zuzenketa datuekin konpontzen da eta ez programazioarekin. Datuak sortzea ez da EJIEk kontrata dezakeen jardueretako bat; beraz, Eusko Jaurlaritzak egin du zuzenean.
KPIak (negozioan duen inpaktua eta ereduaren metrikak)
Egunero egindako eskarien-kopuruaren adierazleak daude eta kolektiboaren arabera daude segmentatuta (gailua, ip, apikey…). 30.000 pertsonako kolektibo batek egindako 200.000 eskari baino gehiago daude egunean. Zerbitzu ofizialei egindako itzulpenen eskariaren kopurua nabarmen murriztu da hizkuntza-tresnek eskaintzen duten laguntzaren ondorioz.
Finantzaketa
Aurrekontuen diruarekin egindako proiektua da % 100, eta hizkuntza-politikak (HPS), teknologiaren zuzendaritzak (DTIC) eta IVAPek hartu dute parte.
Kolaboratzaileak
Vicomtech izan da AA ereduen kontratazioaren enpresa esleipenduna. EJIEk ITn duen 40 urtetik gorako bere ezagutza eskaini du.