Logo

EJIE – AAn oinarritutako hizkuntza-tresnak produktibo egitea

EJIE 

Sektorea: Zerbitzuak

Negozio-kasua

Nola ustiatu daitezke +1 egunean funtzionatzen duten itzulpen-, transkripzio- eta laburpen-tresnak?

Helburuak

Teknikoak: beharren eta autorecoveryren araberako zerbitzuaren eskala. Funtzioak: Eta itzulpena hobetu baldin badaiteke, nola hauteman eta zuzendu dezakegu?

Erabilera-kasua

Ereduak edukiontzi-moduan daude zabalduta onpremise irtenbide baten (openshift de Red Hat) gainean, eta baliabide grafiko birtualak dituzte (V100s txartelen 4gb slotak). Ereduak esleitutako memoria-grafikoan sartu behar dira eta edukiontziak “health” funtzioak izan behar ditu (liveness, kubernetes hizkeran).

Azpiegitura

On Premise

Erabilitako teknologiak

Irudiak hautematea/prozesatzea Ikaskuntza Automatikoa edo Sakona Testuen meatzaritza

Erabilitako datuak

Itzulpena: bitartekoen (publikoa) datuak eta hizkera administratiboa dituen hizkera orokorra, IVAPen itzulpen-zerbitzuaren % 100 datuekin. Transkripzioa: oinarri-eredua + prozesatutako datua (epaiak + eitb). Laburpena: 4 ahots (3eu+1es) sortutako datuarekin + 2 datu inet (fr,en)

Erabilitako baliabideak

Taldea Vicomtecheko langileek eta EJIEko Berrikuntza Taldeko kideek osatzen dute, eta irtenbidea Eusko Jaurlaritzaren CPDetan dago hedatuta. Beharrezkoa izan da kontratazioak egitea, bai datua aberasteko (transkripzioa), bai datua hutsetik sortzeko (laburpena).

Zailtasunak eta ikaskuntza

Alderdi teknikoan, beharrezkoa izan da baliabide grafikoekin (GPU) lan egiteko garaian dinamikak barneratzea: eskuratzea, birtualizazioa, tamaina finkoa duten sloten ereduen dimentsionamendu egokia… Ereduen hobekuntza eta zuzenketa datuekin konpontzen da eta ez programazioarekin. Datuak sortzea ez da EJIEk kontrata dezakeen jardueretako bat; beraz, Eusko Jaurlaritzak egin du zuzenean.

KPIak (negozioan duen inpaktua eta ereduaren metrikak)

Egunero egindako eskarien-kopuruaren adierazleak daude eta kolektiboaren arabera daude segmentatuta (gailua, ip, apikey…). 30.000 pertsonako kolektibo batek egindako 200.000 eskari baino gehiago daude egunean. Zerbitzu ofizialei egindako itzulpenen eskariaren kopurua nabarmen murriztu da hizkuntza-tresnek eskaintzen duten laguntzaren ondorioz.

Finantzaketa

Aurrekontuen diruarekin egindako proiektua da % 100, eta hizkuntza-politikak (HPS), teknologiaren zuzendaritzak (DTIC) eta IVAPek hartu dute parte.

Kolaboratzaileak

Vicomtech izan da AA ereduen kontratazioaren enpresa esleipenduna. EJIEk ITn duen 40 urtetik gorako bere ezagutza eskaini du.

Scroll to Top