Elhuyar – Multimedia edukien kudeaketa (MAM) metadatuen sorkuntza automatizatuarekin, adimen artifizialaren eta hizkuntzaren prozesamendu naturalaren bidez.
Elhuyar
Sektorea: Zerbitzuak
Negozio-kasua
Digitalizazioak eta informazioaren teknologiek artxiboen eta multimedia-edukien hazkunde esponentziala eragin dute, eta, horren ondorioz, aktibo horiek behar bezala kudeatu behar izan dira erakunde modernoetan. Horren ondorioz, Media Asset Managers (MAM) garatu da elementu horiek biltegiratu, sailkatu, antolatu, optimizatu, mantendu eta zaintzeko.
Helburuak
Adimen artifizialeko teknologiak aplikatzea ikus-entzunezko edukien kudeaketa hobetzeko MAM sistemetan, audioak transkribatzeko teknologiak eta gaiaren araberako segmentaziorako eta metadatu semantikoak automatikoki sortzeko teknologiak aplikatuz.
Erabilera-kasua
Hizkuntza neuronaleko ereduak (encoder, encoder-decoder, eta decoder) egokitzea, gaikako segmentazioko lanak, izendatutako erakundeen erauzketa, gaikako deskribatzaileak ateratzea eta laburpen automatikoa egiteko.
Azpiegitura
On Premise eta Cloud
Erabilitako teknologiak
NLP eta ML
Erabilitako datuak
Dataset publiko eta pribatuak, laburpen automatikorako, entitateen erauzketarako eta gaikako deskribatzaileak ateratzeko.
Erabilitako baliabideak
Investigadores especializados en NLP y especialmente en Information Extraction y LLMs. Infraestructura de servidores para desplegar los modelos entrenados.
Zailtasunak eta ikaskuntza
Transkripzioen gaikako segmentazioa nekez ebazten da hurbilpen gainbegiratuaren bidez. Ikuskatzen ez diren hurbilpenak sendoagoak dira, batez ere zero-shot moduan erabiltzen diren LLMetan oinarritutakoak.
KPIak (negozioan duen inpaktua eta ereduaren metrikak)
Entitateen erauzketan eta gaikako deskribatzaileetan % 90etik gorako asmatze-tasak. Hiru hizkuntza prozesatzeko gaitasuna: euskara, gaztelania eta ingelesa. Multimedia edukidun dokumentuen kudeaketa hobetzea.
Finantzaketa
Adimen artifizial aplikatua (SPRI) eta finantziazio pribatua.