Azken urteotan, webean bideo-aktak erabiltzen hasi dira udal osoko bilkuren erregistro ofizial bakar gisa, eskuz transkripzioak edo aktak egin beharrik ez izateagatik eta EAEko bi hizkuntza ofizialetara itzuli behar ez izateagatik. Hala ere, horrek hainbat arazo dakartza: bideo-aktak ez dira pertsona gorrentzat irisgarri; itzulpenik gabe, osoko bilkura asko elebidunak direnez, ez dira errespetatzen herritarren hizkuntza-eskubideak, eta, gainera, pertsona elebakarrek ezin dute ulertu beste hizkuntzan esandakoa; formatu digitalen biziraupena ez dago bermatuta etorkizunean, eta ziurrenik aktak ezin izango dira epe ertain edo luzera ikusi, are gutxiago paperak bezala ehunka urteren ondoren.
Helburuak
Hizketa-ezagutzako teknologia (ASR edo Automatic Speech Recognition) elebiduna erabiltzea azpitituluak eta aktak automatikoki sortzeko, eta itzulpen automatikoko teknologia azpititulu eta akta horiek itzultzeko.
Erabilera-kasua
Transkripzio/azpititulazio eredu elebidunak sortu dira udalen osoko bilkuretan aplikatu ahal izateko. Hizlariak detektatzeko teknologia sortu da: zinegotzi/funtzionario bakoitzak osoko bilkura batean egindako esku-hartzeak identifikatu ondoren, hurrengo bilkuretan automatikoki atzematen da hizlaria. Zinegotzien, alderdien eta abarren hizkuntza bakoitzaren erabileraren estatistikak atera daitezke. Teknologia hori Abao enpresaren eduki-kudeatzaile/-argitaratzailean txertatu da. Enpresa horrek, besteak beste, osoko bilkuren grabaketa eta bideo-akten argitalpena egiten ditu, eta, orain, azpitituluak eta aktak ere sor ditzake, bai jatorrizko hizkuntzan bai itzulitakoan.
Azpiegitura
Cloud
Erabilitako teknologiak
NLP
Erabilitako datuak
Transkribatutako audioen ehunka ordu. Hizlariak bereizten dituzten audioen corpus publikoak.
Erabilitako baliabideak
NLPn eta, bereziki, hizketaren ezagutzan eta itzulpen automatikoan espezializatutako ikertzaileak. Garatutako ezagutza-sistemak ostatatzeko zerbitzarien azpiegitura (On Premises instalaziorik behar ez denean). API garatzaileak, azterketa- eta itzulpen-sistema automatikoen urruneko deirako. Ezagutza eta itzulpen automatikorako eta eskuzko zuzenketarako sistemak integratzeko frontend garatzaileak.
Zailtasunak eta ikaskuntza
Eduki elebidunak transkribatzeko zailtasuna. Tokiko terminologia eta toponimia transkribatzeko zailtasuna. Entrenamendua herrietako datasetekin.
KPIak (negozioan duen inpaktua eta ereduaren metrikak)
Abao-n inplementatzea. Edukien irisgarritasuna handitzea formatu eta hizkuntza ofizialei dagokienez. Osoko bilkuren akten iraunkortasuna handitzea.