Elhuyar – Hizketa-ezagutza (ASR) eta itzulpen automatikoa (MT) ikus-entzunezko komunikabideetan, azpititulazio automatikorako eta irismena handitzeko
Elhuyar
Sektorea: Zerbitzuak
Negozio-kasua
Inklusio eta irisgarritasun arrazoiak direla eta, gero eta zorrotzagoak dira ikus-entzunezko sektoreari eskatzen zaizkion azpitituluentzako eskakizunak. Era berean, hizkuntza askotako azpitituluen eskaintzak handitu egiten du edukiaren jasotzaileen audientzia mundu osoko merkaturaino. Hala ere, azpitituluak eskuz sortu eta itzultzea prozesu luze eta garestia da, eta gutxitan egiten da.
Helburuak
Hizketa ezagutzeko teknologia (ASR edo Automatic Speech Recognition) eta itzulpen automatikoa (MT edo Machine Translation) erabiltzea azpitituluak (erdi-)automatikoki sortzeko eta haien itzulpen (erdi-)automatikoa egiteko.
Erabilera-kasua
Hizketa-ezagutzako sistema komunikabideen domeinura egokitu da, eta ezagutza-tasa handiagoa lortu da elkarrizketa informaletan, euskalkietan eta abarretan. Azpititulazio automatikoak eta horien itzulpen automatikoa txertatu da komunikabideetako multimedia-edukien kudeatzaileetan, eta ikus-entzunezko eduki bat kudeatzailera igotzean eta katalogatzean automatikoki azpitituluak sortzen dira, kudeatzailetik bertatik zuzendu daitezke, horiek itzultzera bidali eta zuzendu daitezke, eta web-ean, sare sozialetan eta abarretan azpitituluekin argitaratu.
Azpiegitura
On Premises edo Cloud, bezeroaren eskakizunen arabera
Erabilitako teknologiak
NLP
Erabilitako datuak
Transkribatutako audioen ehunka ordu
Erabilitako baliabideak
NLPn eta, bereziki, hizketaren ezagutzan eta itzulpen automatikoan espezializatutako ikertzaileak. Garatutako ezagutza- eta itzulpen-sistemak kokatzeko zerbitzarien azpiegitura (On Premises instalaziorik behar ez denean). API garatzaileak, ezagutza- eta itzulpen-sistema automatikoen urruneko deirako. Ezagutza eta itzulpen automatikoko eta eskuzko zuzenketarako sistemak integratzeko frontend garatzaileak.
Zailtasunak eta ikaskuntza
Komunikabideen edukiei aplikatutako hizketa-ezagutza sistemen berariazko eskakizunak: elkarrizketa informalak, euskalkiak, azpitituluetan hizlariak bereizi eta markatzea, azpitituluak iraupen mugatuko segmentutan eta puntu logikoetan banatzea… Entrenamendua domeinuko datasetekin, azpisistema espezifikoen entrenamendua.
KPIak (negozioan duen inpaktua eta ereduaren metrikak)
Inplementazioa Hamaika Telebistan, Goienan, Antxeta Irratian, Teknopolisen… Edukien irisgarritasuna handitzea. Itzulpengintzaren bidez, edukiak publiko globalari heltzea.