Logo

Elhuyar – Hizketa-ezagutza (ASR) eta itzulpen automatikoa (MT) ikus-entzunezko komunikabideetan, azpititulazio automatikorako eta irismena handitzeko

Elhuyar 

Sektorea: Zerbitzuak

Negozio-kasua

Inklusio eta irisgarritasun arrazoiak direla eta, gero eta zorrotzagoak dira ikus-entzunezko sektoreari eskatzen zaizkion azpitituluentzako eskakizunak. Era berean, hizkuntza askotako azpitituluen eskaintzak handitu egiten du edukiaren jasotzaileen audientzia mundu osoko merkaturaino. Hala ere, azpitituluak eskuz sortu eta itzultzea prozesu luze eta garestia da, eta gutxitan egiten da.

Helburuak

Hizketa ezagutzeko teknologia (ASR edo Automatic Speech Recognition) eta itzulpen automatikoa (MT edo Machine Translation) erabiltzea azpitituluak (erdi-)automatikoki sortzeko eta haien itzulpen (erdi-)automatikoa egiteko.

Erabilera-kasua

Hizketa-ezagutzako sistema komunikabideen domeinura egokitu da, eta ezagutza-tasa handiagoa lortu da elkarrizketa informaletan, euskalkietan eta abarretan. Azpititulazio automatikoak eta horien itzulpen automatikoa txertatu da komunikabideetako multimedia-edukien kudeatzaileetan, eta ikus-entzunezko eduki bat kudeatzailera igotzean eta katalogatzean automatikoki azpitituluak sortzen dira, kudeatzailetik bertatik zuzendu daitezke, horiek itzultzera bidali eta zuzendu daitezke, eta web-ean, sare sozialetan eta abarretan azpitituluekin argitaratu.

Azpiegitura

On Premises edo Cloud, bezeroaren eskakizunen arabera

Erabilitako teknologiak

NLP

Erabilitako datuak

Transkribatutako audioen ehunka ordu

Erabilitako baliabideak

NLPn eta, bereziki, hizketaren ezagutzan eta itzulpen automatikoan espezializatutako ikertzaileak. Garatutako ezagutza- eta itzulpen-sistemak kokatzeko zerbitzarien azpiegitura (On Premises instalaziorik behar ez denean). API garatzaileak, ezagutza- eta itzulpen-sistema automatikoen urruneko deirako. Ezagutza eta itzulpen automatikoko eta eskuzko zuzenketarako sistemak integratzeko frontend garatzaileak.

Zailtasunak eta ikaskuntza

Komunikabideen edukiei aplikatutako hizketa-ezagutza sistemen berariazko eskakizunak: elkarrizketa informalak, euskalkiak, azpitituluetan hizlariak bereizi eta markatzea, azpitituluak iraupen mugatuko segmentutan eta puntu logikoetan banatzea… Entrenamendua domeinuko datasetekin, azpisistema espezifikoen entrenamendua.

KPIak (negozioan duen inpaktua eta ereduaren metrikak)

Inplementazioa Hamaika Telebistan, Goienan, Antxeta Irratian, Teknopolisen… Edukien irisgarritasuna handitzea. Itzulpengintzaren bidez, edukiak publiko globalari heltzea.

Finantzaketa

Hazitek, Adimen Artifizial Aplikatua

Kolaboratzaileak

Hamaika Telebista, Goiena, Antxeta Irratia

Scroll to Top