Hvordan utvikle nøyaktige og effektive metoder for audiovisuell innholdsstyring
Audiovisuelt medieinnhold er ikke bare et viktig verktøy for kommunikasjon og underholdning, det blir også sett på som en nyttig kilde til moderne historie. For at alle skal kunne dra nytte av slike informative dokumenter, er det avgjørende å oversette bevegelige bilder, lyd og ord på en effektiv og kostnadseffektiv måte. Gå inn i det EU-finansierte MeMAD-prosjektet som utvikler automatiske språkbaserte metoder for å håndtere, få tilgang til og publisere eksisterende og opprinnelig produsert digitalt innhold i de kreative næringene.
MeMAD-prosjektet fokuserer på TV-kringkasting og on-demand medietjenester, og har også som mål å styrke digital historie-fortelling. I løpet av to år inn i prosjektet har MeMAD-partnerne utviklet en prototypeplattform som hjelper fagfolk innen audiovisuelt innhold. De har også evaluert ulike aspekter av plattformen, som nevnt i et blogginnlegg på prosjektnettstedet.
«Det var fire spor av evaluering: videoredigeringsassistanse, søk, intralual undertekst ved hjelp av automatisk talegjenkjenning (ASR) og flerspråklig teksting ved hjelp av maskinoversettelse (MT).»
Det samme blogginnlegget sier også: “I alle evalueringer fylte deltakerne ut skjemaene for brukeropplevelse spørreskjema (UEQ) etter hver oppgave, tilpasset for å fokusere på selve oppgaven i stedet for brukergrensesnittet. Etter hver evalueringsøkt var det et kort semistrukturert intervju. I tillegg ble det samlet inn data for hjelp til videoredigering og til å søke evalueringer. » Blogginnlegget legger til at ASR-transkripsjoner og MT særlig ble funnet «å være nyttige i både videoredigeringshjelp og i arkivsøking, selv om det fortsatt er rom for forbedring.»
I det samme blogginnlegget understreker prosjektpartnere at presentasjonen og søkbarheten av metadataene også kan forbedres. «Det ville være en fordel å kunne søke etter segmenter der en bestemt person snakker om et emne, og kombinerer ansiktsgjenkjenning og talegjenkjenningsdata. Segmentlengder må også undersøkes, men i lengre videoer kan kortere segmenter resultere i for mange markører til et videoredigeringsverktøy å håndtere. » Blogginnlegget fortsetter: “Fremtidige evalueringer vil omfatte ansiktsgjenkjenning og visuell gjenstander. De samme deltakerne bør brukes i fremtidige evalueringer der det er mulig, siden de allerede er kjent med plattformen og kan sammenligne resultater. «
Romanverktøy
MeMAD (Methods for Managing Audiovisual Data: Combining Automatic Efficiency with Human Precision) -prosjektet bruker maskinlæring og prosessering for å gjøre det lettere å hente inn data fra store mengder innhold og fra flere språk. Den har også som mål å gi innholdsskapere nye verktøy for å bedre strukturere innhold og automatisere leveringen av innholdsderivater til forskjellige plattformer som sosiale medier.
Takket være MT som brukes til taleutskrifter og undertekster, vil innhold være tilgjengelig for nye målgrupper på fremmedspråk og være mer tilgjengelig for mennesker med hørsels- og / eller synshemming. Et eksempel på forskjellige brukssaker av MeMAD involverer automatisk transkripsjon, oversettelse og teksting. Som et resultat kan videoredaktører som redigerer intervjuer på et fremmedspråk, fungere uten tolker.
I et annet tilfelle kan synshemmede brukere følge aktuelle saker ved hjelp av auto-genererte innholdsbeskrivelser som er gjort tilgjengelig. En periodisk prosjektrapport om CORDIS notater: “Nøkkelen til innovasjonen er å gi kreative industrier en felles representasjon for stamdataene i produksjonsprosessene, slik at de nåværende dokument-orienterte redaksjonelle prosessene kan erstattes med en mer strukturert tilnærming. ”
For mer informasjon, vennligst se: MeMAD prosjektnettsted.
Oversetting og tilrettelegging av Frogner Data. © Europa Unionen, 2020 – Kilde: CORDIS, cordis.europa.eu.