Skip to main content

Hvad er dynamisk tidsvridning?

Dynamisk tidsspredning (DTW) involverer en beregningsmetode, kaldet en algoritme, for at sammenligne lyde, video og grafik, der kan være ens, men prøver, som kan have subtile forskelle.Beregningerne formulerer typisk en lineær repræsentation af prøven og måler forskellene som en funktion af tiden.Forskellige elementer i en prøve kan kortlægges på et gitter for at identificere ligheder, mens kommandoer til funktioner ofte bruger symboler til at identificere hver variabel.Talegenkendelse bruger for eksempel undertiden dynamisk tidsskårning til at matche ord, selvom de tales i forskellige hastigheder, eller visse dele udtales forskelligt.

Mange talegenkendelsesprogrammer bruger dynamisk tidsskyr, fordi folk ofte taler i forskellige satser.Visse vokallyde kan annuncieres forskelligt afhængigt af følelser eller andre faktorer.Nogle programmer kan genkende ord, der er talt, uanset hvem der taler.Af denne grund er det normalt ikke effektivt at tilføje de afstande i tidsintervaller for at sammenligne lyde.Med DTW analyseres forskellige tidsspecifikke punkter for hvert signal;Disse afstande beregnes på et gitter, der løber fra bund til venstre til øverste højre.

Ligheder i de tilsvarende dele af to prøver kan måles ved hjælp af Levenshtein-afstanden.Brev bruges til at repræsentere ændringerne mellem en kilde og en anden.Løsningen på algoritmen er typisk et større antal, jo mere forskellige de to prøver er.Dette koncept bruges ofte til talegenkendelse såvel som stavekontrol og analyse af genetisk materiale.

I nogle målinger kan frekvensændringer opveje evnen til dynamisk tidsskårning.Signaler kan beregnes på en sådan måde, at deres form bruges uanset hyppighed.Modulerede signaler kan også udgøre et problem, men et gitter, der beregner afstand mellem linjesegmenter i stedet for punkter, kan kompensere.

Sekvensjustering er generelt matematisk, og nogle computerprogrammeringsevner er nødvendige for at forstå det fuldt ud.Dynamiske tidsdrevende algoritmer afhænger af nogle basale betingelser for realistisk beregning af forskellene mellem lyd- eller visuelle prøver.I betragtning af en prøve som en sti langs et gitter følger algoritmen ofte regler, såsom stien kan ikke vende tilbage, og at den måles et trin ad gangen.Ud over det nederste venstre til øverste højre format er målinger begrænset til placeringer tæt på en diagonal linje.Værdier, der er for stejle eller lavt, ignoreres ofte, fordi de kan forårsage fejl i den endelige måling.