Skip to main content

Vad är dynamisk tidskakning?

Dynamic Time Warping (DTW) involverar en metod för beräkning, kallad en algoritm, för att jämföra ljud, video och grafik som kan vara liknande men prover kan ha subtila skillnader.Beräkningarna formulerar vanligtvis en linjär representation av provet och mäter skillnaderna som en funktion av tiden.Olika element i ett prov kan mappas på ett rutnät för att identifiera likheter, medan kommandon för funktioner ofta använder symboler för att identifiera varje variabel.Taligenkänning använder till exempel ibland dynamisk tidskakning för att matcha ord även om de talas i olika hastigheter eller vissa delar uttalas annorlunda.

Många programmet för taligenkänning använder dynamisk tidskakning eftersom människor ofta talar i olika takt.Vissa vokaljud kan tillkännages annorlunda beroende på känslor eller andra faktorer.Vissa program kan känna igen ord som talas oavsett vem som talar.Av denna anledning är det vanligtvis inte effektivt att lägga till avståndet i tidsintervall för att jämföra ljud.Med DTW analyseras olika tidsspecifika punkter för varje signal;Dessa avstånd beräknas på ett rutnät som går från botten till vänster till högst till höger.

Likheter i motsvarande delar av två prover kan mätas med Levenshtein-avståndet.Bokstäver används för att representera förändringarna mellan en källa och en annan.Lösningen på algoritmen är vanligtvis ett större antal ju mer annorlunda de två proverna är.Detta koncept används ofta för taligenkänning såväl som stavkontroll och analys av genetiskt material.

I vissa mätningar kan frekvensförändringar kompensera förmågan hos dynamisk tidsförskjutning.Signaler kan beräknas på ett sådant sätt att deras form används oavsett frekvens.Modulerade signaler kan också utgöra ett problem, men ett rutnät som beräknar avstånd mellan linjesegment istället för punkter kan kompensera.

Sekvensinriktning är i allmänhet matematisk och vissa datorprogrammeringsförmågor behövs för att fullt ut förstå det.Dynamiska tidskvesande algoritmer beror på vissa grundläggande förhållanden för att realistiskt beräkna skillnaderna mellan ljud eller visuella prover.Med tanke på ett prov som en väg längs ett rutnät följer algoritmen ofta regler, till exempel banan kan inte vända tillbaka och att den mäts ett steg åt gången.Förutom det nedre vänster till högra format är mätningarna begränsade till platser nära en diagonal linje.Värden som är för branta eller grunt bortses av ofta eftersom de kan orsaka fel i den slutliga mätningen.