Skip to main content

Co je to dynamické časové deformace?

Dynamická časová deformace (DTW) zahrnuje metodu výpočtu, nazývanou algoritmus, pro porovnání zvuků, videa a grafiky, které mohou být podobné, ale vzorky, které mohou mít jemné rozdíly.Výpočty obvykle formulují lineární reprezentaci vzorku a měří rozdíly jako funkci času.Různé prvky vzorku mohou být mapovány na mřížce pro identifikaci podobností, zatímco příkazy pro funkce často používají symboly k identifikaci každé proměnné.Například rozpoznávání řeči někdy používá dynamické časové deformace, aby odpovídala slovům, i když se mluví různými rychlostmi nebo určité části jsou vyslovovány odlišně.

Mnoho programů rozpoznávání řeči používá dynamické časové deformace, protože lidé často mluví různými rychlostmi.Některé zvuky samohlásky mohou být ohlášeny odlišně v závislosti na emocích nebo jiných faktorech.Některé programy mohou rozpoznat slova mluvená bez ohledu na to, kdo mluví.Z tohoto důvodu obvykle není účinné přidávat vzdálenosti v časových intervalech pro porovnání zvuků.S DTW jsou analyzovány různé časově specifické body pro každý signál;Tyto vzdálenosti se počítají na mřížce, která probíhá od vlevo dole do pravého horního pravého.

Podobnosti v odpovídajících částech dvou vzorků lze měřit pomocí vzdálenosti levenshteinu.Dopisy se používají k reprezentaci změn mezi jedním zdrojem a druhým.Řešením algoritmu je obvykle větší číslo, tím více jsou dva vzorky.Tento koncept se často používá pro rozpoznávání řeči a kontrolu pravopisu a analýzy genetického materiálu.Signály lze vypočítat tak, aby se jejich forma použila bez ohledu na frekvenci.Modulované signály mohou také představovat problém, ale mřížka, která vypočítává vzdálenosti mezi segmenty linky místo bodů, může kompenzovat.

Srovnání sekvence je obecně matematické a některé dovednosti počítačového programování jsou zapotřebí k plnému porozumění.Algoritmy dynamické časové deformace závisí na některých základních podmínkách pro realistické výpočet rozdílů mezi zvukovými nebo vizuálními vzorky.Vzhledem k tomu, že vzorek jako cestu podél mřížky, algoritmus často dodržuje pravidla, jako je cesta, nemůže se vrátit zpět a že se měří jeden krok najednou.Kromě levého dolního doletu do pravého pravého formátu jsou měření omezena na místa v blízkosti diagonální linie.Hodnoty, které jsou příliš strmé nebo mělké, jsou často ignorovány, protože mohou způsobit chyby při konečném měření.