Co je dynamická deformace času?

Dynamická deformace času (DTW) zahrnuje metodu výpočtu, nazývanou algoritmus, pro porovnání zvuků, videa a grafiky, které mohou být podobné, ale jejich vzorky mohou mít jemné rozdíly. Výpočty obvykle formulují lineární reprezentaci vzorku a měří rozdíly jako funkci času. Různé prvky vzorku mohou být mapovány na mřížce pro identifikaci podobností, zatímco příkazy pro funkce často používají symboly k identifikaci každé proměnné. Například rozpoznávání řeči někdy používá dynamická deformace času, aby odpovídala slovům, i když se mluví různými rychlostmi nebo se určité části vyslovují odlišně.

Mnoho programů rozpoznávání řeči používá dynamické časové deformace, protože lidé často mluví různou rychlostí. Některé zvuky samohlásky mohou být oznámeny odlišně v závislosti na emocích nebo jiných faktorech. Některé programy rozeznávají mluvená slova bez ohledu na to, kdo mluví. Z tohoto důvodu obvykle není efektivní sčítat vzdálenosti v časových intervalech pro porovnání zvuků. Pomocí DTW jsou analyzovány různé časově specifické body pro každý signál; tyto vzdálenosti se počítají na mřížce, která běží zleva zleva doprava.

Podobnosti v odpovídajících částech dvou vzorků lze měřit pomocí vzdálenosti Levenshtein. Dopisy se používají k reprezentaci změn mezi jedním zdrojem a druhým. Řešením algoritmu je obvykle větší počet, čím více jsou tyto dva vzorky odlišné. Tento koncept se často používá pro rozpoznávání řeči, kontrolu pravopisu a analýzu genetického materiálu.

V některých měřeních mohou změny frekvence kompenzovat schopnost dynamického časového zvlnění. Signály lze vypočítat tak, že se použije jejich forma bez ohledu na frekvenci. Modulované signály mohou představovat problém také, ale mřížka, která počítá vzdálenosti mezi segmenty vedení místo bodů, může kompenzovat.

Seřazení sekvencí je obecně matematické a některé počítačové programovací dovednosti jsou nutné k tomu, aby tomu bylo plně porozuměno. Algoritmy dynamické deformace času závisí na některých základních podmínkách pro realistický výpočet rozdílů mezi zvukovými nebo vizuálními vzorky. Uvažujeme-li vzorek jako cestu podél mřížky, algoritmus se často řídí pravidly, jako je cesta, která se nemůže vrátit zpět a že se měří po jednom kroku. Kromě formátu zleva zleva doprava vpravo jsou měření omezena na umístění v blízkosti diagonální čáry. Hodnoty, které jsou příliš strmé nebo mělké, se často neberou v úvahu, protože mohou způsobit chyby v konečném měření.

Co je dynamická deformace času?

Pomohl vám tento článek?