Skip to main content

Was ist dynamische Zeitverzerrung?

Dynamic Time Warping (DTW) beinhaltet eine Berechnungsmethode, die als Algorithmus bezeichnet wird, um Sounds, Video und Grafiken zu vergleichen, die möglicherweise ähnlich sind, von denen jedoch subtile Unterschiede aufweisen können.Die Berechnungen formulieren typischerweise eine lineare Darstellung der Probe und messen die Unterschiede als Funktion der Zeit.Verschiedene Elemente einer Probe können auf ein Raster abgebildet werden, um Ähnlichkeiten zu identifizieren, während Befehle für Funktionen häufig Symbole verwenden, um jede Variable zu identifizieren.Bei der Spracherkennung werden beispielsweise manchmal dynamisches Zeitverzerrung verwendet, um Wörter abzustimmen, auch wenn sie mit unterschiedlichen Geschwindigkeiten gesprochen werden oder bestimmte Teile unterschiedlich ausgesprochen werden.

Viele Spracherkennungsprogramme verwenden dynamisches Zeitverzerren, weil Menschen oft mit unterschiedlichen Raten sprechen.Bestimmte Vokalgeräusche können je nach Emotionen oder anderen Faktoren unterschiedlich angezeigt werden.Einige Programme können gesprochene Wörter erkennen, egal wer spricht.Aus diesem Grund ist es normalerweise nicht wirksam, die Entfernungen in Zeitintervallen zu addieren, um Geräusche zu vergleichen.Bei DTW werden verschiedene zeitspezifische Punkte für jedes Signal analysiert;Diese Entfernungen werden auf einem Raster berechnet, das von unten links nach oben nach rechts verläuft.

Ähnlichkeiten in den entsprechenden Teilen zweier Proben können unter Verwendung des Levenshtein-Abstands gemessen werden.Buchstaben werden verwendet, um die Änderungen zwischen einer Quelle und einer anderen darzustellen.Die Lösung für den Algorithmus ist typischerweise eine größere Zahl, desto unterschiedlicher sind die beiden Proben.Dieses Konzept wird häufig für die Spracherkennung sowie für die Überprüfung und Analyse von Zaubersprüchen und Analyse von genetischem Material verwendet.Signale können so berechnet werden, dass ihre Form unabhängig von der Frequenz verwendet wird.Modulierte Signale können auch ein Problem darstellen, aber ein Raster, das Entfernungen zwischen Liniensegmenten anstelle von Punkten berechnet, kann im Allgemeinen mathematisch ausgleichen, und einige Computerprogrammierfähigkeiten sind erforderlich, um sie vollständig zu verstehen.Dynamische Zeitverzerrungsalgorithmen hängen von einigen grundlegenden Bedingungen ab, um die Unterschiede zwischen Audio- oder visuellen Stichproben realistisch zu berechnen.Wenn der Algorithmus eine Probe als Pfad entlang eines Rasters betrachtet, folgt er häufig Regeln, z.Zusätzlich zum unteren Links bis zum oberen rechten Format sind die Messungen auf Orte in der Nähe einer diagonalen Linie beschränkt.Werte, die zu steil oder flach sind, werden oft ignoriert, weil sie bei der endgültigen Messung Fehler verursachen können.