Skip to main content

Co to jest wydobycie audio?

Wydobycie audio jest zwykle używane w oprogramowaniu rozpoznawania mowy i analizie muzyki.Ta technologia daje użytkownikowi możliwość wyszukiwania mowy lub dźwięku muzycznego, który został przeanalizowany pod kątem określonych cech.W przypadku technologii rozpoznawania mowy, wydobycie audio identyfikuje słowa wypowiedziane w dźwięku i umieszcza je w pliku z możliwością wyszukiwania.Ta funkcja może być przydatna dla studentów lub osób w świecie biznesu, którzy biorą udział w wielu spotkaniach, ponieważ pozwala użytkownikowi łatwiej przeglądać aktualne informacje z prezentacji mowy.Ten rodzaj analizy może być również wykorzystany w muzyce do określenia cech takich jak Beats na minutę (BPM), klucz muzyczny i struktura muzyczna, informacje wykorzystywane do klasyfikacji muzyki.

W rozpoznawaniu mowy, w której technologia jest najczęściej stosowana, do stworzenia modelu akustycznego stosuje się wydobycie audio.Oprogramowanie do rozpoznawania mowy modelu akustycznego w celu rozpoznawania wzorców mowy jako słów.Technologia ta jest opracowywana przez wydobywanie audio nagranie wyrażenia mówionej, które jest porównywane do tekstu dopasowującego wyrażenie mówioną.Komputer używa informacji do rozpoznawania słów, gdy użytkownik wydaje podobne dźwięki jak w modelu akustycznym..Czasami oprogramowanie muzyczne, które kategoryzuje muzykę według gatunku, wykorzystuje wydobycie audio do organizowania muzyki.Proces identyfikuje i grupuje pliki muzyczne o podobieństwach dźwiękowych, które często występują w gatunkach muzycznych.Chociaż ta technologia może ułatwić organizację muzyki i znajdowanie nowej muzyki, może popełniać błędy klasyfikujące piosenki, które mają podobne zmierzone cechy, ale inny ogólny dźwięk.Oprogramowanie do analizy audio może być przydatne dla muzyków, zwłaszcza kompozytorów, ponieważ pozwala kompozytorowi skakać do określonych części struktury utworów, w tym muzycznych kluczowych zmian i słów w tekstach.

Producent oprogramowania do rozpoznawania mowy Dragon sprzedaje program o nazwie Audiomining To przepisuje pliki audio i oznacza pliki, aby można je było wyszukać tekst.Dragon jest producentem komputerowych programów językoznawstwa, technicznego terminu dla dziedziny oprogramowania zaprojektowanego do interpretacji mowy.Wydobycie audio, gdy jest używane jako dwa słowa, jest ogólnym terminem, który odnosi się do analizy pliku dźwiękowego dla określonego zestawu charakterystyk dźwięku.Inni producenci oprogramowania do wydobywania audio to Nuance oraz Nexidia .