Skip to main content

音声統合と認識との関係は何ですか?

音声統合と認識は、コンピューター化された音声分析の両面です。音声統合は、コンピューターによる人間の発話の作成です。たとえば、コンピューターに書かれたテキストを読んでいます。音声認識とは、紙をコンピューターに口述するなど、話し言葉からコンピューター情報を作成することです。2つのプロセスは直接関連していませんが、音声統合と認識はどちらも、人間の音声と変曲を理解するコンピューターの能力に依存しています。1つの方法は出力で、もう1つは入力です。このプロセスは、2つの部分で構成されています。1つは人間の相互作用と、もう1つはない部分です。人間の部分は、人間の言葉がプログラムに入るときです。人間以外の部分は、プログラムが入力を相互運用するときです。プログラムは言語を読み取り、文の配置と句読点を使用して変曲を決定し、各単語が何であるかを決定します。「ライブ」の場合など、単語が複数の方法と宣言される可能性がある場合、プログラムは、実際にどの単語が使用されているかを判断するために、近くの単語とコンテキストの手がかりを探します。その後、単語はプログラムの第2部に移動し、そこで声を出して話されます。入力は、単語をコンピューターに伝える人間のスピーカーから来ています。コンピューターは各単語を聞き、スピーカーの声によって生成されたパターンを、可能な音や単語のライブラリと比較します。次に、最も可能性の高い単語を決定し、システムの第2部に送信します。この部分は、合成プログラムが単語を書く方法と同様に、実際に画面に単語を印刷します。人々がこれらのエラーと戦う方法の1つは、個別の音声プロファイルを使用することです。単一のスピーカーは、彼の特定のボーカルパターンを見つけるために、プログラムによってスピーチを分析します。彼がコンピューター翻訳にエラーを見つけたとき、彼はそれらを具体的に修正することができます。修正はプログラムによって分析および保存され、面倒な単語が再び登場すると、プログラムが正しく翻訳されます。医療分野では、これらのプログラムにより、人々はそうでなければできないかもしれない人を伝えることができます。これらのプログラムは、レポートやドキュメントを翻訳するより速い手段として、ビジネスに幅広いアプリケーションを備えています。音声認識は、自動車にハンズフリーデバイスをセットアップする一般的な方法でもあり、運転中に人々がより安全に電話で話すことができます。