Skip to main content

音声合成とは何ですか?

音声合成とは、人工装置を介して口頭での通信が再現されるプロセスです。テキストをスピーチに変換するコンピューターは、1つのスピーチシンセサイザーです。s音声合成の最も初期の形態は、人間の声道のように機能するように設計された機械を介して実装されました。1700年代にWolfgang von Kempelenによって作成されたスピーキングマシンは例です。このデバイスを使用すると、スピーチは、キッチンの次のキッチン、バグパイプリード、クラリネットベルを通じて作成されました。キッチン・ブローは肺のように動作するように設計されていましたが、声門(声帯の領域)はバグパイプリードを通して表されていました。クラリネットベルは口として機能しました。右手は一連のレバーを制御し、左手はクラリネットベル(口)を操作しました。また、「鼻孔」をプラグインするオプションもあり、それほど鼻の音を生み出しました。いずれにせよ、基本的なコントロールが適切に使用されている限り、機械は気流を受け取りました。この気流は、生成される音の種類を決定しました。compray改善がありましたが、18世紀と19世紀を通じてその後のスピーキングマシンがこのセットアップを維持しました。たとえば、1800年代後半に、ジョセフフェイバーは、キーボードとペダルを介して入力を受信できるスーペンメインを作成しました。音は人工的な「顔」を通して出てきたため、マシンも非常に創造的でした。人間の声帯を模倣するという前提はまだ同じでしたが、20世紀初頭の話す機械は、入力がより正確であるため、より良い音を生み出すことができました。エンターテインメントアリーナの外。これは主に、音声シンセサイザーが別のマシンの代わりにソフトウェアに保存できるためです。さらに、コンピューターが援助として、音声統合は異なる形をとることができます。音の主な源として人間の声を使用します。このプロセスは、人間のスピーチのさまざまな録音を接続することで機能します。結果として得られる音は、はるかに自然で耳にとって心地よいです。これは、音声が声帯のコンピューター化されたモデルを介して複製される調音合成を使用するプログラムとは対照的です。CommercialSpeechSynthesizersは、連結または調音のいずれかを採用できますが、どちらも同じ目的を達成できます。人々にテキストを聞く機会を与えることができること。これは、読書が目立たない、または不可能な状況で特に役立ちます。businessビジネスの世界では、このような状況は、特に電話取引で非常に一般的です。テキストからスピーチ(TTS)の代替案がなければ、ビジネスオーナーはさらに多くの顧客サービス担当者を雇用する必要があります。合成されたソリューションは、すべてがコンピューターによって行われるため、この問題を回避します。人間ではない。時計、辞書、その他のデバイスを話すことは、見たり読んだりするのに苦労している人にとって物事を容易にすることができます。合成されたスピーチは、まったく話すことができなかった個人に声を与えることさえできます。有名な物理学者のスティーブン・ホーキングは顕著な例です。Lou Gehrigの病気は彼をミュートにしたので、Hawkingは音声シンセサイザーを使用して人々とコミュニケーションを取ります。computerさまざまなコンピューター活動を支援するために、TTSアプリケーションも利用できます。これらのタイプのアプリケーションを取得するには、ほとんどのユーザーが個別のソフトウェアを購入するか、パッチをダウンロードする必要があります。後者のオプションは通常、使用されているオペレーティングシステムまたはワープロプログラムに応じて無料です。ただし、人が却下した場合ES別のソフトウェアを購入するために、高品質のシステムにアクセスできます。具体的な例は、Natural Reader 7とText Aloud 2を通じて見ることができます。ある意味では、テキストにそれ自体の寿命を与えます。また、世界に通常は無声であった華麗な個人の考えを聞く機会を与えます。