Skip to main content

自動転写とは何ですか?

Automatic Automatic Transcriptionとは、コンピューターの使用および直接的な人間の介入を介して、音声または記録された音声の書面による転写を生成するプロセスです。正確な自動転写には、高品質の転写ソフトウェアと聴覚入力を正確に受信できるデバイスが必要です。一般に、転写される音声または録音は、歪みやバックグラウンドノイズからの干渉がかなりないことも必要です。特殊な転写ソフトウェアを実行しているコンピューターを使用して音楽を転写する試みも行われています。音楽の転写には、特に即興のソロの場合のように、特にその音楽に既存の表記法がない場合、特定の音楽のメモを書き出すことが含まれます。このソフトウェアは、聴覚入力を処理し、連続言語ストリームを別々の単語に分離し、それらの単語を認識し、テキストで正しく表現する責任があります。一般に、このプロセスのどの段階でも障害は、ソース材料とは多少異なる転写産物をもたらします。優れた自動転写ソフトウェアは、同様の単語の微妙な違いを認識し、さまざまなスタイルと音速を補償できるはずです。理解しにくいアクセントは、最高の転写ソフトウェアでさえ問題がある傾向があります。自動転写ソフトウェアのいくつかの形態は、言葉を転写している人々の声を学ぶことができるため、この目的に特に適しています。そのような場合、自動転写はさまざまな異なるソースから音声の転写を作成するために使用されていないため、ソフトウェアが多種多様な音声パターンを開く必要はありません。ソフトウェアが一人で拡張されたときまたは予備キャリブレーション中に発生する可能性のあるこの最適化プロセスを許可すると、ディクテーションの精度と潜在的な速度が大幅に向上する可能性があります。人間として人間のスピーチを認識しています。たとえば、特定の単語を理解できない場合、文脈上の手がかりを利用することはできません。そのため、人間が自動転写を通じて作成されたトランスクリプトを校正することがしばしば必要です。フォーマットの軽微なエラーと転写のさまざまなエラーは、多くの場合、転写された音声が非常に明確でない限り一般的です。それでも、コンピューター化された転写を使用すると、提出または使用前に限られた人間の介入のみを必要とするトランスクリプトの強固な基盤を作ることができます。