Ses transkripsiyon, konuşulan kelimeleri alıp yazılı metne sokma işlemidir. Geçmişte, bir kişi oturur ve konuşulduğu gibi kelimeler yazardı. Şimdi, çeşitli tiplerde ses kayıtları ve çeşitli transkripsiyon yöntemleri mevcuttur. Analog ve dijital kayıt yöntemleri, konuşma sırasında bulunmayan bir kişinin metni hala yazmasına izin verir. Ek olarak, birçok yazılım paketi ses dosyalarını okuyacak ve bunları gerçekten oynatmak zorunda kalmadan hızlı bir şekilde metne dönüştürecektir.
Uzun yıllar boyunca, ses transkripsiyon uzman ve sıkıcı bir işti. Konuşma sırasında yazıya dökülmüş kişilerin konuşma sırasında hazır olması gerekiyordu; bu, genellikle şirketlerin steno gibi ileri teknikler konusunda eğitilmiş insanları işe almak zorunda kalmaları anlamına geliyordu. Bu aynı zamanda, eğitimli bir transkriptöre erişimi olanlara transkripsiyon servislerini sınırladı.
Ses kayıtlarının icadı ile, bu alan önemli ölçüde değişti. Bir kayda göre, alıcı-verici kaydın gönderilebileceği herhangi bir yerden çalışabilir. Ayrıca, kayıt birçok kez dinlenebileceği ve dinlenebileceği için transkripsiyona artık gerek kalmaz. Tek bir transkripsiyon aynı zamanda çok sayıda müşteri için aynı anda çalışabilir, çünkü artık konuşmalar için hazır olması gerekmiyordu.
Bilgisayar kullanımındaki artış ve İnternet hızlarıyla birlikte, ses transkripsiyon alanı büyük ölçüde aynı kaldı. Bantlar yerine dosyalar normal postayla gönderilmek yerine sık sık e-posta ile gönderilir. Sürecin hızı arttı, ancak yöntemler artmadı.
Bu, 90'lı yılların sonlarında konuşma tanıma ve dikte yazılımının kullanımı ile değişti. Metin yazma işi bilgisayar desteğine ve daha sonra da tam otomasyona doğru gittikçe daha fazla gidiyordu. Bir ses dosyasının içindeki bilgileri okuyabilen ve konuşmanın bir metin sürümünü oluşturmak için konuşmacının dalga paternlerini kullanabilecek yazılım paketleri ortaya çıktı. Bu, bir insan transkriptörünün dakikaları veya saatleri yerine saniyeler sürer.
Bilgisayarla otomatik hale getirilmiş ses transkripsiyonu, en büyüğü düzeltici konuşma eksikliği olan, üstesinden gelinmesi zor birkaç hataya sahiptir. Bir insan transkripti metni dinlediğinde, konuşmayı daha okunaklı hale getirmek için konuşmadaki ufak hataları düzeltebilir. Bazı transkripsiyon sözlü olsa da, bu tam olarak kişinin söylediği şeydir, çoğu değildir. Düzeltici konuşma olmadan, bir insan genellikle kullanılmadan önce yazım hatalarını kontrol etmek zorunda kalacaktır.
Bilgisayar tabanlı ses transkripsiyonunun diğer ortak kusuru, insanların konuşmalarında yatmaktadır. İnsanlar konuştuğunda çok çeşitli tonlara ve desenlere sahip olduklarından, tüm aralığı doğru bir şekilde okuyabilen ve çevirebilen bir bilgisayar programı oluşturmak son derece zordur. Bu, neredeyse tüm transkripsiyon yazılımlarında belirli miktarda bir hatanın yaygın olduğu anlamına gelir. Bu kusur etrafında çalışmanın en yaygın yolu, programın ve tek bir konuşmacının programın tek bir kişinin kalıplarına odaklanmasına yetecek kadar birlikte çalıştığı öğrenilmiş konuşmadır.


