Skip to main content

Τι είναι η σύνθεση ομιλίας;

Η σύνθεση ομιλίας είναι μια διαδικασία όπου η προφορική επικοινωνία αναπαράγεται μέσω μιας τεχνητής συσκευής.Ένας υπολογιστής που μετατρέπει το κείμενο σε ομιλία είναι ένα είδος συνθέτη ομιλίας.

Οι πρώτες μορφές σύνθεσης ομιλίας εφαρμόστηκαν μέσω μηχανών που έχουν σχεδιαστεί για να λειτουργούν όπως η ανθρώπινη φωνητική οδός.Η μηχανή ομιλίας που δημιουργήθηκε από τον Wolfgang von Kempelen στο 1700 είναι ένα παράδειγμα.Με αυτή τη συσκευή, η ομιλία παρήχθη μέσω μιας κουζίνας παρακάτω, ενός καλαμιού και ενός κουδουνιού κλαρινέτου.Η κουζίνα παρακάμψει σχεδιάστηκε για να ενεργεί σαν πνεύμονας, ενώ η γλωττίδα (η περιοχή των φωνητικών κορδονιών) εκπροσωπήθηκε μέσω του Bagpipe Reed.Το κουδούνι του κλαρινέτου χρησίμευσε ως στόμα.

Η λειτουργία της συσκευής ήταν εντελώς χειροκίνητη.Το δεξί χέρι ελέγχει μια σειρά μοχλών ενώ το αριστερό χέρι χειρίστηκε το κουδούνι του κλαρινέτου (στόμα).Υπήρχε επίσης η δυνατότητα σύνδεσης των «ρουθούνων», για να παράγει λιγότερο ρινικό ήχο.Είτε έτσι είτε αλλιώς, εφόσον χρησιμοποιήθηκαν σωστά τα βασικά χειριστήρια, το μηχάνημα έλαβε ροή αέρα.Αυτή η ροή αέρα καθορίζει τους τύπους ήχων που θα παράγονται.

Μεταγενέστερες μηχανές ομιλίας καθ 'όλη τη διάρκεια του 18ου και 19ου αιώνα διατήρησαν αυτή τη ρύθμιση, αν και υπήρξαν βελτιώσεις.Για παράδειγμα, στα τέλη του 1800, ο Joseph Faber δημιούργησε μια μηχανή ομιλίας που θα μπορούσε να λάβει εισροές μέσω ενός πληκτρολογίου και ενός πεντάλ.Το μηχάνημα ήταν επίσης πολύ δημιουργικό, καθώς ο ήχος βγήκε μέσα από ένα τεχνητό «πρόσωπο».Παρόλο που η προϋπόθεση της μίξης του ανθρώπινου φωνητικού συστήματος ήταν ακόμα η ίδια, οι μηχανές ομιλίας στις αρχές του 20ου αιώνα θα μπορούσαν να παράγουν καλύτερους ήχους, αφού η είσοδος ήταν ακριβέστερη.έξω από την αρένα ψυχαγωγίας.Αυτό οφείλεται κυρίως στο γεγονός ότι οι συνθέτες ομιλίας θα μπορούσαν να αποθηκευτούν σε λογισμικό αντί για ξεχωριστό μηχάνημα.Επιπλέον, με τους υπολογιστές ως βοήθεια, η σύνθεση ομιλίας θα μπορούσε να πάρει μια διαφορετική μορφή.Χρησιμοποιώντας τις ανθρώπινες φωνές ως την κύρια πηγή για τον ήχο.

Αυτή η μορφή σύνθεσης ομιλίας είναι γνωστή ως συνοπτική.Η διαδικασία λειτουργεί συνδέοντας διάφορες ηχογραφήσεις της ανθρώπινης ομιλίας.Ο ήχος που προκύπτει είναι πολύ πιο φυσικός και ευχάριστος στο αυτί.Αυτό έρχεται σε αντίθεση με τα προγράμματα που χρησιμοποιούν αρθρωτική σύνθεση, όπου η ομιλία αναπαράγεται μέσω ενός ηλεκτρονικού μοντέλου της φωνητικής οδού.να είναι σε θέση να δώσει στους ανθρώπους την ευκαιρία να ακούσουν κείμενο.Αυτό είναι ιδιαίτερα χρήσιμο σε καταστάσεις όπου η ανάγνωση είναι ενοχλητική ή αδύνατη.

Στον επιχειρηματικό κόσμο, τέτοιες καταστάσεις είναι πολύ συνηθισμένες, ειδικά για τις τηλεφωνικές συναλλαγές.Χωρίς εναλλακτικές λύσεις κειμένου σε ομιλία (TTS), οι ιδιοκτήτες επιχειρήσεων θα πρέπει να ξοδεύουν χρήματα προσλαμβάνοντας ακόμη περισσότερο προσωπικό εξυπηρέτησης πελατών.Οι συνθετικές λύσεις αποφεύγουν αυτό το πρόβλημα, αφού όλα γίνονται από τον υπολογιστή.Δεν είναι ένας άνθρωπος.

Η συνθετική ομιλία παίζει επίσης ρόλο στην καθημερινή ζωή, ειδικά για άτομα που είναι άτομα με ειδικές ανάγκες.Τα ρολόγια, τα λεξικά και άλλες συσκευές μπορούν να κάνουν τα πράγματα ευκολότερα για άτομα που έχουν πρόβλημα να δουν ή να διαβάζουν.Η συνθετική ομιλία είναι ακόμη σε θέση να δώσει μια φωνή σε άτομα που δεν μπορούσαν να μιλήσουν καθόλου.Ο Steven Hawking, ένας διάσημος φυσικός, είναι ένα εξέχον παράδειγμα.Δεδομένου ότι η ασθένεια του Lou Gehrig τον έχει καταστήσει σιωπηλό, ο Hawking χρησιμοποιεί έναν συνθέτη φωνής για να επικοινωνήσει με τους ανθρώπους.

Υπάρχουν επίσης διαθέσιμες εφαρμογές TTS για να βοηθήσουν τους ανθρώπους με διάφορες δραστηριότητες στον υπολογιστή.Για να αποκτήσουν αυτούς τους τύπους εφαρμογών, οι περισσότεροι χρήστες θα πρέπει να αγοράσουν ξεχωριστό λογισμικό ή να κατεβάσουν τα μπαλώματα.Η τελευταία επιλογή είναι συνήθως δωρεάν, ανάλογα με το λειτουργικό σύστημα ή το πρόγραμμα επεξεργασίας κειμένου που χρησιμοποιείται.Ωστόσο, εάν ένα άτομο θα αποφασίσειΓια να αγοράσουν ξεχωριστό λογισμικό, θα μπορούσαν να έχουν πρόσβαση σε ένα σύστημα υψηλότερης ποιότητας.Ειδικά παραδείγματα μπορούν να παρατηρηθούν μέσω του φυσικού αναγνώστη 7 και του κειμένου δυνατά 2.

Τελικά, η σύνθεση ομιλίας είναι η τεχνολογία που έχει φέρει επανάσταση στον τρόπο με τον οποίο η ανθρωπότητα επικοινωνεί.Κατά μία έννοια δίνει κείμενο μια δική του ζωή.Δίνει επίσης στον κόσμο την ευκαιρία να ακούσει τις σκέψεις των λαμπρών ατόμων που θα είχαν κανονικά άφωνους.