Skip to main content

Τι είναι ένα ακουστικό μοντέλο;

Ένα ακουστικό μοντέλο είναι ουσιαστικά ένας χάρτης της φωνής σε σχέση με μια σειρά τυπωμένων λέξεων.Αυτή η τεχνολογία χρησιμοποιείται σε προγράμματα αναγνώρισης ομιλίας για να βοηθήσει έναν υπολογιστή να μάθει να αναγνωρίζει τα πρότυπα ομιλίας των ατόμων.Ένα ακουστικό μοντέλο είναι ένα από τα δύο κύρια αρχεία που είναι απαραίτητα για την εκτέλεση ενός προγράμματος αναγνώρισης ομιλίας.Το άλλο είναι το μοντέλο γλώσσας, το οποίο υποδεικνύει πιθανές λέξεις και πρότυπα ομιλίας που μπορούν να χρησιμοποιηθούν από τον ομιλητή.Αυτά τα μοντέλα δημιουργούνται συγκρίνοντας τις λεπτομέρειες ήχου ενός προφορικού αρχείου ήχου στο κείμενο των ομιλούμενων λέξεων.

Το λογισμικό αναγνώρισης ομιλίας είναι λογισμικό που έχει σχεδιαστεί για να αναγνωρίζει και να μεταγράφει ή να ανταποκρίνεται στις λέξεις που λέει ένα άτομο.Πολλά λειτουργικά συστήματα έχουν σχεδιαστεί με ενσωματωμένες βασικές δυνατότητες αναγνώρισης ομιλίας που ο χρήστης μπορεί να ενεργοποιήσει και να απενεργοποιήσει.Οι δυνατότητες αναγνώρισης ομιλίας στα λειτουργικά συστήματα δίνουν συνήθως στον χρήστη τη δυνατότητα να ελέγχει τον υπολογιστή και να πληκτρολογεί λέξεις στην οθόνη χρησιμοποιώντας τη φωνή του.που επεξεργάζεται τον ήχο.Ενώ πολλοί υπολογιστές διαθέτουν ενσωματωμένα μικρόφωνα, ένα εξωτερικό μικρόφωνο ακουστικών επιτρέπει στον χρήστη το όφελος του σαφέστερου φωνητικού ήχου και της ελευθερίας να μετακινηθεί γύρω από το δωμάτιο ενώ μιλάει.Οι αυτόνομες μάρκες λογισμικού αναγνώρισης ομιλίας περιλαμβάνουν Lumenvox Reg, Loquendo Reg, και Dragon Reg,

Τα περισσότερα προγράμματα αναγνώρισης ομιλίας έχουν προγραμματισμό ακουστικών μοντέλων που επιτρέπει στο πρόγραμμα να αναγνωρίζει τις παραλλαγές στην προφορά.Χρησιμοποιούν μοτίβα στον ήχο της φωνής των ομιλητών για να εντοπίσουν λέξεις στην ομιλία.Πολλοί έχουν σχεδιαστεί με λογισμικό εγκατάστασης για να βοηθήσουν τον χρήστη να δημιουργήσει ένα ακουστικό μοντέλο που έχει σχεδιαστεί για να ερμηνεύει τη δική του φωνή.Ορισμένα προηγμένα προγράμματα αναγνώρισης ομιλίας μπορούν να εντοπίσουν και να ερμηνεύσουν πολλές γλώσσες, συχνά με ένα μικρό ποσό ήχου πληροφοριών.Όσο πιο προηγμένο πρόγραμμα αναγνώρισης ομιλίας, τόσο πιο πιθανό είναι να ερμηνεύσει με ακρίβεια τις λέξεις που βασίζονται στο πλαίσιο της, συμπεριλαμβανομένου του τόπου όπου σε μια πρόταση λέγεται μια λέξη.

Το πεδίο της μελέτης που αναπτύσσει τεχνολογία αναγνώρισης ομιλίας ονομάζεται υπολογιστική γλωσσολογία.Η υπολογιστική γλωσσολογία περιλαμβάνει μελέτη και σχεδιασμό που δημιουργεί λογισμικό προγραμματισμένο για να κατανοήσει την ανθρώπινη ομιλία.Αυτός ο τομέας συχνά ενσωματώνει πληροφορίες από τη μελέτη της ψυχολογίας για τη δημιουργία ακουστικών μοντέλων που μπορούν να ερμηνεύσουν με μεγαλύτερη ακρίβεια την ομιλία.

Η λέξη ακουστική γενικά αναφέρεται σε οτιδήποτε έχει να κάνει με τον ήχο.Αν και τα ακουστικά μοντέλα χρησιμοποιούνται συχνότερα στην αναγνώριση ομιλίας, μπορούν επίσης να χρησιμοποιηθούν στη μουσική.Ένα ακουστικό μοντέλο μιας μουσικής διαδρομής μπορεί να εντοπίσει ιδιότητες όπως beats ανά λεπτό, τα μουσικά κλειδιά ή τα κυρίαρχα γήπεδα στη μουσική.Αυτές οι πληροφορίες μπορούν να χρησιμοποιηθούν από ένα πρόγραμμα υπολογιστή για τον εντοπισμό ενός μουσικού κομμάτι ή μπορεί να χρησιμοποιηθεί για να καθορίσει χαλαρά το είδος στο οποίο η μουσική είναι πιθανό να κατηγοριοποιηθεί.Τα ακουστικά μοντέλα χρησιμοποιούνται επίσης σε ένα πεδίο μελέτης που ονομάζεται Psychoacoustics, στον οποίο οι ερευνητές ελπίζουν να μάθουν να δομούν μουσική που επηρεάζει προβλέψιμα τον εγκέφαλο.