Skip to main content

Tổng hợp lời nói là gì?

Tổng hợp lời nói là một quá trình mà giao tiếp bằng lời nói được nhân rộng thông qua một thiết bị nhân tạo.Một máy tính chuyển đổi văn bản thành lời nói là một loại tổng hợp lời nói.Các hình thức tổng hợp lời nói sớm nhất đã được thực hiện thông qua các máy được thiết kế để hoạt động giống như đường giọng nói của con người.Máy nói được tạo ra bởi Wolfgang von Kempelen trong 1700 1700 là một ví dụ.Với thiết bị này, bài phát biểu được sản xuất thông qua một nhà bếp dưới đây, một chiếc Bagpipe sậy và một chiếc chuông clarinet.Nhà bếp được thiết kế để hoạt động như một phổi, trong khi Glottis (khu vực của dây thanh âm) được thể hiện thông qua Bagpipe Reed.Chuông clarinet đóng vai trò là miệng. Hoạt động của thiết bị hoàn toàn thủ công.Tay phải kiểm soát một loạt đòn bẩy trong khi tay trái thao túng tiếng chuông clarinet (miệng).Ngoài ra còn có tùy chọn cắm ‘lỗ mũi, để tạo ra âm thanh mũi ít hơn.Dù bằng cách nào, miễn là các điều khiển cơ bản được sử dụng đúng cách, máy đã nhận được luồng không khí.Luồng khí này xác định các loại âm thanh sẽ được tạo ra.Các máy nói tiếp theo trong suốt thế kỷ 18 và 19 duy trì thiết lập này, mặc dù đã có những cải tiến.Ví dụ, vào cuối những năm 1800, Joseph Faber đã tạo ra một máy nói có thể nhận được đầu vào thông qua bàn phím và bàn đạp.Cỗ máy này cũng rất sáng tạo, vì âm thanh phát ra từ một khuôn mặt nhân tạo. Khi thế kỷ 20 xuất hiện, những đổi mới trong thiết bị điện tử cho phép tổng hợp lời nói đi theo một hướng thậm chí còn mạnh mẽ hơn.Mặc dù tiền đề của việc bắt chước đường giọng nói của con người vẫn giống nhau, nhưng những cỗ máy nói đầu thế kỷ 20 có thể tạo ra âm thanh tốt hơn vì đầu vào chính xác hơn. Tuy nhiênBên ngoài đấu trường giải trí.Điều này chủ yếu là do bộ tổng hợp giọng nói có thể được lưu trữ trong phần mềm thay vì một máy riêng biệt.Ngoài ra, với các máy tính là một trợ giúp, tổng hợp lời nói có thể có một hình thức khác;Sử dụng giọng nói của con người làm nguồn chính cho âm thanh.

Hình thức tổng hợp lời nói này được gọi là liên kết.Quá trình này hoạt động bằng cách kết nối các bản ghi khác nhau của lời nói của con người.Âm thanh kết quả là tự nhiên hơn và dễ chịu hơn đến tai.Điều này trái ngược với các chương trình sử dụng tổng hợp khớp nối, trong đó lời nói được nhân rộng thông qua một mô hình máy tính của đường phát âm. Các bộ tổng hợp lời nói thương mại có thể sử dụng các phương pháp nối hoặc khớp nối, nhưng cả hai đều có thể đạt được cùng một mục tiêu;Có thể cho mọi người một cơ hội để nghe văn bản.Điều này đặc biệt hữu ích trong các tình huống đọc là khó chịu hoặc không thể.Trong thế giới kinh doanh, những tình huống như vậy là rất phổ biến, đặc biệt là đối với các giao dịch qua điện thoại.Nếu không có các lựa chọn thay thế cho văn bản thành giọng nói (TTS), chủ doanh nghiệp sẽ phải chi tiền thuê nhiều nhân viên dịch vụ khách hàng hơn.Các giải pháp tổng hợp tránh vấn đề này, vì mọi thứ được thực hiện bằng máy tính;Không phải là một con người. Bài phát biểu tổng hợp cũng đóng một vai trò trong cuộc sống hàng ngày, đặc biệt là đối với những người bị khuyết tật.Đồng hồ nói chuyện, từ điển và các thiết bị khác có thể giúp mọi thứ dễ dàng hơn cho những người gặp khó khăn trong việc nhìn hoặc đọc.Bài phát biểu tổng hợp thậm chí có thể phát ra tiếng nói cho những cá nhân không thể nói được.Steven Hawking, một nhà vật lý nổi tiếng, là một ví dụ nổi bật.Vì bệnh Lou Gehrig, đã khiến anh ta câm, Hawking sử dụng bộ tổng hợp giọng nói để giao tiếp với mọi người.Ngoài ra còn có các ứng dụng TTS có sẵn để giúp hỗ trợ mọi người các hoạt động máy tính khác nhau.Để có được các loại ứng dụng này, hầu hết người dùng sẽ phải mua phần mềm riêng biệt hoặc tải xuống các bản vá.Tùy chọn thứ hai thường miễn phí, tùy thuộc vào hệ điều hành hoặc chương trình xử lý văn bản đang được sử dụng.Tuy nhiên, nếu một người quyết địnhes để mua phần mềm riêng biệt, họ có thể có quyền truy cập vào một hệ thống chất lượng cao hơn.Các ví dụ cụ thể có thể được nhìn thấy thông qua người đọc tự nhiên 7 và văn bản to 2. Cuối cùng, tổng hợp lời nói là công nghệ đã cách mạng hóa cách nhân loại giao tiếp.Theo một nghĩa nào đó, nó mang lại cho văn bản một cuộc sống của riêng mình.Nó cũng cho thế giới một cơ hội để nghe những suy nghĩ của những cá nhân xuất sắc, những người thường không có tiếng nói.