Enter your keyword

FPT Speech Synthesis – Hệ thống tổng hợp tiếng nói tiếng Việt dành riêng cho người Việt

FPT Speech synthesis là bộ tổng hợp tiếng Việt mới của FPT, có khả năng đọc diễn cảm các câu văn, đoạn văn, thậm chí là cả một quyển sách với giọng đọc tự nhiên như người thật. Phần mềm sử dụng những thuật toán thông minh nhằm phân tích những âm thanh tiếng Việt được thu từ giọng người thật.

speech-1

Tổng hợp tiếng nói (Speech synthesis) là bài toán cơ bản trong bài toán lớn về giao tiếp giữa người và máy (Human-Machine Interface). Tuy là một bài toán có hàng nghìn năm tuổi, với những khởi đầu khá thô sơ, nhưng cho đến ngày nay vẫn là bài toán đang được tiếp tục giải với sự tham gia của rất nhiều “ông lớn” cùng những tham vọng khác nhau.
Với tham vọng riêng của mình, Ban công nghệ FPT (FTI) đã nỗ lực nghiên cứu suốt gần 5 năm qua để cho ra mắt sản phẩm “FPT Speech Synthesis”. Sảm phẩm là sự kết hợp của :
• Ngôn ngữ học (Linguistics): âm vị học (Phonology), hình thái học (Morphology), ngữ dụng học (Pragmatics);
• Vật lý học: âm học;
• Công nghệ: Xử lý ngôn ngữ tự nhiên (Natural Language Processing) , học máy (Machine Learning), xử lý tín hiệu số (Digital Signal Processing).
Được đánh giá là hệ thống tổng hợp tiếng nói tiếng Việt có chất lượng tốt nhất thị trường hiện nay, hệ thống tổng hợp tiếng Việt mới của FPT đang được mở trên Open FPT (http://openfpt.vn/). Các nhà phát triển có thể khai thác nguồn tài nguyên này để xây dựng ứng dụng của riêng mình trên các nền tảng khác nhau.
Cho đến thời điểm này, sản phẩm “Giao thông thông minh” do FPT IS phát triển đang sử dụng Speech Synthesis API của Open FPT và nhận được rất nhiều phản hồi tích cực từ người dùng.
Tham khảo thêm về công nghệ tổng hợp tiếng nói:
Kì 1: http://tech.fpt.com.vn/cong-nghe-trong-du-an/nghien-cuu-va-xu-ly-tieng-noi-ki-i-mot-so-khai-niem-can-ban-nd497952.html
Kì 2 : http://tech.fpt.com.vn/cong-nghe-trong-du-an/nghien-cuu-va-xu-ly-tieng-noi-ki-ii-cac-phuong-phap-tong-hop-tieng-noi-nd498233.html
Chi tiết về FPT Speech Synthesis API: http://doc.openfpt.vn/services/text2speech/documentation.html#/README