Tổng quan
FPT.AI Speech - Chuyển giọng nói thành văn bản
Giới thiệu
Tiếng nói là công cụ giao tiếp phổ thông và cũng là đối tượng để nghiên cứu trong nhiều ngành khoa học khác nhau. Tiếng nói con người là vô tận. Cùng một người, một hoàn cảnh phát âm và cùng một từ, tại hai thời điểm phát âm khác nhau, sẽ cho ra hai mẫu khác nhau. Do phạm vi rộng của tiếng nói, nên FSR (FPT.AI Speech Recognition) hay còn gọi là FPT.AI Speech - Speech to Text tập trung vào nhận dạng các câu cơ bản để điều khiển các thiết bị trong gia dụng. Nhằm đạt mục tiêu nhận dạng âm thanh có độ chính xác cao.
Ứng dụng
Dùng cho các ứng dụng điều khiển IoT, hay các phần mêm ra lệnh bằng giọng nói.