FPT.AI Speech - Chuyển giọng nói thành văn bản

Giới thiệu

Tiếng nói là công cụ giao tiếp phổ thông và cũng là đối tượng để nghiên cứu trong nhiều ngành khoa học khác nhau. Tiếng nói con người là vô tận. Cùng một người, một hoàn cảnh phát âm và cùng một từ, tại hai thời điểm phát âm khác nhau, sẽ cho ra hai mẫu khác nhau. Do phạm vi rộng của tiếng nói, nên FSR (FPT.AI Speech Recognition) hay còn gọi là FPT.AI Speech - Speech to Text tập trung vào nhận dạng các câu cơ bản để điều khiển các thiết bị trong gia dụng. Nhằm đạt mục tiêu nhận dạng âm thanh có độ chính xác cao.

Ứng dụng

Dùng cho các ứng dụng điều khiển IoT, hay các phần mêm ra lệnh bằng giọng nói.

Documentation

Tổng quan

FPT.AI Speech - Chuyển giọng nói thành văn bản

Giới thiệu

Ứng dụng