Documentation

Documentation

  • Conversation
  • Reader
  • Speech
  • Console
  • AI Agents
  • Languages iconTiếng Việt
    • English
    • Janpanese

›Tổng quan

Tổng quan

  • Chuyển văn bản thành giọng nói
  • Chuyển giọng nói thành văn bản

API

  • Chuyển văn bản thành giọng nói
  • Chuyển giọng nói thành văn bản

Hướng dẫn

  • Chuyển văn bản thành giọng nói
  • Chuyển giọng nói thành văn bản

Tổng quan

FPT.AI Speech - Chuyển giọng nói thành văn bản

Giới thiệu

Tiếng nói là công cụ giao tiếp phổ thông và cũng là đối tượng để nghiên cứu trong nhiều ngành khoa học khác nhau. Tiếng nói con người là vô tận. Cùng một người, một hoàn cảnh phát âm và cùng một từ, tại hai thời điểm phát âm khác nhau, sẽ cho ra hai mẫu khác nhau. Do phạm vi rộng của tiếng nói, nên FSR (FPT.AI Speech Recognition) hay còn gọi là FPT.AI Speech - Speech to Text tập trung vào nhận dạng các câu cơ bản để điều khiển các thiết bị trong gia dụng. Nhằm đạt mục tiêu nhận dạng âm thanh có độ chính xác cao.

Ứng dụng

Dùng cho các ứng dụng điều khiển IoT, hay các phần mêm ra lệnh bằng giọng nói.

← Chuyển văn bản thành giọng nóiChuyển văn bản thành giọng nói →
  • Giới thiệu
  • Ứng dụng
Conversation
DocumentationAPI ReferenceTutorials (Video)
Reader
DocumentationAPI ReferenceTutorials
Speech
DocumentationAPI ReferenceTutorials
Copyright © 2025 FPT Corporation