Trang này mô tả nhiều giới hạn và quy cách khi sử dụng Live API và các mô hình của Live API.
Giới hạn liên quan đến phiên
Đối với Live API, phiên đề cập đến một kết nối liên tục, trong đó đầu vào và đầu ra được truyền trực tuyến liên tục qua một kết nối.
Nếu phiên vượt quá bất kỳ giới hạn nào sau đây, thì kết nối sẽ bị chấm dứt. Tuy nhiên, hãy lưu ý rằng Live API cung cấp một số lựa chọn (xem bên dưới) để xử lý các giới hạn liên quan đến phiên này.
Cửa sổ ngữ cảnh của phiên bị giới hạn ở 128.000 token.
Do giới hạn về cửa sổ ngữ cảnh này, sau đây là độ dài tối đa gần đúng của phiên dựa trên phương thức nhập:
- Các phiên nhập chỉ bằng âm thanh được giới hạn trong
15 phút . - Đầu vào video và âm thanh bị giới hạn ở
2 phút .
- Các phiên nhập chỉ bằng âm thanh được giới hạn trong
Thời lượng kết nối bị giới hạn trong khoảng
10 phút .Bạn sẽ nhận được thông báo sắp kết thúc khoảng
60 giây trước khi kết nối kết thúc.
Sau đây là một số lựa chọn để xử lý các giới hạn liên quan đến phiên:
Nén cửa sổ ngữ cảnh của phiên để máy chủ tự động duy trì kích thước ngữ cảnh trong giới hạn.
Tiếp tục một phiên để tránh mất ngữ cảnh trò chuyện trong trường hợp mạng bị ngắt kết nối tạm thời hoặc sau khi nhận được thông báo sắp rời khỏi.
Tìm hiểu thêm về cách quản lý phiên.
Giới hạn về tốc độ
Live API có giới hạn về tốc độ cho cả số phiên đồng thời trên mỗi dự án Firebase cũng như số mã thông báo mỗi phút (TPM).
Gemini Developer API:
- Hạn mức sẽ khác nhau tuỳ theo Gemini Developer API"cấp sử dụng" của dự án (xem tài liệu về hạn mức sử dụng)
Vertex AI Gemini API:
- 1.000 phiên đồng thời cho mỗi dự án Firebase
- 4 triệu mã thông báo mỗi phút
Định dạng âm thanh
Công cụ Live API hỗ trợ các định dạng âm thanh sau:
- Định dạng âm thanh đầu vào: Âm thanh PCM 16 bit thô ở chế độ little-endian 16 kHz
Định dạng âm thanh đầu ra: Âm thanh PCM 16 bit thô ở chế độ little-endian 24 kHz
Các loại MIME được hỗ trợ:
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
Để truyền tải tốc độ lấy mẫu của âm thanh đầu vào, hãy đặt loại MIME của mỗi Blob chứa âm thanh thành một giá trị như audio/pcm;rate=16000.
Định dạng video
Live API dự kiến sẽ có một chuỗi khung hình rời rạc và hỗ trợ đầu vào khung hình video ở tốc độ 1 khung hình/giây (FPS).
Đầu vào đề xuất: độ phân giải gốc 768x768 ở tốc độ 1 khung hình/giây.
Các loại MIME được hỗ trợ:
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
Xin lưu ý rằng quy cách này khiến Live API không phù hợp với những trường hợp sử dụng yêu cầu phân tích video thay đổi nhanh, chẳng hạn như từng pha trong các môn thể thao tốc độ cao.
Giọng phản hồi
Live API hỗ trợ các lựa chọn giọng nói phản hồi sau đây. Để xem bản minh hoạ về âm thanh của từng giọng nói, hãy xem Chirp 3: Giọng nói chất lượng cao.
Nếu bạn không chỉ định giọng nói phản hồi, thì giọng nói mặc định sẽ là Puck.
Tìm hiểu cách chỉ định giọng nói phản hồi.
Zephyr -- Tươi sángKore -- Chắc chắnOrus -- Chắc chắnAutonoe -- Tươi sángUmbriel -- Dễ chịuErinome -- Rõ ràngLaomedeia -- Vui vẻSchedar -- Bình tĩnhAchird -- Thân thiệnSadachbia -- Sôi nổi
|
Puck – Vui vẻFenrir – Hào hứngAoede – Thoải máiEnceladus – Nhẹ nhàngAlgieba – Êm áiAlgenib – Khàn khànAchernar – Dịu êmGacrux – Trưởng thànhZubenelgenubi – Bình dịSadaltager – Hiểu biết
|
Charon -- Nhiều thông tinLeda -- Trẻ trungCallirrhoe -- Dễ gầnIapetus -- Rõ ràngDespina -- Êm áiRasalgethi -- Nhiều thông tinAlnilam -- Chắc chắnPulcherrima -- Tiến bộVindemiatrix -- Nhẹ nhàngSulafat -- Ấm áp
|
Ngôn ngữ
Live API hỗ trợ các ngôn ngữ sau. Tìm hiểu cách tác động đến ngôn ngữ phản hồi.
| Ngôn ngữ | Mã BCP-47 | Ngôn ngữ | Mã BCP-47 |
|---|---|---|---|
| Tiếng Ả Rập (Ai Cập) | ar-EG | Tiếng Đức (Đức) | de-DE |
| Tiếng Anh (Mỹ) | en-US | Tiếng Tây Ban Nha (Mỹ) | es-US |
| Tiếng Pháp (Pháp) | fr-FR | Tiếng Hindi (Ấn Độ) | hi-IN |
| Tiếng Indonesia (Indonesia) | id-ID | Tiếng Ý (Ý) | it-IT |
| Tiếng Nhật (Nhật Bản) | ja-JP | Tiếng Hàn (Hàn Quốc) | ko-KR |
| Tiếng Bồ Đào Nha (Brazil) | pt-BR | Tiếng Nga (Nga) | ru-RU |
| Tiếng Hà Lan (Hà Lan) | nl-NL | Tiếng Ba Lan (Ba Lan) | pl-PL |
| Tiếng Thái (Thái Lan) | th-TH | Tiếng Thổ Nhĩ Kỳ (Thổ Nhĩ Kỳ) | tr-TR |
| Tiếng Việt (Việt Nam) | vi-VN | Tiếng Rumani (Rumani) | ro-RO |
| Tiếng Ukraina (Ukraina) | uk-UA | Tiếng Bengali (Bangladesh) | bn-BD |
| Tiếng Anh (Ấn Độ) | Gói en-IN và hi-IN | Tiếng Marathi (Ấn Độ) | mr-IN |
| Tiếng Tamil (Ấn Độ) | ta-IN | Tiếng Telugu (Ấn Độ) | te-IN |