Trang này mô tả các hạn mức và cơ cấu giá cho Gemini API từ Vertex AI.
Hạn mức theo khu vực và mô hình
Hạn mức yêu cầu mỗi phút (RPM) áp dụng cho mô hình cơ sở và tất cả các phiên bản, mã nhận dạng và các phiên bản được điều chỉnh của mô hình đó. Sau đây là một số ví dụ:
Một yêu cầu đến
gemini-1.0-pro
và một yêu cầu đếngemini-1.0-pro-001
sẽ được tính là hai yêu cầu vào hạn mức RPM của mô hình cơ sở,gemini-1.0 pro
.Một yêu cầu đến
gemini-1.0-pro-001
và một yêu cầu đối với mô hình đã được điều chỉnh dựa trêngemini-1.0-pro-001
được tính là hai yêu cầu vào hạn mức RPM của mô hình cơ sởgemini-1.0-pro
.
Các hạn mức này áp dụng ở cấp dự án và được chia sẻ cho tất cả ứng dụng và địa chỉ IP sử dụng dự án Firebase đó. Ngoài ra, hạn mức áp dụng cho bất kỳ lệnh gọi nào đến Gemini API, cho dù lệnh gọi đó đang sử dụng Vertex AI cho Firebase SDK, SDK máy chủ (bao gồm cả thông qua Tiện ích của Gemini Firebase), lệnh gọi REST hoặc Vertex AI Studio.
Tìm hạn mức cho mỗi mô hình cho từng khu vực trong tài liệu của Google Cloud.
Yêu cầu tăng hạn mức
Nếu muốn tăng hạn mức cho Vertex AI, bạn có thể sử dụng bảng điều khiển Google Cloud để yêu cầu tăng hạn mức. Để tìm hiểu thêm về hạn mức, xem phần Làm việc với hạn mức.
Giá
Để sử dụng Gemini API của Vertex AI, bạn phải dự án Firebase của mình sử dụng Gói giá trả tiền theo mức dùng.
Tìm giá cho từng kiểu máy trong tài liệu của Google Cloud.