Việc theo dõi chi phí, mức sử dụng và các chỉ số khác của Gemini API là một phần quan trọng trong việc chạy ứng dụng chính thức. Bạn cần biết các mẫu sử dụng thông thường của ứng dụng và đảm bảo rằng bạn đang nằm trong các ngưỡng quan trọng đối với mình.
Theo dõi chi phí
Trong trang tổng quan Mức sử dụng và thanh toán của bảng điều khiển Firebase, bạn có thể xem chi phí của dự án để gọi Vertex AI Gemini API.
Chi phí hiển thị trên trang tổng quan không nhất thiết chỉ dành cho các lệnh gọi qua SDK ứng dụng Vertex AI in Firebase. Chi phí hiển thị được liên kết với mọi lệnh gọi đến Vertex AI Gemini API, cho dù lệnh gọi đó có sử dụng SDK ứng dụng Vertex AI in Firebase, SDK máy chủ Vertex AI, Firebase Genkit, Firebase Extensions cho Gemini API, lệnh gọi REST, Vertex AI Studio hoặc ứng dụng API khác.
Bạn cũng có thể ước tính kích thước mã thông báo và số ký tự có thể tính phí của các yêu cầu bằng cách sử dụng API Count Tokens. Tìm hiểu thêm về giới hạn mã thông báo cho mỗi mô hình và mức giá cho mỗi mô hình.
Thiết lập tính năng cảnh báo
Để tránh bị bất ngờ khi nhận hoá đơn, hãy nhớ thiết lập cảnh báo về ngân sách.
Xin lưu ý rằng cảnh báo ngân sách không phải là giới hạn ngân sách. Cảnh báo sẽ gửi cho bạn thông báo khi bạn sắp đạt đến hoặc đã vượt quá ngưỡng đã định cấu hình để bạn có thể hành động trong ứng dụng hoặc dự án của mình.
Giám sát mức sử dụng và các chỉ số khác
Bạn có thể xem các chỉ số của dự án cho từng API, chẳng hạn như mức sử dụng, trong bảng điều khiển Google Cloud.
Trong bảng điều khiển Google Cloud, hãy chuyển đến từng trang API: Vertex AI API và Vertex AI in Firebase API.
Trang API Vertex AI: Đây là cách sử dụng liên kết với mọi lệnh gọi đến Vertex AI Gemini API, cho dù đó là sử dụng SDK ứng dụng Vertex AI in Firebase, SDK máy chủ Vertex AI, Firebase Genkit, Firebase Extensions cho Gemini API, lệnh gọi REST, Vertex AI Studio, v.v.
Trang API Vertex AI in Firebase: Đây là cách sử dụng dành riêng cho các lệnh gọi đến từ SDK Vertex AI in Firebase.
Nhấp vào Quản lý.
Nhấp vào thẻ Chỉ số.
Sử dụng trình đơn thả xuống để xem các chỉ số mà bạn quan tâm, chẳng hạn như lưu lượng truy cập theo mã phản hồi, lỗi theo phương thức API, độ trễ tổng thể và độ trễ theo phương thức API.