Gemini API की लागत, इस्तेमाल, और अन्य मेट्रिक की निगरानी करना, प्रोडक्शन ऐप्लिकेशन को चलाने का एक अहम हिस्सा है. यह जानना ज़रूरी है कि आपके ऐप्लिकेशन को इस्तेमाल करने के सामान्य पैटर्न क्या हैं. साथ ही, यह भी पक्का करना ज़रूरी है कि आपने ऐप्लिकेशन के इस्तेमाल के लिए ज़रूरी थ्रेशोल्ड को पूरा किया हो.
लागत पर नज़र रखें
Firebase कंसोल के इस्तेमाल और बिलिंग डैशबोर्ड में, Vertex AI Gemini API को कॉल करने पर अपने प्रोजेक्ट की लागत देखी जा सकती है.
डैशबोर्ड पर दिखाई गई लागत, Vertex AI in Firebase क्लाइंट एसडीके के ज़रिए किए गए कॉल के लिए ज़रूरी नहीं है. दिखाई गई कीमतें, Vertex AI Gemini API के किसी भी कॉल से जुड़ी होती हैं. भले ही, वह Vertex AI in Firebase क्लाइंट SDK टूल, Vertex AI सर्वर SDK टूल, Firebase Genkit, Gemini API के लिए Firebase Extensions, REST कॉल, Vertex AI Studio या अन्य एपीआई क्लाइंट का इस्तेमाल कर रहा हो.
Count Tokens API का इस्तेमाल करके, अपने अनुरोधों के टोकन साइज़ और बिलिंग के लिए ज़रूरी वर्णों का अनुमान भी लगाया जा सकता है. हर मॉडल के लिए टोकन की सीमाओं और हर मॉडल के लिए कीमत के बारे में ज़्यादा जानें.
सूचनाएं पाने की सुविधा सेट अप करना
अचानक होने वाले बिल से बचने के लिए, बजट अलर्ट सेट अप ज़रूर करें.
ध्यान दें कि बजट खत्म होने की चेतावनियां, बजट के कैप नहीं हैं. जब आप अपने कॉन्फ़िगर किए गए थ्रेशोल्ड के करीब पहुंच जाएंगे या उसे पार कर लेंगे, तो आपको एक चेतावनी मिलेगी. इससे आपको अपने ऐप्लिकेशन या प्रोजेक्ट पर कार्रवाई करने के लिए, सूचना मिलेगी.
इस्तेमाल और अन्य मेट्रिक पर नज़र रखना
Google Cloud कंसोल में, हर एपीआई के लिए अपने प्रोजेक्ट की मेट्रिक देखी जा सकती हैं. जैसे, एपीआई के इस्तेमाल की जानकारी.
Google Cloud console में, हर एपीआई पेज पर जाएं: Vertex AI एपीआई और Vertex AI in Firebase एपीआई.
Vertex AI एपीआई पेज: यह Vertex AI Gemini API को किए गए किसी भी कॉल से जुड़ा इस्तेमाल है. भले ही, वह कॉल Vertex AI in Firebase क्लाइंट SDK टूल, Vertex AI सर्वर SDK टूल, Firebase Genkit, Gemini API के लिए Firebase Extensions, REST कॉल, Vertex AI Studio वगैरह का इस्तेमाल करता हो.
Vertex AI in Firebase एपीआई पेज: यह खास तौर पर, Vertex AI in Firebase SDK टूल से आने वाले कॉल के लिए इस्तेमाल किया जाता है.
प्रबंधित करें पर क्लिक करें.
मेट्रिक टैब पर क्लिक करें.
अपनी पसंद की मेट्रिक देखने के लिए, ड्रॉप-डाउन मेन्यू का इस्तेमाल करें. जैसे, रिस्पॉन्स कोड के हिसाब से ट्रैफ़िक, एपीआई के तरीके से होने वाली गड़बड़ियां, इंतज़ार का कुल समय, और एपीआई तरीके से इंतज़ार का समय.