कोटा के बारे में जानना और उन्हें मैनेज करना

Vertex AI in Firebase के लिए, दो अलग-अलग एपीआई (हर एक के लिए अलग कोटा) की ज़रूरत होती है: Vertex AI एपीआई और Vertex AI in Firebase एपीआई.

इनमें से हर एपीआई के लिए एक कोटा तय होता है. इसे हर मिनट के अनुरोधों (आरपीएम) के तौर पर मेज़र किया जाता है. खास तौर पर, "कॉन्टेंट जनरेट करें" अनुरोधों (स्ट्रीमिंग और बिना स्ट्रीमिंग, दोनों के लिए) के लिए. Vertex AI एपीआई के लिए, हर मिनट इनपुट टोकन का कोटा भी तय होता है.

इस पेज पर इनके बारे में जानकारी दी गई है:

Google Cloud दस्तावेज़ में, कोटा के बारे में सामान्य जानकारी देखी जा सकती है.

हर एपीआई के लिए कोटा समझना

हर एपीआई के कोटे को थोड़ा अलग तरीके से मेज़र किया जाता है. इसका मतलब है कि उनका इस्तेमाल अलग-अलग कामों के लिए किया जा सकता है.

Vertex AI एपीआई कोटा के बारे में जानकारी

Vertex AI एपीआई कोटा, हर मॉडल के लिए हर क्षेत्र में हर मिनट के हिसाब से, "कॉन्टेंट के अनुरोध जनरेट करें" पर आधारित होते हैं.

यहां इन कोटा के बारे में कुछ अहम जानकारी दी गई है. खास तौर पर, हर मिनट के अनुरोध और हर मिनट के इनपुट टोकन:

  • ये प्रोजेक्ट-लेवल पर लागू होते हैं और उन सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किए जाते हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

  • ये Vertex AI Gemini API के किसी भी कॉल पर लागू होते हैं. भले ही, वह Vertex AI in Firebase क्लाइंट SDK टूल, Vertex AI सर्वर SDK टूल, Firebase Genkit, Gemini Firebase Extensions, REST कॉल, Vertex AI Studio या अन्य एपीआई क्लाइंट का इस्तेमाल करता हो.

  • ये सेटिंग, किसी बेस मॉडल और उस मॉडल के सभी वर्शन, आइडेंटिफ़ायर, और ट्यून किए गए वर्शन पर लागू होती हैं. यहां कुछ उदाहरण दिए गए हैं:

    • gemini-1.0-pro और gemini-1.0-pro-001 के लिए किए गए अनुरोधों को, बेस मॉडल gemini-1.0 pro के आरपीएम कोटे के लिए दो अनुरोधों के तौर पर गिना जाता है.

    • gemini-1.0-pro-001 के लिए किए गए अनुरोध और gemini-1.0-pro-001 पर आधारित ट्यून किए गए मॉडल के लिए किए गए अनुरोध को, बेस मॉडल gemini-1.0-pro के आरपीएम कोटे के लिए दो अनुरोधों के तौर पर गिना जाता है.

  • Google Cloud दस्तावेज़ में, हर मॉडल और हर इलाके के लिए डिफ़ॉल्ट कोटा देखे जा सकते हैं.

इस एपीआई के कोटे को, अपने सभी उपयोगकर्ताओं के लिए "कुल" कोटा माना जा सकता है. ये ऐसे उपयोगकर्ता होते हैं जो आपके ऐप्लिकेशन में, किसी खास मॉडल और किसी खास इलाके पर आधारित एआई की सुविधाओं का इस्तेमाल करते हैं.

ये कोटा ज़रूरत के हिसाब से होने चाहिए, ताकि किसी खास इलाके के उन असली उपयोगकर्ताओं की कुल संख्या को ध्यान में रखा जा सके जो किसी खास मॉडल पर आधारित एआई की सुविधाओं को ऐक्सेस कर सकते हैं. ये कोटा हर मिनट के हिसाब से तय किए जाते हैं. इसलिए, यह संभावना कम है कि किसी इलाके में आपके सभी उपयोगकर्ता एक ही समय पर सुविधाओं के एक ही सेट का इस्तेमाल करें और ये कोटा खत्म कर दें. हालांकि, हर ऐप्लिकेशन अलग होता है. इसलिए, इन कोटा को उसके हिसाब से अडजस्ट करें.

के लिए "इलाका" है.

Vertex AI in Firebase एपीआई कोटा के बारे में जानकारी

Vertex AI in Firebase एपीआई कोटा, हर उपयोगकर्ता के लिए हर क्षेत्र में हर मिनट के हिसाब से, "कॉन्टेंट के अनुरोध जनरेट करें" पर आधारित होता है.

इस कोटे के बारे में कुछ अहम जानकारी यहां दी गई है. खास तौर पर, हर मिनट के अनुरोधों की संख्या:

  • यह प्रोजेक्ट-लेवल पर लागू होता है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पते पर लागू होता है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

  • यह किसी भी ऐसे कॉल पर लागू होता है जो खास तौर पर किसी भी Vertex AI in Firebase SDK टूल से जाता है.

  • डिफ़ॉल्ट कोटा, हर उपयोगकर्ता के लिए 100 आरपीएम होता है.
    ध्यान दें कि आपको अब भी Vertex AI एपीआई के लिए कोटा की सीमाओं को ध्यान में रखना होगा. ऐसा खास तौर पर तब ज़रूरी है, जब ये सीमाएं 100 आरपीएम से कम हों.

Vertex AI in Firebase पर आधारित एआई की सुविधाओं के लिए, इस एपीआई के कोटे को "हर उपयोगकर्ता" के कोटे के तौर पर माना जा सकता है.

यह कोटा इतना ज़्यादा होना चाहिए कि Vertex AI in Firebase पर आधारित एआई की सुविधाओं को ऐक्सेस करने वाले एक उपयोगकर्ता के लिए, ज़रूरत के हिसाब से जगह हो. यह एपीआई, Vertex AI एपीआई के गेटवे के तौर पर काम करता है. इसलिए, Vertex AI in Firebase एपीआई कोटा का इस्तेमाल करके यह पक्का किया जा सकता है कि कोई भी उपयोगकर्ता आपके Vertex AI एपीआई कोटा को खत्म न करे. यह कोटा आपके सभी उपयोगकर्ताओं के साथ शेयर किया जाता है.

हर एपीआई के लिए कोटा देखना

Google Cloud कंसोल में, हर एपीआई के लिए कोटा देखे जा सकते हैं.

  1. Google Cloud कंसोल में, अपनी पसंद के एपीआई के पेज पर जाएं: Vertex AI एपीआई या Vertex AI in Firebase एपीआई.

  2. प्रबंधित करें पर क्लिक करें.

  3. पेज पर नीचे, कोटा और सिस्टम की सीमाएं टैब पर क्लिक करें.

  4. दिलचस्पी के कोटे दिखाने के लिए, टेबल को फ़िल्टर करें.

    ध्यान दें कि Dimension फ़िल्टर बनाने के लिए, आपको नीचे दिए गए उदाहरणों में वैल्यू को कॉपी करके चिपकाने के बजाय, फ़िल्टर टूल का इस्तेमाल करना होगा.

    • Vertex AI एपीआई के लिए: सुविधा (कॉन्टेंट जनरेट करने के अनुरोध), मॉडल का नाम, और क्षेत्र की जानकारी दें.

      उदाहरण के लिए, ईयू के किसी भी इलाके में Gemini 1.5 Flash की मदद से कॉन्टेंट के अनुरोध जनरेट करने के लिए कोटा देखने के लिए, आपका फ़िल्टर ऐसा दिखेगा:
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • Vertex AI in Firebase एपीआई के लिए: सुविधा (कॉन्टेंट जनरेट करने के अनुरोध) और क्षेत्र की जानकारी दें.

      उदाहरण के लिए, एशिया के किसी भी देश/इलाके में कॉन्टेंट के अनुरोध जनरेट करने के लिए, हर उपयोगकर्ता के कोटे की जानकारी देखने के लिए, आपका फ़िल्टर इस तरह दिखेगा:
      Generate content requests + Dimension:region:asia

      ध्यान दें कि Vertex AI in Firebase एपीआई कोटा, किसी खास मॉडल पर आधारित नहीं होते. साथ ही, (default) कोटा की लाइन, Vertex AI in Firebase पर लागू नहीं होती.

कोटा में बदलाव करना या कोटा बढ़ाने का अनुरोध करना

प्रोडक्शन में जाने से पहले या कोटा से ज़्यादा अनुरोध मिलने पर, आपको अपने कोटा में बदलाव करना पड़ सकता है या कोटा बढ़ाने का अनुरोध करना पड़ सकता है. पक्का करें कि आपने हर एपीआई के कोटे में इसी हिसाब से बदलाव किया हो. इस बारे में जानने के लिए, इस पेज पर पहले दिया गया हर एपीआई के कोटे के बारे में जानें लेख पढ़ें.

कोटे में बदलाव करने के लिए, आपके पास serviceusage.quotas.update अनुमति होनी चाहिए. यह अनुमति, मालिक और एडिटर की भूमिका में डिफ़ॉल्ट रूप से शामिल होती है.

कोटा में बदलाव करने या कोटा बढ़ाने का अनुरोध करने का तरीका यहां बताया गया है:

  1. हर एपीआई के कोटे देखने के लिए, पिछले सब-सेक्शन में दिए गए निर्देशों का पालन करें.

  2. अपनी दिलचस्पी के हर कोटे के बाईं ओर मौजूद चेकबॉक्स को चुनें.

  3. कोटा की लाइन के आखिर में, तीन बिंदु वाले मेन्यू पर क्लिक करें. इसके बाद, कोटा में बदलाव करें को चुनें.

  4. कोटा में बदलाव फ़ॉर्म में, ये काम करें:

    1. नई वैल्यू फ़ील्ड में, बढ़ाया गया कोटा डालें.

      यह कोटा प्रोजेक्ट-लेवल पर लागू होता है और इसे उस Firebase प्रोजेक्ट का इस्तेमाल करने वाले सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किया जाता है.

    2. फ़ॉर्म में अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.

    3. अनुरोध सबमिट करें पर क्लिक करें.