|
इस पेज पर, सेवा देने वाले पार्टनरGemini API के हिसाब से कॉन्टेंट और कोड देखने के लिए, उसके नाम पर क्लिक करें. |
रेट लिमिट (आम तौर पर इन्हें कोटा कहा जाता है) से यह तय होता है कि तय समय में, Gemini API को कितने अनुरोध भेजे जा सकते हैं. इन सीमाओं से, सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस बनाए रखने में मदद मिलती है. साथ ही, यह पक्का किया जाता है कि सभी लोग इस सुविधा का सही तरीके से इस्तेमाल करें और इसका गलत इस्तेमाल न हो.
Firebase AI Logic का इस्तेमाल करके Gemini और Imagen मॉडल को अनुरोध भेजने पर, आपके प्रोजेक्ट की रेट लिमिट, चुने गए "Gemini API" के सेवा देने वाले पार्टनर पर निर्भर करती हैं. Firebase AI Logic "हर उपयोगकर्ता" के लिए रेट लिमिट सेट करने का तरीका भी उपलब्ध कराता है .
के लिए रेट लिमिट देखना Gemini Developer API
अगर आपने कोटा से ज़्यादा अनुरोध किए हैं या आपके ऐक्सेस किए जा रहे मॉडल की क्षमता खत्म हो गई है, तो आपको 429 गड़बड़ी का मैसेज मिलेगा.
रेट लिमिट (कोटा) कैसे काम करती हैं
रेट लिमिट (कोटा) को चार डाइमेंशन के हिसाब से मापा जाता है:
- हर मिनट में अनुरोध (आरपीएम)
- हर दिन मिलने वाले अनुरोध (आरपीडी)
- हर मिनट में टोकन (टीपीएम)
- हर दिन मिलने वाले टोकन (टीपीडी)
आपके इस्तेमाल का आकलन, हर लिमिट के हिसाब से किया जाता है. इनमें से किसी भी लिमिट को पार करने पर, कोटा खत्म होने की 429 गड़बड़ी दिखेगी. उदाहरण के लिए, अगर आपकी आरपीएम लिमिट 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी दिखेगी. भले ही, आपने टीपीएम या अन्य लिमिट को पार न किया हो.
रेट लिमिट, प्रोजेक्ट लेवल पर लागू होती हैं. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
इस्तेमाल किए जा रहे मॉडल के हिसाब से, लिमिट अलग-अलग होती हैं. साथ ही, कुछ लिमिट सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, हर मिनट में इमेज (आईपीएम) की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen) के लिए की जाती है. हालांकि, यह टीपीएम के जैसा ही है.
एक्सपेरिमेंट के तौर पर उपलब्ध और प्रीव्यू मॉडल के लिए, रेट लिमिट ज़्यादा पाबंदियों वाली होती हैं.
रेट लिमिट बढ़ाने का अनुरोध करना
अगर आपके पास Gemini Developer API के लिए "पैसे चुकाकर इस्तेमाल करने का प्लान" है, तो आप रेट लिमिट बढ़ाने का अनुरोध कर सकते हैं.
"हर उपयोगकर्ता" के लिए रेट लिमिट सेट करना
Firebase AI Logic का इस्तेमाल करने के लिए, आपके प्रोजेक्ट में चुने गए Gemini API सेवा देने वाले पार्टनर की सुविधा चालू होनी चाहिए. हालांकि, आपको Firebase AI Logic API की सुविधा भी चालू करनी होगी. यह API, हमारे क्लाइंट एसडीके और Gemini API सेवा देने वाले पार्टनर के बीच गेटवे के तौर पर काम करता है. जब आप अपने Firebase प्रोजेक्ट में पहली बार Firebase AI Logic सेट अप करते हैं, तब यह एपीआई आपके लिए चालू हो जाता है.
आपके पास Firebase AI Logic API की रेट लिमिट (कोटा) को अपने ऐप्लिकेशन के लिए "हर उपयोगकर्ता" के हिसाब से रेट लिमिट के तौर पर इस्तेमाल करने का विकल्प होता है. खास तौर पर, एआई की उन सुविधाओं के लिए जो Firebase AI Logic पर निर्भर करती हैं. आपको यह लिमिट इस तरह सेट करनी चाहिए कि एआई की सुविधाओं को ऐक्सेस करने वाले किसी एक उपयोगकर्ता के लिए, यह लिमिट सही हो. साथ ही, यह भी पक्का करें कि कोई एक उपयोगकर्ता, Gemini API के सेवा देने वाले पार्टनर की लिमिट को पार न करे. ऐसा इसलिए, क्योंकि यह लिमिट आपके सभी उपयोगकर्ताओं के लिए शेयर की जाती है.
"हर उपयोगकर्ता" के लिए रेट लिमिट के बारे में जानकारी
Firebase AI Logic API रेट लिमिट (कोटा) के बारे में कुछ अहम जानकारी यहां दी गई है. खास तौर पर, हर मिनट में अनुरोध (आरपीएम):
यह "कॉन्टेंट जनरेट करने के अनुरोध" पर आधारित है. इसे हर उपयोगकर्ता, हर इलाके, और हर मिनट के हिसाब से तय किया जाता है. यह मॉडल के आधार पर तय नहीं किया जाता.
यह रेट लिमिट, आपके सभी उपयोगकर्ताओं पर लागू होती है. फ़िलहाल, किसी खास उपयोगकर्ता या उपयोगकर्ताओं के किसी खास ग्रुप के लिए, रेट लिमिट सेट करने का कोई तरीका नहीं है सेट करने का कोई तरीका नहीं है उपयोगकर्ताओं के किसी खास ग्रुप के लिए*.
यह प्रोजेक्ट लेवल पर लागू होती है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
यह किसी भी Firebase AI Logic एसडीके से आने वाले हर कॉल पर लागू होती है.
डिफ़ॉल्ट रेट लिमिट, हर उपयोगकर्ता के लिए 100 आरपीएम है.
ध्यान दें कि आपको Gemini API के सेवा देने वाले पार्टनर की लिमिट (ऊपर देखें) को भी ध्यान में रखना होगा. यह लिमिट, Firebase AI Logic API की लिमिट से ज़्यादा प्राथमिकता वाली होती है.
* अगर Vertex AI Gemini API का इस्तेमाल किया जा रहा है और आपका ऐप्लिकेशन, उपयोगकर्ताओं को अलग-अलग इलाकों में ले जाता है (उदाहरण के लिए, Firebase Remote Config का इस्तेमाल करके), तो आपके पास किसी खास इलाके के उपयोगकर्ताओं के लिए, रेट लिमिट सेट करने का विकल्प होता है.
"हर उपयोगकर्ता" के लिए रेट लिमिट को अडजस्ट करना
अनुरोध संख्या सीमित करना (कोटा) को अडजस्ट करने के लिए, आपके पास serviceusage.quotas.update अनुमति होनी चाहिए. यह अनुमति, डिफ़ॉल्ट रूप से मालिक और संपादक की भूमिका में शामिल होती है.
रेट लिमिट (कोटा) में बदलाव करने या इसे बढ़ाने का अनुरोध करने का तरीका यहां बताया गया है:
Google Cloud Console में, Firebase AI Logic API के पेज पर जाएं.
प्रबंधित करें पर क्लिक करें.
पेज पर नीचे की ओर, कोटा और सिस्टम की लिमिट टैब पर क्लिक करें.
टेबल को फ़िल्टर करके, अपनी ज़रूरत के हिसाब से कोटा दिखाएं. जैसे, क्षमता (कॉन्टेंट जनरेट करने के अनुरोध) और इलाका.
उदाहरण के लिए, एशिया के किसी भी ऐसे इलाके में, जहां यह सुविधा उपलब्ध है, कॉन्टेंट जनरेट करने के अनुरोधों के लिए, हर उपयोगकर्ता के हिसाब से कोटा देखने के लिए, आपका फ़िल्टर इस तरह दिखेगा: यह:
Generate content requests+Dimension:region:asiaअपनी ज़रूरत के हिसाब से हर कोटा के बाईं ओर मौजूद चेकबॉक्स को चुनें.
कोटा की लाइन के आखिर में, , ज़्यादा पर क्लिक करें. इसके बाद, कोटा में बदलाव करें को चुनें.
कोटा में बदलाव फ़ॉर्म में, यह काम करें:
नई वैल्यू फ़ील्ड में, बढ़ाया गया कोटा डालें.
यह कोटा, प्रोजेक्ट लेवल पर लागू होता है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों के लिए शेयर किया जाता है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
फ़ॉर्म में अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.
अनुरोध भेजें पर क्लिक करें.