The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models were shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

दर की सीमाएं और कोटा

इस पेज पर, सेवा देने वाले पार्टनरGemini API के हिसाब से कॉन्टेंट और कोड देखने के लिए, उसके नाम पर क्लिक करें.

रेट लिमिट (आम तौर पर इन्हें कोटा कहा जाता है) से यह तय होता है कि तय समय में, Gemini API को कितने अनुरोध भेजे जा सकते हैं. इन सीमाओं से, सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस बनाए रखने में मदद मिलती है. साथ ही, यह पक्का किया जाता है कि सभी लोग इस सुविधा का सही तरीके से इस्तेमाल करें और इसका गलत इस्तेमाल न हो.

Firebase AI Logic का इस्तेमाल करके Gemini और Imagen मॉडल को अनुरोध भेजने पर, आपके प्रोजेक्ट की रेट लिमिट, चुने गए "Gemini API" के सेवा देने वाले पार्टनर पर निर्भर करती हैं. Firebase AI Logic "हर उपयोगकर्ता" के लिए रेट लिमिट सेट करने का तरीका भी उपलब्ध कराता है .

के लिए रेट लिमिट देखना Gemini Developer API

दस्तावेज़ में दी गई रेट लिमिट (जैसे, हर मिनट में अनुरोध (आरपीएम)), ज़्यादा से ज़्यादा सीमाएं हैं जिन्हें Gemini Developer API सपोर्ट करता है.

आपके Firebase प्रोजेक्ट के लिए उपलब्धज़्यादा से ज़्यादा कोटा और आपके इस्तेमाल किए जा रहे मॉडल कई चीज़ों पर निर्भर करते हैं. जैसे, लिंक किए गए Cloud Billing खाते की स्थिति और पूरे सिस्टम की क्षमता.

अगर आपने कोटा से ज़्यादा अनुरोध किए हैं या आपके ऐक्सेस किए जा रहे मॉडल की क्षमता खत्म हो गई है, तो आपको 429 गड़बड़ी का मैसेज मिलेगा.

रेट लिमिट (कोटा) कैसे काम करती हैं

रेट लिमिट (कोटा) को चार डाइमेंशन के हिसाब से मापा जाता है:

हर मिनट में अनुरोध (आरपीएम)
हर दिन मिलने वाले अनुरोध (आरपीडी)
हर मिनट में टोकन (टीपीएम)
हर दिन मिलने वाले टोकन (टीपीडी)

आपके इस्तेमाल का आकलन, हर लिमिट के हिसाब से किया जाता है. इनमें से किसी भी लिमिट को पार करने पर, कोटा खत्म होने की 429 गड़बड़ी दिखेगी. उदाहरण के लिए, अगर आपकी आरपीएम लिमिट 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी दिखेगी. भले ही, आपने टीपीएम या अन्य लिमिट को पार न किया हो.

रेट लिमिट, प्रोजेक्ट लेवल पर लागू होती हैं. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

इस्तेमाल किए जा रहे मॉडल के हिसाब से, लिमिट अलग-अलग होती हैं. साथ ही, कुछ लिमिट सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, हर मिनट में इमेज (आईपीएम) की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen) के लिए की जाती है. हालांकि, यह टीपीएम के जैसा ही है.

एक्सपेरिमेंट के तौर पर उपलब्ध और प्रीव्यू मॉडल के लिए, रेट लिमिट ज़्यादा पाबंदियों वाली होती हैं.

रेट लिमिट बढ़ाने का अनुरोध करना

अगर आपके पास Gemini Developer API के लिए "पैसे चुकाकर इस्तेमाल करने का प्लान" है, तो आप रेट लिमिट बढ़ाने का अनुरोध कर सकते हैं.

"हर उपयोगकर्ता" के लिए रेट लिमिट सेट करना

Firebase AI Logic का इस्तेमाल करने के लिए, आपके प्रोजेक्ट में चुने गए Gemini API सेवा देने वाले पार्टनर की सुविधा चालू होनी चाहिए. हालांकि, आपको Firebase AI Logic API की सुविधा भी चालू करनी होगी. यह API, हमारे क्लाइंट एसडीके और Gemini API सेवा देने वाले पार्टनर के बीच गेटवे के तौर पर काम करता है. जब आप अपने Firebase प्रोजेक्ट में पहली बार Firebase AI Logic सेट अप करते हैं, तब यह एपीआई आपके लिए चालू हो जाता है.

आपके पास Firebase AI Logic API की रेट लिमिट (कोटा) को अपने ऐप्लिकेशन के लिए "हर उपयोगकर्ता" के हिसाब से रेट लिमिट के तौर पर इस्तेमाल करने का विकल्प होता है. खास तौर पर, एआई की उन सुविधाओं के लिए जो Firebase AI Logic पर निर्भर करती हैं. आपको यह लिमिट इस तरह सेट करनी चाहिए कि एआई की सुविधाओं को ऐक्सेस करने वाले किसी एक उपयोगकर्ता के लिए, यह लिमिट सही हो. साथ ही, यह भी पक्का करें कि कोई एक उपयोगकर्ता, Gemini API के सेवा देने वाले पार्टनर की लिमिट को पार न करे. ऐसा इसलिए, क्योंकि यह लिमिट आपके सभी उपयोगकर्ताओं के लिए शेयर की जाती है.

"हर उपयोगकर्ता" के लिए रेट लिमिट के बारे में जानकारी

Firebase AI Logic API रेट लिमिट (कोटा) के बारे में कुछ अहम जानकारी यहां दी गई है. खास तौर पर, हर मिनट में अनुरोध (आरपीएम):

यह "कॉन्टेंट जनरेट करने के अनुरोध" पर आधारित है. इसे हर उपयोगकर्ता, हर इलाके, और हर मिनट के हिसाब से तय किया जाता है. यह मॉडल के आधार पर तय नहीं किया जाता.
यह रेट लिमिट, आपके सभी उपयोगकर्ताओं पर लागू होती है. फ़िलहाल, किसी खास उपयोगकर्ता या उपयोगकर्ताओं के किसी खास ग्रुप के लिए, रेट लिमिट सेट करने का कोई तरीका नहीं है सेट करने का कोई तरीका नहीं है उपयोगकर्ताओं के किसी खास ग्रुप के लिए^*.
यह प्रोजेक्ट लेवल पर लागू होती है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
यह किसी भी Firebase AI Logic एसडीके से आने वाले हर कॉल पर लागू होती है.
डिफ़ॉल्ट रेट लिमिट, हर उपयोगकर्ता के लिए 100 आरपीएम है.
ध्यान दें कि आपको Gemini API के सेवा देने वाले पार्टनर की लिमिट (ऊपर देखें) को भी ध्यान में रखना होगा. यह लिमिट, Firebase AI Logic API की लिमिट से ज़्यादा प्राथमिकता वाली होती है.

^{* अगर Vertex AI Gemini API का इस्तेमाल किया जा रहा है और आपका
ऐप्लिकेशन, उपयोगकर्ताओं को अलग-अलग इलाकों में ले जाता है (उदाहरण के लिए,
Firebase Remote Config का इस्तेमाल करके),
तो आपके पास किसी खास इलाके के उपयोगकर्ताओं के लिए, रेट लिमिट सेट करने का विकल्प होता है.}

"हर उपयोगकर्ता" के लिए रेट लिमिट को अडजस्ट करना

अनुरोध संख्या सीमित करना (कोटा) को अडजस्ट करने के लिए, आपके पास serviceusage.quotas.update अनुमति होनी चाहिए. यह अनुमति, डिफ़ॉल्ट रूप से मालिक और संपादक की भूमिका में शामिल होती है.

रेट लिमिट (कोटा) में बदलाव करने या इसे बढ़ाने का अनुरोध करने का तरीका यहां बताया गया है:

Google Cloud Console में, Firebase AI Logic API के पेज पर जाएं.
प्रबंधित करें पर क्लिक करें.
पेज पर नीचे की ओर, कोटा और सिस्टम की लिमिट टैब पर क्लिक करें.
टेबल को फ़िल्टर करके, अपनी ज़रूरत के हिसाब से कोटा दिखाएं. जैसे, क्षमता (कॉन्टेंट जनरेट करने के अनुरोध) और इलाका.

उदाहरण के लिए, एशिया के किसी भी ऐसे इलाके में, जहां यह सुविधा उपलब्ध है, कॉन्टेंट जनरेट करने के अनुरोधों के लिए, हर उपयोगकर्ता के हिसाब से कोटा देखने के लिए, आपका फ़िल्टर इस तरह दिखेगा: यह: Generate content requests + Dimension:region:asia

ध्यान दें: Dimension फ़िल्टर बनाने के लिए, आपको फ़िल्टर टूलिंग का इस्तेमाल करना होगा, इसके लिए, ऊपर दिए गए उदाहरण में मौजूद वैल्यू को सिर्फ़ कॉपी-पेस्ट न करें. इसके अलावा, (default) कोटा वाली लाइन, Firebase AI Logic पर लागू नहीं होती.
अपनी ज़रूरत के हिसाब से हर कोटा के बाईं ओर मौजूद चेकबॉक्स को चुनें.
कोटा की लाइन के आखिर में, , ज़्यादा पर क्लिक करें. इसके बाद, कोटा में बदलाव करें को चुनें.
कोटा में बदलाव फ़ॉर्म में, यह काम करें:
1. नई वैल्यू फ़ील्ड में, बढ़ाया गया कोटा डालें.
  
  यह कोटा, प्रोजेक्ट लेवल पर लागू होता है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों के लिए शेयर किया जाता है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
2. फ़ॉर्म में अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.
3. अनुरोध भेजें पर क्लिक करें.