The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

दर की सीमाएं और कोटा

इस पेज पर, सेवा देने वाली कंपनी के हिसाब से कॉन्टेंट और कोड देखने के लिए, Gemini API सेवा देने वाली कंपनी पर क्लिक करें.

दर सीमाएं (जिन्हें आम तौर पर कोटा कहा जाता है) यह तय करती हैं कि किसी तय समयसीमा में, Gemini API से कितने अनुरोध किए जा सकते हैं. इन सीमाओं से यह पक्का करने में मदद मिलती है कि सभी लोग, Gemini का सही तरीके से इस्तेमाल करें. साथ ही, इससे Gemini के गलत इस्तेमाल को रोकने और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.

Gemini और Imagen मॉडल को अनुरोध भेजने के लिए Firebase AI Logic का इस्तेमाल करते समय, आपके प्रोजेक्ट के लिए तय की गई दर की सीमाएं, "Gemini API" सेवा देने वाली कंपनी पर निर्भर करती हैं. Firebase AI Logic, "हर उपयोगकर्ता के हिसाब से" दर की सीमाएं सेट करने का तरीका भी उपलब्ध कराता है.

Gemini Developer API के लिए दर की सीमाएं देखना

दस्तावेज़ में बताई गई दर की सीमाएं (जैसे, हर मिनट में किए जा सकने वाले अनुरोध (आरपीएम)), Gemini Developer API के लिए ज़्यादा से ज़्यादा सीमाएं हैं.

आपके Firebase प्रोजेक्ट के लिए उपलब्ध असल ज़्यादा से ज़्यादा कोटा और इस्तेमाल किया जा रहा मॉडल कई बातों पर निर्भर करता है. जैसे, लिंक किए गए Cloud Billing खाते की स्थिति और पूरे सिस्टम की क्षमता.

अगर आपने अपने कोटे से ज़्यादा अनुरोध किए हैं या जिस मॉडल को ऐक्सेस किया जा रहा है उसकी क्षमता खत्म हो गई है, तो आपको 429 गड़बड़ी का मैसेज दिखेगा.

दर की सीमाएं (कोटा) कैसे काम करती हैं

दर की सीमाओं (कोटा) को चार डाइमेंशन के हिसाब से मेज़र किया जाता है:

हर मिनट के हिसाब से अनुरोध (आरपीएम)
हर दिन के अनुरोध (आरपीडी)
टोकन प्रति मिनट (टीपीएम)
हर दिन के टोकन (टीपीडी)

आपके इस्तेमाल की तुलना हर सीमा से की जाती है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, कोटा खत्म होने की वजह से 429 गड़बड़ी ट्रिगर हो जाएगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.

दर की सीमाएं, प्रोजेक्ट-लेवल पर लागू होती हैं. साथ ही, ये उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

इस्तेमाल की सीमाएं, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ चुनिंदा मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट (आईपीएम) की गिनती सिर्फ़ उन मॉडल के लिए की जाती है जो इमेज जनरेट कर सकते हैं (Imagen). हालांकि, यह टीपीएम के जैसा ही होता है.

एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.

अनुरोधों की संख्या बढ़ाने का अनुरोध करना

अगर आपने Gemini Developer API के लिए "पैसे चुकाकर ली जाने वाली सदस्यता" ली है, तो दर सीमा बढ़ाने का अनुरोध किया जा सकता है.

"हर उपयोगकर्ता के हिसाब से" दर की सीमाएं सेट करना

Firebase AI Logic का इस्तेमाल करने के लिए, आपके प्रोजेक्ट में Gemini API की सेवा देने वाली कंपनी की सुविधा चालू होनी चाहिए. हालांकि, आपको Firebase AI Logic API भी चालू करना होगा. यह हमारे क्लाइंट एसडीके और Gemini API की सेवा देने वाली कंपनी के बीच गेटवे के तौर पर काम करता है. जब Firebase प्रोजेक्ट में पहली बार Firebase AI Logic सेट अप किया जाता है, तब यह एपीआई आपके लिए चालू हो जाता है.

अपने ऐप्लिकेशन के लिए, Firebase AI Logic एपीआई के इस्तेमाल की दर (कोटा) को "हर उपयोगकर्ता" के हिसाब से तय किया जा सकता है. खास तौर पर, उन एआई सुविधाओं के लिए जो Firebase AI Logic पर निर्भर करती हैं. आपको यह सीमा सेट करनी चाहिए, ताकि कोई एक उपयोगकर्ता आपकी एआई सुविधाओं का आसानी से इस्तेमाल कर सके. साथ ही, यह भी पक्का किया जा सके कि कोई एक उपयोगकर्ता, Gemini API सेवा देने वाली कंपनी की तय की गई सीमाओं का उल्लंघन न करे. यह सीमा, आपके सभी उपयोगकर्ताओं के लिए तय की जाती है.

ज़रूरतों को पूरा कर सके.

"हर उपयोगकर्ता के हिसाब से" दर सीमा के बारे में जानकारी

Firebase AI Logic एपीआई के लिए, अनुरोधों की संख्या से जुड़ी सीमाएं (कोटा) -- खास तौर पर, हर मिनट किए जाने वाले अनुरोधों (आरपीएम) के बारे में यहां कुछ अहम जानकारी दी गई है:

यह "कॉन्टेंट जनरेट करने के अनुरोध" पर आधारित है. यह हर उपयोगकर्ता, हर इलाके, और हर मिनट के हिसाब से तय होता है. यह मॉडल पर आधारित नहीं होता.
यह दर सीमा, आपके सभी उपयोगकर्ताओं पर लागू होती है. फ़िलहाल, किसी उपयोगकर्ता या उपयोगकर्ताओं के किसी ग्रुप के लिए, दर सीमा सेट करने का कोई तरीका नहीं है^*.
यह प्रोजेक्ट-लेवल पर लागू होती है. साथ ही, उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
यह उस कॉल पर लागू होता है जो खास तौर पर किसी Firebase AI Logic SDK से आता है.
डिफ़ॉल्ट रूप से, हर उपयोगकर्ता के लिए अनुरोधों की दर की सीमा 100 आरपीएम होती है.
ध्यान दें कि आपको अब भी Gemini API सेवा देने वाली कंपनी की तय की गई सीमाएं (ऊपर देखें) ध्यान में रखनी होंगी. ये सीमाएं, Firebase AI Logic एपीआई की सीमाओं से ज़्यादा अहम होती हैं.

^{* अगर Vertex AI Gemini API का इस्तेमाल किया जा रहा है और आपका ऐप्लिकेशन लोगों को अलग-अलग देशों/इलाकों में रीडायरेक्ट करता है (उदाहरण के लिए, Firebase Remote Config का इस्तेमाल करके), तो किसी देश/इलाके के लोगों के लिए, अनुरोधों की संख्या की सीमा तय की जा सकती है.}

"हर उपयोगकर्ता के लिए" तय की गई दर की सीमा में बदलाव करना

दर सीमा (कोटा) में बदलाव करने के लिए, आपके पास serviceusage.quotas.update अनुमति होनी चाहिए. यह अनुमति, मालिक और एडिटर की भूमिका में डिफ़ॉल्ट रूप से शामिल होती है.

यहां, दर सीमा (कोटा) में बदलाव करने या इसे बढ़ाने का अनुरोध करने का तरीका बताया गया है:

Google Cloud कंसोल में, Firebase AI Logic एपीआई के पेज पर जाएं.
प्रबंधित करें पर क्लिक करें.
पेज पर नीचे की ओर, कोटा और सिस्टम की सीमाएं टैब पर क्लिक करें.
टेबल को फ़िल्टर करके, अपनी दिलचस्पी के कोटे दिखाएं. जैसे, क्षमता (कॉन्टेंट जनरेट करने के अनुरोध) और क्षेत्र.

उदाहरण के लिए, अगर आपको एशिया के किसी भी ऐसे देश/इलाके में कॉन्टेंट जनरेट करने के अनुरोधों के लिए, हर उपयोगकर्ता के हिसाब से तय किए गए कोटे देखने हैं जहां Gemini Pro उपलब्ध है, तो आपका फ़िल्टर कुछ इस तरह दिखेगा: Generate content requests + Dimension:region:asia

ध्यान दें: Dimension फ़िल्टर बनाने के लिए, आपको फ़िल्टर टूलिंग का इस्तेमाल करना होगा. इसके लिए, ऊपर दिए गए उदाहरण में वैल्यू को सिर्फ़ कॉपी करके चिपकाने से काम नहीं चलेगा. साथ ही, (default) कोटा वाली लाइन, Firebase AI Logic पर लागू नहीं होती.
जिस कोटे के बारे में आपको जानना है उसके बाईं ओर मौजूद चेकबॉक्स को चुनें.
कोटे की लाइन के आखिर में, पर क्लिक करें. इसके बाद, कोटा में बदलाव करें को चुनें.
कोटा में बदलाव वाले फ़ॉर्म में, यह तरीका अपनाएं:
1. नई वैल्यू फ़ील्ड में, बढ़ा हुआ कोटा डालें.
  
  यह कोटा, प्रोजेक्ट-लेवल पर लागू होता है. साथ ही, उस Firebase प्रोजेक्ट का इस्तेमाल करने वाले सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किया जाता है.
2. फ़ॉर्म में मौजूद अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.
3. अनुरोध भेजें पर क्लिक करें.