|
इस पेज पर, सेवा देने वाली कंपनी के हिसाब से कॉन्टेंट और कोड देखने के लिए, Gemini API सेवा देने वाली कंपनी पर क्लिक करें. |
दर सीमाएं (जिन्हें आम तौर पर कोटा कहा जाता है) यह तय करती हैं कि किसी तय समयसीमा में, Gemini API से कितने अनुरोध किए जा सकते हैं. इन सीमाओं से यह पक्का करने में मदद मिलती है कि सभी लोग, Gemini का सही तरीके से इस्तेमाल करें. साथ ही, इससे Gemini के गलत इस्तेमाल को रोकने और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.
Gemini और Imagen मॉडल को अनुरोध भेजने के लिए Firebase AI Logic का इस्तेमाल करते समय, आपके प्रोजेक्ट के लिए तय की गई दर की सीमाएं, "Gemini API" सेवा देने वाली कंपनी पर निर्भर करती हैं. Firebase AI Logic, "हर उपयोगकर्ता के हिसाब से" दर की सीमाएं सेट करने का तरीका भी उपलब्ध कराता है.
Gemini Developer API के लिए दर की सीमाएं देखना
अगर आपने अपने कोटे से ज़्यादा अनुरोध किए हैं या जिस मॉडल को ऐक्सेस किया जा रहा है उसकी क्षमता खत्म हो गई है, तो आपको 429 गड़बड़ी का मैसेज दिखेगा.
दर की सीमाएं (कोटा) कैसे काम करती हैं
दर की सीमाओं (कोटा) को चार डाइमेंशन के हिसाब से मेज़र किया जाता है:
- हर मिनट के हिसाब से अनुरोध (आरपीएम)
- हर दिन के अनुरोध (आरपीडी)
- टोकन प्रति मिनट (टीपीएम)
- हर दिन के टोकन (टीपीडी)
आपके इस्तेमाल की तुलना हर सीमा से की जाती है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, कोटा खत्म होने की वजह से 429 गड़बड़ी ट्रिगर हो जाएगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.
दर की सीमाएं, प्रोजेक्ट-लेवल पर लागू होती हैं. साथ ही, ये उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
इस्तेमाल की सीमाएं, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ चुनिंदा मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट (आईपीएम) की गिनती सिर्फ़ उन मॉडल के लिए की जाती है जो इमेज जनरेट कर सकते हैं (Imagen). हालांकि, यह टीपीएम के जैसा ही होता है.
एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.
अनुरोधों की संख्या बढ़ाने का अनुरोध करना
अगर आपने Gemini Developer API के लिए "पैसे चुकाकर ली जाने वाली सदस्यता" ली है, तो दर सीमा बढ़ाने का अनुरोध किया जा सकता है.
"हर उपयोगकर्ता के हिसाब से" दर की सीमाएं सेट करना
Firebase AI Logic का इस्तेमाल करने के लिए, आपके प्रोजेक्ट में Gemini API की सेवा देने वाली कंपनी की सुविधा चालू होनी चाहिए. हालांकि, आपको Firebase AI Logic API भी चालू करना होगा. यह हमारे क्लाइंट एसडीके और Gemini API की सेवा देने वाली कंपनी के बीच गेटवे के तौर पर काम करता है. जब Firebase प्रोजेक्ट में पहली बार Firebase AI Logic सेट अप किया जाता है, तब यह एपीआई आपके लिए चालू हो जाता है.
अपने ऐप्लिकेशन के लिए, Firebase AI Logic एपीआई के इस्तेमाल की दर (कोटा) को "हर उपयोगकर्ता" के हिसाब से तय किया जा सकता है. खास तौर पर, उन एआई सुविधाओं के लिए जो Firebase AI Logic पर निर्भर करती हैं. आपको यह सीमा सेट करनी चाहिए, ताकि कोई एक उपयोगकर्ता आपकी एआई सुविधाओं का आसानी से इस्तेमाल कर सके. साथ ही, यह भी पक्का किया जा सके कि कोई एक उपयोगकर्ता, Gemini API सेवा देने वाली कंपनी की तय की गई सीमाओं का उल्लंघन न करे. यह सीमा, आपके सभी उपयोगकर्ताओं के लिए तय की जाती है.
ज़रूरतों को पूरा कर सके."हर उपयोगकर्ता के हिसाब से" दर सीमा के बारे में जानकारी
Firebase AI Logic एपीआई के लिए, अनुरोधों की संख्या से जुड़ी सीमाएं (कोटा) -- खास तौर पर, हर मिनट किए जाने वाले अनुरोधों (आरपीएम) के बारे में यहां कुछ अहम जानकारी दी गई है:
यह "कॉन्टेंट जनरेट करने के अनुरोध" पर आधारित है. यह हर उपयोगकर्ता, हर इलाके, और हर मिनट के हिसाब से तय होता है. यह मॉडल पर आधारित नहीं होता.
यह दर सीमा, आपके सभी उपयोगकर्ताओं पर लागू होती है. फ़िलहाल, किसी उपयोगकर्ता या उपयोगकर्ताओं के किसी ग्रुप के लिए, दर सीमा सेट करने का कोई तरीका नहीं है*.
यह प्रोजेक्ट-लेवल पर लागू होती है. साथ ही, उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
यह उस कॉल पर लागू होता है जो खास तौर पर किसी Firebase AI Logic SDK से आता है.
डिफ़ॉल्ट रूप से, हर उपयोगकर्ता के लिए अनुरोधों की दर की सीमा 100 आरपीएम होती है.
ध्यान दें कि आपको अब भी Gemini API सेवा देने वाली कंपनी की तय की गई सीमाएं (ऊपर देखें) ध्यान में रखनी होंगी. ये सीमाएं, Firebase AI Logic एपीआई की सीमाओं से ज़्यादा अहम होती हैं.
* अगर Vertex AI Gemini API का इस्तेमाल किया जा रहा है और आपका ऐप्लिकेशन लोगों को अलग-अलग देशों/इलाकों में रीडायरेक्ट करता है (उदाहरण के लिए, Firebase Remote Config का इस्तेमाल करके), तो किसी देश/इलाके के लोगों के लिए, अनुरोधों की संख्या की सीमा तय की जा सकती है.
"हर उपयोगकर्ता के लिए" तय की गई दर की सीमा में बदलाव करना
दर सीमा (कोटा) में बदलाव करने के लिए, आपके पास serviceusage.quotas.update
अनुमति होनी चाहिए. यह अनुमति, मालिक और एडिटर की भूमिका में डिफ़ॉल्ट रूप से शामिल होती है.
यहां, दर सीमा (कोटा) में बदलाव करने या इसे बढ़ाने का अनुरोध करने का तरीका बताया गया है:
Google Cloud कंसोल में, Firebase AI Logic एपीआई के पेज पर जाएं.
प्रबंधित करें पर क्लिक करें.
पेज पर नीचे की ओर, कोटा और सिस्टम की सीमाएं टैब पर क्लिक करें.
टेबल को फ़िल्टर करके, अपनी दिलचस्पी के कोटे दिखाएं. जैसे, क्षमता (कॉन्टेंट जनरेट करने के अनुरोध) और क्षेत्र.
उदाहरण के लिए, अगर आपको एशिया के किसी भी ऐसे देश/इलाके में कॉन्टेंट जनरेट करने के अनुरोधों के लिए, हर उपयोगकर्ता के हिसाब से तय किए गए कोटे देखने हैं जहां Gemini Pro उपलब्ध है, तो आपका फ़िल्टर कुछ इस तरह दिखेगा:
Generate content requests+Dimension:region:asiaजिस कोटे के बारे में आपको जानना है उसके बाईं ओर मौजूद चेकबॉक्स को चुनें.
कोटे की लाइन के आखिर में, पर क्लिक करें. इसके बाद, कोटा में बदलाव करें को चुनें.
कोटा में बदलाव वाले फ़ॉर्म में, यह तरीका अपनाएं:
नई वैल्यू फ़ील्ड में, बढ़ा हुआ कोटा डालें.
यह कोटा, प्रोजेक्ट-लेवल पर लागू होता है. साथ ही, उस Firebase प्रोजेक्ट का इस्तेमाल करने वाले सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किया जाता है.
फ़ॉर्म में मौजूद अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.
अनुरोध भेजें पर क्लिक करें.