Gemini API का इस्तेमाल करके फ़ंक्शन कॉलिंग


जनरेटिव मॉडल, कई तरह की समस्याओं को हल करने में काफ़ी असरदार होते हैं. हालांकि, इन पर ये पाबंदियां लागू होती हैं:

  • ट्रेनिंग के बाद, इन मॉडल को फ़्रीज़ कर दिया जाता है. इससे, इन मॉडल में मौजूद जानकारी पुरानी हो जाती है.
  • वे बाहरी डेटा पर क्वेरी नहीं चला सकते या उसमें बदलाव नहीं कर सकते.

फ़ंक्शन कॉल करने से, इनमें से कुछ सीमाओं को दूर करने में मदद मिल सकती है. फ़ंक्शन कॉल करने को कभी-कभी टूल का इस्तेमाल कहा जाता है, क्योंकि इससे मॉडल को एपीआई और फ़ंक्शन जैसे बाहरी टूल का इस्तेमाल करके, अपना आखिरी जवाब जनरेट करने में मदद मिलती है.

Google Cloud दस्तावेज़ में, फ़ंक्शन कॉल करने के बारे में ज़्यादा जानें. इसमें, फ़ंक्शन कॉल करने के इस्तेमाल के उदाहरणों की मददगार सूची भी शामिल है.

फ़ंक्शन कॉल करने की सुविधा, Gemini 1.0 Pro, Gemini 1.5 Pro, और Gemini 1.5 Flash के साथ काम करती है.

इस गाइड में, इस पेज के अगले मुख्य सेक्शन में दिए गए उदाहरण की तरह ही, फ़ंक्शन कॉल सेटअप को लागू करने का तरीका बताया गया है. अपने ऐप्लिकेशन में फ़ंक्शन कॉल करने की सुविधा को सेट अप करने के लिए, यह तरीका अपनाएं:

  1. ऐसा फ़ंक्शन लिखें जो मॉडल को वह जानकारी दे सके जिसकी ज़रूरत उसे अपना फ़ाइनल रिस्पॉन्स जनरेट करने के लिए होती है. उदाहरण के लिए, फ़ंक्शन किसी बाहरी एपीआई को कॉल कर सकता है.

  2. फ़ंक्शन का एलान करें, जिसमें फ़ंक्शन और उसके पैरामीटर के बारे में बताया गया हो.

  3. मॉडल के शुरू होने के दौरान फ़ंक्शन का एलान करें, ताकि ज़रूरत पड़ने पर मॉडल को पता रहे कि वह फ़ंक्शन का इस्तेमाल कैसे कर सकता है.

  4. अपने ऐप्लिकेशन को सेट अप करें, ताकि मॉडल आपके ऐप्लिकेशन को फ़ंक्शन को कॉल करने के लिए ज़रूरी जानकारी भेज सके.

  5. फ़ंक्शन के जवाब को मॉडल को वापस भेजें, ताकि मॉडल अपना आखिरी जवाब जनरेट कर सके.

कोड लागू करने पर जाएं

फ़ंक्शन कॉल करने के उदाहरण की खास जानकारी

मॉडल को अनुरोध भेजते समय, उसे "टूल" (जैसे, फ़ंक्शन) का एक सेट भी दिया जा सकता है. इनका इस्तेमाल करके, मॉडल अपना फ़ाइनल जवाब जनरेट कर सकता है. इन फ़ंक्शन का इस्तेमाल करने और उन्हें कॉल करने ("फ़ंक्शन कॉलिंग") के लिए, मॉडल और आपके ऐप्लिकेशन को एक-दूसरे को जानकारी देनी होगी. इसलिए, फ़ंक्शन कॉलिंग का इस्तेमाल करने का सुझाया गया तरीका, मल्टी-टर्न चैट इंटरफ़ेस है.

मान लें कि आपके पास एक ऐसा ऐप्लिकेशन है जिसमें उपयोगकर्ता, इस तरह का प्रॉम्प्ट डाल सकता है: What was the weather in Boston on October 17, 2024?.

हो सकता है कि Gemini मॉडल को मौसम की यह जानकारी न हो. हालांकि, मान लें कि आपको मौसम की जानकारी देने वाली किसी बाहरी सेवा के एपीआई के बारे में पता है. फ़ंक्शन कॉलिंग का इस्तेमाल करके, Gemini मॉडल को उस एपीआई और मौसम की जानकारी का पाथवे दिया जा सकता है.

सबसे पहले, अपने ऐप्लिकेशन में एक फ़ंक्शन fetchWeather लिखें, जो इस काल्पनिक बाहरी एपीआई के साथ इंटरैक्ट करता है. इसमें यह इनपुट और आउटपुट होता है:

पैरामीटर टाइप ज़रूरी है जानकारी
इनपुट
location ऑब्जेक्ट हां उस शहर और राज्य का नाम जहां का मौसम जानना है.
यह सुविधा सिर्फ़ अमेरिका के शहरों में उपलब्ध है. यह हमेशा city और state का नेस्ट किया गया ऑब्जेक्ट होना चाहिए.
date स्ट्रिंग हां वह तारीख जिसके लिए मौसम की जानकारी फ़ेच करनी है. यह तारीख हमेशा YYYY-MM-DD फ़ॉर्मैट में होनी चाहिए.
आउटपुट
temperature पूर्णांक हां तापमान (फ़ैरनहाइट में)
chancePrecipitation स्ट्रिंग हां बारिश या बर्फ़बारी वगैरह होने की संभावना (प्रतिशत के तौर पर)
cloudConditions स्ट्रिंग हां क्लाउड की स्थिति (clear, partlyCloudy, mostlyCloudy, cloudy में से कोई एक)

मॉडल को शुरू करते समय, आपको मॉडल को बताना होता है कि यह fetchWeather फ़ंक्शन मौजूद है और ज़रूरत पड़ने पर, आने वाले अनुरोधों को प्रोसेस करने के लिए इसका इस्तेमाल कैसे किया जा सकता है. इसे "फ़ंक्शन का एलान" कहा जाता है. मॉडल, फ़ंक्शन को सीधे नहीं बुलाता. इसके बजाय, मॉडल आने वाले अनुरोध को प्रोसेस करते समय यह तय करता है कि fetchWeather फ़ंक्शन, अनुरोध का जवाब देने में उसकी मदद कर सकता है या नहीं. अगर मॉडल यह तय करता है कि फ़ंक्शन वाकई काम का हो सकता है, तो वह स्ट्रक्चर्ड डेटा जनरेट करता है. इससे आपके ऐप्लिकेशन को फ़ंक्शन को कॉल करने में मदद मिलेगी.

फिर से आने वाले अनुरोध को देखें: What was the weather in Boston on October 17, 2024?. मॉडल यह तय कर सकता है कि fetchWeather फ़ंक्शन से उसे जवाब जनरेट करने में मदद मिल सकती है. मॉडल यह देखेगा कि fetchWeather के लिए कौनसे इनपुट पैरामीटर ज़रूरी हैं. इसके बाद, वह फ़ंक्शन के लिए स्ट्रक्चर्ड इनपुट डेटा जनरेट करेगा, जो कुछ ऐसा दिखेगा:

{
  functionName: fetchWeather,
  location: {
    city: Boston,
    state: Massachusetts  // the model can infer the state from the prompt
  },
  date: 2024-10-17
}

मॉडल, इस स्ट्रक्चर्ड इनपुट डेटा को आपके ऐप्लिकेशन को भेजता है, ताकि आपका ऐप्लिकेशन fetchWeather फ़ंक्शन को कॉल कर सके. जब आपके ऐप्लिकेशन को एपीआई से मौसम की जानकारी मिलती है, तो वह जानकारी को मॉडल को भेज देता है. मौसम की इस जानकारी की मदद से, मॉडल अपनी फ़ाइनल प्रोसेसिंग पूरी कर पाता है और What was the weather in Boston on October 17, 2024? के शुरुआती अनुरोध का जवाब जनरेट कर पाता है

मॉडल, आम भाषा में ऐसा जवाब दे सकता है: On October 17, 2024, in Boston, it was 38 degrees Fahrenheit with partly cloudy skies.

डायग्राम में दिखाया गया है कि फ़ंक्शन कॉल करने में, आपके ऐप्लिकेशन के फ़ंक्शन के साथ इंटरैक्ट करने वाले मॉडल का इस्तेमाल कैसे किया जाता है 

फ़ंक्शन कॉल करने की सुविधा लागू करना

शुरू करने से पहले

अगर आपने अब तक ऐसा नहीं किया है, तो Vertex AI in Firebase SDK टूल के लिए शुरुआती गाइड को पूरा करें. पक्का करें कि आपने ये सभी काम कर लिए हैं:

  1. नया या मौजूदा Firebase प्रोजेक्ट सेट अप करें. इसमें, ब्लेज़ कीमत वाले प्लान का इस्तेमाल करना और ज़रूरी एपीआई चालू करना शामिल है.

  2. अपने ऐप्लिकेशन को Firebase से कनेक्ट करें. इसमें, अपने ऐप्लिकेशन को रजिस्टर करना और अपने ऐप्लिकेशन में Firebase कॉन्फ़िगरेशन जोड़ना शामिल है.

  3. SDK टूल जोड़ें और अपने ऐप्लिकेशन में Vertex AI सेवा और जनरेटिव मॉडल को शुरू करें.

अपने ऐप्लिकेशन को Firebase से कनेक्ट करने, SDK टूल जोड़ने, और Vertex AI सेवा और जनरेटिव मॉडल को शुरू करने के बाद, Gemini API को कॉल किया जा सकता है.

इस गाइड के बाकी चरणों में, फ़ंक्शन कॉल सेटअप को लागू करने का तरीका बताया गया है. यह तरीका, फ़ंक्शन कॉल करने के उदाहरण की खास जानकारी में बताए गए वर्कफ़्लो से मिलता-जुलता है. इसकी जानकारी पाने के लिए, इस पेज का सबसे ऊपर मौजूद सेक्शन देखें.

इस पेज पर, फ़ंक्शन को कॉल करने के इस उदाहरण के लिए पूरा कोड सैंपल बाद में देखा जा सकता है.

पहला चरण: फ़ंक्शन लिखना

मान लें कि आपके पास एक ऐसा ऐप्लिकेशन है जिसमें उपयोगकर्ता, इस तरह का प्रॉम्प्ट डाल सकता है: What was the weather in Boston on October 17, 2024?. हो सकता है कि Gemini मॉडल को मौसम की यह जानकारी न पता हो. हालांकि, मान लें कि आपको मौसम की जानकारी देने वाली किसी बाहरी सेवा का एपीआई पता है, जो यह जानकारी दे सकता है. इस गाइड में दिया गया उदाहरण, इस काल्पनिक बाहरी एपीआई पर आधारित है.

अपने ऐप्लिकेशन में वह फ़ंक्शन लिखें जो किसी बाहरी एपीआई के साथ इंटरैक्ट करेगा. साथ ही, मॉडल को वह जानकारी देगा जो उसे अपना आखिरी अनुरोध जनरेट करने के लिए ज़रूरी है. मौसम के इस उदाहरण में, यह fetchWeather फ़ंक्शन होगा जो इस काल्पनिक बाहरी एपीआई को कॉल करता है.

दूसरा चरण: फ़ंक्शन का एलान करना

फ़ंक्शन का एलान करें, जिसे बाद में मॉडल को दिया जाएगा (इस गाइड का अगला चरण).

अपने एलान में, फ़ंक्शन और उसके पैरामीटर के ब्यौरे में ज़्यादा से ज़्यादा जानकारी शामिल करें.

मॉडल, फ़ंक्शन के एलान में दी गई जानकारी का इस्तेमाल करके यह तय करता है कि कौनसा फ़ंक्शन चुनना है और फ़ंक्शन के असल कॉल के लिए पैरामीटर वैल्यू कैसे देनी है. इस पेज पर, अन्य व्यवहार और विकल्प देखें. इससे आपको यह जानने में मदद मिलेगी कि मॉडल, फ़ंक्शन में से किसका विकल्प चुन सकता है. साथ ही, यह भी जानें कि इस विकल्प को कैसे कंट्रोल किया जा सकता है.

आपके दिए गए स्कीमा के बारे में इन बातों का ध्यान रखें:

  • आपको फ़ंक्शन के एलान, स्कीमा फ़ॉर्मैट में देने होंगे. यह फ़ॉर्मैट, OpenAPI स्कीमा के साथ काम करना चाहिए. Vertex AI, OpenAPI स्कीमा के साथ सीमित तौर पर काम करता है.

    • इन एट्रिब्यूट का इस्तेमाल किया जा सकता है: type, nullable, required, format, description, properties, items, enum.

    • ये एट्रिब्यूट इस्तेमाल नहीं किए जा सकते: default, optional, maximum, oneOf.

  • डिफ़ॉल्ट रूप से, Vertex AI in Firebase SDKs के लिए सभी फ़ील्ड को ज़रूरी माना जाता है. ऐसा तब तक होता है, जब तक कि आपने उन्हें optionalProperties ऐरे में 'ज़रूरी नहीं है' के तौर पर नहीं बताया है. इन वैकल्पिक फ़ील्ड के लिए, मॉडल फ़ील्ड में अपने-आप जानकारी भर सकता है या उन्हें छोड़ सकता है. ध्यान दें कि यह Vertex AI Gemini API के लिए डिफ़ॉल्ट व्यवहार से उलट है.

फ़ंक्शन के एलान से जुड़े सबसे सही तरीकों के बारे में जानने के लिए, Google Cloud दस्तावेज़ में सबसे सही तरीके देखें. इसमें नाम और ब्यौरे से जुड़ी सलाह भी शामिल है.

फ़ंक्शन का एलान करने का तरीका यहां बताया गया है:

तीसरा चरण: मॉडल को शुरू करने के दौरान फ़ंक्शन का एलान करना

अनुरोध के साथ ज़्यादा से ज़्यादा 128 फ़ंक्शन डिक्लेरेशन दिए जा सकते हैं. इस पेज पर, अन्य व्यवहार और विकल्प देखें. इससे आपको यह जानने में मदद मिलेगी कि मॉडल, फ़ंक्शन में से किसका इस्तेमाल कर सकता है. साथ ही, यह भी जानें कि आपके पास उस विकल्प को कंट्रोल करने का विकल्प है या नहीं. इसके लिए, फ़ंक्शन कॉल करने का मोड सेट करने के लिए toolConfig का इस्तेमाल करें.

अपने इस्तेमाल के उदाहरण और ऐप्लिकेशन के हिसाब से, Gemini मॉडल और जगह चुनने का तरीका जानें.

चौथा चरण: बाहरी एपीआई को कॉल करने के लिए फ़ंक्शन को कॉल करना

अगर मॉडल यह तय करता है कि fetchWeather फ़ंक्शन से उसे आखिरी जवाब जनरेट करने में मदद मिल सकती है, तो आपके ऐप्लिकेशन को मॉडल से मिले स्ट्रक्चर्ड इनपुट डेटा का इस्तेमाल करके, उस फ़ंक्शन को असल कॉल करना होगा.

मॉडल और ऐप्लिकेशन के बीच जानकारी को बार-बार पास किया जाना चाहिए. इसलिए, फ़ंक्शन कॉल करने का सुझाया गया तरीका, मल्टी-टर्न चैट इंटरफ़ेस का इस्तेमाल करना है.

नीचे दिया गया कोड स्निपेट दिखाता है कि आपके ऐप्लिकेशन को कैसे बताया जाता है कि मॉडल fetchWeather फ़ंक्शन का इस्तेमाल करना चाहता है. इससे यह भी पता चलता है कि मॉडल ने फ़ंक्शन कॉल (और उसके अंदर मौजूद बाहरी एपीआई) के लिए ज़रूरी इनपुट पैरामीटर वैल्यू दी हैं.

इस उदाहरण में, इनकमिंग अनुरोध में प्रॉम्प्ट What was the weather in Boston on October 17, 2024? शामिल था. इस प्रॉम्प्ट से, मॉडल ने fetchWeather फ़ंक्शन के लिए ज़रूरी इनपुट पैरामीटर का अनुमान लगाया. जैसे, city, state, और date.

पांचवां चरण: आखिरी जवाब जनरेट करने के लिए, मॉडल को फ़ंक्शन का आउटपुट दें

fetchWeather फ़ंक्शन से मौसम की जानकारी मिलने के बाद, आपके ऐप्लिकेशन को उसे मॉडल को वापस भेजना होगा.

इसके बाद, मॉडल आखिरी प्रोसेसिंग करता है और नैचुरल लैंग्वेज में फ़ाइनल जवाब जनरेट करता है, जैसे कि: On October 17, 2024 in Boston, it was 38 degrees Fahrenheit with partly cloudy skies.

अन्य व्यवहार और विकल्प

फ़ंक्शन कॉल करने के कुछ और तरीके यहां दिए गए हैं. आपको अपने कोड में इनका इस्तेमाल करना होगा. साथ ही, इन विकल्पों को कंट्रोल किया जा सकता है.

मॉडल, किसी फ़ंक्शन को फिर से कॉल करने या किसी दूसरे फ़ंक्शन को कॉल करने के लिए कह सकता है.

अगर मॉडल को अपना आखिरी जवाब जनरेट करने के लिए, एक फ़ंक्शन कॉल का जवाब काफ़ी नहीं है, तो मॉडल किसी और फ़ंक्शन कॉल के लिए कह सकता है या किसी पूरी तरह से अलग फ़ंक्शन के लिए कॉल कर सकता है. ऐसा सिर्फ़ तब हो सकता है, जब आपने फ़ंक्शन के एलान की सूची में, मॉडल को एक से ज़्यादा फ़ंक्शन दिए हों.

आपके ऐप्लिकेशन में यह सुविधा होनी चाहिए कि मॉडल, अन्य फ़ंक्शन के लिए कॉल कर सके.

मॉडल, एक ही समय पर कई फ़ंक्शन कॉल करने के लिए कह सकता है.

मॉडल के लिए, फ़ंक्शन के एलान की सूची में ज़्यादा से ज़्यादा 128 फ़ंक्शन दिए जा सकते हैं. इस आधार पर, मॉडल यह तय कर सकता है कि आखिरी जवाब जनरेट करने के लिए, एक से ज़्यादा फ़ंक्शन की ज़रूरत है. साथ ही, यह एक ही समय पर इनमें से कुछ फ़ंक्शन को कॉल करने का फ़ैसला भी ले सकता है – इसे पारलल फ़ंक्शन कॉलिंग कहा जाता है.

आपके ऐप्लिकेशन को इस बात का ध्यान रखना होगा कि मॉडल एक ही समय पर कई फ़ंक्शन चलाने के लिए कह सकता है. साथ ही, आपके ऐप्लिकेशन को फ़ंक्शन से मिले सभी जवाब, मॉडल को वापस देने होंगे.

Gemini 1.5 Pro और Gemini 1.5 Flash में, फ़ंक्शन को एक साथ कॉल करने की सुविधा काम करती है.

आपके पास यह कंट्रोल करने का विकल्प होता है कि मॉडल, फ़ंक्शन को कॉल करने के लिए कैसे और कब कहे.

आपके पास यह तय करने का विकल्प होता है कि मॉडल, दिए गए फ़ंक्शन के एलान का इस्तेमाल कैसे करे और करे भी या नहीं. इसे फ़ंक्शन कॉलिंग मोड सेट करना कहा जाता है. यहां कुछ उदाहरण दिए गए हैं:

  • मॉडल को तुरंत सामान्य भाषा में जवाब देने और फ़ंक्शन कॉल के बीच में से किसी एक को चुनने की अनुमति देने के बजाय, उसे हमेशा फ़ंक्शन कॉल का इस्तेमाल करने के लिए मजबूर किया जा सकता है. इसे फ़ंक्शन को जबरन कॉल करना कहा जाता है.

  • अगर आपने एक से ज़्यादा फ़ंक्शन के एलान दिए हैं, तो मॉडल को दिए गए फ़ंक्शन के सिर्फ़ सबसेट का इस्तेमाल करने के लिए सीमित किया जा सकता है.

इन पाबंदियों (या मोड) को लागू करने के लिए, प्रॉम्प्ट और फ़ंक्शन के एलान के साथ-साथ टूल कॉन्फ़िगरेशन (toolConfig) जोड़ें. टूल के कॉन्फ़िगरेशन में, इनमें से कोई एक मोड चुना जा सकता है. सबसे ज़्यादा काम का मोड ANY है.

मोड जानकारी
AUTO मॉडल का डिफ़ॉल्ट व्यवहार. मॉडल यह तय करता है कि फ़ंक्शन कॉल का इस्तेमाल करना है या सामान्य भाषा में जवाब देना है.
ANY मॉडल में फ़ंक्शन कॉल ("फ़ोर्स्ड फ़ंक्शन कॉलिंग") का इस्तेमाल करना ज़रूरी है. मॉडल को फ़ंक्शन के सबसेट तक सीमित करने के लिए, allowedFunctionNames में इस्तेमाल किए जा सकने वाले फ़ंक्शन के नाम बताएं.
NONE मॉडल में फ़ंक्शन कॉल का इस्तेमाल नहीं किया जाना चाहिए. यह व्यवहार, किसी फ़ंक्शन के एलान के बिना मॉडल के अनुरोध के बराबर है.

फ़ंक्शन कॉलिंग मोड, Gemini 1.5 Pro और Gemini 1.5 Flash के साथ काम करता है.

इसके अलावा और क्या किया जा सकता है?

Gemini API की अन्य सुविधाएं आज़माएं

कॉन्टेंट जनरेशन को कंट्रोल करने का तरीका जानें

Vertex AI Studio का इस्तेमाल करके, प्रॉम्प्ट और मॉडल कॉन्फ़िगरेशन के साथ भी एक्सपेरिमेंट किया जा सकता है.

Gemini मॉडल के बारे में ज़्यादा जानें

अलग-अलग कामों के लिए उपलब्ध मॉडल और उनके कोटा और कीमत के बारे में जानें.


Vertex AI in Firebase इस्तेमाल करने के अपने अनुभव के बारे में सुझाव/राय देना या शिकायत करना