Firebase AI Logic का इस्तेमाल करके Gemini API
Firebase AI Logic का इस्तेमाल करके, Gemini मॉडल की मदद से एआई की सुविधाओं वाले मोबाइल और वेब ऐप्लिकेशन बनाना
Firebase AI Logic में आपको Google के जनरेटिव एआई के नए मॉडल का ऐक्सेस मिलता है: Gemini मॉडल.
अगर आपको सर्वर-साइड के बजाय, सीधे अपने मोबाइल या वेब ऐप्लिकेशन से Gemini API को कॉल करना है, तो Gemini API क्लाइंट SDK टूल का इस्तेमाल किया जा सकता है.Firebase AI Logic ये क्लाइंट एसडीके, खास तौर पर मोबाइल और वेब ऐप्लिकेशन के साथ इस्तेमाल करने के लिए बनाए गए हैं. ये अनधिकृत क्लाइंट के ख़िलाफ़ सुरक्षा के विकल्प के साथ-साथ, Firebase की अन्य सेवाओं के साथ इंटिग्रेशन की सुविधा भी देते हैं.
ये क्लाइंट एसडीके, Apple प्लैटफ़ॉर्म के लिए Swift, Android के लिए Kotlin और Java, वेब के लिए JavaScript, Flutter के लिए Dart, और Unity में उपलब्ध हैं.
इन क्लाइंट SDK की मदद से, ऐप्लिकेशन में एआई की मदद से मनमुताबिक अनुभव दिया जा सकता है. साथ ही, एआई चैट की सुविधा बनाई जा सकती है. इसके अलावा, एआई की मदद से ऑप्टिमाइज़ेशन और ऑटोमेशन की सुविधा बनाई जा सकती है. साथ ही, कई अन्य काम किए जा सकते हैं!
मुख्य सुविधाएं
| मल्टीमोडल और नैचुरल लैंग्वेज इनपुट |
Gemini मॉडल मल्टीमॉडल हैं. इसलिए, Gemini API को भेजे गए प्रॉम्प्ट में टेक्स्ट, इमेज, PDF, वीडियो, और ऑडियो शामिल हो सकते हैं. कुछ Gemini मॉडल, कई तरह के फ़ॉर्मैट में आउटपुट जनरेट कर सकते हैं.
Gemini मॉडल को आम बोलचाल की भाषा में इनपुट दिया जा सकता है. |
| सुविधाओं का बढ़ता दायरा | एसडीके की मदद से, अपने मोबाइल या वेब ऐप्लिकेशन से सीधे Gemini API को कॉल किया जा सकता है. इससे ये काम किए जा सकते हैं: एआई चैट की सुविधाएं बनाना, इमेज जनरेट करना,टूल इस्तेमाल करना. जैसे, फ़ंक्शन कॉलिंग और Google Search से जानकारी पाना, मल्टीमॉडल इनपुट और आउटपुट (इसमें ऑडियो भी शामिल है) स्ट्रीम करना वगैरह. |
| प्रोडक्शन ऐप्लिकेशन के लिए सुरक्षा और बुरे बर्ताव को रोकना |
Firebase App Check का इस्तेमाल करके, Gemini मॉडल को ऐक्सेस करने वाले एपीआई को बिना अनुमति वाले क्लाइंट के गलत इस्तेमाल से सुरक्षित रखें.
Firebase AI Logic में डिफ़ॉल्ट रूप से हर उपयोगकर्ता के लिए दर की सीमाएं भी होती हैं. साथ ही, हर उपयोगकर्ता के लिए दर की इन सीमाओं को पूरी तरह से कॉन्फ़िगर किया जा सकता है. |
| मज़बूत इन्फ़्रास्ट्रक्चर | स्केल किए जा सकने वाले इन्फ़्रास्ट्रक्चर का फ़ायदा पाएं. इसे मोबाइल और वेब ऐप्लिकेशन के साथ इस्तेमाल करने के लिए बनाया गया है. जैसे, Cloud Storage for Firebase की मदद से फ़ाइलें मैनेज करना, Firebase डेटाबेस की सुविधाओं (जैसे, Cloud Firestore) की मदद से स्ट्रक्चर्ड डेटा मैनेज करना, और Firebase Remote Config की मदद से रन-टाइम कॉन्फ़िगरेशन को डाइनैमिक तरीके से सेट करना. |
यह कैसे काम करता है?
Firebase AI Logic क्लाइंट SDK टूल, प्रॉक्सी सेवा, और अन्य सुविधाएँ उपलब्ध कराता है. इनकी मदद से, Google के जनरेटिव एआई मॉडल को ऐक्सेस किया जा सकता है. इससे अपने मोबाइल और वेब ऐप्लिकेशन में एआई सुविधाएँ बनाई जा सकती हैं.
Google के मॉडल और "Gemini API" की सेवा देने वाली कंपनियों के साथ काम करता है
हम Gemini के सभी नए मॉडल के साथ काम करते हैं. इन मॉडल को ऐक्सेस करने के लिए, आपको अपनी पसंद का "Gemini API" प्रोवाइडर चुनना होगा. हम Gemini Developer API और Vertex AI Gemini API, दोनों का इस्तेमाल करने का विकल्प देते हैं. एपीआई उपलब्ध कराने वाली इन दोनों कंपनियों के बीच के अंतर के बारे में जानें.
अगर आपको Gemini Developer API का इस्तेमाल करना है, तो "मुफ़्त टियर" का फ़ायदा लिया जा सकता है. इससे आपको जल्दी शुरुआत करने में मदद मिलेगी.
मोबाइल और वेब क्लाइंट एसडीके
हमारे Firebase AI Logicक्लाइंट एसडीके का इस्तेमाल करके, अपने मोबाइल या वेब ऐप्लिकेशन से सीधे तौर पर मॉडल को अनुरोध भेजे जा सकते हैं. ये एसडीके, Apple प्लैटफ़ॉर्म के लिए Swift, Android के लिए Kotlin और Java, वेब के लिए JavaScript, Flutter के लिए Dart, और Unity में उपलब्ध हैं.
अगर आपने अपने Firebase प्रोजेक्ट में दोनों Gemini API प्रोवाइडर सेट अप किए हैं, तो एपीआई प्रोवाइडर के बीच स्विच किया जा सकता है. इसके लिए, आपको सिर्फ़ दूसरे एपीआई को चालू करना होगा और कुछ लाइनों के शुरुआती कोड को बदलना होगा.
इसके अलावा, हमारे कई क्लाइंट SDK टूल, हाइब्रिड और डिवाइस पर मौजूद डेटा के आधार पर अनुमान लगाने की सुविधा का ऐक्सेस देते हैं. इस कॉन्फ़िगरेशन की मदद से, आपका ऐप्लिकेशन उपलब्ध होने पर डिवाइस पर मौजूद मॉडल का इस्तेमाल कर सकता है. हालांकि, ज़रूरत पड़ने पर यह क्लाउड पर होस्ट किए गए मॉडल पर आसानी से स्विच कर सकता है. इसके उलट भी किया जा सकता है.
प्रॉक्सी सेवा
हमारी प्रॉक्सी सेवा, क्लाइंट और आपके चुने हुए Gemini API प्रोवाइडर (और Google के मॉडल) के बीच गेटवे के तौर पर काम करती है. यह मोबाइल और वेब ऐप्लिकेशन के लिए ज़रूरी सेवाएं और इंटिग्रेशन उपलब्ध कराता है. उदाहरण के लिए, Firebase App Check सेट अप किया जा सकता है. इससे, एपीआई उपलब्ध कराने वाली कंपनी और बैकएंड रिसॉर्स को बिना अनुमति वाले क्लाइंट के गलत इस्तेमाल से बचाया जा सकता है.
अगर आपने Gemini Developer API का इस्तेमाल करने का विकल्प चुना है, तो यह खास तौर पर ज़रूरी है. ऐसा इसलिए, क्योंकि हमारी प्रॉक्सी सेवा और App Check इंटिग्रेशन यह पक्का करते हैं कि आपकी Gemini एपीआई कुंजी सर्वर पर ही रहे और आपके ऐप्लिकेशन के कोडबेस में एम्बेड न हो.
लागू करने का पाथ
| अपना Firebase प्रोजेक्ट सेट अप करना और अपने ऐप्लिकेशन को Firebase से कनेक्ट करना | Firebase कंसोल के Firebase AI Logic पेज पर दिए गए निर्देशों का पालन करके, अपना प्रोजेक्ट सेट अप करें. इसमें, चुने गए Gemini API प्रोवाइडर के लिए ज़रूरी एपीआई चालू करना, अपने ऐप्लिकेशन को Firebase प्रोजेक्ट के साथ रजिस्टर करना, और फिर अपने ऐप्लिकेशन में Firebase कॉन्फ़िगरेशन जोड़ना शामिल है. | |
| एसडीके इंस्टॉल करना और उसे शुरू करना | अपने ऐप्लिकेशन के प्लैटफ़ॉर्म के हिसाब से Firebase AI Logic SDK इंस्टॉल करें. इसके बाद, सेवा को शुरू करें और अपने ऐप्लिकेशन में मॉडल इंस्टेंस बनाएं. | |
| Gemini मॉडल को प्रॉम्प्ट के अनुरोध भेजना | एसडीके का इस्तेमाल करके, किसी Gemini मॉडल को सिर्फ़ टेक्स्ट या मल्टीमॉडल प्रॉम्प्ट भेजें. इससे टेक्स्ट और कोड, स्ट्रक्चर्ड आउटपुट (जैसे कि JSON), और इमेज जनरेट की जा सकती हैं.
इन सुविधाओं का इस्तेमाल करके, बेहतर अनुभव पाएं: एक से ज़्यादा बार बातचीत करने की सुविधा, दोनों ओर से स्ट्रीमिंग (इसमें ऑडियो भी शामिल है), और फ़ंक्शन कॉलिंग. |
|
| प्रोडक्शन के लिए तैयारी करना | मोबाइल और वेब ऐप्लिकेशन के लिए ज़रूरी इंटिग्रेशन लागू करें. जैसे, Firebase App Check का इस्तेमाल करके, एपीआई को गलत इस्तेमाल से बचाना और Firebase Remote Config का इस्तेमाल करके, अपने कोड में पैरामीटर को दूर से अपडेट करना. इनमें सबसे ज़रूरी है मॉडल का नाम. |
अगले चरण
अपने मोबाइल या वेब ऐप्लिकेशन से किसी मॉडल को ऐक्सेस करना शुरू करना