رابط برنامهنویسی کاربردی Gemini با استفاده از منطق هوش مصنوعی Firebase
ساخت اپلیکیشنها و ویژگیهای موبایل و وب مبتنی بر هوش مصنوعی با مدلهای Gemini و Imagen با استفاده از Firebase AI Logic
منطق هوش مصنوعی فایربیس به شما امکان دسترسی به جدیدترین مدلهای هوش مصنوعی تولیدی گوگل را میدهد: مدلهای Gemini و مدلهای Imagen .
اگر نیاز دارید که مستقیماً از طریق برنامه موبایل یا وب خود - به جای سمت سرور - رابط برنامهنویسی Gemini یا رابط برنامهنویسی Imagen API را فراخوانی کنید، میتوانید از SDKهای کلاینت Firebase AI Logic استفاده کنید. این SDKهای کلاینت به طور خاص برای استفاده با برنامههای موبایل و وب ساخته شدهاند و گزینههای امنیتی در برابر کلاینتهای غیرمجاز و همچنین ادغام با سایر سرویسهای Firebase را ارائه میدهند.
این SDK های کلاینت به زبان های Swift برای پلتفرم های اپل، Kotlin و Java برای اندروید، JavaScript برای وب، Dart برای Flutter و Unity در دسترس هستند.
با این SDK های کلاینت، میتوانید شخصیسازی هوش مصنوعی را به برنامهها اضافه کنید، یک تجربه چت هوش مصنوعی بسازید، بهینهسازیها و اتوماسیون مبتنی بر هوش مصنوعی ایجاد کنید و موارد بسیار دیگری!
به انعطافپذیری بیشتر یا ادغام سمت سرور نیاز دارید؟
Genkit چارچوب متنباز Firebase برای توسعه هوش مصنوعی پیشرفته سمت سرور با دسترسی گسترده به مدلهای گوگل، OpenAI، Anthropic و موارد دیگر است. این شامل ویژگیهای پیشرفتهتر هوش مصنوعی و ابزارهای محلی اختصاصی است.
قابلیتهای کلیدی
ورودی چندوجهی و زبان طبیعی | مدلهای Gemini چندوجهی هستند، بنابراین پیامهای ارسالی به API Gemini میتوانند شامل متن، تصویر، فایلهای PDF، ویدیو و صدا باشند. برخی از مدلهای Gemini همچنین میتوانند خروجی چندوجهی تولید کنند. هر دو مدل Gemini و Imagen را میتوان با ورودی زبان طبیعی فعال کرد. |
مجموعه رو به رشدی از قابلیتها | با استفاده از SDKها، میتوانید مستقیماً از طریق برنامه تلفن همراه یا وب خود ، رابط برنامهنویسی Gemini یا Imagen API را فراخوانی کنید تا تجربههای چت هوش مصنوعی بسازید ، تصاویر تولید کنید، از ابزارها (مانند فراخوانی تابع و اتصال به زمین با جستجوی گوگل )، جریان ورودی و خروجی چندوجهی (از جمله صدا) و موارد دیگر استفاده کنید. |
امنیت و پیشگیری از سوءاستفاده برای برنامههای کاربردی در حال تولید | از Firebase App Check برای محافظت از APIهایی که به مدلهای Gemini و Imagen دسترسی دارند در برابر سوءاستفاده توسط کلاینتهای غیرمجاز استفاده کنید. Firebase AI Logic همچنین به طور پیشفرض محدودیتهای سرعت برای هر کاربر دارد و این محدودیتهای سرعت برای هر کاربر کاملاً قابل تنظیم هستند. |
زیرساخت قوی | از زیرساختهای مقیاسپذیر که برای استفاده با برنامههای تلفن همراه و وب ساخته شدهاند، مانند مدیریت فایلها با Cloud Storage for Firebase ، مدیریت دادههای ساختاریافته با ارائههای پایگاه داده Firebase (مانند Cloud Firestore ) و تنظیم پویای پیکربندیهای زمان اجرا با Firebase Remote Config ، بهره ببرید. |
چگونه کار میکند؟
Firebase AI Logic کیتهای توسعه نرمافزار (SDK) کلاینت، یک سرویس پروکسی و سایر ویژگیهایی را ارائه میدهد که به شما امکان میدهد به مدلهای هوش مصنوعی مولد گوگل دسترسی داشته باشید تا ویژگیهای هوش مصنوعی را در برنامههای تلفن همراه و وب خود بسازید.
پشتیبانی از مدلهای گوگل و ارائهدهندگان « Gemini API »
ما از تمام مدلهای جدید Gemini و Imagen پشتیبانی میکنیم و شما میتوانید ارائهدهندهی « Gemini API » مورد نظر خود را برای دسترسی به این مدلها انتخاب کنید. ما از هر دو API توسعهدهندهی Gemini و Vertex AI Gemini API پشتیبانی میکنیم. در مورد تفاوتهای بین استفاده از این دو ارائهدهندهی API اطلاعات کسب کنید.
و اگر تصمیم به استفاده از رابط برنامهنویسی کاربردی توسعهدهندگان Gemini دارید، میتوانید از «رده رایگان» آنها برای راهاندازی سریع و آسان استفاده کنید.
SDK های کلاینت موبایل و وب
شما میتوانید درخواستها را مستقیماً از طریق برنامه تلفن همراه یا وب خود با استفاده از SDK های کلاینت Firebase AI Logic ما که در Swift برای پلتفرمهای اپل، Kotlin و Java برای اندروید، JavaScript برای وب، Dart برای Flutter و Unity موجود است، به مدلها ارسال کنید.
اگر هر دو ارائهدهنده API مربوط به Gemini را در پروژه Firebase خود تنظیم کردهاید، میتوانید با فعال کردن API دیگر و تغییر چند خط کد مقداردهی اولیه، بین ارائهدهندگان API جابهجا شوید.
علاوه بر این، SDK کلاینت ما برای وب، دسترسی آزمایشی به استنتاج ترکیبی و درون دستگاهی را برای برنامههای وب که روی کروم دسکتاپ اجرا میشوند، ارائه میدهد. این پیکربندی به برنامه شما اجازه میدهد تا در صورت وجود، از مدل درون دستگاهی استفاده کند، اما در صورت نیاز، به طور یکپارچه به مدل میزبانی ابری بازگردد.
سرویس پروکسی
سرویس پروکسی ما به عنوان دروازهای بین کلاینت و ارائهدهنده API انتخابی شما برای Gemini (و مدلهای گوگل) عمل میکند. این سرویس، خدمات و ادغامهایی را ارائه میدهد که برای برنامههای تلفن همراه و وب مهم هستند. به عنوان مثال، میتوانید Firebase App Check تنظیم کنید تا از ارائهدهنده API انتخابی و منابع backend شما در برابر سوءاستفاده توسط کلاینتهای غیرمجاز محافظت کند.
این امر به ویژه در صورتی که تصمیم به استفاده از API توسعهدهنده Gemini گرفته باشید، بسیار مهم است، زیرا سرویس پروکسی ما و این ادغام App Check تضمین میکنند که کلید API Gemini شما روی سرور باقی میماند و در کدبیس برنامههای شما جاسازی نمیشود .
مسیر پیادهسازی
پروژه Firebase خود را تنظیم کنید و برنامه خود را به Firebase متصل کنید | از گردش کار هدایتشده در صفحه Firebase AI Logic کنسول Firebase برای راهاندازی پروژه خود (از جمله فعال کردن APIهای مورد نیاز برای ارائهدهنده API Gemini انتخابی شما)، ثبت برنامه خود در پروژه Firebase و سپس اضافه کردن پیکربندی Firebase به برنامه خود استفاده کنید. | |
SDK را نصب کنید و مقداردهی اولیه را انجام دهید | کیت توسعه نرمافزار (SDK) مربوط به Firebase AI Logic را که مختص پلتفرم برنامه شماست، نصب کنید و سپس سرویس را راهاندازی اولیه کرده و یک نمونه مدل در برنامه خود ایجاد کنید. | |
ارسال درخواستهای فوری به مدلهای Gemini و Imagen | از SDKها برای ارسال پیامهای متنی یا چندوجهی به مدل Gemini برای تولید متن و کد ، خروجی ساختاریافته (مانند JSON) و تصاویر استفاده کنید. همچنین میتوانید از یک مدل Imagen برای تولید تصاویر استفاده کنید. با چت چند نوبته ، پخش دو طرفه متن و صدا و فراخوانی تابع ، تجربیات غنیتری بسازید. | |
آماده سازی برای تولید | پیادهسازی یکپارچهسازیهای مهم برای برنامههای موبایل و وب، مانند محافظت از API در برابر سوءاستفاده با Firebase App Check و استفاده از Firebase Remote Config برای بهروزرسانی پارامترهای کد از راه دور (مانند نام مدل). |