برای برنامههای موبایل و وب، Firebase AI Logic SDK به شما امکان میدهد با مدلهای پشتیبانیشده Gemini و مدلهای Imagen مستقیماً از برنامه خود تعامل داشته باشید.
مدلهای جمینی چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایلهای PDF، تصاویر، ویدئو و صدا هستند. از مدل های Imagen می توان با متن برای تولید تصاویر درخواست کرد.
جدول زیر مروری کوتاه بر مدل های پشتیبانی شده برای Firebase AI Logic و آخرین نام مدل های پایدار آنها است. این جدول همچنین مدلهای پیشنمایش و آزمایشی را که برای نمونهسازی موارد استفاده در دسترس هستند، فهرست میکند.
همچنین، سؤالات متداول ما را درباره همه مدلهایی که Firebase AI Logic پشتیبانی میکند و پشتیبانی نمیکند، مرور کنید.
مدل های جمینی
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
مدل های جمینی با نسخه های پایدار | |||
جمینی 2.5 پروgemini-2.5-pro | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | پیشرفته ترین مدل استدلال ما، قادر به حل مسائل پیچیده است. |
فلش جمینی 2.5gemini-2.5-flash | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | مدل تفکر ما که قابلیت های عالی و کاملی را ارائه می دهد. این برای ارائه تعادل بین قیمت و عملکرد طراحی شده است. |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | متعادلترین مدل Gemini ما، بهینهسازی شده برای موارد استفاده با تأخیر کم و برنامههای مقرون به صرفه. |
Gemini 2.5 Flash Imagegemini-2.5-flash-image | متن، کد، فایل های PDF، تصاویر | تصاویر، متن و تصاویر | مدل استاندارد فلش ما برای گردشهای کاری خلاقانه سریع با تولید تصویر و قابلیتهای ویرایش مکالمه و چند نوبتی ارتقا یافته است. (معروف به "نانو موز") |
فلش جمینی 2.0gemini-2.0-flash-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | مدل چندوجهی ما با ویژگیهای نسل بعدی و قابلیتهای بهبودیافته، از جمله سرعت برتر، استفاده از ابزار داخلی، و پنجره زمینه توکن 1M |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | سریع ترین و مقرون به صرفه ترین مدل فلش ما. این یک مسیر ارتقاء برای کاربران فلش 1.5 است که کیفیت بهتری با همان قیمت و سرعت می خواهند. |
مدلهای Gemini فقط با نسخههای پیشنمایش و آزمایشی (فقط برای نمونهسازی موارد استفاده توصیه میشود) | |||
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation | متن، کد، فایل های PDF، تصاویر | تصاویر، متن و تصاویر | مدل چند وجهی ما که از ورودی و خروجی تصویر چندوجهی پشتیبانی می کند. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | متن (استریم)، صوتی (استریم) | متن (استریم)، صوتی (استریم) | مدل چندوجهی ما که از جریان بیدرنگ با تأخیر کم ورودی ها و خروجی های چندوجهی پشتیبانی می کند. |
1 نام مدل های دیگر بسته به ارائه دهنده و دسترسی Gemini API انتخابی شما از Live API API پشتیبانی می کند (به صفحه Live API مراجعه کنید).
مدل های تصویری
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
مدل های Imagen با نسخه های پایدار | |||
تصویر 4imagen-4.0-generate-001 | متن | تصاویر | تصاویر واقعی و باکیفیت را از پیامهای متنی به زبان طبیعی ایجاد میکند |
Imagen 4 سریعimagen-4.0-fast-generate-001 | متن | تصاویر | تصاویر را برای نمونه سازی اولیه یا موارد استفاده با تأخیر کم تولید می کند |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | متن | تصاویر | تصاویر واقعی و باکیفیت را از پیامهای متنی به زبان طبیعی ایجاد میکند |
تصویر 3imagen-3.0-generate-002 | متن | تصاویر | تصاویر واقعی و باکیفیت را از پیامهای متنی به زبان طبیعی ایجاد میکند |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | متن | تصاویر | تصاویر را برای نمونه سازی اولیه یا موارد استفاده با تأخیر کم تولید می کند |
قابلیت Imagen 3 2imagen-3.0-capability-001 | متن، تصاویر | تصاویر | ویرایش و تولید تصاویر؛ از ویرایش مبتنی بر ماسک و سفارشی سازی با استفاده از تصاویر مرجع پشتیبانی می کند |
مدلهای Imagen فقط با نسخههای پیشنمایش و آزمایشی (فقط برای نمونهسازی موارد استفاده توصیه میشود) | |||
--- | --- | --- | --- |
2 بدون توجه به اینکه چگونه به آن دسترسی داشته باشید توسط Gemini Developer API پشتیبانی نمی شود.
در ادامه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Firebase AI Logic ارائه می شود.
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالایی از قابلیت های پشتیبانی شده
- مشخصات و محدودیتها، برای مثال حداکثر نشانههای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه نسخهسازی مدلها ، بهویژه نسخههای پایدار ، بهروزرسانی خودکار ، پیشنمایش و نسخههای آزمایشی آنها
لیستی از نام مدل های موجود برای گنجاندن در کد خود در هنگام شروع اولیه
لیست زبان های پشتیبانی شده برای مدل ها
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Firebase AI Logic توصیف می کند. هر مدل ممکن است قابلیتهای بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.
اگر نمی توانید اطلاعات مورد نظر خود را در بخش های فرعی زیر پیدا کنید، می توانید اطلاعات بیشتری را در اسناد ارائه دهنده API انتخابی خود بیابید:
Gemini Developer API : مدلهای Gemini و مدلهای Imagen
Vertex AI Gemini API : مدلهای Gemini و مدلهای Imagen
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
جوزا 2.5 Pro، Flash، Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (تولید) | تصویر (قابلیت) | |
---|---|---|---|---|---|---|---|---|
انواع ورودی | ||||||||
متن | ||||||||
متن (استریم) | ||||||||
کد | ||||||||
اسناد (PDF یا متن ساده) | ||||||||
تصاویر | ||||||||
ویدئو | ||||||||
صوتی | ||||||||
صوتی (استریم) | ||||||||
انواع خروجی | ||||||||
متن | ||||||||
متن (استریم) | ||||||||
کد | ||||||||
خروجی ساختاریافته (مانند JSON) | ||||||||
تصاویر | ||||||||
صوتی | ||||||||
صوتی (استریم) |
برای آشنایی با انواع فایل های پشتیبانی شده، فایل های ورودی پشتیبانی شده و الزامات را ببینید.
قابلیت ها و ویژگی های پشتیبانی شده
اینها قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
جوزا 2.5 Pro، Flash، Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (تولید) | تصویر (قابلیت) | |
---|---|---|---|---|---|---|---|---|
فکر کردن | ||||||||
متن را از ورودی های متنی یا چند وجهی تولید کنید | بهم پیوسته یا به عنوان بخشی از تصویر | بهم پیوسته یا به عنوان بخشی از تصویر | فقط جریان | |||||
تولید تصاویر ( جوزا یا ایمیجن ) | ||||||||
ویرایش تصاویر ( جوزا یا ایمیجن ) | ||||||||
تولید صدا | فقط جریان | |||||||
تولید خروجی ساختار یافته (مانند JSON) | ||||||||
اسناد را تجزیه و تحلیل کنید (PDF یا متن ساده) | ||||||||
تجزیه و تحلیل تصاویر (بینایی) | ||||||||
تجزیه و تحلیل ویدئو (دید) | ||||||||
آنالیز صدا | فقط جریان | |||||||
چت چند نوبتی | ||||||||
جریان چندوجهی دوطرفه | ||||||||
فراخوانی تابع | ||||||||
اجرای کد | ||||||||
زمینه سازی با جستجوی گوگل | ||||||||
دستورالعمل های سیستم | ||||||||
توکن ها را بشمار |
مشخصات و محدودیت ها
اینها مشخصات و محدودیتها هنگام استفاده از هر مدل با Firebase AI Logic هستند:
اموال | جوزا 2.5 Pro، Flash، Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (تولید) | تصویر (قابلیت) |
---|---|---|---|---|---|---|---|---|
پنجره زمینه * حد توکن کل (ورودی + خروجی ترکیبی) | 1,048,576 توکن | 32768 توکن | 1,048,576 توکن | 1,048,576 توکن | 32768 توکن | 32768 توکن | 480 توکن | 480 توکن |
محدودیت رمز خروجی * | 65536 توکن | 8192 توکن | 8192 توکن | 8192 توکن | 8192 توکن | 8192 توکن | --- | --- |
تاریخ قطع دانش | ژانویه 2025 | ژوئن 2025 | ژوئن 2024 | ژوئن 2024 | آگوست 2024 | آگوست 2024 | --- | --- |
فایل های PDF (در هر درخواست) | ||||||||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3 فایل | 3000 فایل | 3000 فایل | 3000 فایل | --- | --- | --- |
حداکثر تعداد از صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 3 صفحه | 1000 صفحه | 1000 صفحه | 1000 صفحه | --- | --- | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | --- | --- |
تصاویر (در هر درخواست) | ||||||||
حداکثر تعداد از تصاویر ورودی | 3000 عکس | 3 تصویر | 3000 عکس | 3000 عکس | 3000 عکس | --- | --- | 4 تصویر |
حداکثر تعداد از تصاویر خروجی | --- | 10 تصویر | --- | --- | 10 تصویر | --- | 4 تصویر | 4 تصویر |
حداکثر اندازه به ازای هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | --- | --- |
ویدئو (به ازای درخواست) | ||||||||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | --- | 10 فایل | 10 فایل | --- | --- | --- | --- |
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب) | ~60 دقیقه | --- | ~60 دقیقه | ~60 دقیقه | --- | --- | --- | --- |
حداکثر طول از تمام ویدیوهای ورودی (قاب + صدا) | ~45 دقیقه | --- | ~45 دقیقه | ~45 دقیقه | --- | --- | --- | --- |
صوتی (به ازای درخواست) | ||||||||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | --- | 1 فایل | 1 فایل | --- | --- | --- | --- |
حداکثر تعداد از فایل های صوتی خروجی | --- | --- | --- | --- | --- | --- | --- | --- |
حداکثر طول از تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت | --- | --- | --- | --- |
حداکثر طول از تمام صدای خروجی | --- | --- | --- | --- | --- | --- | --- | --- |
* برای تمام مدل های جمینی ، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
اطلاعات دقیق اضافی را بیابید
سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.
درباره انواع فایل های ورودی پشتیبانی شده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایل های ورودی و درخواست های چندوجهی شما الزامات را برآورده می کنند و بهترین روش ها را در فایل های ورودی و الزامات پشتیبانی شده دنبال می کنند، بیاموزید.
مدل سازی و الگوهای نامگذاری
مدل ها در نسخه های پایدار ، پیش نمایش و آزمایشی ارائه می شوند. برای راحتی، نام مستعار بدون مقادیر نسخه صریح پشتیبانی می شود.
برای یافتن نامهای مدل خاص برای استفاده در کد خود، بخش «نام مدلهای موجود» را در ادامه این صفحه ببینید.
نوع نسخه / مرحله انتشار | توضیحات | الگوی نام مدل | |
---|---|---|---|
پایدار | نسخه های پایدار در دسترس هستند و برای استفاده تولید از تاریخ انتشار پشتیبانی می شوند. یک نسخه مدل پایدار معمولاً با تاریخ بازنشستگی منتشر می شود که نشان دهنده آخرین روز عرضه مدل است. پس از این تاریخ، مدل دیگر توسط Google قابل دسترسی یا پشتیبانی نیست. |
| |
نام مستعار پایدار بهروزرسانی خودکار (فقط مدل های Gemini 2.0 ) | نام مستعار پایدار با به روز رسانی خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کند. اگر یک نسخه پایدار جدید منتشر شود، نام مستعار به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند. | فقط مدل های Gemini 2.0 مثال: | |
پیش نمایش | نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . این مدلها برای استفاده در تولید توصیه نمیشوند ، محدودیتهای نرخ محدودتری دارند و ممکن است الزامات صورتحساب داشته باشند. برای Vertex AI Gemini API ، مدلهای پیشنمایش که پس از ژوئن 2025 منتشر میشوند معمولاً از شما میخواهند که مکان مدل را روی | نام مدل های نسخه های پیش نمایش به ضمیمه شده است مثال: | |
تجربی | نسخه های آزمایشی قابلیت های جدیدی دارند و پایدار نیستند . این مدلها برای استفاده در تولید توصیه نمیشوند و محدودیتهای نرخ محدودتری دارند. مدلهای آزمایشی برای جمعآوری بازخورد و فعال کردن آزمایش با آخرین ویژگیهای ما در نظر گرفته شدهاند. برای Vertex AI Gemini API ، مدلهای آزمایشی که پس از ژوئن 2025 منتشر شدند، از شما میخواهند مکان مدل را روی | نام مدل های نسخه های آزمایشی به ضمیمه می شود مثال: | |
بازنشسته | نسخه های بازنشسته تاریخ بازنشستگی خود را پشت سر گذاشته اند و برای همیشه غیرفعال شده اند. مدلهای بازنشسته دیگر توسط Google قابل دسترسی یا پشتیبانی نیستند، و درخواستهای ارجاع به شناسه مدل بازنشسته معمولاً خطای 404 را برمیگرداند. | --- |
نام مدل های موجود
نام مدل ها مقادیر صریحی هستند که در کد خود در هنگام شروع اولیه مدل وارد می کنید.
Gemini پرش به نام مدل های Imagen پرش به نام مدل های
همه مدل های موجود را به صورت برنامه ای لیست کنید
می توانید با استفاده از REST API نام همه مدل های موجود را فهرست کنید:
Gemini Developer API : نقطه پایانی
models.list
را فراخوانی کنیدVertex AI Gemini API : با نقطه پایانی
publishers.models.list
تماس بگیرید
توجه داشته باشید که این لیست بازگشتی شامل همه مدلهای پشتیبانیشده توسط ارائهدهندگان API میشود، اما Firebase AI Logic فقط از مدلهای Gemini و Imagen که در این صفحه توضیح داده شدهاند پشتیبانی میکند. همچنین توجه داشته باشید که نام مستعار به روز شده خودکار (به عنوان مثال، gemini-2.0-flash
) در فهرست قرار نگرفته اند زیرا آنها نام مستعار راحتی برای مدل پایه هستند.
نام مدل های جمینی
برای مثالهای اولیه برای پلتفرم خود، راهنمای شروع کار را ببینید.
برای جزئیات در مورد مراحل انتشار (مخصوصاً برای موارد استفاده و صورتحساب)، نسخهسازی مدل و الگوهای نامگذاری را ببینید.
نام مدل های Gemini 2.5 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-pro | نسخه پایدار Gemini 2.5 Pro | پایدار | 17-06-2025 | نه زودتر از 17-06-2026 |
اسم مدل های فلش Gemini 2.5
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash | نسخه پایدار Gemini 2.5 Flash | پایدار | 17-06-2025 | نه زودتر از 17-06-2026 |
نام مدل های Gemini 2.5 Flash-Lite
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-lite | نسخه پایدار Gemini 2.5 Flash-Lite | پایدار | 22-07-2025 | نه زودتر از 22-07-2026 |
نام مدل های Gemini 2.5 Flash Image (معروف به "نانو موز")
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-image | نسخه پایدار برای Gemini 2.5 Flash Image (معروف به "نانو موز") | پایدار | 02-10-2025 | 02-10-2026 |
gemini-2.5-flash-image-preview | نسخه پیش نمایش برای Gemini 2.5 Flash Image (معروف به "نانو موز") | پیش نمایش | 26-08-2025 | 2025-10-31 |
نام مدل های فلش لایو Gemini 2.5
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-live-2.5-flash | نسخه پایدار برای Gemini 2.5 Flash Live | پایدار (جی خصوصی) 1 | 01-06-2025 | نه زودتر از 01-06-2026 |
gemini-live-2.5-flash-preview 2 | نسخه پیش نمایش برای Gemini 2.5 Flash Live | پیش نمایش | 01-06-2025 | تعیین شود |
توجه داشته باشید که در نامهای مدل 2.5 برای Live API ، بخش live
بلافاصله پس از بخش gemini
قرار میگیرد.
Firebase AI Logic هنوز از مدلهای صوتی بومی (مانند gemini-2.5-flash-native-audio-preview-09-2025
) پشتیبانی نمیکند .
1 برای درخواست دسترسی با نماینده تیم حساب Google Cloud خود تماس بگیرید.
2 مهم نیست که چگونه به آن دسترسی داشته باشید توسط Vertex AI Gemini API پشتیبانی نمی شود.
نام مدل های فلش Gemini 2.0
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-001 | آخرین نسخه پایدار Gemini 2.0 Flash | پایدار | 05-02-2025 | نه زودتر از 05-02-2026 |
gemini-2.0-flash | نام مستعار بهروزرسانی خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash اشاره دارد (در حال حاضر gemini-2.0-flash-001 ) | پایدار | 10-02-2025 | --- |
نام مدل های Gemini 2.0 Flash-Lite
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | آخرین نسخه پایدار Gemini 2.0 Flash-Lite | پایدار | 2025-02-25 | نه زودتر از 2026-02-25 |
gemini-2.0-flash-lite | نام مستعار بهروزرسانی خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash-Lite اشاره میکند (در حال حاضر gemini-2.0-flash-lite-001 ) | پایدار | 2025-02-25 | --- |
نام مدل های Gemini 2.0 Flash Image Generation
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | نسخه پیش نمایش برای Gemini 2.0 Flash Image Generation | پیش نمایش | 06-05-2025 | 2025-10-31 |
نام مدل های فلش لایو Gemini 2.0
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | نسخه پایدار برای Gemini 2.0 Flash Live | پایدار | 01-04-2025 | نه زودتر از 01-04-2026 |
gemini-2.0-flash-live-preview-04-09 | نسخه پیش نمایش برای Gemini 2.0 Flash Live | پیش نمایش | 09-04-2025 | تعیین شود |
2 مهم نیست که چگونه به آن دسترسی داشته باشید توسط Vertex AI Gemini API پشتیبانی نمی شود.
نام مدل های Imagen
برای نمونه های اولیه سازی برای پلتفرم خود، به تولید تصاویر با راهنمای Imagen مراجعه کنید.
برای جزئیات در مورد مراحل انتشار (مخصوصاً برای موارد استفاده و صورتحساب)، نسخهسازی مدل و الگوهای نامگذاری را ببینید.
Imagen 4 نام مدل
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-generate-001 | نسخه پایدار Imagen 4 | پایدار | 14-08-2025 | نه زودتر از 14/08/2026 |
imagen-4.0-generate-preview-06-06 | نسخه پیش نمایش Imagen 4 | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 4 نام مدل های سریع
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | نسخه پایدار Imagen 4 Fast | پایدار | 14-08-2025 | نه زودتر از 14/08/2026 |
imagen-4.0-fast-generate-preview-06-06 3 | نسخه پیش نمایش Imagen 4 Fast (به زودی بازنشسته می شود - استفاده نکنید) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
نام مدل های Imagen 4 Ultra
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | نسخه پایدار Imagen 4 Ultra | پایدار | 14-08-2025 | نه زودتر از 14/08/2026 |
imagen-4.0-ultra-generate-preview-06-06 | نسخه پیش نمایش Imagen 4 Ultra (به زودی بازنشسته می شود - استفاده نکنید) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
ایمیج 3 نام مدل
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-generate-002 | آخرین نسخه پایدار Imagen 3 | پایدار | 2025-01-23 | نه زودتر از 23/01/2026 |
imagen-3.0-generate-001 3 | نسخه پایدار اولیه Imagen 3 | پایدار | 2024-07-31 | نه زودتر از 31/07/2025 |
Imagen 3 نام مدل های سریع
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | نسخه پایدار اولیه Imagen 3 Fast | پایدار | 2024-07-31 | نه زودتر از 31/07/2025 |
3 بدون توجه به اینکه چگونه به آن دسترسی دارید توسط Gemini Developer API پشتیبانی نمی شود.
Imagen 3 نام مدل های قابلیت
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-capability-001 3 | نسخه پایدار اولیه Imagen 3 Capability | پایدار | 2024-12-10 | نه زودتر از 2025-12-10 |
3 بدون توجه به اینکه چگونه به آن دسترسی دارید توسط Gemini Developer API پشتیبانی نمی شود.
زبان های پشتیبانی شده
جوزا
همه مدلهای Gemini میتوانند به زبانهای زیر بفهمند و پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)
مدلهای Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash میتوانند به زبانهای اضافی زیر بفهمند و پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)
Imagen
در دسترس بودن عمومی : انگلیسی
پیش نمایش : چینی (ساده شده)، چینی (سنتی)، هندی، ژاپنی، کره ای، پرتغالی، اسپانیایی
اطلاعاتی در مورد مدل های قدیمی تر
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Firebase AI Logic هستند:
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
انواع ورودی | |||||||
متن | |||||||
کد | |||||||
اسناد (PDF یا متن ساده) | |||||||
تصاویر | |||||||
ویدئو | |||||||
صوتی | |||||||
صوتی (استریم) | |||||||
انواع خروجی | |||||||
متن | |||||||
کد | |||||||
خروجی ساختاریافته (مانند JSON) | |||||||
تصاویر، ویدئو و صدا |
اینها قابلیتها و ویژگیهایی هستند که هنگام استفاده از هر مدل با Firebase AI Logic :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
متن را از ورودی فقط متنی تولید کنید | ||||
تولید متن از ورودی چند وجهی | ||||
تولید تصاویر | ||||
تولید صدا | ||||
تولید خروجی ساختار یافته (مانند JSON) | ||||
اسناد را تجزیه و تحلیل کنید (PDF یا متن ساده) | ||||
تجزیه و تحلیل تصاویر (بینایی) | ||||
تجزیه و تحلیل ویدئو (دید) | ||||
آنالیز صدا | ||||
چت چند نوبتی | ||||
فراخوانی تابع (ابزار) | ||||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | ||||
دستورالعمل های سیستم | ||||
جریان چندوجهی دو طرفه |
اینها مشخصات و محدودیتها هنگام استفاده از هر مدل با Firebase AI Logic هستند:
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
پنجره زمینه * حد توکن کل (ورودی + خروجی ترکیبی) | 2,097,152 توکن | 1,048,576 توکن | 16384 توکن | 32760 توکن | |||
محدودیت رمز خروجی * | 8192 توکن | 8192 توکن | 2048 توکن | 8192 توکن | |||
تاریخ قطع دانش | می 2024 | می 2024 | فوریه 2023 | فوریه 2023 | |||
فایل های PDF (در هر درخواست) | |||||||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3000 فایل | 16 فایل | --- | |||
حداکثر تعداد تعداد صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 1000 صفحه | 16 صفحه | --- | |||
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | |||
تصاویر (در هر درخواست) | |||||||
حداکثر تعداد از تصاویر ورودی | 3000 عکس | 3000 عکس | 16 تصویر | --- | |||
حداکثر تعداد از تصاویر خروجی | --- | --- | --- | --- | |||
حداکثر اندازه به ازای هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | |||
ویدئو (به ازای درخواست) | |||||||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | 10 فایل | 1 فایل | --- | |||
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب) | ~60 دقیقه | ~60 دقیقه | 2 دقیقه | --- | |||
حداکثر طول از تمام ویدیوهای ورودی (قاب + صدا) | ~45 دقیقه | ~45 دقیقه | --- | --- | |||
صوتی (به ازای درخواست) | |||||||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | 1 فایل | --- | --- | |||
حداکثر تعداد از فایل های صوتی خروجی | --- | --- | --- | --- | |||
حداکثر طول از تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | --- | --- | |||
حداکثر طول از تمام صدای خروجی | --- | --- | --- | --- |
* برای تمام مدل های جمینی ، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
نام مدل ها مقادیر صریحی هستند که در کد خود در هنگام شروع اولیه مدل وارد می کنید.
نام مدل های Gemini 1.5 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | آخرین نسخه پایدار Gemini 1.5 Pro | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | نسخه پایدار اولیه Gemini 1.5 Pro | بازنشستگی آینده | 24-05-2024 | 2025-05-24 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.5-pro | به آخرین نسخه پایدار 1.5 Pro اشاره می کند (در حال حاضر gemini-1.5-pro-002 ) | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
نام مدل های فلش Gemini 1.5
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | آخرین نسخه پایدار Gemini 1.5 Flash | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | نسخه پایدار اولیه Gemini 1.5 Flash | بازنشستگی آینده | 24-05-2024 | 2025-05-24 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.5-flash | به آخرین نسخه پایدار 1.5 Flash اشاره می کند (در حال حاضر gemini-1.5-flash-002 ) | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
نام مدل های Gemini 1.0 Pro Vision
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | آخرین نسخه پایدار Gemini 1.0 Pro Vision | بازنشسته | 15-02-2024 | 2025-04-21 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.0-pro-vision | به آخرین نسخه پایدار 1.5 Pro Vision اشاره می کند (در حال حاضر gemini-1.5-pro-vision-001 ) | بازنشسته | 04-01-2024 | 2025-04-21 |
نام مدل های Gemini 1.0 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | آخرین نسخه پایدار Gemini 1.0 Pro | بازنشسته | 09-04-2024 | 2025-04-21 |
gemini-1.0-pro-001 | نسخه پایدار Gemini 1.0 Pro | بازنشسته | 15-02-2024 | 2025-04-21 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.0-pro | به آخرین نسخه پایدار 1.0 Pro اشاره می کند (در حال حاضر gemini-1.0-pro-002 ) | بازنشسته | 15-02-2024 | 2025-04-21 |
مراحل بعدی
قابلیت های Gemini API را امتحان کنید
- مکالمات چند نوبتی (چت) بسازید.
- متن را از اعلانهای فقط متنی ایجاد کنید.
- با درخواست انواع فایلهای مختلف، مانند تصاویر ، فایلهای PDF ، ویدئو و صدا ، متن تولید کنید.
- خروجی ساختاریافته (مانند JSON) را هم از دستورات متنی و هم از چند وجهی ایجاد کنید.
- تصاویر را از دستورهای متنی ( جمینی یا Imagen ) تولید کنید.
- ورودی و خروجی (از جمله صدا) را با استفاده از Gemini Live API پخش کنید.
- از ابزارهایی (مانند فراخوانی عملکرد و اتصال زمین با جستجوی Google ) برای اتصال مدل Gemini به سایر بخشهای برنامه و سیستمها و اطلاعات خارجی خود استفاده کنید.
برای برنامههای موبایل و وب، Firebase AI Logic SDK به شما امکان میدهد با مدلهای پشتیبانیشده Gemini و مدلهای Imagen مستقیماً از برنامه خود تعامل داشته باشید.
مدلهای جمینی چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایلهای PDF، تصاویر، ویدئو و صدا هستند. از مدل های Imagen می توان با متن برای تولید تصاویر درخواست کرد.
جدول زیر مروری کوتاه بر مدل های پشتیبانی شده برای Firebase AI Logic و آخرین نام مدل های پایدار آنها است. این جدول همچنین مدلهای پیشنمایش و آزمایشی را که برای نمونهسازی موارد استفاده در دسترس هستند، فهرست میکند.
همچنین، سؤالات متداول ما را درباره همه مدلهایی که Firebase AI Logic پشتیبانی میکند و پشتیبانی نمیکند، مرور کنید.
مدل های جمینی
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
مدل های جمینی با نسخه های پایدار | |||
جمینی 2.5 پروgemini-2.5-pro | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | پیشرفته ترین مدل استدلال ما، قادر به حل مسائل پیچیده است. |
فلش جمینی 2.5gemini-2.5-flash | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | مدل تفکر ما که قابلیت های عالی و کاملی را ارائه می دهد. این برای ارائه تعادل بین قیمت و عملکرد طراحی شده است. |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | متعادلترین مدل Gemini ما، بهینهسازی شده برای موارد استفاده با تأخیر کم و برنامههای مقرون به صرفه. |
Gemini 2.5 Flash Imagegemini-2.5-flash-image | متن، کد، فایل های PDF، تصاویر | تصاویر، متن و تصاویر | مدل استاندارد فلش ما برای گردشهای کاری خلاقانه سریع با تولید تصویر و قابلیتهای ویرایش مکالمه و چند نوبتی ارتقا یافته است. (معروف به "نانو موز") |
فلش جمینی 2.0gemini-2.0-flash-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | مدل چندوجهی ما با ویژگیهای نسل بعدی و قابلیتهای بهبودیافته، از جمله سرعت برتر، استفاده از ابزار داخلی، و پنجره زمینه توکن 1M |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | سریع ترین و مقرون به صرفه ترین مدل فلش ما. این یک مسیر ارتقاء برای کاربران فلش 1.5 است که کیفیت بهتری با همان قیمت و سرعت می خواهند. |
مدلهای Gemini فقط با نسخههای پیشنمایش و آزمایشی (فقط برای نمونهسازی موارد استفاده توصیه میشود) | |||
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation | متن، کد، فایل های PDF، تصاویر | تصاویر، متن و تصاویر | مدل چند وجهی ما که از ورودی و خروجی تصویر چندوجهی پشتیبانی می کند. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | متن (استریم)، صوتی (استریم) | متن (استریم)، صوتی (استریم) | مدل چندوجهی ما که از جریان بیدرنگ با تأخیر کم ورودی ها و خروجی های چندوجهی پشتیبانی می کند. |
1 نام مدل های دیگر بسته به ارائه دهنده و دسترسی Gemini API انتخابی شما از Live API API پشتیبانی می کند (به صفحه Live API مراجعه کنید).
مدل های تصویری
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
مدل های Imagen با نسخه های پایدار | |||
تصویر 4imagen-4.0-generate-001 | متن | تصاویر | تصاویر واقعی و باکیفیت را از پیامهای متنی به زبان طبیعی ایجاد میکند |
Imagen 4 سریعimagen-4.0-fast-generate-001 | متن | تصاویر | تصاویر را برای نمونه سازی اولیه یا موارد استفاده با تأخیر کم تولید می کند |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | متن | تصاویر | تصاویر واقعی و باکیفیت را از پیامهای متنی به زبان طبیعی ایجاد میکند |
تصویر 3imagen-3.0-generate-002 | متن | تصاویر | تصاویر واقعی و باکیفیت را از پیامهای متنی به زبان طبیعی ایجاد میکند |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | متن | تصاویر | تصاویر را برای نمونه سازی اولیه یا موارد استفاده با تأخیر کم تولید می کند |
قابلیت Imagen 3 2imagen-3.0-capability-001 | متن، تصاویر | تصاویر | ویرایش و تولید تصاویر؛ از ویرایش مبتنی بر ماسک و سفارشی سازی با استفاده از تصاویر مرجع پشتیبانی می کند |
مدلهای Imagen فقط با نسخههای پیشنمایش و آزمایشی (فقط برای نمونهسازی موارد استفاده توصیه میشود) | |||
--- | --- | --- | --- |
2 بدون توجه به اینکه چگونه به آن دسترسی داشته باشید توسط Gemini Developer API پشتیبانی نمی شود.
در ادامه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Firebase AI Logic ارائه می شود.
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالایی از قابلیت های پشتیبانی شده
- مشخصات و محدودیتها، برای مثال حداکثر نشانههای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه نسخهسازی مدلها ، بهویژه نسخههای پایدار ، بهروزرسانی خودکار ، پیشنمایش و نسخههای آزمایشی آنها
لیستی از نام مدل های موجود برای گنجاندن در کد خود در هنگام شروع اولیه
لیست زبان های پشتیبانی شده برای مدل ها
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Firebase AI Logic توصیف می کند. هر مدل ممکن است قابلیتهای بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.
اگر نمی توانید اطلاعات مورد نظر خود را در بخش های فرعی زیر پیدا کنید، می توانید اطلاعات بیشتری را در اسناد ارائه دهنده API انتخابی خود بیابید:
Gemini Developer API : مدلهای Gemini و مدلهای Imagen
Vertex AI Gemini API : مدلهای Gemini و مدلهای Imagen
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
جوزا 2.5 Pro، Flash، Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (تولید) | تصویر (قابلیت) | |
---|---|---|---|---|---|---|---|---|
انواع ورودی | ||||||||
متن | ||||||||
متن (استریم) | ||||||||
کد | ||||||||
اسناد (PDF یا متن ساده) | ||||||||
تصاویر | ||||||||
ویدئو | ||||||||
صوتی | ||||||||
صوتی (استریم) | ||||||||
انواع خروجی | ||||||||
متن | ||||||||
متن (استریم) | ||||||||
کد | ||||||||
خروجی ساختاریافته (مانند JSON) | ||||||||
تصاویر | ||||||||
صوتی | ||||||||
صوتی (استریم) |
برای آشنایی با انواع فایل های پشتیبانی شده، فایل های ورودی پشتیبانی شده و الزامات را ببینید.
قابلیت ها و ویژگی های پشتیبانی شده
اینها قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
جوزا 2.5 Pro، Flash، Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (تولید) | تصویر (قابلیت) | |
---|---|---|---|---|---|---|---|---|
فکر کردن | ||||||||
متن را از ورودی های متنی یا چند وجهی تولید کنید | بهم پیوسته یا به عنوان بخشی از تصویر | بهم پیوسته یا به عنوان بخشی از تصویر | فقط جریان | |||||
تولید تصاویر ( جوزا یا ایمیجن ) | ||||||||
ویرایش تصاویر ( جوزا یا ایمیجن ) | ||||||||
تولید صدا | فقط جریان | |||||||
تولید خروجی ساختار یافته (مانند JSON) | ||||||||
اسناد را تجزیه و تحلیل کنید (PDF یا متن ساده) | ||||||||
تجزیه و تحلیل تصاویر (بینایی) | ||||||||
تجزیه و تحلیل ویدئو (دید) | ||||||||
آنالیز صدا | فقط جریان | |||||||
چت چند نوبتی | ||||||||
جریان چندوجهی دو طرفه | ||||||||
فراخوانی تابع | ||||||||
اجرای کد | ||||||||
زمینه سازی با جستجوی گوگل | ||||||||
دستورالعمل های سیستم | ||||||||
توکن ها را بشمار |
مشخصات و محدودیت ها
اینها مشخصات و محدودیتها هنگام استفاده از هر مدل با Firebase AI Logic هستند:
اموال | جوزا 2.5 Pro، Flash، Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (تولید) | تصویر (قابلیت) |
---|---|---|---|---|---|---|---|---|
پنجره زمینه * حد توکن کل (ورودی + خروجی ترکیبی) | 1,048,576 توکن | 32768 توکن | 1,048,576 توکن | 1,048,576 توکن | 32768 توکن | 32768 توکن | 480 توکن | 480 توکن |
محدودیت رمز خروجی * | 65536 توکن | 8192 توکن | 8192 توکن | 8192 توکن | 8192 توکن | 8192 توکن | --- | --- |
تاریخ قطع دانش | ژانویه 2025 | ژوئن 2025 | ژوئن 2024 | ژوئن 2024 | آگوست 2024 | آگوست 2024 | --- | --- |
فایل های PDF (در هر درخواست) | ||||||||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3 فایل | 3000 فایل | 3000 فایل | 3000 فایل | --- | --- | --- |
حداکثر تعداد از صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 3 صفحه | 1000 صفحه | 1000 صفحه | 1000 صفحه | --- | --- | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | --- | --- |
تصاویر (در هر درخواست) | ||||||||
حداکثر تعداد از تصاویر ورودی | 3000 عکس | 3 تصویر | 3000 عکس | 3000 عکس | 3000 عکس | --- | --- | 4 تصویر |
حداکثر تعداد از تصاویر خروجی | --- | 10 تصویر | --- | --- | 10 تصویر | --- | 4 تصویر | 4 تصویر |
حداکثر اندازه به ازای هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | --- | --- |
ویدئو (به ازای درخواست) | ||||||||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | --- | 10 فایل | 10 فایل | --- | --- | --- | --- |
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب) | ~60 دقیقه | --- | ~60 دقیقه | ~60 دقیقه | --- | --- | --- | --- |
حداکثر طول از تمام ویدیوهای ورودی (قاب + صدا) | ~45 دقیقه | --- | ~45 دقیقه | ~45 دقیقه | --- | --- | --- | --- |
صوتی (به ازای درخواست) | ||||||||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | --- | 1 فایل | 1 فایل | --- | --- | --- | --- |
حداکثر تعداد از فایل های صوتی خروجی | --- | --- | --- | --- | --- | --- | --- | --- |
حداکثر طول از تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت | --- | --- | --- | --- |
حداکثر طول از تمام صدای خروجی | --- | --- | --- | --- | --- | --- | --- | --- |
* برای تمام مدل های جمینی ، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
اطلاعات دقیق اضافی را بیابید
سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.
درباره انواع فایل های ورودی پشتیبانی شده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایل های ورودی و درخواست های چندوجهی شما الزامات را برآورده می کنند و بهترین روش ها را در فایل های ورودی و الزامات پشتیبانی شده دنبال می کنند، بیاموزید.
مدل سازی و الگوهای نامگذاری
مدل ها در نسخه های پایدار ، پیش نمایش و آزمایشی ارائه می شوند. برای راحتی، نام مستعار بدون مقادیر نسخه صریح پشتیبانی می شود.
برای یافتن نامهای مدل خاص برای استفاده در کد خود، بخش «نام مدلهای موجود» را در ادامه این صفحه ببینید.
نوع نسخه / مرحله انتشار | توضیحات | الگوی نام مدل | |
---|---|---|---|
پایدار | نسخه های پایدار برای استفاده از تولید از تاریخ انتشار در دسترس و پشتیبانی می شوند. یک نسخه مدل پایدار به طور معمول با تاریخ بازنشستگی منتشر می شود ، که نشان می دهد روز آخر مدل موجود است. پس از این تاریخ ، این مدل دیگر توسط Google قابل دسترسی یا پشتیبانی نیست. |
| |
نام مستعار پایدار به روز شده (فقط مدل های Gemini 2.0 ) | نام مستعار پایدار به روز شده همیشه به آخرین نسخه پایدار آن مدل اشاره می کند. اگر یک نسخه پایدار جدید منتشر شود ، نام مستعار به روز شده به طور خودکار شروع به اشاره به آن نسخه پایدار جدید می کند. | فقط مدل های جمینی 2.0 مثال: | |
پیش نمایش | نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و پایدار تلقی نمی شوند. این مدل ها برای استفاده از تولید توصیه نمی شوند ، با محدودیت نرخ محدود کننده تر و ممکن است نیاز به صورتحساب داشته باشند. برای Vertex AI Gemini API ، مدل های پیش نمایش منتشر شده پس از ژوئن سال 2025 معمولاً شما را ملزم به | نام مدل نسخه های پیش نمایش با آن ضمیمه شده است مثال: | |
تجربی | نسخه های آزمایشی قابلیت های جدیدی دارند و پایدار تلقی نمی شوند. این مدل ها برای استفاده از تولید توصیه نمی شوند و محدودیت های محدود کننده تری دارند. مدل های آزمایشی برای جمع آوری بازخورد و فعال کردن آزمایش با آخرین ویژگی های ما در نظر گرفته شده است. برای Vertex AI Gemini API ، مدل های آزمایشی منتشر شده پس از ژوئن سال 2025 شما را ملزم به تنظیم مکان این مدل در | نام مدل نسخه های تجربی با آن ضمیمه شده است مثال: | |
بازنشسته | نسخه های بازنشسته از تاریخ بازنشستگی آنها گذشته و به طور دائم غیرفعال شده اند. مدل های بازنشسته دیگر توسط Google قابل دسترسی یا پشتیبانی نیستند ، و درخواست مراجعه به شناسه مدل بازنشسته معمولاً خطای 404 را برمی گرداند. | --- |
نام های مدل موجود
نام های مدل مقادیر صریح است که شما در زمان اولیه سازی مدل در کد خود درج می کنید.
جمینی پرش به نام مدل های تصویر پرش به نام مدل های
از نظر برنامه ای همه مدل های موجود را لیست کنید
می توانید با استفاده از API REST ، تمام نام مدل های موجود را لیست کنید:
Gemini Developer API : با
models.list
Endpoint تماس بگیریدvertex ai gemini api : با
publishers.models.list
Endpoint
توجه داشته باشید که این لیست برگشتی شامل کلیه مدل های پشتیبانی شده توسط ارائه دهندگان API خواهد بود ، اما Firebase AI Logic فقط از مدل های جمینی و تصویربرداری که در این صفحه شرح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نام مستعار به روز شده (به عنوان مثال ، gemini-2.0-flash
) ذکر نشده است زیرا آنها یک نام مستعار برای مدل پایه هستند.
نام های مدل جمینی
برای نمونه های اولیه سازی برای سیستم عامل خود ، به راهنمای شروع کار مراجعه کنید.
برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده و صورتحساب) ، به الگوهای نسخه سازی و نامگذاری مدل مراجعه کنید.
نام های مدل Gemini 2.5 Pro
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-pro | نسخه پایدار Gemini 2.5 Pro | پایدار | 17-06-2025 | نه زودتر از 2026-06-17 |
نام مدل فلش جمینی 2.5
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash | نسخه پایدار فلش جمینی 2.5 | پایدار | 17-06-2025 | نه زودتر از 2026-06-17 |
نام های مدل فلش Gemini 2.5
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-lite | نسخه پایدار Gemini 2.5 Flash - Lite | پایدار | 22-07-2025 | نه زودتر از 2026-07-22 |
نام های مدل فلش Gemini 2.5 (نام مستعار "نانو موز")
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-image | نسخه پایدار برای Gemini 2.5 Flash Image (با نام "نانو موز") | پایدار | 02-10-2025 | 02-10-2026 |
gemini-2.5-flash-image-preview | نسخه پیش نمایش برای Gemini 2.5 Image Flash (با نام "Nano Banana") | پیش نمایش | 26-08-2025 | 2025-10-31 |
نام های مدل زنده Gemini 2.5 Flash Live
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-live-2.5-flash | نسخه پایدار برای Gemini 2.5 Flash Live | پایدار (GA خصوصی) 1 | 01-06-2025 | نه زودتر از 01-06-2026 |
gemini-live-2.5-flash-preview 2 | نسخه پیش نمایش برای Gemini 2.5 Flash Live | پیش نمایش | 01-06-2025 | تعیین شود |
توجه داشته باشید که در نام مدل 2.5 برای Live API ، بخش live
بلافاصله بخش gemini
را دنبال می کند.
منطق AI Firebase هنوز از مدلهای صوتی بومی پشتیبانی نمی کند (مانند gemini-2.5-flash-native-audio-preview-09-2025
).
1 برای درخواست دسترسی به نماینده تیم حساب Google Cloud خود دسترسی پیدا کنید.
2 مهم نیست که چگونه به آن دسترسی پیدا کنید.
نام مدل فلش جمینی 2.0
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-001 | آخرین نسخه پایدار فلش Gemini 2.0 | پایدار | 05-02-2025 | نه زودتر از 2026-02-05 |
gemini-2.0-flash | نام مستعار به روز شده خود به آخرین نسخه پایدار فلش Gemini 2.0 (در حال حاضر gemini-2.0-flash-001 ) | پایدار | 10-02-2025 | --- |
نام های مدل فلش Gemini 2.0
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | آخرین نسخه پایدار Gemini 2.0 Flash - Lite | پایدار | 2025-02-25 | نه زودتر از 2026-02-25 |
gemini-2.0-flash-lite | نام مستعار به روز شده خود به آخرین نسخه پایدار Gemini 2.0 Flash-Lite (در حال حاضر gemini-2.0-flash-lite-001 ) | پایدار | 2025-02-25 | --- |
نام مدل های تولید تصویر فلش جمینی 2.0
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | نسخه پیش نمایش برای تولید تصویر فلش جمینی 2.0 | پیش نمایش | 2025-05-06 | 2025-10-31 |
نام مدل های Flash Gemini 2.0 Flash Live
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | نسخه پایدار برای Gemini 2.0 Flash Live | پایدار | 01-04-2025 | نه زودتر از 01-04-2026 |
gemini-2.0-flash-live-preview-04-09 | نسخه پیش نمایش برای Gemini 2.0 Flash Live | پیش نمایش | 09-04-2025 | تعیین شود |
2 مهم نیست که چگونه به آن دسترسی پیدا کنید.
نام مدل های تصویر
برای نمونه های اولیه سازی برای پلت فرم خود ، تصاویر تولید را با راهنمای Imagen ببینید.
برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده و صورتحساب) ، به الگوهای نسخه سازی و نامگذاری مدل مراجعه کنید.
تصاویر 4 مدل
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-generate-001 | نسخه پایدار Imagen 4 | پایدار | 14-08-2025 | زودتر از 2026-08-14 |
imagen-4.0-generate-preview-06-06 | نسخه پیش نمایش Imagen 4 | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 4 نام مدل سریع
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | نسخه پایدار Imagen 4 سریع | پایدار | 14-08-2025 | زودتر از 2026-08-14 |
imagen-4.0-fast-generate-preview-06-06 3 | نسخه پیش نمایش Imagen 4 سریع (به زودی بازنشسته می شود - استفاده نکنید) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 4 نام مدل فوق العاده
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | نسخه پایدار Imagen 4 Ultra | پایدار | 14-08-2025 | زودتر از 2026-08-14 |
imagen-4.0-ultra-generate-preview-06-06 | نسخه پیش نمایش Imagen 4 Ultra (به زودی بازنشسته می شود - استفاده نکنید) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
تصویر 3 مدل مدل
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-generate-002 | آخرین نسخه پایدار Imagen 3 | پایدار | 2025-01-23 | زودتر از 2026-01-23 |
imagen-3.0-generate-001 3 | نسخه پایدار اولیه Imagen 3 | پایدار | 2024-07-31 | زودتر از 2025-07-31 |
3 نام مدل سریع Imagen
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | نسخه پایدار اولیه Imagen 3 Fast | پایدار | 2024-07-31 | زودتر از 2025-07-31 |
3 بدون توجه به دسترسی به آن توسط توسعه دهنده Gemini API پشتیبانی نمی شود.
Imagen 3 نام مدل توانایی
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-capability-001 3 | نسخه پایدار اولیه قابلیت Imagen 3 | پایدار | 2024-12-10 | زودتر از 2025-12-10 |
3 بدون توجه به دسترسی به آن توسط توسعه دهنده Gemini API پشتیبانی نمی شود.
زبان های پشتیبانی شده
جوزا
تمام مدلهای جمینی می توانند به زبانهای زیر درک و پاسخ دهند:
عربی (AR) ، بنگالی (BN) ، بلغاری (BG) ، چینی ساده و سنتی (Zh) ، کرواسی (HR) ، چک (CS) ، دانمارکی (DA) ، هلندی (NL) ، انگلیسی (en) ، استونی (ET) ، فنلاندی (فی) ، فرانسوی (FR) ، آلمانی (de) ، HiNing (De) ، یورو (ال) ، یورو (ال) ، . (PL) ، پرتغالی (PT) ، رومانیایی (RO) ، روسی (RU) ، صربستان (SR) ، اسلواکی (SK) ، اسلوونی (SL) ، اسپانیایی (ES) ، Swahili (SW) ، سوئدی (SV) ، تایلندی (TH) ، ترکیه (TR) ، UKRAINIAN (UK) ، VI)
Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 مدل های فلش می توانند به زبان های اضافی زیر درک و پاسخ دهند:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino . (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (KY) ، لاتین (LA) ، Luxembourgish (LB) ، Lao (LO) ، Malagasy (MG) ، Maori (MI) ، مقدونی (MK) ، مالاییایی (ML) ، مغول ها (MN) ، Meiteilon (Manipuri) (Mni-Mtei) ، Marathi (MR) ، Malay (MS) ، Maltese (MT) ، Mymanmar (Burmese) (My) ، Nepali (NE) ، Nyanja (Chichewa) ، Sindi (ny) ، Odia (oriyya) (oriya) (or) ، panjabi (or) ، panjabi (or) ، panjabi (or) ، panjabi (or) ، panjabi (or) ، panjabi (or) ، panjabi (or) ، panjabt سینا (سینالی) (سی) ، ساموآن (SM) ، شونا (SN) ، سومالی (SO) ، آلبانیایی (SQ) ، Sesotho (St) ، Sundanese (Su) ، تامیل (Ta) ، telugu (te) ، tajik (tg) ، uyghur (ug) ، urdu (ur) ، uzbek (uz) ، xhosa (xh) ، yoruba (yoriba) ، yoriba (yddish (yi).
Imagen
در دسترس بودن عمومی : انگلیسی
پیش نمایش : چینی (ساده) ، چینی (سنتی) ، هندی ، ژاپنی ، کره ای ، پرتغالی ، اسپانیایی
اطلاعات مربوط به مدل های قدیمی تر
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
این انواع ورودی و خروجی هنگام استفاده از هر مدل با منطق AI Firebase :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | جمینی 1.0 طرفدار | ||||
---|---|---|---|---|---|---|---|
انواع ورودی | |||||||
متن | |||||||
کد | |||||||
اسناد (PDFS یا متن ساده) | |||||||
تصاویر | |||||||
ویدئو | |||||||
صوتی | |||||||
صوتی (جریان) | |||||||
انواع خروجی | |||||||
متن | |||||||
کد | |||||||
خروجی ساختاریافته (مثل JSON) | |||||||
تصاویر ، فیلم و صدا |
این قابلیت ها و ویژگی ها هنگام استفاده از هر مدل با منطق AI Firebase است:
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | جمینی 1.0 طرفدار | |
---|---|---|---|---|
متن را از ورودی فقط متن ایجاد کنید | ||||
متن را از ورودی چندمودال تولید کنید | ||||
تولید تصاویر | ||||
تولید صدا | ||||
تولید ساختاری (مثل JSON) | ||||
اسناد را تجزیه و تحلیل کنید (PDFS یا متن ساده) | ||||
تجزیه و تحلیل تصاویر (دید) | ||||
تجزیه و تحلیل فیلم (چشم انداز) | ||||
آنالیز صدا | ||||
چت چند نوبت | ||||
فراخوانی عملکرد (ابزار) | ||||
توکن ها و شخصیت های قابل پرداخت را بشمارید | ||||
دستورالعمل های سیستم | ||||
جریان چند جانبه دو طرفه |
این مشخصات و محدودیت ها هنگام استفاده از هر مدل با منطق AI Firebase است:
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | جمینی 1.0 طرفدار | ||||
---|---|---|---|---|---|---|---|
پنجره متن * حد مجاز توکن (ورودی ترکیبی+خروجی) | 2،097،152 توکن | 1،048،576 نشانه | 16،384 نشانه | 32،760 نشانه | |||
محدودیت توکن خروجی * | 8،192 نشانه | 8،192 نشانه | 2،048 نشانه | 8،192 نشانه | |||
تاریخ قطع دانش | می 2024 | می 2024 | فوریه 2023 | فوریه 2023 | |||
pdfs (در هر درخواست) | |||||||
حداکثر تعداد از پرونده های PDF ورودی ** | 3000 پرونده | 3000 پرونده | 16 پرونده | --- | |||
حداکثر تعداد از صفحات در هر پرونده PDF ورودی ** | 1000 صفحه | 1000 صفحه | 16 صفحه | --- | |||
حداکثر اندازه در هر پرونده PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | |||
تصاویر (در هر درخواست) | |||||||
حداکثر تعداد تصاویر ورودی | 3000 تصویر | 3000 تصویر | 16 تصویر | --- | |||
حداکثر تعداد تصاویر خروجی | --- | --- | --- | --- | |||
حداکثر اندازه در هر ورودی پایه 64 رمزگذاری شده | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | |||
ویدئو (در هر درخواست) | |||||||
حداکثر تعداد از پرونده های ویدیویی ورودی | 10 پرونده | 10 پرونده | 1 فایل | --- | |||
حداکثر طول از همه ویدیوی ورودی (فقط فریم) | 60 دقیقه | 60 دقیقه | 2 دقیقه | --- | |||
حداکثر طول از همه ویدیوی ورودی (فریم+صوتی) | ~45 دقیقه | ~45 دقیقه | --- | --- | |||
صوتی (در هر درخواست) | |||||||
حداکثر تعداد از پرونده های صوتی ورودی | 1 فایل | 1 فایل | --- | --- | |||
حداکثر تعداد از پرونده های صوتی خروجی | --- | --- | --- | --- | |||
حداکثر طول از همه صوتی ورودی | 8.4 ساعت | 8.4 ساعت | --- | --- | |||
حداکثر طول از همه صوتی خروجی | --- | --- | --- | --- |
* برای همه مدل های جمینی ، یک نشانه معادل 4 کاراکتر است ، بنابراین 100 نشانه حدود 60-80 کلمه انگلیسی است. برای مدل های جمینی ، می توانید تعداد کل نشانه ها را در درخواست های خود با استفاده از countTokens
تعیین کنید.
** PDF ها به عنوان تصاویر رفتار می شوند ، بنابراین یک صفحه واحد از PDF به عنوان یک تصویر رفتار می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند از آن پشتیبانی کند.
نام های مدل مقادیر صریح است که شما در زمان اولیه سازی مدل در کد خود درج می کنید.
نام های مدل Gemini 1.5 Pro
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | آخرین نسخه پایدار Gemini 1.5 Pro | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | نسخه پایدار اولیه Gemini 1.5 Pro | بازنشستگی آینده | 24-05-2024 | 2025-05-24 |
نام مستعار پایدار به روز شده | ||||
gemini-1.5-pro | به آخرین نسخه پایدار 1.5 Pro اشاره می کند (در حال حاضر gemini-1.5-pro-002 ) | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
نام مدل فلش جمینی 1.5
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | آخرین نسخه پایدار از فلش Gemini 1.5 | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | نسخه پایدار اولیه فلش Gemini 1.5 | بازنشستگی آینده | 24-05-2024 | 2025-05-24 |
نام مستعار پایدار به روز شده | ||||
gemini-1.5-flash | به آخرین نسخه پایدار 1.5 فلش اشاره می کند (در حال حاضر gemini-1.5-flash-002 ) | بازنشستگی آینده | 2024-09-24 | 2025-09-24 |
نام های مدل Vision Gemini 1.0 Pro
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | آخرین نسخه پایدار Gemini 1.0 Pro Vision | بازنشسته | 15-02-2024 | 2025-04-21 |
نام مستعار پایدار به روز شده | ||||
gemini-1.0-pro-vision | به آخرین نسخه پایدار 1.5 Pro Vision اشاره می کند (در حال حاضر gemini-1.5-pro-vision-001 ) | بازنشسته | 04-01-2024 | 2025-04-21 |
نام های مدل Gemini 1.0 Pro
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | آخرین نسخه پایدار Gemini 1.0 Pro | بازنشسته | 09-04-2024 | 2025-04-21 |
gemini-1.0-pro-001 | نسخه پایدار Gemini 1.0 Pro | بازنشسته | 15-02-2024 | 2025-04-21 |
نام مستعار پایدار به روز شده | ||||
gemini-1.0-pro | به آخرین نسخه پایدار 1.0 Pro اشاره می کند (در حال حاضر gemini-1.0-pro-002 ) | بازنشسته | 15-02-2024 | 2025-04-21 |
مراحل بعدی
قابلیت های API Gemini را امتحان کنید
- مکالمه های چند چرخش (گپ) بسازید.
- متن را از طریق متن فقط متن ایجاد کنید.
- با درخواست با انواع مختلف فایل مانند تصاویر ، PDF ، فیلم و صدا ، متن را ایجاد کنید.
- خروجی ساختاری (مانند JSON) را از هر دو متن و مولتی حالت تولید کنید.
- تصاویر را از متن متن ( جمینی یا تصویر ) ایجاد کنید.
- ورودی و خروجی جریان (از جمله صدا) با استفاده از Gemini Live API .
- برای اتصال یک مدل جمینی به سایر قسمت های برنامه و سیستم ها و اطلاعات خارجی از ابزارها (مانند تماس با عملکرد و زمین با Google Search ) استفاده کنید.
برای برنامه های موبایل و وب ، SDK های Logic Firebase AI به شما امکان می دهد با مدل های GEMINI پشتیبانی شده و مدل های Imagen مستقیماً از برنامه خود ارتباط برقرار کنید.
مدل های جمینی چند حالته در نظر گرفته می شوند زیرا قادر به پردازش و حتی تولید چندین روش از جمله متن ، کد ، PDF ، تصاویر ، فیلم و صدا هستند. برای تولید تصاویر می توان از مدل های Imagen با متن استفاده کرد.
در جدول زیر ، مختصری از مدل های پشتیبانی شده برای منطق AI Firebase AI و آخرین نام مدل های پایدار آنها است. در این جدول همچنین مدل های پیش نمایش و آزمایشی که برای موارد استفاده از نمونه سازی موجود است ، لیست شده است.
همچنین ، سؤالات متداول ما را در مورد تمام مدلهایی که منطق AI Firebase از آن پشتیبانی می کند و پشتیبانی نمی کند ، مرور کنید.
مدل های جمینی
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
مدل های جمینی با نسخه های پایدار | |||
جمینی 2.5 پروgemini-2.5-pro | متن ، کد ، pdfs ، تصاویر ، فیلم ، صوتی | متن ، کد ، JSON | پیشرفته ترین مدل استدلال ما ، قادر به حل مشکلات پیچیده است. |
فلش جمینی 2.5gemini-2.5-flash | متن ، کد ، pdfs ، تصاویر ، فیلم ، صوتی | متن ، کد ، JSON | مدل تفکر ما که قابلیت های عالی و خوبی را ارائه می دهد. این طراحی شده است تا تعادل بین قیمت و عملکرد را ارائه دهد. |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | متن ، کد ، pdfs ، تصاویر ، فیلم ، صوتی | متن ، کد ، JSON | متعادل ترین مدل جمینی ما ، بهینه شده برای موارد استفاده کم و با تأخیر و برنامه های آگاهی از هزینه. |
Gemini 2.5 Flash Imagegemini-2.5-flash-image | متن ، کد ، pdfs ، تصاویر | تصاویر ، متن و تصاویر | مدل فلش استاندارد ما برای گردش کار خلاقانه سریع با تولید تصویر و قابلیت ویرایش مکالمه ، چند چرخش ارتقا یافته است. (با نام "نانو موز") |
فلش جمینی 2.0gemini-2.0-flash-001 | متن ، کد ، pdfs ، تصاویر ، فیلم ، صوتی | متن ، کد ، JSON | مدل چندمادی ما با ویژگی های نسل بعدی و قابلیت های بهبود یافته ، از جمله سرعت برتر ، استفاده از ابزار داخلی و یک پنجره زمینه 1M Token |
Gemini 2.0 Flash - Litegemini-2.0-flash-lite-001 | متن ، کد ، pdfs ، تصاویر ، فیلم ، صوتی | متن ، کد ، JSON | سریعترین و مقرون به صرفه ترین مدل فلش ما. این یک مسیر ارتقاء برای 1.5 کاربران فلش است که با همان قیمت و سرعت کیفیت بهتری می خواهند. |
مدل های جمینی فقط با نسخه های پیش نمایش و تجربی (فقط برای موارد استفاده از نمونه های اولیه توصیه می شود) | |||
GEMINI 2.0 تولید تصویر فلشgemini-2.0-flash-preview-image-generation | متن ، کد ، pdfs ، تصاویر | تصاویر ، متن و تصاویر | مدل چندمادی ما که از ورودی و خروجی چند حالته پشتیبانی می کند. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | متن (جریان) ، صوتی (جریان) | متن (جریان) ، صوتی (جریان) | مدل چند مدلی ما که از جریان کم تحرک کم در زمان واقعی ورودی ها و خروجی های چند مدلی پشتیبانی می کند. |
1 نام مدل اضافی بسته به ارائه دهنده و دسترسی انتخابی Gemini API خود از Live API پشتیبانی می کند (به صفحه Live API مراجعه کنید).
مدل های تصویری
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
مدل های تصویر با نسخه های پایدار | |||
تصویر 4imagen-4.0-generate-001 | متن | تصاویر | تصاویر واقع بینانه و با کیفیت را از متن های متن طبیعی ایجاد می کند |
تصور کنید 4 سریعimagen-4.0-fast-generate-001 | متن | تصاویر | برای نمونه های نمونه سازی یا استفاده از کمبود ، تصاویر ایجاد می کند |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | متن | تصاویر | تصاویر واقع بینانه و با کیفیت را از متن های متن طبیعی ایجاد می کند |
تصویر 3imagen-3.0-generate-002 | متن | تصاویر | تصاویر واقع بینانه و با کیفیت را از متن های متن طبیعی ایجاد می کند |
تصور کنید 3 سریع 2imagen-3.0-fast-generate-001 | متن | تصاویر | برای نمونه های نمونه سازی یا استفاده از کمبود ، تصاویر ایجاد می کند |
Imagen 3 توانایی 2imagen-3.0-capability-001 | متن ، تصاویر | تصاویر | ویرایش و تولید تصاویر ؛ با استفاده از تصاویر مرجع از ویرایش و سفارشی سازی مبتنی بر ماسک پشتیبانی می کند |
مدل های Imagen فقط با نسخه های پیش نمایش و تجربی (فقط برای موارد استفاده از نمونه های اولیه توصیه می شود) | |||
--- | --- | --- | --- |
2 مهم نیست که چگونه به آن دسترسی پیدا کنید.
باقیمانده این صفحه اطلاعات مفصلی در مورد مدل های پشتیبانی شده توسط منطق AI Firebase ارائه می دهد.
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالا از قابلیت های پشتیبانی شده
- مشخصات و محدودیت ها ، به عنوان مثال حداکثر نشانه های ورودی یا حداکثر طول ویدیوی ورودی
توضیحات نحوه نسخه سازی مدل ها ، به طور خاص نسخه های پایدار ، به روز شده ، پیش نمایش و تجربی آنها
لیست نام های مدل موجود در هنگام اولیه سازی در کد شما گنجانده شده است
لیست زبانهای پشتیبانی شده برای مدل ها
در پایین این صفحه ، می توانید اطلاعات دقیق در مورد مدلهای قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل برای پشتیبانی از موارد مختلف استفاده از قابلیت های متفاوتی برخوردار است. توجه داشته باشید که هر یک از جداول موجود در این بخش ، هر مدل را هنگام استفاده از منطق AI Firebase شرح می دهد. هر مدل ممکن است قابلیت های دیگری داشته باشد که هنگام استفاده از SDK های ما در دسترس نیست.
اگر نمی توانید اطلاعات مورد نظر خود را در بخش های زیر پیدا کنید ، می توانید اطلاعات بیشتری را در مستندات ارائه دهنده API انتخاب شده خود پیدا کنید:
توسعه دهنده Gemini API : مدل های جمینی و مدل های تصویربرداری
vertex ai gemini api : مدل های جمینی و مدل های تصویربرداری
ورودی و خروجی پشتیبانی شده
این انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با منطق AI Firebase :
جوزا 2.5 حرفه ای ، فلش ، فلش | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 فلش- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 فلش- زندگی کنید | Imagen (تولید) | Imagen (قابلیت) | |
---|---|---|---|---|---|---|---|---|
انواع ورودی | ||||||||
متن | ||||||||
متن (جریان) | ||||||||
کد | ||||||||
اسناد (PDFS یا متن ساده) | ||||||||
تصاویر | ||||||||
ویدئو | ||||||||
صوتی | ||||||||
صوتی (جریان) | ||||||||
انواع خروجی | ||||||||
متن | ||||||||
متن (جریان) | ||||||||
کد | ||||||||
خروجی ساختاریافته (مثل JSON) | ||||||||
تصاویر | ||||||||
صوتی | ||||||||
صوتی (جریان) |
برای کسب اطلاعات در مورد انواع فایل های پشتیبانی شده ، به پرونده های ورودی پشتیبانی شده و الزامات مراجعه کنید.
قابلیت ها و ویژگی های پشتیبانی شده
این قابلیت ها و ویژگی های پشتیبانی شده هنگام استفاده از هر مدل با منطق AI Firebase :
جوزا 2.5 حرفه ای ، فلش ، فلش | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 فلش- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 فلش- زندگی کنید | Imagen (تولید) | Imagen (قابلیت) | |
---|---|---|---|---|---|---|---|---|
فکر کردن | ||||||||
متن را از ورودی های فقط متن یا چند حالته ایجاد کنید | در هم تنیده یا به عنوان بخشی از تصویر | در هم تنیده یا به عنوان بخشی از تصویر | فقط جریان | |||||
تولید تصاویر ( جمینی یا تصویر ) | ||||||||
ویرایش تصاویر ( جمینی یا تصویر ) | ||||||||
تولید صدا | فقط جریان | |||||||
تولید ساختاری (مثل JSON) | ||||||||
اسناد را تجزیه و تحلیل کنید (PDFS یا متن ساده) | ||||||||
تجزیه و تحلیل تصاویر (دید) | ||||||||
تجزیه و تحلیل فیلم (چشم انداز) | ||||||||
آنالیز صدا | فقط جریان | |||||||
چت چند نوبت | ||||||||
جریان چند جانبه دو طرفه | ||||||||
فراخوانی تابع | ||||||||
اجرای کد | ||||||||
زمینه سازی با جستجوی گوگل | ||||||||
دستورالعمل های سیستم | ||||||||
توکن ها را بشمار |
مشخصات و محدودیت ها
این مشخصات و محدودیت ها هنگام استفاده از هر مدل با منطق AI Firebase است:
اموال | جوزا 2.5 حرفه ای ، فلش ، فلش | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 فلش- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 فلش- زندگی کنید | Imagen (تولید) | Imagen (قابلیت) |
---|---|---|---|---|---|---|---|---|
پنجره متن * حد مجاز توکن (ورودی ترکیبی+خروجی) | 1،048،576 نشانه | 32،768 نشانه | 1،048،576 نشانه | 1،048،576 نشانه | 32،768 نشانه | 32،768 نشانه | 480 نشانه | 480 نشانه |
محدودیت توکن خروجی * | 65،536 نشانه | 8،192 نشانه | 8،192 نشانه | 8،192 نشانه | 8،192 نشانه | 8،192 نشانه | --- | --- |
تاریخ قطع دانش | ژانویه 2025 | ژوئن 2025 | ژوئن 2024 | ژوئن 2024 | آگوست 2024 | آگوست 2024 | --- | --- |
pdfs (در هر درخواست) | ||||||||
حداکثر تعداد از پرونده های PDF ورودی ** | 3000 پرونده | 3 پرونده | 3000 پرونده | 3000 پرونده | 3000 پرونده | --- | --- | --- |
حداکثر تعداد از صفحات در هر ورودی پرونده PDF ** | 1000 صفحه | 3 صفحه | 1000 صفحه | 1000 صفحه | 1000 صفحه | --- | --- | --- |
حداکثر اندازه در هر پرونده PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | --- | --- |
تصاویر (در هر درخواست) | ||||||||
حداکثر تعداد تصاویر ورودی | 3000 تصویر | 3 تصویر | 3000 تصویر | 3000 تصویر | 3000 تصویر | --- | --- | 4 تصویر |
حداکثر تعداد تصاویر خروجی | --- | 10 تصویر | --- | --- | 10 تصویر | --- | 4 تصویر | 4 تصویر |
حداکثر اندازه در هر ورودی پایه 64 رمزگذاری شده | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | --- | --- |
ویدئو (در هر درخواست) | ||||||||
حداکثر تعداد از پرونده های ویدیویی ورودی | 10 پرونده | --- | 10 پرونده | 10 پرونده | --- | --- | --- | --- |
حداکثر طول از همه ویدیوی ورودی (فقط فریم) | 60 دقیقه | --- | 60 دقیقه | 60 دقیقه | --- | --- | --- | --- |
حداکثر طول از همه ویدیوی ورودی (فریم+صوتی) | ~45 دقیقه | --- | ~45 دقیقه | ~45 دقیقه | --- | --- | --- | --- |
صوتی (در هر درخواست) | ||||||||
حداکثر تعداد از پرونده های صوتی ورودی | 1 فایل | --- | 1 فایل | 1 فایل | --- | --- | --- | --- |
حداکثر تعداد از پرونده های صوتی خروجی | --- | --- | --- | --- | --- | --- | --- | --- |
حداکثر طول از همه صوتی ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت | --- | --- | --- | --- |
حداکثر طول از همه صوتی خروجی | --- | --- | --- | --- | --- | --- | --- | --- |
* برای همه مدل های جمینی ، یک نشانه معادل 4 کاراکتر است ، بنابراین 100 نشانه حدود 60-80 کلمه انگلیسی است. برای مدل های جمینی ، می توانید تعداد کل نشانه ها را در درخواست های خود با استفاده از countTokens
تعیین کنید.
** PDF ها به عنوان تصاویر رفتار می شوند ، بنابراین یک صفحه واحد از PDF به عنوان یک تصویر رفتار می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند از آن پشتیبانی کند.
اطلاعات مفصل اضافی را پیدا کنید
سهمیه و قیمت گذاری برای هر مدل متفاوت است. قیمت گذاری همچنین به ورودی و خروجی بستگی دارد.
در مورد انواع فایل ورودی پشتیبانی شده ، نحوه مشخص کردن نوع MIME ، و چگونگی اطمینان از اینکه پرونده های ورودی و درخواست های چند حالته شما الزامات را برآورده می کنند و بهترین روش ها را در پرونده های ورودی پشتیبانی شده و الزامات دنبال می کنند ، بیاموزید.
مدل سازی مدل و الگوهای نامگذاری
مدل ها در نسخه های پایدار ، پیش نمایش و تجربی ارائه می شوند. برای راحتی ، نام مستعار بدون مقادیر نسخه صریح پشتیبانی می شود.
برای یافتن نام های مدل خاص برای استفاده در کد خود ، بعداً در این صفحه به بخش "نام مدل موجود" مراجعه کنید.
نوع نسخه / مرحله آزاد کردن | توضیحات | الگوی نام | |
---|---|---|---|
پایدار | نسخه های پایدار برای استفاده از تولید از تاریخ انتشار در دسترس و پشتیبانی می شوند. یک نسخه مدل پایدار به طور معمول با تاریخ بازنشستگی منتشر می شود ، که نشان می دهد روز آخر مدل موجود است. پس از این تاریخ ، این مدل دیگر توسط Google قابل دسترسی یا پشتیبانی نیست. |
| |
نام مستعار پایدار به روز شده (فقط مدل های Gemini 2.0 ) | نام مستعار پایدار به روز شده همیشه به آخرین نسخه پایدار آن مدل اشاره می کند. اگر یک نسخه پایدار جدید منتشر شود ، نام مستعار به روز شده به طور خودکار شروع به اشاره به آن نسخه پایدار جدید می کند. | فقط مدل های جمینی 2.0 مثال: | |
پیش نمایش | نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و پایدار تلقی نمی شوند. این مدل ها برای استفاده از تولید توصیه نمی شوند ، با محدودیت نرخ محدود کننده تر و ممکن است نیاز به صورتحساب داشته باشند. برای Vertex AI Gemini API ، مدل های پیش نمایش منتشر شده پس از ژوئن سال 2025 معمولاً شما را ملزم به | نام مدل نسخه های پیش نمایش با آن ضمیمه شده است مثال: | |
تجربی | نسخه های آزمایشی قابلیت های جدیدی دارند و پایدار تلقی نمی شوند. این مدل ها برای استفاده از تولید توصیه نمی شوند و محدودیت های محدود کننده تری دارند. مدل های آزمایشی برای جمع آوری بازخورد و فعال کردن آزمایش با آخرین ویژگی های ما در نظر گرفته شده است. برای Vertex AI Gemini API ، مدل های آزمایشی منتشر شده پس از ژوئن سال 2025 شما را ملزم به تنظیم مکان این مدل در | نام مدل نسخه های تجربی با آن ضمیمه شده است مثال: | |
بازنشسته | نسخه های بازنشسته از تاریخ بازنشستگی آنها گذشته و به طور دائم غیرفعال شده اند. مدل های بازنشسته دیگر توسط Google قابل دسترسی یا پشتیبانی نیستند ، و درخواست مراجعه به شناسه مدل بازنشسته معمولاً خطای 404 را برمی گرداند. | --- |
نام های مدل موجود
نام های مدل مقادیر صریح است که شما در زمان اولیه سازی مدل در کد خود درج می کنید.
جمینی پرش به نام مدل های تصویر پرش به نام مدل های
از نظر برنامه ای همه مدل های موجود را لیست کنید
می توانید با استفاده از API REST ، تمام نام مدل های موجود را لیست کنید:
Gemini Developer API : با
models.list
Endpoint تماس بگیریدvertex ai gemini api : با
publishers.models.list
Endpoint
توجه داشته باشید که این لیست برگشتی شامل کلیه مدل های پشتیبانی شده توسط ارائه دهندگان API خواهد بود ، اما Firebase AI Logic فقط از مدل های جمینی و تصویربرداری که در این صفحه شرح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نام مستعار به روز شده (به عنوان مثال ، gemini-2.0-flash
) ذکر نشده است زیرا آنها یک نام مستعار برای مدل پایه هستند.
نام های مدل جمینی
برای نمونه های اولیه سازی برای سیستم عامل خود ، به راهنمای شروع کار مراجعه کنید.
برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده و صورتحساب) ، به الگوهای نسخه سازی و نامگذاری مدل مراجعه کنید.
نام های مدل Gemini 2.5 Pro
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-pro | نسخه پایدار Gemini 2.5 Pro | پایدار | 17-06-2025 | نه زودتر از 2026-06-17 |
نام مدل فلش جمینی 2.5
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash | نسخه پایدار فلش جمینی 2.5 | پایدار | 17-06-2025 | نه زودتر از 2026-06-17 |
نام های مدل فلش Gemini 2.5
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-lite | نسخه پایدار Gemini 2.5 Flash - Lite | پایدار | 22-07-2025 | نه زودتر از 2026-07-22 |
نام های مدل فلش Gemini 2.5 (نام مستعار "نانو موز")
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-image | نسخه پایدار برای Gemini 2.5 Flash Image (با نام "نانو موز") | پایدار | 02-10-2025 | 02-10-2026 |
gemini-2.5-flash-image-preview | نسخه پیش نمایش برای Gemini 2.5 Image Flash (با نام "Nano Banana") | پیش نمایش | 26-08-2025 | 2025-10-31 |
نام های مدل زنده Gemini 2.5 Flash Live
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-live-2.5-flash | نسخه پایدار برای Gemini 2.5 Flash Live | پایدار (GA خصوصی) 1 | 01-06-2025 | نه زودتر از 01-06-2026 |
gemini-live-2.5-flash-preview 2 | نسخه پیش نمایش برای Gemini 2.5 Flash Live | پیش نمایش | 01-06-2025 | تعیین شود |
توجه داشته باشید که در نام مدل 2.5 برای Live API ، بخش live
بلافاصله بخش gemini
را دنبال می کند.
منطق AI Firebase هنوز از مدلهای صوتی بومی پشتیبانی نمی کند (مانند gemini-2.5-flash-native-audio-preview-09-2025
).
1 برای درخواست دسترسی به نماینده تیم حساب Google Cloud خود دسترسی پیدا کنید.
2 مهم نیست که چگونه به آن دسترسی پیدا کنید.
نام مدل فلش جمینی 2.0
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-001 | آخرین نسخه پایدار فلش Gemini 2.0 | پایدار | 05-02-2025 | نه زودتر از 2026-02-05 |
gemini-2.0-flash | نام مستعار به روز شده خود به آخرین نسخه پایدار فلش Gemini 2.0 (در حال حاضر gemini-2.0-flash-001 ) | پایدار | 10-02-2025 | --- |
نام های مدل فلش Gemini 2.0
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | آخرین نسخه پایدار Gemini 2.0 Flash - Lite | پایدار | 2025-02-25 | نه زودتر از 2026-02-25 |
gemini-2.0-flash-lite | نام مستعار به روز شده خود به آخرین نسخه پایدار Gemini 2.0 Flash-Lite (در حال حاضر gemini-2.0-flash-lite-001 ) | پایدار | 2025-02-25 | --- |
نام مدل های تولید تصویر فلش جمینی 2.0
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | نسخه پیش نمایش برای تولید تصویر فلش جمینی 2.0 | پیش نمایش | 2025-05-06 | 2025-10-31 |
نام مدل های Flash Gemini 2.0 Flash Live
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | نسخه پایدار برای Gemini 2.0 Flash Live | پایدار | 01-04-2025 | نه زودتر از 01-04-2026 |
gemini-2.0-flash-live-preview-04-09 | نسخه پیش نمایش برای Gemini 2.0 Flash Live | پیش نمایش | 09-04-2025 | تعیین شود |
2 مهم نیست که چگونه به آن دسترسی پیدا کنید.
نام مدل های تصویر
برای نمونه های اولیه سازی برای پلت فرم خود ، تصاویر تولید را با راهنمای Imagen ببینید.
برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده و صورتحساب) ، به الگوهای نسخه سازی و نامگذاری مدل مراجعه کنید.
تصاویر 4 مدل
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-generate-001 | نسخه پایدار Imagen 4 | پایدار | 14-08-2025 | زودتر از 2026-08-14 |
imagen-4.0-generate-preview-06-06 | نسخه پیش نمایش Imagen 4 | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 4 نام مدل سریع
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | نسخه پایدار Imagen 4 سریع | پایدار | 14-08-2025 | زودتر از 2026-08-14 |
imagen-4.0-fast-generate-preview-06-06 3 | نسخه پیش نمایش Imagen 4 سریع (به زودی بازنشسته می شود - استفاده نکنید) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 4 نام مدل فوق العاده
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | نسخه پایدار Imagen 4 Ultra | پایدار | 14-08-2025 | زودتر از 2026-08-14 |
imagen-4.0-ultra-generate-preview-06-06 | نسخه پیش نمایش Imagen 4 Ultra (به زودی بازنشسته می شود - استفاده نکنید) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
تصویر 3 مدل مدل
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-generate-002 | آخرین نسخه پایدار Imagen 3 | پایدار | 2025-01-23 | زودتر از 2026-01-23 |
imagen-3.0-generate-001 3 | نسخه پایدار اولیه Imagen 3 | پایدار | 2024-07-31 | زودتر از 2025-07-31 |
3 نام مدل سریع Imagen
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | نسخه پایدار اولیه Imagen 3 Fast | پایدار | 2024-07-31 | زودتر از 2025-07-31 |
3 بدون توجه به دسترسی به آن توسط توسعه دهنده Gemini API پشتیبانی نمی شود.
Imagen 3 نام مدل توانایی
نام مدل | توضیحات | مرحله آزاد کردن | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-capability-001 3 | نسخه پایدار اولیه قابلیت Imagen 3 | پایدار | 2024-12-10 | زودتر از 2025-12-10 |
3 بدون توجه به دسترسی به آن توسط توسعه دهنده Gemini API پشتیبانی نمی شود.
زبان های پشتیبانی شده
جوزا
تمام مدلهای جمینی می توانند به زبانهای زیر درک و پاسخ دهند:
عربی (AR) ، بنگالی (BN) ، بلغاری (BG) ، چینی ساده و سنتی (Zh) ، کرواسی (HR) ، چک (CS) ، دانمارکی (DA) ، هلندی (NL) ، انگلیسی (en) ، استونی (ET) ، فنلاندی (فی) ، فرانسوی (FR) ، آلمانی (de) ، HiNing (De) ، یورو (ال) ، یورو (ال) ، . (PL) ، پرتغالی (PT) ، رومانیایی (RO) ، روسی (RU) ، صربستان (SR) ، اسلواکی (SK) ، اسلوونی (SL) ، اسپانیایی (ES) ، Swahili (SW) ، سوئدی (SV) ، تایلندی (TH) ، ترکیه (TR) ، UKRAINIAN (UK) ، VI)
Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 مدل های فلش می توانند به زبان های اضافی زیر درک و پاسخ دهند:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Imagen
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about older models
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
These are the input and output types when using each model with Firebase AI Logic :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
انواع ورودی | |||||||
متن | |||||||
کد | |||||||
اسناد (PDFs or plain-text) | |||||||
تصاویر | |||||||
ویدئو | |||||||
صوتی | |||||||
Audio (streaming) | |||||||
انواع خروجی | |||||||
متن | |||||||
کد | |||||||
خروجی ساختاریافته (like JSON) | |||||||
Images, Video, and Audio |
These are the capabilities and features when using each model with Firebase AI Logic :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
Generate text from text-only input | ||||
Generate text from multimodal input | ||||
تولید تصاویر | ||||
تولید صدا | ||||
Generate structured output (like JSON) | ||||
Analyze documents (PDFs or plain-text) | ||||
Analyze images (vision) | ||||
Analyze video (vision) | ||||
آنالیز صدا | ||||
Multi-turn chat | ||||
Function calling (tools) | ||||
Count tokens and billable characters | ||||
دستورالعمل های سیستم | ||||
Bidirectional multimodal streaming |
These are the specifications and limitations when using each model with Firebase AI Logic :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 2,097,152 tokens | 1,048,576 tokens | 16,384 tokens | 32,760 tokens | |||
Output token limit * | 8,192 tokens | 8,192 tokens | 2,048 tokens | 8,192 tokens | |||
تاریخ قطع دانش | می 2024 | می 2024 | فوریه 2023 | فوریه 2023 | |||
PDFs (per request) | |||||||
حداکثر تعداد of input PDF files ** | 3,000 files | 3,000 files | 16 files | --- | |||
حداکثر تعداد of pages per input PDF file ** | 1,000 pages | 1,000 pages | 16 صفحه | --- | |||
حداکثر اندازه per input PDF file | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | |||
Images (per request) | |||||||
حداکثر تعداد of input images | 3,000 images | 3,000 images | 16 تصویر | --- | |||
حداکثر تعداد of output images | --- | --- | --- | --- | |||
حداکثر اندازه per input base64-encoded image | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | |||
Video (per request) | |||||||
حداکثر تعداد of input video files | 10 files | 10 files | 1 فایل | --- | |||
حداکثر طول of all input video (frames only) | ~60 minutes | ~60 minutes | 2 دقیقه | --- | |||
حداکثر طول of all input video (frames+audio) | ~45 دقیقه | ~45 دقیقه | --- | --- | |||
Audio (per request) | |||||||
حداکثر تعداد of input audio files | 1 فایل | 1 فایل | --- | --- | |||
حداکثر تعداد of output audio files | --- | --- | --- | --- | |||
حداکثر طول of all input audio | ~8.4 hours | ~8.4 hours | --- | --- | |||
حداکثر طول of all output audio | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
Gemini 1.5 Pro model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | Latest stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Initial stable version of Gemini 1.5 Pro | Upcoming Retirement | 24-05-2024 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-pro | Points to the latest stable version of 1.5 Pro (در حال حاضر gemini-1.5-pro-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | Latest stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Initial stable version of Gemini 1.5 Flash | Upcoming Retirement | 24-05-2024 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-flash | Points to the latest stable version of 1.5 Flash (در حال حاضر gemini-1.5-flash-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | Latest stable version of Gemini 1.0 Pro Vision | بازنشسته | 15-02-2024 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro-vision | Points to the latest stable version of 1.5 Pro Vision (در حال حاضر gemini-1.5-pro-vision-001 ) | بازنشسته | 04-01-2024 | 2025-04-21 |
Gemini 1.0 Pro model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | Latest stable version of Gemini 1.0 Pro | بازنشسته | 09-04-2024 | 2025-04-21 |
gemini-1.0-pro-001 | Stable version of Gemini 1.0 Pro | بازنشسته | 15-02-2024 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro | Points to the latest stable version of 1.0 Pro (در حال حاضر gemini-1.0-pro-002 ) | بازنشسته | 15-02-2024 | 2025-04-21 |
مراحل بعدی
Try out the capabilities of the Gemini API
- Build multi-turn conversations (chat) .
- Generate text from text-only prompts .
- Generate text by prompting with various file types, like images , PDFs , video , and audio .
- Generate structured output (like JSON) from both text and multimodal prompts.
- Generate images from text prompts ( Gemini or Imagen ).
- Stream input and output (including audio) using the Gemini Live API .
- Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.
For mobile and web apps, the Firebase AI Logic SDKs let you interact with the supported Gemini models and Imagen models directly from your app.
Gemini models are considered multimodal because they're capable of processing and even generating multiple modalities, including text, code, PDFs, images, video, and audio. Imagen models can be prompted with text to generate images.
The following table is a brief overview of supported models for Firebase AI Logic and their latest stable model names. This table also lists preview and experimental models that are available for prototyping use cases.
Also, review our FAQ about all the models that Firebase AI Logic supports and does not support.
مدل های جمینی
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
Gemini models with stable versions | |||
جمینی 2.5 پروgemini-2.5-pro | text, code, PDFs, images, video, audio | text, code, JSON | Our most advanced reasoning model, capable of solving complex problems. |
فلش جمینی 2.5gemini-2.5-flash | text, code, PDFs, images, video, audio | text, code, JSON | Our thinking model that offers great, well-rounded capabilities. It's designed to offer a balance between price and performance. |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | text, code, PDFs, images, video, audio | text, code, JSON | Our most balanced Gemini model, optimized for low-latency use cases and cost-conscious apps. |
Gemini 2.5 Flash Imagegemini-2.5-flash-image | text, code, PDFs, images | images, text & images | Our standard Flash model upgraded for rapid creative workflows with image generation and conversational, multi-turn editing capabilities. (aka "nano banana") |
فلش جمینی 2.0gemini-2.0-flash-001 | text, code, PDFs, images, video, audio | text, code, JSON | Our multimodal model with next-gen features and improved capabilities, including superior speed, built-in tool use, and a 1M token context window |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001 | text, code, PDFs, images, video, audio | text, code, JSON | Our fastest and most cost efficient Flash model. It's an upgrade path for 1.5 Flash users who want better quality for the same price and speed. |
Gemini models with only preview and experimental versions (recommended for prototyping use cases only) | |||
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation | text, code, PDFs, images | images, text & images | Our multimodal model that supports multimodal input and image output. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | text (streaming), audio (streaming) | text (streaming), audio (streaming) | Our multimodal model that supports low-latency realtime streaming of multimodal inputs and outputs. |
1 Additional model names support the Live API depending on your chosen Gemini API provider and access (see the Live API page ).
مدل های تصویری
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
Imagen models with stable versions | |||
تصویر 4imagen-4.0-generate-001 | متن | تصاویر | Generates realistic, high-quality images from natural language text prompts |
Imagen 4 Fastimagen-4.0-fast-generate-001 | متن | تصاویر | Generates images for prototyping or low-latency use cases |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | متن | تصاویر | Generates realistic, high-quality images from natural language text prompts |
تصویر 3imagen-3.0-generate-002 | متن | تصاویر | Generates realistic, high-quality images from natural language text prompts |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | متن | تصاویر | Generates images for prototyping or low-latency use cases |
Imagen 3 Capability 2imagen-3.0-capability-001 | text, images | تصاویر | Edits and generates images; supports both mask-based editing and customization using reference images |
Imagen models with only preview and experimental versions (recommended for prototyping use cases only) | |||
--- | --- | --- | --- |
2 Not supported by the Gemini Developer API no matter how you access it.
The remainder of this page provides detailed information about the models supported by Firebase AI Logic .
- Supported input and output
- High-level comparison of the supported capabilities
- Specifications and limitations, for example max input tokens or max length of input video
Description of how models are versioned , specifically their stable , auto-updated , preview , and experimental versions
Lists of available model names to include in your code during initialization
Lists of supported languages for the models
At the bottom of this page, you can view detailed information about older models .
مقایسه مدل ها
Each model has different capabilities to support various use cases. Note that each of tables in this section describe each model when used with Firebase AI Logic . Each model might have additional capabilities that aren't available when using our SDKs.
If you can't find the information you're looking for in the following sub-sections, you can find even more information in your chosen API provider documentation:
Gemini Developer API : Gemini models and Imagen models
Vertex AI Gemini API : Gemini models and Imagen models
Supported input and output
These are the supported input and output types when using each model with Firebase AI Logic :
جوزا 2.5 Pro, Flash, Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (generate) | Imagen (capability) | |
---|---|---|---|---|---|---|---|---|
انواع ورودی | ||||||||
متن | ||||||||
Text (streaming) | ||||||||
کد | ||||||||
اسناد (PDFs or plain-text) | ||||||||
تصاویر | ||||||||
ویدئو | ||||||||
صوتی | ||||||||
Audio (streaming) | ||||||||
انواع خروجی | ||||||||
متن | ||||||||
Text (streaming) | ||||||||
کد | ||||||||
خروجی ساختاریافته (like JSON) | ||||||||
تصاویر | ||||||||
صوتی | ||||||||
Audio (streaming) |
To learn about supported file types, see Supported input files and requirements .
Supported capabilities and features
These are the supported capabilities and features when using each model with Firebase AI Logic :
جوزا 2.5 Pro, Flash, Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (generate) | Imagen (capability) | |
---|---|---|---|---|---|---|---|---|
فکر کردن | ||||||||
Generate text from text-only or multimodal inputs | interleaved or as part of image | interleaved or as part of image | streaming only | |||||
تولید تصاویر ( Gemini or Imagen ) | ||||||||
ویرایش تصاویر ( Gemini or Imagen ) | ||||||||
تولید صدا | streaming only | |||||||
Generate structured output (like JSON) | ||||||||
Analyze documents (PDFs or plain-text) | ||||||||
Analyze images (vision) | ||||||||
Analyze video (vision) | ||||||||
آنالیز صدا | streaming only | |||||||
Multi-turn chat | ||||||||
Bidirectional multimodal streaming | ||||||||
فراخوانی تابع | ||||||||
اجرای کد | ||||||||
زمینه سازی با جستجوی گوگل | ||||||||
دستورالعمل های سیستم | ||||||||
توکن ها را بشمار |
Specifications and limitations
These are the specifications and limitations when using each model with Firebase AI Logic :
اموال | جوزا 2.5 Pro, Flash, Flash-Lite | جوزا 2.5 فلش تصویر | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 فلش تولید تصویر | جوزا 2.0 Flash- زندگی کنید | Imagen (generate) | Imagen (capability) |
---|---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 1,048,576 tokens | 32,768 tokens | 1,048,576 tokens | 1,048,576 tokens | 32,768 tokens | 32,768 tokens | 480 tokens | 480 tokens |
Output token limit * | 65,536 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | --- | --- |
تاریخ قطع دانش | ژانویه 2025 | ژوئن 2025 | ژوئن 2024 | ژوئن 2024 | آگوست 2024 | آگوست 2024 | --- | --- |
PDFs (per request) | ||||||||
حداکثر تعداد of input PDF files ** | 3,000 files | 3 files | 3,000 files | 3,000 files | 3,000 files | --- | --- | --- |
حداکثر تعداد از صفحات per input PDF file ** | 1,000 pages | 3 صفحه | 1,000 pages | 1,000 pages | 1,000 pages | --- | --- | --- |
حداکثر اندازه per input PDF file | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | --- | --- |
Images (per request) | ||||||||
حداکثر تعداد of input images | 3,000 images | 3 تصویر | 3,000 images | 3,000 images | 3,000 images | --- | --- | 4 تصویر |
حداکثر تعداد of output images | --- | 10 تصویر | --- | --- | 10 تصویر | --- | 4 تصویر | 4 تصویر |
حداکثر اندازه per input base64-encoded image | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | --- | --- |
Video (per request) | ||||||||
حداکثر تعداد of input video files | 10 files | --- | 10 files | 10 files | --- | --- | --- | --- |
حداکثر طول of all input video (frames only) | ~60 minutes | --- | ~60 minutes | ~60 minutes | --- | --- | --- | --- |
حداکثر طول of all input video (frames+audio) | ~45 دقیقه | --- | ~45 دقیقه | ~45 دقیقه | --- | --- | --- | --- |
Audio (per request) | ||||||||
حداکثر تعداد of input audio files | 1 فایل | --- | 1 فایل | 1 فایل | --- | --- | --- | --- |
حداکثر تعداد of output audio files | --- | --- | --- | --- | --- | --- | --- | --- |
حداکثر طول of all input audio | ~8.4 hours | ~8.4 hours | ~8.4 hours | ~8.4 hours | --- | --- | --- | --- |
حداکثر طول of all output audio | --- | --- | --- | --- | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Find additional detailed information
Quotas and pricing are different for each model. Pricing also depends on input and output.
Learn about supported input file types, how to specify MIME type, and how to make sure that your input files and multimodal requests meet the requirements and follow best practices in Supported input files and requirements .
Model versioning and naming patterns
Models are offered in stable , preview , and experimental versions. For convenience, aliases without explicit version values are supported.
To find specific model names to use in your code, see the "available model names" section later on this page.
Version type / Release stage | توضیحات | Model name pattern | |
---|---|---|---|
پایدار | Stable versions are available and supported for production use starting on the release date. A stable model version is typically released with a retirement date, which indicates the last day that the model is available. After this date, the model is no longer accessible or supported by Google. |
| |
Auto-updated stable alias ( Gemini 2.0 models only) | Auto-updated stable aliases always point to the latest stable version of that model. If a new stable version is released, the auto-updated alias automatically starts pointing to that new stable version. | Gemini 2.0 models only مثال: | |
پیش نمایش | Preview versions have new capabilities and are considered not stable . These models are not recommended for production use, come with more restrictive rate limits, and may have billing requirements. For the Vertex AI Gemini API , preview models released after June 2025 usually require you to set the model's location to | Model names of preview versions are appended with مثال: | |
تجربی | Experimental versions have new capabilities and are considered not stable . These models are not recommended for production use and come with more restrictive rate limits. Experimental models are intended for gathering feedback and to enable experimentation with our latest features. For the Vertex AI Gemini API , experimental models released after June 2025 require you to set the model's location to | Model names of experimental versions are appended with مثال: | |
بازنشسته | Retired versions are past their retirement date and have been permanently deactivated. Retired models are no longer accessible or supported by Google, and requests referencing a retired model ID typically returns a 404 error. | --- |
Available model names
Model names are the explicit values that you include in your code during initialization of the model.
Gemini model names Jump to Imagen model names Jump to
Programmatically list all available models
You can list all available models names using the REST API:
Gemini Developer API : Call the
models.list
endpointVertex AI Gemini API : Call the
publishers.models.list
endpoint
Note that this returned list will include all models supported by the API providers, but Firebase AI Logic only supports the Gemini and Imagen models described on this page. Also note that auto-updated aliases (for example, gemini-2.0-flash
) aren't listed because they're a convenience alias for the base model.
Gemini model names
For initialization examples for your platform, see the getting started guide .
For details about the release stages (especially for use cases and billing), see model versioning and naming patterns .
Gemini 2.5 Pro model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-pro | Stable version of Gemini 2.5 Pro | پایدار | 17-06-2025 | نه زودتر از 2026-06-17 |
Gemini 2.5 Flash model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash | Stable version of Gemini 2.5 Flash | پایدار | 17-06-2025 | نه زودتر از 2026-06-17 |
Gemini 2.5 Flash‑Lite model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-lite | Stable version of Gemini 2.5 Flash‑Lite | پایدار | 22-07-2025 | نه زودتر از 2026-07-22 |
Gemini 2.5 Flash Image model names (aka "nano banana")
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.5-flash-image | Stable version for Gemini 2.5 Flash Image (aka "nano banana") | پایدار | 02-10-2025 | 02-10-2026 |
gemini-2.5-flash-image-preview | Preview version for Gemini 2.5 Flash Image (aka "nano banana") | پیش نمایش | 26-08-2025 | 2025-10-31 |
Gemini 2.5 Flash Live model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-live-2.5-flash | Stable version for Gemini 2.5 Flash Live | پایدار (private GA) 1 | 01-06-2025 | نه زودتر از 01-06-2026 |
gemini-live-2.5-flash-preview 2 | Preview version for Gemini 2.5 Flash Live | پیش نمایش | 01-06-2025 | تعیین شود |
Take note that in the 2.5 model names for the Live API , the live
segment immediately follows the gemini
segment.
Firebase AI Logic does not yet support the native audio models (like gemini-2.5-flash-native-audio-preview-09-2025
).
1 Reach out to your Google Cloud account team representative to request access.
2 Not supported by the Vertex AI Gemini API no matter how you access it.
Gemini 2.0 Flash model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-001 | Latest stable version of Gemini 2.0 Flash | پایدار | 05-02-2025 | نه زودتر از 2026-02-05 |
gemini-2.0-flash | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash (در حال حاضر gemini-2.0-flash-001 ) | پایدار | 10-02-2025 | --- |
Gemini 2.0 Flash‑Lite model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Latest stable version of Gemini 2.0 Flash‑Lite | پایدار | 2025-02-25 | نه زودتر از 2026-02-25 |
gemini-2.0-flash-lite | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash‑Lite (در حال حاضر gemini-2.0-flash-lite-001 ) | پایدار | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | Preview version for Gemini 2.0 Flash Image Generation | پیش نمایش | 2025-05-06 | 2025-10-31 |
Gemini 2.0 Flash Live model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | Stable version for Gemini 2.0 Flash Live | پایدار | 01-04-2025 | نه زودتر از 01-04-2026 |
gemini-2.0-flash-live-preview-04-09 | Preview version for Gemini 2.0 Flash Live | پیش نمایش | 09-04-2025 | تعیین شود |
2 Not supported by the Vertex AI Gemini API no matter how you access it.
Imagen model names
For initialization examples for your platform, see the generate images with Imagen guide .
For details about the release stages (especially for use cases and billing), see model versioning and naming patterns .
Imagen 4 model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-generate-001 | Stable version of Imagen 4 | پایدار | 14-08-2025 | No earlier than 2026-08-14 |
imagen-4.0-generate-preview-06-06 | Preview version of Imagen 4 | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 4 Fast model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | Stable version of Imagen 4 Fast | پایدار | 14-08-2025 | No earlier than 2026-08-14 |
imagen-4.0-fast-generate-preview-06-06 3 | Preview version of Imagen 4 Fast (will be retired soon - do not use) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 4 Ultra model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Stable version of Imagen 4 Ultra | پایدار | 14-08-2025 | No earlier than 2026-08-14 |
imagen-4.0-ultra-generate-preview-06-06 | Preview version of Imagen 4 Ultra (will be retired soon - do not use) | پیش نمایش | 06-06-2025 | همان اوایل 14-08-2025 |
Imagen 3 model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-generate-002 | Latest stable version of Imagen 3 | پایدار | 2025-01-23 | No earlier than 2026-01-23 |
imagen-3.0-generate-001 3 | Initial stable version of Imagen 3 | پایدار | 2024-07-31 | No earlier than 2025-07-31 |
Imagen 3 Fast model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Initial stable version of Imagen 3 Fast | پایدار | 2024-07-31 | No earlier than 2025-07-31 |
3 Not supported by the Gemini Developer API no matter how you access it.
Imagen 3 Capability model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
imagen-3.0-capability-001 3 | Initial stable version of Imagen 3 Capability | پایدار | 2024-12-10 | No earlier than 2025-12-10 |
3 Not supported by the Gemini Developer API no matter how you access it.
زبان های پشتیبانی شده
جوزا
All the Gemini models can understand and respond in the following languages:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Imagen
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about older models
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
These are the input and output types when using each model with Firebase AI Logic :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
انواع ورودی | |||||||
متن | |||||||
کد | |||||||
اسناد (PDFs or plain-text) | |||||||
تصاویر | |||||||
ویدئو | |||||||
صوتی | |||||||
Audio (streaming) | |||||||
انواع خروجی | |||||||
متن | |||||||
کد | |||||||
خروجی ساختاریافته (like JSON) | |||||||
Images, Video, and Audio |
These are the capabilities and features when using each model with Firebase AI Logic :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
Generate text from text-only input | ||||
Generate text from multimodal input | ||||
تولید تصاویر | ||||
تولید صدا | ||||
Generate structured output (like JSON) | ||||
Analyze documents (PDFs or plain-text) | ||||
Analyze images (vision) | ||||
Analyze video (vision) | ||||
آنالیز صدا | ||||
Multi-turn chat | ||||
Function calling (tools) | ||||
Count tokens and billable characters | ||||
دستورالعمل های سیستم | ||||
Bidirectional multimodal streaming |
These are the specifications and limitations when using each model with Firebase AI Logic :
جمینی 1.5 پرو | فلش جمینی 1.5 | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 2,097,152 tokens | 1,048,576 tokens | 16,384 tokens | 32,760 tokens | |||
Output token limit * | 8,192 tokens | 8,192 tokens | 2,048 tokens | 8,192 tokens | |||
تاریخ قطع دانش | می 2024 | می 2024 | فوریه 2023 | فوریه 2023 | |||
PDFs (per request) | |||||||
حداکثر تعداد of input PDF files ** | 3,000 files | 3,000 files | 16 files | --- | |||
حداکثر تعداد of pages per input PDF file ** | 1,000 pages | 1,000 pages | 16 صفحه | --- | |||
حداکثر اندازه per input PDF file | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- | |||
Images (per request) | |||||||
حداکثر تعداد of input images | 3,000 images | 3,000 images | 16 تصویر | --- | |||
حداکثر تعداد of output images | --- | --- | --- | --- | |||
حداکثر اندازه per input base64-encoded image | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- | |||
Video (per request) | |||||||
حداکثر تعداد of input video files | 10 files | 10 files | 1 فایل | --- | |||
حداکثر طول of all input video (frames only) | ~60 minutes | ~60 minutes | 2 دقیقه | --- | |||
حداکثر طول of all input video (frames+audio) | ~45 دقیقه | ~45 دقیقه | --- | --- | |||
Audio (per request) | |||||||
حداکثر تعداد of input audio files | 1 فایل | 1 فایل | --- | --- | |||
حداکثر تعداد of output audio files | --- | --- | --- | --- | |||
حداکثر طول of all input audio | ~8.4 hours | ~8.4 hours | --- | --- | |||
حداکثر طول of all output audio | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
Gemini 1.5 Pro model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | Latest stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Initial stable version of Gemini 1.5 Pro | Upcoming Retirement | 24-05-2024 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-pro | Points to the latest stable version of 1.5 Pro (در حال حاضر gemini-1.5-pro-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | Latest stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Initial stable version of Gemini 1.5 Flash | Upcoming Retirement | 24-05-2024 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-flash | Points to the latest stable version of 1.5 Flash (در حال حاضر gemini-1.5-flash-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | Latest stable version of Gemini 1.0 Pro Vision | بازنشسته | 15-02-2024 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro-vision | Points to the latest stable version of 1.5 Pro Vision (در حال حاضر gemini-1.5-pro-vision-001 ) | بازنشسته | 04-01-2024 | 2025-04-21 |
Gemini 1.0 Pro model names
نام مدل | توضیحات | Release stage | تاریخ انتشار | تاریخ بازنشستگی |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | Latest stable version of Gemini 1.0 Pro | بازنشسته | 09-04-2024 | 2025-04-21 |
gemini-1.0-pro-001 | Stable version of Gemini 1.0 Pro | بازنشسته | 15-02-2024 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro | Points to the latest stable version of 1.0 Pro (در حال حاضر gemini-1.0-pro-002 ) | بازنشسته | 15-02-2024 | 2025-04-21 |
مراحل بعدی
Try out the capabilities of the Gemini API
- Build multi-turn conversations (chat) .
- Generate text from text-only prompts .
- Generate text by prompting with various file types, like images , PDFs , video , and audio .
- Generate structured output (like JSON) from both text and multimodal prompts.
- Generate images from text prompts ( Gemini or Imagen ).
- Stream input and output (including audio) using the Gemini Live API .
- Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.