মোবাইল এবং ওয়েব অ্যাপগুলির জন্য, Firebase AI লজিক SDKগুলি আপনাকে সরাসরি আপনার অ্যাপ থেকে সমর্থিত জেমিনি মডেল এবং ইমেজেন মডেলগুলির সাথে ইন্টারঅ্যাক্ট করতে দেয়৷
জেমিনি মডেলগুলিকে মাল্টিমোডাল হিসাবে বিবেচনা করা হয় কারণ তারা পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও এবং অডিও সহ একাধিক পদ্ধতি প্রক্রিয়াকরণ এবং এমনকি তৈরি করতে সক্ষম। ইমেজেন মডেলগুলিকে ইমেজ তৈরি করার জন্য পাঠ্যের সাথে অনুরোধ করা যেতে পারে।
নিম্নলিখিত টেবিলটি Firebase AI লজিকের জন্য সমর্থিত মডেলগুলির একটি সংক্ষিপ্ত বিবরণ এবং তাদের সর্বশেষ স্থিতিশীল মডেলের নাম। এই টেবিলটি প্রিভিউ এবং পরীক্ষামূলক মডেলগুলিও তালিকাভুক্ত করে যা প্রোটোটাইপিং ব্যবহারের ক্ষেত্রে উপলব্ধ।
এছাড়াও, Firebase AI লজিক সমর্থন করে এবং সমর্থন করে না এমন সমস্ত মডেল সম্পর্কে আমাদের FAQ পর্যালোচনা করুন।
মিথুন মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ মিথুন মডেল | |||
Gemini 2.5 Progemini-2.5-pro | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের সবচেয়ে উন্নত যুক্তি মডেল, জটিল সমস্যা সমাধান করতে সক্ষম. |
মিথুন 2.5 ফ্ল্যাশgemini-2.5-flash | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের চিন্তার মডেল যা দুর্দান্ত, ভাল বৃত্তাকার ক্ষমতা প্রদান করে। এটি মূল্য এবং কর্মক্ষমতার মধ্যে ভারসাম্য অফার করার জন্য ডিজাইন করা হয়েছে। |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের সবচেয়ে ভারসাম্যপূর্ণ জেমিনি মডেল, কম লেটেন্সি ব্যবহারের ক্ষেত্রে এবং খরচ-সচেতন অ্যাপগুলির জন্য অপ্টিমাইজ করা হয়েছে। |
মিথুন 2.5 ফ্ল্যাশ চিত্রgemini-2.5-flash-image | পাঠ্য, কোড, পিডিএফ, ছবি | ছবি, পাঠ্য এবং ছবি | আমাদের স্ট্যান্ডার্ড ফ্ল্যাশ মডেলটি ইমেজ জেনারেশন এবং কথোপকথন, মাল্টি-টার্ন এডিটিং ক্ষমতা সহ দ্রুত সৃজনশীল কর্মপ্রবাহের জন্য আপগ্রেড করা হয়েছে। (ওরফে "ন্যানো কলা") |
Gemini 2.0 Flashgemini-2.0-flash-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | উচ্চতর গতি, অন্তর্নির্মিত টুল ব্যবহার এবং একটি 1M টোকেন প্রসঙ্গ উইন্ডো সহ পরবর্তী প্রজন্মের বৈশিষ্ট্য এবং উন্নত ক্ষমতা সহ আমাদের মাল্টিমোডাল মডেল |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের দ্রুততম এবং সবচেয়ে সাশ্রয়ী ফ্ল্যাশ মডেল। এটি 1.5 ফ্ল্যাশ ব্যবহারকারীদের জন্য একটি আপগ্রেড পাথ যারা একই দাম এবং গতিতে আরও ভাল মানের চান৷ |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ জেমিনি মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশনgemini-2.0-flash-preview-image-generation | পাঠ্য, কোড, পিডিএফ, ছবি | ছবি, পাঠ্য এবং ছবি | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং ইমেজ আউটপুট সমর্থন করে। |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং আউটপুটগুলির স্বল্প-বিলম্বিত রিয়েলটাইম স্ট্রিমিং সমর্থন করে। |
1টি অতিরিক্ত মডেল নাম আপনার নির্বাচিত জেমিনি API প্রদানকারী এবং অ্যাক্সেসের উপর নির্ভর করে Live API সমর্থন করে ( Live API পৃষ্ঠা দেখুন)।
ইমেজ মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ ইমেজ মডেল | |||
চিত্র 4imagen-4.0-generate-001 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 4 দ্রুতimagen-4.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা কম লেটেন্সি ব্যবহারের ক্ষেত্রে ছবি তৈরি করে |
চিত্র 4 আল্ট্রাimagen-4.0-ultra-generate-001 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 3imagen-3.0-generate-002 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 3 দ্রুত 2imagen-3.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা কম লেটেন্সি ব্যবহারের ক্ষেত্রে ছবি তৈরি করে |
চিত্র 3 ক্ষমতা 2imagen-3.0-capability-001 | পাঠ্য, ছবি | ছবি | ইমেজ এডিট এবং জেনারেট করে; রেফারেন্স ইমেজ ব্যবহার করে মাস্ক-ভিত্তিক সম্পাদনা এবং কাস্টমাইজেশন উভয় সমর্থন করে |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ ইমেজ মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
--- | --- | --- | --- |
2 জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয় আপনি যেভাবেই এটি অ্যাক্সেস করুন না কেন।
এই পৃষ্ঠার অবশিষ্টাংশ Firebase AI লজিক দ্বারা সমর্থিত মডেলগুলি সম্পর্কে বিস্তারিত তথ্য প্রদান করে।
- সমর্থিত ইনপুট এবং আউটপুট
- সমর্থিত ক্ষমতার উচ্চ-স্তরের তুলনা
- স্পেসিফিকেশন এবং সীমাবদ্ধতা, উদাহরণস্বরূপ সর্বোচ্চ ইনপুট টোকেন বা ইনপুট ভিডিওর সর্বোচ্চ দৈর্ঘ্য
মডেলগুলি কীভাবে সংস্করণ করা হয় তার বিবরণ, বিশেষত তাদের স্থিতিশীল , স্বয়ংক্রিয় আপডেট হওয়া , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ
আরম্ভ করার সময় আপনার কোডে অন্তর্ভুক্ত করার জন্য উপলব্ধ মডেল নামের তালিকা
মডেলের জন্য সমর্থিত ভাষার তালিকা
এই পৃষ্ঠার নীচে, আপনি পুরানো মডেল সম্পর্কে বিস্তারিত তথ্য দেখতে পারেন।
মডেল তুলনা করুন
বিভিন্ন ব্যবহারের ক্ষেত্রে সমর্থন করার জন্য প্রতিটি মডেলের বিভিন্ন ক্ষমতা রয়েছে। লক্ষ্য করুন যে এই বিভাগের প্রতিটি টেবিল প্রতিটি মডেলকে বর্ণনা করে যখন Firebase AI লজিক ব্যবহার করা হয় । প্রতিটি মডেলের অতিরিক্ত ক্ষমতা থাকতে পারে যা আমাদের SDK ব্যবহার করার সময় পাওয়া যায় না।
আপনি যদি নিম্নলিখিত উপ-বিভাগগুলিতে যে তথ্য খুঁজছেন তা খুঁজে না পান, আপনি আপনার নির্বাচিত API প্রদানকারী ডকুমেন্টেশনে আরও তথ্য পেতে পারেন:
জেমিনি ডেভেলপার এপিআই : জেমিনি মডেল এবং ইমেজেন মডেল
Vertex AI Gemini API : জেমিনি মডেল এবং ইমেজেন মডেল
সমর্থিত ইনপুট এবং আউটপুট
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ইনপুট এবং আউটপুট প্রকার:
মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | চিত্র (জেনারেট) | চিত্র (ক্ষমতা) | |
---|---|---|---|---|---|---|---|---|
ইনপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
নথিপত্র (পিডিএফ বা প্লেইন-টেক্সট) | ||||||||
ছবি | ||||||||
ভিডিও | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) | ||||||||
আউটপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
স্ট্রাকচার্ড আউটপুট (JSON এর মত) | ||||||||
ছবি | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) |
সমর্থিত ফাইল প্রকার সম্পর্কে জানতে, সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তা দেখুন।
সমর্থিত ক্ষমতা এবং বৈশিষ্ট্য
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ক্ষমতা এবং বৈশিষ্ট্যগুলি:
মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | চিত্র (জেনারেট) | চিত্র (ক্ষমতা) | |
---|---|---|---|---|---|---|---|---|
ভাবছেন | ||||||||
শুধুমাত্র পাঠ্য বা মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ইন্টারলেভড বা ইমেজের অংশ হিসাবে | ইন্টারলেভড বা ইমেজের অংশ হিসাবে | শুধুমাত্র স্ট্রিমিং | |||||
ছবি তৈরি করুন ( মিথুন বা চিত্র ) | ||||||||
ছবি সম্পাদনা করুন ( মিথুন বা চিত্র ) | ||||||||
অডিও জেনারেট করুন | শুধুমাত্র স্ট্রিমিং | |||||||
কাঠামোগত আউটপুট তৈরি করুন (JSON এর মত) | ||||||||
নথি বিশ্লেষণ করুন (পিডিএফ বা প্লেইন-টেক্সট) | ||||||||
ছবি বিশ্লেষণ করুন (দৃষ্টি) | ||||||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | ||||||||
অডিও বিশ্লেষণ করুন | শুধুমাত্র স্ট্রিমিং | |||||||
বহু পালা চ্যাট | ||||||||
দ্বিমুখী মাল্টিমডাল স্ট্রিমিং | ||||||||
ফাংশন কলিং | ||||||||
কোড এক্সিকিউশন | ||||||||
Google অনুসন্ধানের সাথে গ্রাউন্ডিং | ||||||||
সিস্টেম নির্দেশাবলী | ||||||||
টোকেন গণনা করুন |
স্পেসিফিকেশন এবং সীমাবদ্ধতা
ফায়ারবেস এআই লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি নির্দিষ্টকরণ এবং সীমাবদ্ধতাগুলি:
সম্পত্তি | মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | চিত্র (জেনারেট) | চিত্র (ক্ষমতা) |
---|---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 1,048,576 টোকেন | 32,768 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 32,768 টোকেন | 32,768 টোকেন | 480 টোকেন | 480 টোকেন |
আউটপুট টোকেন সীমা * | 65,536 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | --- | --- |
জ্ঞান কাটঅফ তারিখ | জানুয়ারী 2025 | জুন 2025 | জুন 2024 | জুন 2024 | আগস্ট 2024 | আগস্ট 2024 | --- | --- |
পিডিএফ (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3টি ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | --- | --- | --- |
সর্বোচ্চ সংখ্যা পৃষ্ঠাগুলির প্রতি ইনপুট পিডিএফ ফাইল ** | 1,000 পৃষ্ঠা | 3 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | --- | --- | --- |
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | --- | --- | --- |
ছবি (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট ইমেজ | 3,000 ছবি | 3টি ছবি | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | --- | --- | 4টি ছবি |
সর্বোচ্চ সংখ্যা আউটপুট ইমেজ | --- | 10টি ছবি | --- | --- | 10টি ছবি | --- | 4টি ছবি | 4টি ছবি |
সর্বোচ্চ আকার প্রতি ইনপুট base64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | --- | --- | --- |
ভিডিও (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইলের | 10টি ফাইল | --- | 10টি ফাইল | 10টি ফাইল | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (শুধু ফ্রেম) | ~60 মিনিট | --- | ~60 মিনিট | ~60 মিনিট | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (ফ্রেম + অডিও) | ~45 মিনিট | --- | ~45 মিনিট | ~45 মিনিট | --- | --- | --- | --- |
অডিও (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলের | 1 ফাইল | --- | 1 ফাইল | 1 ফাইল | --- | --- | --- | --- |
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইলের | --- | --- | --- | --- | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সব ইনপুট অডিও | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সব আউটপুট অডিও | --- | --- | --- | --- | --- | --- | --- | --- |
* সমস্ত মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য, তাই 100টি টোকেন প্রায় 60-80টি ইংরেজি শব্দ। মিথুন মডেলের জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধে মোট টোকেনের সংখ্যা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠার সংখ্যা মডেলটি সমর্থন করতে পারে এমন চিত্রগুলির সংখ্যার মধ্যে সীমাবদ্ধ।
অতিরিক্ত বিস্তারিত তথ্য খুঁজুন
প্রতিটি মডেলের জন্য কোটা এবং মূল্য আলাদা। দাম ইনপুট এবং আউটপুট উপর নির্ভর করে.
সমর্থিত ইনপুট ফাইলের ধরন সম্পর্কে জানুন, কীভাবে MIME প্রকার নির্দিষ্ট করবেন এবং কীভাবে নিশ্চিত করবেন যে আপনার ইনপুট ফাইল এবং মাল্টিমোডাল অনুরোধগুলি প্রয়োজনীয়তাগুলি পূরণ করে এবং সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তাগুলিতে সর্বোত্তম অনুশীলনগুলি অনুসরণ করে।
মডেল সংস্করণ এবং নামকরণের ধরণ
মডেলগুলি স্থিতিশীল , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণে দেওয়া হয়। সুবিধার জন্য, স্পষ্ট সংস্করণ মান ছাড়া উপনাম সমর্থিত।
আপনার কোডে ব্যবহার করার জন্য নির্দিষ্ট মডেলের নাম খুঁজতে, এই পৃষ্ঠায় পরে "উপলভ্য মডেলের নাম" বিভাগটি দেখুন।
সংস্করণ প্রকার / মুক্তির মঞ্চ | বর্ণনা | মডেল নামের প্যাটার্ন | |
---|---|---|---|
স্থিতিশীল | স্থিতিশীল সংস্করণগুলি উপলব্ধ এবং প্রকাশের তারিখ থেকে উত্পাদন ব্যবহারের জন্য সমর্থিত। একটি স্থিতিশীল মডেল সংস্করণ সাধারণত অবসর গ্রহণের তারিখের সাথে প্রকাশ করা হয়, যা শেষ দিনটি নির্দেশ করে যে মডেলটি উপলব্ধ। এই তারিখের পরে, মডেলটি আর অ্যাক্সেসযোগ্য বা Google দ্বারা সমর্থিত নয়৷ |
| |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম (শুধু জেমিনি 2.0 মডেল) | স্বতঃ-আপডেট করা স্থিতিশীল উপনামগুলি সর্বদা সেই মডেলের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ যদি একটি নতুন স্থিতিশীল সংস্করণ প্রকাশিত হয়, স্বয়ংক্রিয়ভাবে আপডেট হওয়া উপনাম স্বয়ংক্রিয়ভাবে সেই নতুন স্থিতিশীল সংস্করণের দিকে নির্দেশ করা শুরু করে। | শুধুমাত্র Gemini 2.0 মডেল উদাহরণ: | |
পূর্বরূপ | পূর্বরূপ সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না , আরও সীমাবদ্ধ হারের সীমা সহ আসে এবং বিলিং প্রয়োজনীয়তা থাকতে পারে। Vertex AI Gemini API-এর জন্য, জুন 2025-এর পরে প্রকাশিত প্রিভিউ মডেলগুলির জন্য সাধারণত আপনাকে মডেলের অবস্থান | পূর্বরূপ সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে উদাহরণ: | |
পরীক্ষামূলক | পরীক্ষামূলক সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না এবং আরও সীমাবদ্ধ হারের সীমা সহ আসে। পরীক্ষামূলক মডেলগুলি প্রতিক্রিয়া সংগ্রহের জন্য এবং আমাদের সাম্প্রতিক বৈশিষ্ট্যগুলির সাথে পরীক্ষা সক্ষম করার উদ্দেশ্যে তৈরি করা হয়েছে৷ Vertex AI Gemini API-এর জন্য, 2025 সালের জুনের পরে প্রকাশিত পরীক্ষামূলক মডেলগুলির জন্য আপনাকে মডেলের অবস্থান | পরীক্ষামূলক সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে উদাহরণ: | |
অবসরপ্রাপ্ত | অবসরপ্রাপ্ত সংস্করণগুলি তাদের অবসর গ্রহণের তারিখ অতিক্রম করেছে এবং স্থায়ীভাবে নিষ্ক্রিয় করা হয়েছে৷ অবসরপ্রাপ্ত মডেলগুলি আর Google দ্বারা অ্যাক্সেসযোগ্য বা সমর্থিত নয়, এবং অবসরপ্রাপ্ত মডেল আইডি উল্লেখ করার অনুরোধগুলি সাধারণত একটি 404 ত্রুটি প্রদান করে৷ | --- |
উপলব্ধ মডেল নাম
মডেলের নামগুলি হল সুস্পষ্ট মান যা আপনি মডেলের শুরু করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
মিথুন মডেলের নামগুলিতে যান ইমেজেন মডেলের নামগুলিতে যান
প্রোগ্রামগতভাবে সমস্ত উপলব্ধ মডেল তালিকা
আপনি REST API ব্যবহার করে সমস্ত উপলব্ধ মডেলের নাম তালিকাভুক্ত করতে পারেন:
জেমিনি ডেভেলপার API :
models.list
এন্ডপয়েন্টে কল করুনVertex AI Gemini API :
publishers.models.list
এন্ডপয়েন্টে কল করুন
মনে রাখবেন যে এই প্রত্যাবর্তিত তালিকায় API প্রদানকারীদের দ্বারা সমর্থিত সমস্ত মডেল অন্তর্ভুক্ত থাকবে, কিন্তু Firebase AI লজিক শুধুমাত্র এই পৃষ্ঠায় বর্ণিত জেমিনি এবং ইমেজেন মডেলগুলিকে সমর্থন করে৷ এছাড়াও মনে রাখবেন যে স্বয়ংক্রিয়-আপডেট করা উপনামগুলি (উদাহরণস্বরূপ, gemini-2.0-flash
) তালিকাভুক্ত নয় কারণ সেগুলি বেস মডেলের জন্য একটি সুবিধাজনক উপনাম৷
মিথুন মডেলের নাম
আপনার প্ল্যাটফর্মের জন্য প্রাথমিক উদাহরণের জন্য, শুরু করার নির্দেশিকা দেখুন।
প্রকাশের পর্যায়গুলি সম্পর্কে বিশদ বিবরণের জন্য (বিশেষ করে ব্যবহারের ক্ষেত্রে এবং বিলিং এর জন্য), মডেল সংস্করণ এবং নামকরণের ধরণগুলি দেখুন।
Gemini 2.5 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-pro | Gemini 2.5 Pro এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-06-17 | এর আগে নয় 2026-06-17 |
Gemini 2.5 Flash মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-flash | Gemini 2.5 Flash এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-06-17 | এর আগে নয় 2026-06-17 |
Gemini 2.5 Flash-Lite মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-flash-lite | Gemini 2.5 Flash-Lite- এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-07-22 | এর আগে নয় 2026-07-22 |
জেমিনি 2.5 ফ্ল্যাশ ছবির মডেল নাম (ওরফে "ন্যানো কলা")
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-flash-image | জেমিনি 2.5 ফ্ল্যাশ ইমেজের জন্য স্থিতিশীল সংস্করণ (ওরফে "ন্যানো কলা") | স্থিতিশীল | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | জেমিনি 2.5 ফ্ল্যাশ ইমেজের পূর্বরূপ সংস্করণ (ওরফে "ন্যানো কলা") | পূর্বরূপ | 2025-08-26 | 2025-10-31 |
Gemini 2.5 Flash Live মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-live-2.5-flash | Gemini 2.5 Flash Live এর জন্য স্থিতিশীল সংস্করণ | স্থিতিশীল (প্রাইভেট জিএ) ১ | 2025-06-01 | এর আগে নয় 2026-06-01 |
gemini-live-2.5-flash-preview 2 | Gemini 2.5 Flash Live- এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-06-01 | নির্ধারণ করা |
মনে রাখবেন যে Live API জন্য 2.5 মডেলের নামগুলিতে, live
সেগমেন্ট অবিলম্বে gemini
বিভাগকে অনুসরণ করে।
Firebase AI লজিক এখনও নেটিভ অডিও মডেলগুলিকে সমর্থন করে না (যেমন gemini-2.5-flash-native-audio-preview-09-2025
)।
1 অ্যাক্সেসের অনুরোধ করতে আপনার Google Cloud অ্যাকাউন্ট দলের প্রতিনিধির সাথে যোগাযোগ করুন।
2 ভার্টেক্স এআই জেমিনি এপিআই দ্বারা সমর্থিত নয় আপনি যেভাবেই এটি অ্যাক্সেস করুন না কেন।
জেমিনি 2.0 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-001 | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-05 | এর আগে নয় 2026-02-05 |
gemini-2.0-flash | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে স্বয়ংক্রিয়-আপডেট করা উপনাম৷ (বর্তমানে gemini-2.0-flash-001 ) | স্থিতিশীল | 2025-02-10 | --- |
Gemini 2.0 Flash-Lite মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Gemini 2.0 Flash-Lite- এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-25 | এর আগে নয় 2026-02-25 |
gemini-2.0-flash-lite | জেমিনি 2.0 ফ্ল্যাশ-লাইটের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে স্বতঃ-আপডেট করা উপনাম (বর্তমানে gemini-2.0-flash-lite-001 ) | স্থিতিশীল | 2025-02-25 | --- |
জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশন মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশনের পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | 2025-10-31 |
Gemini 2.0 Flash Live মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | Gemini 2.0 Flash Live এর জন্য স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-04-01 | এর আগে নয় 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | Gemini 2.0 Flash Live- এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-09 | নির্ধারণ করা |
2 ভার্টেক্স এআই জেমিনি এপিআই দ্বারা সমর্থিত নয় আপনি যেভাবেই এটি অ্যাক্সেস করুন না কেন।
ইমেজ মডেল নাম
আপনার প্ল্যাটফর্মের জন্য আরম্ভ করার উদাহরণের জন্য, ইমেজেন গাইডের সাহায্যে ছবি তৈরি করুন দেখুন।
প্রকাশের পর্যায়গুলি সম্পর্কে বিশদ বিবরণের জন্য (বিশেষ করে ব্যবহারের ক্ষেত্রে এবং বিলিং এর জন্য), মডেল সংস্করণ এবং নামকরণের ধরণগুলি দেখুন।
ইমেজ 4 মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-4.0-generate-001 | Imagen 4 এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে নয় |
imagen-4.0-generate-preview-06-06 | Imagen 4 এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
চিত্র 4 দ্রুত মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | Imagen 4 ফাস্টের স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে নয় |
imagen-4.0-fast-generate-preview-06-06 3 | Imagen 4 ফাস্টের পূর্বরূপ সংস্করণ (শীঘ্রই অবসর গ্রহণ করা হবে - ব্যবহার করবেন না) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
চিত্র 4 আল্ট্রা মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Imagen 4 Ultra এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে নয় |
imagen-4.0-ultra-generate-preview-06-06 | Imagen 4 Ultra এর পূর্বরূপ সংস্করণ (শীঘ্রই অবসর গ্রহণ করা হবে - ব্যবহার করবেন না) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
ইমেজ 3 মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-3.0-generate-002 | Imagen 3 এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-01-23 | 2026-01-23 এর আগে নয় |
imagen-3.0-generate-001 3 | Imagen 3 এর প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে নয় |
চিত্র 3 দ্রুত মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Imagen 3 ফাস্টের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে নয় |
3 জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয় আপনি এটিকে যেভাবে অ্যাক্সেস করুন না কেন।
চিত্র 3 ক্ষমতা মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-3.0-capability-001 3 | Imagen 3 সক্ষমতার প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-12-10 | 2025-12-10 এর আগে নয় |
3 জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয় আপনি এটিকে যেভাবে অ্যাক্সেস করুন না কেন।
সমর্থিত ভাষা
মিথুন
সমস্ত মিথুন মডেল নিম্নলিখিত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আরবি (আরবি), বাংলা (বিএন), বুলগেরিয়ান (বিজি), চাইনিজ সরলীকৃত এবং ঐতিহ্যবাহী (zh), ক্রোয়েশিয়ান (hr), চেক (cs), ডেনিশ (da), ডাচ (nl), ইংরেজি (en), এস্তোনিয়ান (et), ফিনিশ (fi), ফ্রেঞ্চ (fr), জার্মান (de), গ্রীক (el), হিব্রু (iw), হিন্দি (hi), হাঙ্গেরিয়ান (hu), কোরিয়া (hu), কোরিয়া (হু), কোরিয়া (ইন্দো), জাপানি (ইংরেজি) লাটভিয়ান (lv), লিথুয়ানিয়ান (lt), নরওয়েজিয়ান (no), পোলিশ (pl), পর্তুগিজ (pt), রোমানিয়ান (ro), রাশিয়ান (ru), সার্বিয়ান (sr), স্লোভাক (sk), স্লোভেনিয়ান (sl), স্প্যানিশ (es), সোয়াহিলি (sw), সুইডিশ (sv), থাই (th), তুর্কি (tr), ইউক্রেনীয় (ইউক্রেনীয়)
জেমিনি 2.0 ফ্ল্যাশ , জেমিনি 1.5 প্রো এবং জেমিনি 1.5 ফ্ল্যাশ মডেলগুলি নিম্নলিখিত অতিরিক্ত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
Afrikaans (af), আমহারিক (am), অসমীয়া (as), আজারবাইজানীয় (az), বেলারুশিয়ান (be), বসনিয়ান (bs), কাতালান (ca), Cebuano (ceb), কর্সিকান (co), ওয়েলশ (cy), দিভেহি (dv), এস্পেরান্তো (eo), বাস্ক (eu), ফার্সি (fa), ফিলিপিনো (তাগালগ (ইউ), ফিলিপিনো (তাগালগ (ইউ), ফিলিপিনো (তাগালগ) (gd), গ্যালিসিয়ান (gl), গুজরাটি (gu), হাউসা (ha), হাওয়াইয়ান (haw), Hmong (hmn), হাইতিয়ান ক্রেওল (ht), আর্মেনিয়ান (hy), ইগবো (ig), আইসল্যান্ডিক (is), জাভানিজ (jv), জর্জিয়ান (ka), কাজাখ (kk), খেমার (km), Kannada (knrnishkriyz), লাকরিও (kn) (kn) (la), লুক্সেমবার্গিশ (lb), লাও (lo), মালাগাসি (mg), মাওরি (mi), ম্যাসেডোনিয়ান (mk), মালায়ালাম (ml), মঙ্গোলিয়ান (mn), Meiteilon (মণিপুরি) (mni-Mtei), মারাঠি (mr), মালয় (ms), মাল্টিজ (mt), মায়ানমার (Burmese), নেপালী (Burmese), নেপালী (mn) ওড়িয়া (ওড়িয়া) (বা), পাঞ্জাবি (পা), পশতু (পিএস), সিন্ধি (এসডি), সিংহলা (সিংহলি) (সি), সামোয়ান (এসএম), শোনা (এসএন), সোমালি (সো), আলবেনিয়ান (বর্গ), সেসোথো (স্ট), সুদানিজ (সু), তামিল (তা), তেলুগু (টে), তাজিক (টিজি), উজুরুকু (উর্দু), উর্দু (উইজিউর) (xh), ইদ্দিশ (yi), ইওরুবা (yo), জুলু (zu)
চিত্র
সাধারণ উপলব্ধতা : ইংরেজি
পূর্বরূপ : চাইনিজ (সরলীকৃত), চাইনিজ (প্রথাগত), হিন্দি, জাপানিজ, কোরিয়ান, পর্তুগিজ, স্প্যানিশ
পুরানো মডেল সম্পর্কে তথ্য
মডেল | ইনপুট | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি ইনপুট এবং আউটপুট প্রকার:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
ইনপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
নথিপত্র (পিডিএফ বা প্লেইন-টেক্সট) | |||||||
ছবি | |||||||
ভিডিও | |||||||
অডিও | |||||||
অডিও (স্ট্রিমিং) | |||||||
আউটপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
স্ট্রাকচার্ড আউটপুট (JSON এর মত) | |||||||
ছবি, ভিডিও এবং অডিও |
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এই ক্ষমতা এবং বৈশিষ্ট্যগুলি হল:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | |
---|---|---|---|---|
শুধুমাত্র পাঠ্য ইনপুট থেকে পাঠ্য তৈরি করুন | ||||
মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ||||
ছবি তৈরি করুন | ||||
অডিও জেনারেট করুন | ||||
কাঠামোগত আউটপুট তৈরি করুন (JSON এর মত) | ||||
নথি বিশ্লেষণ করুন (পিডিএফ বা প্লেইন-টেক্সট) | ||||
ছবি বিশ্লেষণ করুন (দৃষ্টি) | ||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | ||||
অডিও বিশ্লেষণ করুন | ||||
বহু পালা চ্যাট | ||||
ফাংশন কলিং (সরঞ্জাম) | ||||
টোকেন এবং বিলযোগ্য অক্ষর গণনা করুন | ||||
সিস্টেম নির্দেশাবলী | ||||
দ্বিমুখী মাল্টিমডাল স্ট্রিমিং |
ফায়ারবেস এআই লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি নির্দিষ্টকরণ এবং সীমাবদ্ধতাগুলি:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 2,097,152 টোকেন | 1,048,576 টোকেন | 16,384 টোকেন | 32,760 টোকেন | |||
আউটপুট টোকেন সীমা * | 8,192 টোকেন | 8,192 টোকেন | 2,048 টোকেন | 8,192 টোকেন | |||
জ্ঞান কাটঅফ তারিখ | মে 2024 | মে 2024 | ফেব্রুয়ারি 2023 | ফেব্রুয়ারি 2023 | |||
পিডিএফ (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3,000 ফাইল | 16টি ফাইল | --- | |||
সর্বোচ্চ সংখ্যা প্রতি ইনপুট পিডিএফ ফাইলের পৃষ্ঠাগুলির সংখ্যা ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 16 পৃষ্ঠা | --- | |||
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | --- | |||
ছবি (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ইমেজ | 3,000 ছবি | 3,000 ছবি | 16টি ছবি | --- | |||
সর্বোচ্চ সংখ্যা আউটপুট ইমেজ | --- | --- | --- | --- | |||
সর্বোচ্চ আকার প্রতি ইনপুট base64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | --- | |||
ভিডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইলের | 10টি ফাইল | 10টি ফাইল | 1 ফাইল | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (শুধুমাত্র ফ্রেম) | ~60 মিনিট | ~60 মিনিট | 2 মিনিট | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (ফ্রেম+অডিও) | ~45 মিনিট | ~45 মিনিট | --- | --- | |||
অডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলের | 1 ফাইল | 1 ফাইল | --- | --- | |||
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইলের | --- | --- | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য সব ইনপুট অডিও | ~8.4 ঘন্টা | ~8.4 ঘন্টা | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য সব আউটপুট অডিও | --- | --- | --- | --- |
* সমস্ত মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য, তাই 100টি টোকেন প্রায় 60-80টি ইংরেজি শব্দ। মিথুন মডেলের জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধে মোট টোকেনের সংখ্যা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠার সংখ্যা মডেলটি সমর্থন করতে পারে এমন চিত্রগুলির সংখ্যার মধ্যে সীমাবদ্ধ।
মডেলের নামগুলি হল সুস্পষ্ট মান যা আপনি মডেলের শুরু করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
Gemini 1.5 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.5-pro-002 | জেমিনি 1.5 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | জেমিনি 1.5 প্রো- এর প্রাথমিক স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-05-24 | 2025-05-24 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.5-pro | 1.5 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে (বর্তমানে gemini-1.5-pro-002 ) | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.5-flash-002 | জেমিনি 1.5 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | জেমিনি 1.5 ফ্ল্যাশের প্রাথমিক স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-05-24 | 2025-05-24 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.5-flash | 1.5 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ (বর্তমানে gemini-1.5-flash-002 ) | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
জেমিনি 1.0 প্রো ভিশন মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.0-pro-vision-001 | জেমিনি 1.0 প্রো ভিশনের সর্বশেষ স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.0-pro-vision | 1.5 প্রো ভিশনের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে (বর্তমানে gemini-1.5-pro-vision-001 ) | অবসরপ্রাপ্ত | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.0-pro-002 | Gemini 1.0 Pro এর সর্বশেষ স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Gemini 1.0 Pro এর স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.0-pro | 1.0 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ (বর্তমানে gemini-1.0-pro-002 ) | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
পরবর্তী পদক্ষেপ
জেমিনি API- এর ক্ষমতা ব্যবহার করে দেখুন
- মাল্টি-টার্ন কথোপকথন তৈরি করুন (চ্যাট) ।
- শুধুমাত্র পাঠ্য প্রম্পট থেকে পাঠ্য তৈরি করুন।
- ছবি , পিডিএফ , ভিডিও এবং অডিওর মতো বিভিন্ন ধরনের ফাইল প্রম্পট করে পাঠ্য তৈরি করুন।
- টেক্সট এবং মাল্টিমোডাল প্রম্পট উভয় থেকে কাঠামোগত আউটপুট (যেমন JSON) তৈরি করুন।
- টেক্সট প্রম্পট ( মিথুন বা ইমেজেন ) থেকে ছবি তৈরি করুন।
- Gemini Live API ব্যবহার করে স্ট্রিম ইনপুট এবং আউটপুট (অডিও সহ)।
- আপনার অ্যাপের অন্যান্য অংশ এবং বাহ্যিক সিস্টেম এবং তথ্যের সাথে মিথুন মডেলকে সংযুক্ত করতে সরঞ্জামগুলি (যেমন ফাংশন কলিং এবং Google অনুসন্ধানের সাথে গ্রাউন্ডিং ) ব্যবহার করুন৷
মোবাইল এবং ওয়েব অ্যাপগুলির জন্য, Firebase AI লজিক SDKগুলি আপনাকে সরাসরি আপনার অ্যাপ থেকে সমর্থিত জেমিনি মডেল এবং ইমেজেন মডেলগুলির সাথে ইন্টারঅ্যাক্ট করতে দেয়৷
জেমিনি মডেলগুলিকে মাল্টিমোডাল হিসাবে বিবেচনা করা হয় কারণ তারা পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও এবং অডিও সহ একাধিক পদ্ধতি প্রক্রিয়াকরণ এবং এমনকি তৈরি করতে সক্ষম। ইমেজেন মডেলগুলিকে ইমেজ তৈরি করার জন্য পাঠ্যের সাথে অনুরোধ করা যেতে পারে।
নিম্নলিখিত টেবিলটি Firebase AI লজিকের জন্য সমর্থিত মডেলগুলির একটি সংক্ষিপ্ত বিবরণ এবং তাদের সর্বশেষ স্থিতিশীল মডেলের নাম। এই টেবিলটি প্রিভিউ এবং পরীক্ষামূলক মডেলগুলিও তালিকাভুক্ত করে যা প্রোটোটাইপিং ব্যবহারের ক্ষেত্রে উপলব্ধ।
এছাড়াও, Firebase AI লজিক সমর্থন করে এবং সমর্থন করে না এমন সমস্ত মডেল সম্পর্কে আমাদের FAQ পর্যালোচনা করুন।
মিথুন মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ মিথুন মডেল | |||
Gemini 2.5 Progemini-2.5-pro | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের সবচেয়ে উন্নত যুক্তি মডেল, জটিল সমস্যা সমাধান করতে সক্ষম. |
মিথুন 2.5 ফ্ল্যাশgemini-2.5-flash | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের চিন্তার মডেল যা দুর্দান্ত, ভাল বৃত্তাকার ক্ষমতা প্রদান করে। এটি মূল্য এবং কর্মক্ষমতার মধ্যে ভারসাম্য অফার করার জন্য ডিজাইন করা হয়েছে। |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের সবচেয়ে ভারসাম্যপূর্ণ জেমিনি মডেল, কম লেটেন্সি ব্যবহারের ক্ষেত্রে এবং খরচ-সচেতন অ্যাপগুলির জন্য অপ্টিমাইজ করা হয়েছে। |
মিথুন 2.5 ফ্ল্যাশ চিত্রgemini-2.5-flash-image | পাঠ্য, কোড, পিডিএফ, ছবি | ছবি, পাঠ্য এবং ছবি | আমাদের স্ট্যান্ডার্ড ফ্ল্যাশ মডেলটি ইমেজ জেনারেশন এবং কথোপকথন, মাল্টি-টার্ন এডিটিং ক্ষমতা সহ দ্রুত সৃজনশীল কর্মপ্রবাহের জন্য আপগ্রেড করা হয়েছে। (ওরফে "ন্যানো কলা") |
Gemini 2.0 Flashgemini-2.0-flash-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | উচ্চতর গতি, অন্তর্নির্মিত টুল ব্যবহার এবং একটি 1M টোকেন প্রসঙ্গ উইন্ডো সহ পরবর্তী প্রজন্মের বৈশিষ্ট্য এবং উন্নত ক্ষমতা সহ আমাদের মাল্টিমোডাল মডেল |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের দ্রুততম এবং সবচেয়ে সাশ্রয়ী ফ্ল্যাশ মডেল। এটি 1.5 ফ্ল্যাশ ব্যবহারকারীদের জন্য একটি আপগ্রেড পাথ যারা একই দাম এবং গতিতে আরও ভাল মানের চান৷ |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ জেমিনি মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশনgemini-2.0-flash-preview-image-generation | পাঠ্য, কোড, পিডিএফ, ছবি | ছবি, পাঠ্য এবং ছবি | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং ইমেজ আউটপুট সমর্থন করে। |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং আউটপুটগুলির স্বল্প-বিলম্বিত রিয়েলটাইম স্ট্রিমিং সমর্থন করে। |
1টি অতিরিক্ত মডেল নাম আপনার নির্বাচিত জেমিনি API প্রদানকারী এবং অ্যাক্সেসের উপর নির্ভর করে Live API সমর্থন করে ( Live API পৃষ্ঠা দেখুন)।
ইমেজ মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ ইমেজ মডেল | |||
চিত্র 4imagen-4.0-generate-001 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 4 দ্রুতimagen-4.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা কম লেটেন্সি ব্যবহারের ক্ষেত্রে ছবি তৈরি করে |
চিত্র 4 আল্ট্রাimagen-4.0-ultra-generate-001 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 3imagen-3.0-generate-002 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 3 দ্রুত 2imagen-3.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা কম লেটেন্সি ব্যবহারের ক্ষেত্রে ছবি তৈরি করে |
চিত্র 3 ক্ষমতা 2imagen-3.0-capability-001 | পাঠ্য, ছবি | ছবি | ইমেজ এডিট এবং জেনারেট করে; রেফারেন্স ইমেজ ব্যবহার করে মাস্ক-ভিত্তিক সম্পাদনা এবং কাস্টমাইজেশন উভয় সমর্থন করে |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ ইমেজ মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
--- | --- | --- | --- |
2 জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয় আপনি যেভাবেই এটি অ্যাক্সেস করুন না কেন।
এই পৃষ্ঠার অবশিষ্টাংশ Firebase AI লজিক দ্বারা সমর্থিত মডেলগুলি সম্পর্কে বিস্তারিত তথ্য প্রদান করে।
- সমর্থিত ইনপুট এবং আউটপুট
- সমর্থিত ক্ষমতার উচ্চ-স্তরের তুলনা
- স্পেসিফিকেশন এবং সীমাবদ্ধতা, উদাহরণস্বরূপ সর্বোচ্চ ইনপুট টোকেন বা ইনপুট ভিডিওর সর্বোচ্চ দৈর্ঘ্য
মডেলগুলি কীভাবে সংস্করণ করা হয় তার বিবরণ, বিশেষত তাদের স্থিতিশীল , স্বয়ংক্রিয় আপডেট হওয়া , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ
আরম্ভ করার সময় আপনার কোডে অন্তর্ভুক্ত করার জন্য উপলব্ধ মডেল নামের তালিকা
মডেলের জন্য সমর্থিত ভাষার তালিকা
এই পৃষ্ঠার নীচে, আপনি পুরানো মডেল সম্পর্কে বিস্তারিত তথ্য দেখতে পারেন।
মডেল তুলনা করুন
বিভিন্ন ব্যবহারের ক্ষেত্রে সমর্থন করার জন্য প্রতিটি মডেলের বিভিন্ন ক্ষমতা রয়েছে। লক্ষ্য করুন যে এই বিভাগের প্রতিটি টেবিল প্রতিটি মডেলকে বর্ণনা করে যখন Firebase AI লজিক ব্যবহার করা হয় । প্রতিটি মডেলের অতিরিক্ত ক্ষমতা থাকতে পারে যা আমাদের SDK ব্যবহার করার সময় পাওয়া যায় না।
আপনি যদি নিম্নলিখিত উপ-বিভাগগুলিতে যে তথ্য খুঁজছেন তা খুঁজে না পান, আপনি আপনার নির্বাচিত API প্রদানকারী ডকুমেন্টেশনে আরও তথ্য পেতে পারেন:
জেমিনি ডেভেলপার এপিআই : জেমিনি মডেল এবং ইমেজেন মডেল
Vertex AI Gemini API : জেমিনি মডেল এবং ইমেজেন মডেল
সমর্থিত ইনপুট এবং আউটপুট
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ইনপুট এবং আউটপুট প্রকার:
মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | চিত্র (জেনারেট) | চিত্র (ক্ষমতা) | |
---|---|---|---|---|---|---|---|---|
ইনপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
নথিপত্র (পিডিএফ বা প্লেইন-টেক্সট) | ||||||||
ছবি | ||||||||
ভিডিও | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) | ||||||||
আউটপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
স্ট্রাকচার্ড আউটপুট (JSON এর মত) | ||||||||
ছবি | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) |
সমর্থিত ফাইল প্রকার সম্পর্কে জানতে, সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তা দেখুন।
সমর্থিত ক্ষমতা এবং বৈশিষ্ট্য
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ক্ষমতা এবং বৈশিষ্ট্যগুলি:
মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | চিত্র (জেনারেট) | চিত্র (ক্ষমতা) | |
---|---|---|---|---|---|---|---|---|
ভাবছেন | ||||||||
শুধুমাত্র পাঠ্য বা মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ইন্টারলেভড বা ইমেজের অংশ হিসাবে | ইন্টারলেভড বা ইমেজের অংশ হিসাবে | শুধুমাত্র স্ট্রিমিং | |||||
ছবি তৈরি করুন ( মিথুন বা চিত্র ) | ||||||||
ছবি সম্পাদনা করুন ( মিথুন বা চিত্র ) | ||||||||
অডিও জেনারেট করুন | শুধুমাত্র স্ট্রিমিং | |||||||
কাঠামোগত আউটপুট তৈরি করুন (JSON এর মত) | ||||||||
নথি বিশ্লেষণ করুন (পিডিএফ বা প্লেইন-টেক্সট) | ||||||||
ছবি বিশ্লেষণ করুন (দৃষ্টি) | ||||||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | ||||||||
অডিও বিশ্লেষণ করুন | শুধুমাত্র স্ট্রিমিং | |||||||
বহু পালা চ্যাট | ||||||||
দ্বিমুখী মাল্টিমডাল স্ট্রিমিং | ||||||||
ফাংশন কলিং | ||||||||
কোড এক্সিকিউশন | ||||||||
Google অনুসন্ধানের সাথে গ্রাউন্ডিং | ||||||||
সিস্টেম নির্দেশাবলী | ||||||||
টোকেন গণনা করুন |
স্পেসিফিকেশন এবং সীমাবদ্ধতা
ফায়ারবেস এআই লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি নির্দিষ্টকরণ এবং সীমাবদ্ধতাগুলি:
সম্পত্তি | মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | চিত্র (জেনারেট) | চিত্র (ক্ষমতা) |
---|---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 1,048,576 টোকেন | 32,768 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 32,768 টোকেন | 32,768 টোকেন | 480 টোকেন | 480 টোকেন |
আউটপুট টোকেন সীমা * | 65,536 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | --- | --- |
জ্ঞান কাটঅফ তারিখ | জানুয়ারী 2025 | জুন 2025 | জুন 2024 | জুন 2024 | আগস্ট 2024 | আগস্ট 2024 | --- | --- |
পিডিএফ (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3টি ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | --- | --- | --- |
সর্বোচ্চ সংখ্যা পৃষ্ঠাগুলির প্রতি ইনপুট পিডিএফ ফাইল ** | 1,000 পৃষ্ঠা | 3 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | --- | --- | --- |
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | --- | --- | --- |
ছবি (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট ইমেজ | 3,000 ছবি | 3টি ছবি | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | --- | --- | 4টি ছবি |
সর্বোচ্চ সংখ্যা আউটপুট ইমেজ | --- | 10টি ছবি | --- | --- | 10টি ছবি | --- | 4টি ছবি | 4টি ছবি |
সর্বোচ্চ আকার প্রতি ইনপুট base64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | --- | --- | --- |
ভিডিও (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইলের | 10টি ফাইল | --- | 10টি ফাইল | 10টি ফাইল | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (শুধু ফ্রেম) | ~60 মিনিট | --- | ~60 মিনিট | ~60 মিনিট | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (ফ্রেম+অডিও) | ~45 মিনিট | --- | ~45 মিনিট | ~45 মিনিট | --- | --- | --- | --- |
অডিও (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলের | 1 ফাইল | --- | 1 ফাইল | 1 ফাইল | --- | --- | --- | --- |
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইলের | --- | --- | --- | --- | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সব ইনপুট অডিও | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সব আউটপুট অডিও | --- | --- | --- | --- | --- | --- | --- | --- |
* সমস্ত মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য, তাই 100টি টোকেন প্রায় 60-80টি ইংরেজি শব্দ। মিথুন মডেলের জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধে মোট টোকেনের সংখ্যা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠার সংখ্যা মডেলটি সমর্থন করতে পারে এমন চিত্রগুলির সংখ্যার মধ্যে সীমাবদ্ধ।
অতিরিক্ত বিস্তারিত তথ্য খুঁজুন
প্রতিটি মডেলের জন্য কোটা এবং মূল্য আলাদা। দাম ইনপুট এবং আউটপুট উপর নির্ভর করে.
সমর্থিত ইনপুট ফাইলের ধরন সম্পর্কে জানুন, কীভাবে MIME প্রকার নির্দিষ্ট করবেন এবং কীভাবে নিশ্চিত করবেন যে আপনার ইনপুট ফাইল এবং মাল্টিমোডাল অনুরোধগুলি প্রয়োজনীয়তাগুলি পূরণ করে এবং সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তাগুলিতে সর্বোত্তম অনুশীলনগুলি অনুসরণ করে।
মডেল সংস্করণ এবং নামকরণের ধরণ
মডেলগুলি স্থিতিশীল , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণে দেওয়া হয়। সুবিধার জন্য, স্পষ্ট সংস্করণ মান ছাড়া উপনাম সমর্থিত।
আপনার কোডে ব্যবহার করার জন্য নির্দিষ্ট মডেলের নাম খুঁজতে, এই পৃষ্ঠায় পরে "উপলভ্য মডেলের নাম" বিভাগটি দেখুন।
সংস্করণ প্রকার / মুক্তির মঞ্চ | বর্ণনা | মডেল নামের প্যাটার্ন | |
---|---|---|---|
স্থিতিশীল | স্থিতিশীল সংস্করণগুলি প্রকাশের তারিখ থেকে শুরু করে উত্পাদন ব্যবহারের জন্য উপলব্ধ এবং সমর্থিত। একটি স্থিতিশীল মডেল সংস্করণ সাধারণত একটি অবসর গ্রহণের তারিখের সাথে প্রকাশিত হয়, যা মডেলটি উপলব্ধ যে শেষ দিনটি নির্দেশ করে। এই তারিখের পরে, মডেলটি আর অ্যাক্সেসযোগ্য বা গুগল দ্বারা সমর্থিত নয়। |
| |
অটো-আপডেটেড স্থিতিশীল ওরফে (কেবল জেমিনি ২.০ মডেল) | অটো-আপডেটেড স্থিতিশীল নামগুলি সর্বদা সেই মডেলের সর্বশেষতম স্থিতিশীল সংস্করণটির দিকে নির্দেশ করে। যদি একটি নতুন স্থিতিশীল সংস্করণ প্রকাশিত হয়, অটো-আপডেটেড ওরফে স্বয়ংক্রিয়ভাবে সেই নতুন স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করা শুরু করে। | কেবল মিথুন 2.0 মডেল উদাহরণ: | |
পূর্বরূপ | পূর্বরূপ সংস্করণগুলির নতুন ক্ষমতা রয়েছে এবং এটি স্থিতিশীল নয় বলে বিবেচিত হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না , আরও সীমাবদ্ধ হারের সীমা নিয়ে আসুন এবং বিলিংয়ের প্রয়োজনীয়তা থাকতে পারে। ভার্টেক্স এআই জেমিনি এপিআইয়ের জন্য, 2025 সালের জুনের পরে প্রকাশিত পূর্বরূপ মডেলগুলির জন্য সাধারণত আপনাকে মডেলটির অবস্থানটি | পূর্বরূপ সংস্করণগুলির মডেল নামগুলির সাথে যুক্ত করা হয় উদাহরণ: | |
পরীক্ষামূলক | পরীক্ষামূলক সংস্করণগুলির নতুন ক্ষমতা রয়েছে এবং এটি স্থিতিশীল নয় বলে বিবেচিত হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না এবং আরও সীমাবদ্ধ হারের সীমা সহ আসে। পরীক্ষামূলক মডেলগুলি প্রতিক্রিয়া সংগ্রহ করার জন্য এবং আমাদের সর্বশেষ বৈশিষ্ট্যগুলির সাথে পরীক্ষা -নিরীক্ষা সক্ষম করার উদ্দেশ্যে। ভার্টেক্স এআই জেমিনি এপিআইয়ের জন্য, 2025 সালের জুনের পরে প্রকাশিত পরীক্ষামূলক মডেলগুলির জন্য আপনাকে মডেলটির অবস্থানটি | পরীক্ষামূলক সংস্করণগুলির মডেল নামগুলির সাথে যুক্ত করা হয় উদাহরণ: | |
অবসরপ্রাপ্ত | অবসরপ্রাপ্ত সংস্করণগুলি তাদের অবসর গ্রহণের তারিখ পেরিয়ে গেছে এবং স্থায়ীভাবে নিষ্ক্রিয় করা হয়েছে। অবসরপ্রাপ্ত মডেলগুলি আর অ্যাক্সেসযোগ্য বা গুগল দ্বারা সমর্থিত নয় এবং অবসরপ্রাপ্ত মডেল আইডি উল্লেখ করার অনুরোধগুলি সাধারণত 404 ত্রুটি দেয়। | --- |
উপলভ্য মডেল নাম
মডেলের নামগুলি হ'ল স্পষ্ট মান যা আপনি মডেলটির সূচনা করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
প্রোগ্রামিকভাবে সমস্ত উপলব্ধ মডেল তালিকাভুক্ত করুন
আপনি REST এপিআই ব্যবহার করে সমস্ত উপলভ্য মডেলের নাম তালিকাভুক্ত করতে পারেন:
মিথুন বিকাশকারী এপিআই :
models.list
কল করুন list লিস্ট এন্ডপয়েন্টভার্টেক্স এআই জেমিনি এপিআই :
publishers.models.list
এন্ডপয়েন্ট
নোট করুন যে এই ফিরে আসা তালিকায় এপিআই সরবরাহকারীদের দ্বারা সমর্থিত সমস্ত মডেল অন্তর্ভুক্ত থাকবে তবে ফায়ারবেস এআই লজিক কেবল এই পৃষ্ঠায় বর্ণিত মিথুন এবং ইমেজড মডেলগুলিকে সমর্থন করে। এছাড়াও নোট করুন যে অটো-আপডেটেড এলিয়াসগুলি (উদাহরণস্বরূপ, gemini-2.0-flash
) তালিকাভুক্ত নয় কারণ তারা বেস মডেলের সুবিধার্থে উপনাম।
মিথুন মডেলের নাম
আপনার প্ল্যাটফর্মের জন্য সূচনা উদাহরণগুলির জন্য, শুরু করা গাইডটি দেখুন।
রিলিজের পর্যায়ে (বিশেষত ব্যবহারের ক্ষেত্রে এবং বিলিংয়ের জন্য) সম্পর্কে বিশদগুলির জন্য, মডেল সংস্করণ এবং নামকরণের নিদর্শনগুলি দেখুন।
মিথুন 2.5 প্রো মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-pro | জেমিনি 2.5 প্রো এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-06-17 | এর আগে আর নেই 2026-06-17 |
মিথুন 2.5 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-flash | জেমিনি 2.5 ফ্ল্যাশের স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-06-17 | এর আগে আর নেই 2026-06-17 |
মিথুন 2.5 ফ্ল্যাশ - লাইট মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-flash-lite | জেমিনি 2.5 ফ্ল্যাশ - লাইটের স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-07-22 | এর আগে আর নেই 2026-07-22 |
মিথুন 2.5 ফ্ল্যাশ ইমেজ মডেলের নাম (ওরফে "ন্যানো কলা")
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-flash-image | জেমিনি 2.5 ফ্ল্যাশ চিত্রের জন্য স্থিতিশীল সংস্করণ (ওরফে "ন্যানো কলা") | স্থিতিশীল | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | জেমিনি 2.5 ফ্ল্যাশ চিত্রের জন্য পূর্বরূপ সংস্করণ (ওরফে "ন্যানো কলা") | পূর্বরূপ | 2025-08-26 | 2025-10-31 |
মিথুন 2.5 ফ্ল্যাশ লাইভ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-live-2.5-flash | জেমিনি 2.5 ফ্ল্যাশ লাইভের জন্য স্থিতিশীল সংস্করণ | স্থিতিশীল (প্রাইভেট জিএ) 1 | 2025-06-01 | এর আগে আর নেই 2026-06-01 |
gemini-live-2.5-flash-preview 2 | জেমিনি 2.5 ফ্ল্যাশ লাইভের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-06-01 | নির্ধারণ করা |
নোট করুন যে Live API 2.5 মডেলের নামগুলিতে live
বিভাগটি তাত্ক্ষণিকভাবে gemini
বিভাগটি অনুসরণ করে।
ফায়ারবেস এআই লজিক এখনও নেটিভ অডিও মডেলগুলিকে সমর্থন করে না (যেমন gemini-2.5-flash-native-audio-preview-09-2025
)।
1 অ্যাক্সেসের জন্য অনুরোধ করতে আপনার Google Cloud অ্যাকাউন্ট দলের প্রতিনিধির কাছে পৌঁছান।
2 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন ভার্টেক্স এআই জেমিনি এপিআই দ্বারা সমর্থিত নয়।
মিথুন 2.0 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-001 | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-05 | এর আগে আর নেই 2026-02-05 |
gemini-2.0-flash | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষতম স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করে অটো-আপডেটেড ওরফে (বর্তমানে gemini-2.0-flash-001 ) | স্থিতিশীল | 2025-02-10 | --- |
মিথুন 2.0 ফ্ল্যাশ - লাইট মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | জেমিনি 2.0 ফ্ল্যাশ - লাইটের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-25 | এর আগে আর নেই 2026-02-25 |
gemini-2.0-flash-lite | জেমিনি 2.0 ফ্ল্যাশ-লাইটের সর্বশেষতম স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করে অটো-আপডেটেড ওরফে (বর্তমানে gemini-2.0-flash-lite-001 ) | স্থিতিশীল | 2025-02-25 | --- |
মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | জেমিনি 2.0 ফ্ল্যাশ চিত্র প্রজন্মের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | 2025-10-31 |
মিথুন 2.0 ফ্ল্যাশ লাইভ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | জেমিনি 2.0 ফ্ল্যাশ লাইভের জন্য স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-04-01 | এর আগে আর নেই 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | জেমিনি 2.0 ফ্ল্যাশ লাইভের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-09 | নির্ধারণ করা |
2 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন ভার্টেক্স এআই জেমিনি এপিআই দ্বারা সমর্থিত নয়।
ইমেজ মডেল নাম
আপনার প্ল্যাটফর্মের জন্য সূচনা উদাহরণগুলির জন্য, ইমেজেন গাইড সহ উত্পন্ন চিত্রগুলি দেখুন।
রিলিজের পর্যায়ে (বিশেষত ব্যবহারের ক্ষেত্রে এবং বিলিংয়ের জন্য) সম্পর্কে বিশদগুলির জন্য, মডেল সংস্করণ এবং নামকরণের নিদর্শনগুলি দেখুন।
4 মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4.0-generate-001 | ইমেজেন 4 এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে কোনও আগে নেই |
imagen-4.0-generate-preview-06-06 | ইমেজেন 4 এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
4 টি দ্রুত মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | ইমেজেন 4 ফাস্টের স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে কোনও আগে নেই |
imagen-4.0-fast-generate-preview-06-06 3 | ইমেজেন 4 দ্রুতের পূর্বরূপ সংস্করণ (শীঘ্রই অবসর গ্রহণ করা হবে - ব্যবহার করবেন না) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
4 আল্ট্রা মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | ইমেজেন 4 আল্ট্রা এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে কোনও আগে নেই |
imagen-4.0-ultra-generate-preview-06-06 | ইমেজেন 4 আল্ট্রা এর পূর্বরূপ সংস্করণ (শীঘ্রই অবসর গ্রহণ করা হবে - ব্যবহার করবেন না) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
ইমেজ 3 মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-generate-002 | ইমেজেন 3 এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-01-23 | 2026-01-23 এর আগে কোনও আগে নেই |
imagen-3.0-generate-001 3 | ইমেজেন 3 এর প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে কোনও আগে নেই |
ইমেজ 3 দ্রুত মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | ইমেজেন 3 দ্রুতের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে কোনও আগে নেই |
3 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন মিথুন বিকাশকারী এপিআই দ্বারা সমর্থিত নয়।
ইমেজ 3 সক্ষমতা মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-capability-001 3 | ইমেজেন 3 সামর্থ্যের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-12-10 | 2025-12-10 এর আগে কোনও আগে নেই |
3 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন মিথুন বিকাশকারী এপিআই দ্বারা সমর্থিত নয়।
সমর্থিত ভাষা
মিথুন
সমস্ত জেমিনি মডেলগুলি নিম্নলিখিত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আরবি (এআর), বাংলা (বিএন), বুলগেরিয়ান (বিজি), চীনা সরল ও traditional তিহ্যবাহী (জেডএইচ), ক্রোয়েশিয়ান (এইচআর), চেক (সিএস), ডেনিশ (ডিএ), ডাচ (এনএল), ইংলিশ (এন), এস্তোনিয়ান (ইটি), ফিনিশ (এফআই), জার্মান (ডি), জার্মান (ডি) (হু), ইন্দোনেশিয়ান (আইডি), ইতালিয়ান (আইটি), জাপানি (জেএ), কোরিয়ান (কেও), লাত্ভিয়ান (এলভি), লিথুয়ানিয়ান (এলটি), নরওয়েজিয়ান (এনও), পোলিশ (পিএল), পর্তুগিজ (পিটি), রোমানিয়ান (আরও), রাশিয়ান (আরইউ), সার্বিয়ান (এসআর), স্লোভাক (এসকে), স্লোভেনিয়ান (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু) (ইউকে), ভিয়েতনামী (vi)
জেমিনি ২.০ ফ্ল্যাশ , জেমিনি 1.5 প্রো এবং জেমিনি 1.5 ফ্ল্যাশ মডেলগুলি নিম্নলিখিত অতিরিক্ত ভাষাগুলিতে বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আফ্রিকান (এএফ), আমহারিক (এএম), আসামিজ (এএস), আজারবাইজান (এজেড), বেলারুশিয়ান (বিই), বসনিয়ান (বিএস), কাতালান (সিএ), সেবুয়ানো (সিইবি), কর্সিকান (সিওয়াই), ডিভিও (ডিভি), ডিএইচআইএই (ডিভি), ডিএইচআইএইচআই (ডিভি), ডিএইচআইএইচআই (ডিএইচআই) ফিলিপিনো (তাগালগ) (ফিল), ফ্রিসিয়ান (এফওয়াই), আইরিশ (জিএ), স্কটস গ্যালিক ) ক্রিও (ক্রি), কুর্দিশ (কেইউ), কিরগিজ (কেওয়াই), লাতিন (এলএ), লাক্সেমবার্গিশ (এলবি), লাও (এলও), মালাগ্যাসি (এমজি), মাওরি (এমআই), ম্যাসেডোনিয়ান (এমকে), মালায়ালাম (এমএল), মঙ্গোলিয়ান (এমএন), মাইটেলন (মণিপুরি), ম্যালা (মালা), মালা (এমএনআই), মালাথি (এমআর) নেপালি (নে), নানজা (চিচওয়া) (এনওয়াই), ওডিয়া (ওরিয়া) (ওআর), পাঞ্জাবি (পিএ), পশতো (পিএস), সিন্ধি (এসডি), সিংহালা (সিংহালি) (সি), সামোয়ান (এসএম), শোনা (এসএন), সোমালি (এসও), আলবেনিয়ান (এসকিউ), সেসোথো (এসটি), সেসোথো (এসটি), সেসোথো (এসটি), সেসোথো (এসটি), সান্দান (এসটি), সান্দান (এসটি), সান্দান (এসটি), সেসদো (এসটি), সোন্দান (এসটি) (টিজি), ইউঘুর (ইউজি), উর্দু (ইউআর), উজবেক (ইউজেড), জোসা (এক্সএইচ), ইহুদী (ইয়ে), ইওরুবা (ইও), জুলু (জু)
চিত্র
সাধারণ প্রাপ্যতা : ইংরেজি
পূর্বরূপ : চাইনিজ (সরলীকৃত), চাইনিজ (traditional তিহ্যবাহী), হিন্দি, জাপানি, কোরিয়ান, পর্তুগিজ, স্প্যানিশ
পুরানো মডেল সম্পর্কে তথ্য
মডেল | ইনপুট | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
ফায়ারবেস এআই লজিক সহ প্রতিটি মডেল ব্যবহার করার সময় এগুলি ইনপুট এবং আউটপুট প্রকারগুলি:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
ইনপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
নথিপত্র (পিডিএফএস বা প্লেইন-টেক্সট) | |||||||
ছবি | |||||||
ভিডিও | |||||||
অডিও | |||||||
অডিও (স্ট্রিমিং) | |||||||
আউটপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
স্ট্রাকচার্ড আউটপুট (জসনের মতো) | |||||||
চিত্র, ভিডিও এবং অডিও |
ফায়ারবেস এআই লজিক সহ প্রতিটি মডেল ব্যবহার করার সময় এগুলি ক্ষমতা এবং বৈশিষ্ট্যগুলি:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | |
---|---|---|---|---|
কেবল পাঠ্য- ইনপুট থেকে পাঠ্য তৈরি করুন | ||||
মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ||||
ছবি তৈরি করুন | ||||
অডিও জেনারেট করুন | ||||
কাঠামোগত আউটপুট উত্পন্ন করুন (জসনের মতো) | ||||
নথি বিশ্লেষণ করুন (পিডিএফএস বা প্লেইন-টেক্সট) | ||||
চিত্র বিশ্লেষণ (দৃষ্টি) | ||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | ||||
অডিও বিশ্লেষণ করুন | ||||
মাল্টি-টার্ন চ্যাট | ||||
ফাংশন কলিং (সরঞ্জাম) | ||||
টোকেন এবং বিলযোগ্য অক্ষর গণনা করুন | ||||
সিস্টেম নির্দেশাবলী | ||||
দ্বি -নির্দেশমূলক মাল্টিমোডাল স্ট্রিমিং |
ফায়ারবেস এআই লজিক সহ প্রতিটি মডেল ব্যবহার করার সময় এগুলি স্পেসিফিকেশন এবং সীমাবদ্ধতা:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 2,097,152 টোকেন | 1,048,576 টোকেন | 16,384 টোকেন | 32,760 টোকেন | |||
আউটপুট টোকেন সীমা * | 8,192 টোকেন | 8,192 টোকেন | 2,048 টোকেন | 8,192 টোকেন | |||
জ্ঞান কাটঅফ তারিখ | মে 2024 | মে 2024 | ফেব্রুয়ারি 2023 | ফেব্রুয়ারি 2023 | |||
পিডিএফএস (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3,000 ফাইল | 16টি ফাইল | --- | |||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল প্রতি পৃষ্ঠাগুলি ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 16 পৃষ্ঠা | --- | |||
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | --- | |||
চিত্র (অনুরোধ প্রতি) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট চিত্র | 3,000 চিত্র | 3,000 চিত্র | 16টি ছবি | --- | |||
সর্বোচ্চ সংখ্যা আউটপুট চিত্র | --- | --- | --- | --- | |||
সর্বোচ্চ আকার প্রতি ইনপুট বেস 64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | --- | |||
ভিডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইল | 10টি ফাইল | 10টি ফাইল | 1 ফাইল | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিওর (কেবল ফ্রেম) | ~ 60 মিনিট | ~ 60 মিনিট | 2 মিনিট | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিওর (ফ্রেম+অডিও) | ~45 মিনিট | ~45 মিনিট | --- | --- | |||
অডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলগুলির | 1 ফাইল | 1 ফাইল | --- | --- | |||
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইল | --- | --- | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট অডিও | ~ 8.4 ঘন্টা | ~ 8.4 ঘন্টা | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত আউটপুট অডিওর | --- | --- | --- | --- |
* সমস্ত জেমিনি মডেলের জন্য, একটি টোকেন প্রায় 4 টি অক্ষরের সমতুল্য, সুতরাং 100 টি টোকেন প্রায় 60-80 ইংরেজি শব্দ। জেমিনি মডেলগুলির জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধগুলিতে মোট টোকেনের মোট গণনা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, সুতরাং পিডিএফের একটি একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠাগুলির সংখ্যা মডেল যে চিত্রগুলি সমর্থন করতে পারে তার মধ্যে সীমাবদ্ধ।
মডেলের নামগুলি হ'ল স্পষ্ট মান যা আপনি মডেলটির সূচনা করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
মিথুন 1.5 প্রো মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.5-pro-002 | জেমিনি 1.5 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | জেমিনি 1.5 প্রো এর প্রাথমিক স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-05-24 | 2025-05-24 |
অটো-আপডেটেড স্থিতিশীল ওরফে | ||||
gemini-1.5-pro | 1.5 প্রো এর সর্বশেষতম স্থিতিশীল সংস্করণে নির্দেশ করে (বর্তমানে gemini-1.5-pro-002 ) | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
মিথুন 1.5 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.5-flash-002 | জেমিনি 1.5 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | জেমিনি 1.5 ফ্ল্যাশের প্রাথমিক স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-05-24 | 2025-05-24 |
অটো-আপডেটেড স্থিতিশীল ওরফে | ||||
gemini-1.5-flash | 1.5 ফ্ল্যাশের সর্বশেষতম স্থিতিশীল সংস্করণে নির্দেশ করে (বর্তমানে gemini-1.5-flash-002 ) | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
মিথুন 1.0 প্রো ভিশন মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.0-pro-vision-001 | জেমিনি 1.0 প্রো ভিশনের সর্বশেষ স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
অটো-আপডেটেড স্থিতিশীল ওরফে | ||||
gemini-1.0-pro-vision | 1.5 প্রো ভিশনের সর্বশেষতম স্থিতিশীল সংস্করণে নির্দেশ করে (বর্তমানে gemini-1.5-pro-vision-001 ) | অবসরপ্রাপ্ত | 2024-01-04 | 2025-04-21 |
মিথুন 1.0 প্রো মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.0-pro-002 | জেমিনি 1.0 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | জেমিনি 1.0 প্রো এর স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
অটো-আপডেটেড স্থিতিশীল ওরফে | ||||
gemini-1.0-pro | 1.0 প্রো এর সর্বশেষতম স্থিতিশীল সংস্করণে নির্দেশ করে (বর্তমানে gemini-1.0-pro-002 ) | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
পরবর্তী পদক্ষেপ
জেমিনি এপিআই এর ক্ষমতা চেষ্টা করে দেখুন
- মাল্টি-টার্ন কথোপকথন (চ্যাট) তৈরি করুন।
- কেবল পাঠ্য-প্রম্পটগুলি থেকে পাঠ্য তৈরি করুন।
- চিত্র , পিডিএফএস , ভিডিও এবং অডিওর মতো বিভিন্ন ফাইলের ধরণের সাথে অনুরোধ করে পাঠ্য তৈরি করুন।
- উভয় পাঠ্য এবং মাল্টিমোডাল প্রম্পট থেকে কাঠামোগত আউটপুট (জেএসনের মতো) উত্পন্ন করুন।
- পাঠ্য প্রম্পটগুলি থেকে চিত্র তৈরি করুন ( মিথুন বা ইমেজেন )।
- Gemini Live API ব্যবহার করে স্ট্রিম ইনপুট এবং আউটপুট (অডিও সহ)।
- আপনার অ্যাপ্লিকেশন এবং বাহ্যিক সিস্টেম এবং তথ্যের অন্যান্য অংশের সাথে একটি মিথুন মডেলকে সংযুক্ত করতে সরঞ্জামগুলি ( গুগল অনুসন্ধানের সাথে ফাংশন কলিং এবং গ্রাউন্ডিং) ব্যবহার করুন।
মোবাইল এবং ওয়েব অ্যাপ্লিকেশনগুলির জন্য, ফায়ারবেস এআই লজিক এসডিকে আপনাকে আপনার অ্যাপ্লিকেশন থেকে সরাসরি সমর্থিত মিথুন মডেল এবং ইমেজ মডেলগুলির সাথে ইন্টারঅ্যাক্ট করতে দেয়।
মিথুন মডেলগুলি মাল্টিমোডাল হিসাবে বিবেচিত হয় কারণ তারা পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও এবং অডিও সহ একাধিক পদ্ধতি প্রক্রিয়াকরণ এবং এমনকি তৈরি করতে সক্ষম। ইমেজড মডেলগুলি চিত্র তৈরি করতে পাঠ্য দিয়ে অনুরোধ করা যেতে পারে।
নিম্নলিখিত টেবিলটি ফায়ারবেস এআই লজিকের জন্য সমর্থিত মডেলগুলির একটি সংক্ষিপ্ত ওভারভিউ এবং তাদের সর্বশেষ স্থিতিশীল মডেলের নাম। এই টেবিলটি প্রোটোটাইপিং ব্যবহারের ক্ষেত্রে উপলভ্য পূর্বরূপ এবং পরীক্ষামূলক মডেলগুলিও তালিকাভুক্ত করে।
এছাড়াও, ফায়ারবেস এআই লজিক সমর্থন করে এবং সমর্থন করে না এমন সমস্ত মডেল সম্পর্কে আমাদের এফএকিউ পর্যালোচনা করুন।
মিথুন মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ মিথুন মডেল | |||
Gemini 2.5 Progemini-2.5-pro | পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও, অডিও | পাঠ্য, কোড, জসন | আমাদের সবচেয়ে উন্নত যুক্তি মডেল, জটিল সমস্যাগুলি সমাধান করতে সক্ষম। |
মিথুন 2.5 ফ্ল্যাশgemini-2.5-flash | পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও, অডিও | পাঠ্য, কোড, জসন | আমাদের চিন্তাভাবনা মডেল যা দুর্দান্ত, সুদৃ .় ক্ষমতা সরবরাহ করে। এটি মূল্য এবং পারফরম্যান্সের মধ্যে ভারসাম্য সরবরাহ করার জন্য ডিজাইন করা হয়েছে। |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও, অডিও | পাঠ্য, কোড, জসন | আমাদের সবচেয়ে সুষম মিথুন মডেল, স্বল্প-লেটেন্সি ব্যবহারের কেস এবং ব্যয়-সচেতন অ্যাপ্লিকেশনগুলির জন্য অনুকূলিত। |
মিথুন 2.5 ফ্ল্যাশ চিত্রgemini-2.5-flash-image | পাঠ্য, কোড, পিডিএফএস, চিত্র | চিত্র, পাঠ্য এবং চিত্র | আমাদের স্ট্যান্ডার্ড ফ্ল্যাশ মডেল চিত্র প্রজন্ম এবং কথোপকথন, মাল্টি-টার্ন সম্পাদনা ক্ষমতা সহ দ্রুত সৃজনশীল কর্মপ্রবাহের জন্য আপগ্রেড করেছে। (ওরফে "ন্যানো কলা") |
Gemini 2.0 Flashgemini-2.0-flash-001 | পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও, অডিও | পাঠ্য, কোড, জসন | উচ্চতর গতি, অন্তর্নির্মিত সরঞ্জাম ব্যবহার এবং 1 এম টোকেন প্রসঙ্গ উইন্ডো সহ পরবর্তী-জেন বৈশিষ্ট্য এবং উন্নত ক্ষমতা সহ আমাদের মাল্টিমোডাল মডেল |
মিথুন 2.0 ফ্ল্যাশ - লাইটgemini-2.0-flash-lite-001 | পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও, অডিও | পাঠ্য, কোড, জসন | আমাদের দ্রুত এবং সবচেয়ে ব্যয়বহুল দক্ষ ফ্ল্যাশ মডেল। এটি 1.5 ফ্ল্যাশ ব্যবহারকারীদের জন্য একটি আপগ্রেড পথ যারা একই দাম এবং গতির জন্য আরও ভাল মানের চান। |
কেবলমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ জেমিনি মডেলগুলি (কেবলমাত্র প্রোটোটাইপিংয়ের জন্য প্রস্তাবিত) | |||
মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশনgemini-2.0-flash-preview-image-generation | পাঠ্য, কোড, পিডিএফএস, চিত্র | চিত্র, পাঠ্য এবং চিত্র | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং চিত্র আউটপুট সমর্থন করে। |
মিথুন 2.0 ফ্ল্যাশ লাইভ 1gemini-2.0-flash-live-preview-04-09 | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং আউটপুটগুলির কম-লেটেন্সি রিয়েলটাইম স্ট্রিমিং সমর্থন করে। |
1 অতিরিক্ত মডেলের নামগুলি আপনার নির্বাচিত জেমিনি এপিআই সরবরাহকারী এবং অ্যাক্সেসের উপর নির্ভর করে Live API সমর্থন করে ( Live API পৃষ্ঠা দেখুন)।
ইমেজ মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ মডেলগুলি | |||
চিত্র 4imagen-4.0-generate-001 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য অনুরোধগুলি থেকে বাস্তববাদী, উচ্চমানের চিত্রগুলি উত্পন্ন করে |
4 দ্রুত ইমেজ করুনimagen-4.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা স্বল্প-লেটেন্সি ব্যবহারের ক্ষেত্রে চিত্র তৈরি করে |
চিত্র 4 আল্ট্রাimagen-4.0-ultra-generate-001 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য অনুরোধগুলি থেকে বাস্তববাদী, উচ্চমানের চিত্রগুলি উত্পন্ন করে |
চিত্র 3imagen-3.0-generate-002 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য অনুরোধগুলি থেকে বাস্তববাদী, উচ্চমানের চিত্রগুলি উত্পন্ন করে |
ইমেজ 3 দ্রুত 2imagen-3.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা স্বল্প-লেটেন্সি ব্যবহারের ক্ষেত্রে চিত্র তৈরি করে |
ইমেজ 3 ক্ষমতা 2imagen-3.0-capability-001 | পাঠ্য, চিত্র | ছবি | চিত্রগুলি সম্পাদনা করে এবং উত্পন্ন করে; রেফারেন্স চিত্রগুলি ব্যবহার করে মাস্ক-ভিত্তিক সম্পাদনা এবং কাস্টমাইজেশন উভয়কেই সমর্থন করে |
কেবলমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ মডেলগুলি (কেবলমাত্র প্রোটোটাইপিংয়ের জন্য প্রস্তাবিত) | |||
--- | --- | --- | --- |
2 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন মিথুন বিকাশকারী এপিআই দ্বারা সমর্থিত নয়।
এই পৃষ্ঠার বাকী অংশগুলি ফায়ারবেস এআই লজিক দ্বারা সমর্থিত মডেলগুলি সম্পর্কে বিস্তারিত তথ্য সরবরাহ করে।
- সমর্থিত ইনপুট এবং আউটপুট
- সমর্থিত ক্ষমতাগুলির উচ্চ-স্তরের তুলনা
- স্পেসিফিকেশন এবং সীমাবদ্ধতা, উদাহরণস্বরূপ সর্বাধিক ইনপুট টোকেন বা ইনপুট ভিডিওর সর্বাধিক দৈর্ঘ্য
মডেলগুলি কীভাবে সংস্করণ করা হয় তার বিবরণ, বিশেষত তাদের স্থিতিশীল , অটো-আপডেট , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ
প্রারম্ভিককরণের সময় আপনার কোডে অন্তর্ভুক্ত করার জন্য উপলব্ধ মডেলের নামগুলির তালিকা
মডেলগুলির জন্য সমর্থিত ভাষার তালিকা
এই পৃষ্ঠার নীচে, আপনি পুরানো মডেলগুলি সম্পর্কে বিস্তারিত তথ্য দেখতে পারেন।
মডেল তুলনা করুন
প্রতিটি মডেলের বিভিন্ন ব্যবহারের ক্ষেত্রে সমর্থন করার জন্য বিভিন্ন ক্ষমতা রয়েছে। নোট করুন যে এই বিভাগের প্রতিটি টেবিলগুলি ফায়ারবেস এআই লজিকের সাথে ব্যবহৃত হওয়ার সময় প্রতিটি মডেলকে বর্ণনা করে। প্রতিটি মডেলের অতিরিক্ত ক্ষমতা থাকতে পারে যা আমাদের এসডিকে ব্যবহার করার সময় উপলভ্য নয়।
নিম্নলিখিত উপ-বিভাগগুলিতে আপনি যে তথ্যটি সন্ধান করছেন তা যদি আপনি খুঁজে না পান তবে আপনি আপনার নির্বাচিত এপিআই সরবরাহকারীর ডকুমেন্টেশনে আরও তথ্য পেতে পারেন:
মিথুন বিকাশকারী এপিআই : মিথুন মডেল এবং ইমেজ মডেল
ভার্টেক্স এআই জেমিনি এপিআই : জেমিনি মডেল এবং ইমেজড মডেলগুলি
সমর্থিত ইনপুট এবং আউটপুট
ফায়ারবেস এআই লজিক সহ প্রতিটি মডেল ব্যবহার করার সময় এগুলি সমর্থিত ইনপুট এবং আউটপুট প্রকারগুলি:
মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ (উত্পন্ন) | ইমেজ (সক্ষমতা) | |
---|---|---|---|---|---|---|---|---|
ইনপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
নথিপত্র (পিডিএফএস বা প্লেইন-টেক্সট) | ||||||||
ছবি | ||||||||
ভিডিও | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) | ||||||||
আউটপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
স্ট্রাকচার্ড আউটপুট (জসনের মতো) | ||||||||
ছবি | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) |
সমর্থিত ফাইলের ধরণগুলি সম্পর্কে জানতে, সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তাগুলি দেখুন।
সমর্থিত ক্ষমতা এবং বৈশিষ্ট্য
ফায়ারবেস এআই লজিক সহ প্রতিটি মডেল ব্যবহার করার সময় এগুলি সমর্থিত ক্ষমতা এবং বৈশিষ্ট্যগুলি:
মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ (উত্পন্ন) | ইমেজ (সক্ষমতা) | |
---|---|---|---|---|---|---|---|---|
ভাবছেন | ||||||||
কেবলমাত্র পাঠ্য-বা মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ইন্টারলিভড বা চিত্রের অংশ হিসাবে | ইন্টারলিভড বা চিত্রের অংশ হিসাবে | শুধুমাত্র স্ট্রিমিং | |||||
ছবি তৈরি করুন ( মিথুন বা ইমেজেন ) | ||||||||
ছবি সম্পাদনা করুন ( মিথুন বা ইমেজেন ) | ||||||||
অডিও জেনারেট করুন | শুধুমাত্র স্ট্রিমিং | |||||||
কাঠামোগত আউটপুট উত্পন্ন করুন (জসনের মতো) | ||||||||
নথি বিশ্লেষণ করুন (পিডিএফএস বা প্লেইন-টেক্সট) | ||||||||
চিত্র বিশ্লেষণ (দৃষ্টি) | ||||||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | ||||||||
অডিও বিশ্লেষণ করুন | শুধুমাত্র স্ট্রিমিং | |||||||
মাল্টি-টার্ন চ্যাট | ||||||||
দ্বি -নির্দেশমূলক মাল্টিমোডাল স্ট্রিমিং | ||||||||
ফাংশন কলিং | ||||||||
কোড এক্সিকিউশন | ||||||||
Google অনুসন্ধানের সাথে গ্রাউন্ডিং | ||||||||
সিস্টেম নির্দেশাবলী | ||||||||
টোকেন গণনা করুন |
স্পেসিফিকেশন এবং সীমাবদ্ধতা
ফায়ারবেস এআই লজিক সহ প্রতিটি মডেল ব্যবহার করার সময় এগুলি স্পেসিফিকেশন এবং সীমাবদ্ধতা:
সম্পত্তি | মিথুন 2.5 প্রো, ফ্ল্যাশ, ফ্ল্যাশ-লাইট | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ (উত্পন্ন) | ইমেজ (সক্ষমতা) |
---|---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 1,048,576 টোকেন | 32,768 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 32,768 টোকেন | 32,768 টোকেন | 480 টোকেন | 480 টোকেন |
আউটপুট টোকেন সীমা * | 65,536 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | --- | --- |
জ্ঞান কাটঅফ তারিখ | জানুয়ারী 2025 | জুন 2025 | জুন 2024 | জুন 2024 | আগস্ট 2024 | আগস্ট 2024 | --- | --- |
পিডিএফএস (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3টি ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | --- | --- | --- |
সর্বোচ্চ সংখ্যা পৃষ্ঠাগুলির প্রতি ইনপুট পিডিএফ ফাইল ** | 1,000 পৃষ্ঠা | 3 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | --- | --- | --- |
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | --- | --- | --- |
চিত্র (অনুরোধ প্রতি) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট চিত্র | 3,000 চিত্র | 3টি ছবি | 3,000 চিত্র | 3,000 চিত্র | 3,000 চিত্র | --- | --- | 4টি ছবি |
সর্বোচ্চ সংখ্যা আউটপুট চিত্র | --- | 10টি ছবি | --- | --- | 10টি ছবি | --- | 4টি ছবি | 4টি ছবি |
সর্বোচ্চ আকার প্রতি ইনপুট বেস 64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | --- | --- | --- |
ভিডিও (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইল | 10টি ফাইল | --- | 10টি ফাইল | 10টি ফাইল | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিওর (কেবল ফ্রেম) | ~ 60 মিনিট | --- | ~ 60 মিনিট | ~ 60 মিনিট | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিওর (ফ্রেম+অডিও) | ~45 মিনিট | --- | ~45 মিনিট | ~45 মিনিট | --- | --- | --- | --- |
অডিও (প্রতি অনুরোধ) | ||||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলগুলির | 1 ফাইল | --- | 1 ফাইল | 1 ফাইল | --- | --- | --- | --- |
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইল | --- | --- | --- | --- | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট অডিও | ~ 8.4 ঘন্টা | ~ 8.4 ঘন্টা | ~ 8.4 ঘন্টা | ~ 8.4 ঘন্টা | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত আউটপুট অডিওর | --- | --- | --- | --- | --- | --- | --- | --- |
* সমস্ত জেমিনি মডেলের জন্য, একটি টোকেন প্রায় 4 টি অক্ষরের সমতুল্য, সুতরাং 100 টি টোকেন প্রায় 60-80 ইংরেজি শব্দ। জেমিনি মডেলগুলির জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধগুলিতে মোট টোকেনের মোট গণনা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, সুতরাং পিডিএফের একটি একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠাগুলির সংখ্যা মডেল যে চিত্রগুলি সমর্থন করতে পারে তার মধ্যে সীমাবদ্ধ।
অতিরিক্ত বিস্তারিত তথ্য সন্ধান করুন
প্রতিটি মডেলের জন্য কোটা এবং মূল্য আলাদা। মূল্য ইনপুট এবং আউটপুট উপরও নির্ভর করে।
সমর্থিত ইনপুট ফাইলের ধরণগুলি সম্পর্কে শিখুন, কীভাবে মাইম টাইপ নির্দিষ্ট করা যায় এবং কীভাবে আপনার ইনপুট ফাইলগুলি এবং মাল্টিমোডাল অনুরোধগুলি প্রয়োজনীয়তাগুলি পূরণ করে এবং সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তাগুলিতে সর্বোত্তম অনুশীলনগুলি অনুসরণ করে তা নিশ্চিত করতে হয়।
মডেল সংস্করণ এবং নামকরণ নিদর্শন
মডেলগুলি স্থিতিশীল , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণগুলিতে দেওয়া হয়। সুবিধার জন্য, সুস্পষ্ট সংস্করণ মানগুলি ছাড়াই আলিয়াসগুলি সমর্থিত।
আপনার কোডে ব্যবহারের জন্য নির্দিষ্ট মডেলের নামগুলি সন্ধান করতে, এই পৃষ্ঠায় পরে "উপলভ্য মডেল নামগুলি" বিভাগটি দেখুন।
সংস্করণ প্রকার / মুক্তির মঞ্চ | বর্ণনা | মডেল নাম প্যাটার্ন | |
---|---|---|---|
স্থিতিশীল | স্থিতিশীল সংস্করণগুলি প্রকাশের তারিখ থেকে শুরু করে উত্পাদন ব্যবহারের জন্য উপলব্ধ এবং সমর্থিত। একটি স্থিতিশীল মডেল সংস্করণ সাধারণত একটি অবসর গ্রহণের তারিখের সাথে প্রকাশিত হয়, যা মডেলটি উপলব্ধ যে শেষ দিনটি নির্দেশ করে। এই তারিখের পরে, মডেলটি আর অ্যাক্সেসযোগ্য বা গুগল দ্বারা সমর্থিত নয়। |
| |
অটো-আপডেটেড স্থিতিশীল ওরফে (কেবল জেমিনি ২.০ মডেল) | অটো-আপডেটেড স্থিতিশীল নামগুলি সর্বদা সেই মডেলের সর্বশেষতম স্থিতিশীল সংস্করণটির দিকে নির্দেশ করে। যদি একটি নতুন স্থিতিশীল সংস্করণ প্রকাশিত হয়, অটো-আপডেটেড ওরফে স্বয়ংক্রিয়ভাবে সেই নতুন স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করা শুরু করে। | কেবল মিথুন 2.0 মডেল উদাহরণ: | |
পূর্বরূপ | পূর্বরূপ সংস্করণগুলির নতুন ক্ষমতা রয়েছে এবং এটি স্থিতিশীল নয় বলে বিবেচিত হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না , আরও সীমাবদ্ধ হারের সীমা নিয়ে আসুন এবং বিলিংয়ের প্রয়োজনীয়তা থাকতে পারে। ভার্টেক্স এআই জেমিনি এপিআইয়ের জন্য, 2025 সালের জুনের পরে প্রকাশিত পূর্বরূপ মডেলগুলির জন্য সাধারণত আপনাকে মডেলটির অবস্থানটি | পূর্বরূপ সংস্করণগুলির মডেল নামগুলির সাথে যুক্ত করা হয় উদাহরণ: | |
পরীক্ষামূলক | পরীক্ষামূলক সংস্করণগুলির নতুন ক্ষমতা রয়েছে এবং এটি স্থিতিশীল নয় বলে বিবেচিত হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না এবং আরও সীমাবদ্ধ হারের সীমা সহ আসে। পরীক্ষামূলক মডেলগুলি প্রতিক্রিয়া সংগ্রহ করার জন্য এবং আমাদের সর্বশেষ বৈশিষ্ট্যগুলির সাথে পরীক্ষা -নিরীক্ষা সক্ষম করার উদ্দেশ্যে। ভার্টেক্স এআই জেমিনি এপিআইয়ের জন্য, 2025 সালের জুনের পরে প্রকাশিত পরীক্ষামূলক মডেলগুলির জন্য আপনাকে মডেলটির অবস্থানটি | পরীক্ষামূলক সংস্করণগুলির মডেল নামগুলির সাথে যুক্ত করা হয় উদাহরণ: | |
অবসরপ্রাপ্ত | অবসরপ্রাপ্ত সংস্করণগুলি তাদের অবসর গ্রহণের তারিখ পেরিয়ে গেছে এবং স্থায়ীভাবে নিষ্ক্রিয় করা হয়েছে। অবসরপ্রাপ্ত মডেলগুলি আর অ্যাক্সেসযোগ্য বা গুগল দ্বারা সমর্থিত নয় এবং অবসরপ্রাপ্ত মডেল আইডি উল্লেখ করার অনুরোধগুলি সাধারণত 404 ত্রুটি দেয়। | --- |
উপলভ্য মডেল নাম
মডেলের নামগুলি হ'ল স্পষ্ট মান যা আপনি মডেলটির সূচনা করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
প্রোগ্রামিকভাবে সমস্ত উপলব্ধ মডেল তালিকাভুক্ত করুন
আপনি REST এপিআই ব্যবহার করে সমস্ত উপলভ্য মডেলের নাম তালিকাভুক্ত করতে পারেন:
মিথুন বিকাশকারী এপিআই :
models.list
কল করুন list লিস্ট এন্ডপয়েন্টভার্টেক্স এআই জেমিনি এপিআই :
publishers.models.list
এন্ডপয়েন্ট
নোট করুন যে এই ফিরে আসা তালিকায় এপিআই সরবরাহকারীদের দ্বারা সমর্থিত সমস্ত মডেল অন্তর্ভুক্ত থাকবে তবে ফায়ারবেস এআই লজিক কেবল এই পৃষ্ঠায় বর্ণিত মিথুন এবং ইমেজড মডেলগুলিকে সমর্থন করে। এছাড়াও নোট করুন যে অটো-আপডেটেড এলিয়াসগুলি (উদাহরণস্বরূপ, gemini-2.0-flash
) তালিকাভুক্ত নয় কারণ তারা বেস মডেলের সুবিধার্থে উপনাম।
মিথুন মডেলের নাম
আপনার প্ল্যাটফর্মের জন্য সূচনা উদাহরণগুলির জন্য, শুরু করা গাইডটি দেখুন।
রিলিজের পর্যায়ে (বিশেষত ব্যবহারের ক্ষেত্রে এবং বিলিংয়ের জন্য) সম্পর্কে বিশদগুলির জন্য, মডেল সংস্করণ এবং নামকরণের নিদর্শনগুলি দেখুন।
মিথুন 2.5 প্রো মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-pro | জেমিনি 2.5 প্রো এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-06-17 | এর আগে আর নেই 2026-06-17 |
মিথুন 2.5 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-flash | জেমিনি 2.5 ফ্ল্যাশের স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-06-17 | এর আগে আর নেই 2026-06-17 |
মিথুন 2.5 ফ্ল্যাশ - লাইট মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-flash-lite | জেমিনি 2.5 ফ্ল্যাশ - লাইটের স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-07-22 | এর আগে আর নেই 2026-07-22 |
মিথুন 2.5 ফ্ল্যাশ ইমেজ মডেলের নাম (ওরফে "ন্যানো কলা")
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-flash-image | জেমিনি 2.5 ফ্ল্যাশ চিত্রের জন্য স্থিতিশীল সংস্করণ (ওরফে "ন্যানো কলা") | স্থিতিশীল | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | জেমিনি 2.5 ফ্ল্যাশ চিত্রের জন্য পূর্বরূপ সংস্করণ (ওরফে "ন্যানো কলা") | পূর্বরূপ | 2025-08-26 | 2025-10-31 |
মিথুন 2.5 ফ্ল্যাশ লাইভ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-live-2.5-flash | জেমিনি 2.5 ফ্ল্যাশ লাইভের জন্য স্থিতিশীল সংস্করণ | স্থিতিশীল (প্রাইভেট জিএ) 1 | 2025-06-01 | এর আগে আর নেই 2026-06-01 |
gemini-live-2.5-flash-preview 2 | জেমিনি 2.5 ফ্ল্যাশ লাইভের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-06-01 | নির্ধারণ করা |
নোট করুন যে Live API 2.5 মডেলের নামগুলিতে live
বিভাগটি তাত্ক্ষণিকভাবে gemini
বিভাগটি অনুসরণ করে।
ফায়ারবেস এআই লজিক এখনও নেটিভ অডিও মডেলগুলিকে সমর্থন করে না (যেমন gemini-2.5-flash-native-audio-preview-09-2025
)।
1 অ্যাক্সেসের জন্য অনুরোধ করতে আপনার Google Cloud অ্যাকাউন্ট দলের প্রতিনিধির কাছে পৌঁছান।
2 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন ভার্টেক্স এআই জেমিনি এপিআই দ্বারা সমর্থিত নয়।
মিথুন 2.0 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-001 | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-05 | এর আগে আর নেই 2026-02-05 |
gemini-2.0-flash | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষতম স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করে অটো-আপডেটেড ওরফে (বর্তমানে gemini-2.0-flash-001 ) | স্থিতিশীল | 2025-02-10 | --- |
মিথুন 2.0 ফ্ল্যাশ - লাইট মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | জেমিনি 2.0 ফ্ল্যাশ - লাইটের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-25 | এর আগে আর নেই 2026-02-25 |
gemini-2.0-flash-lite | জেমিনি 2.0 ফ্ল্যাশ-লাইটের সর্বশেষতম স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করে অটো-আপডেটেড ওরফে (বর্তমানে gemini-2.0-flash-lite-001 ) | স্থিতিশীল | 2025-02-25 | --- |
মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | জেমিনি 2.0 ফ্ল্যাশ চিত্র প্রজন্মের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | 2025-10-31 |
মিথুন 2.0 ফ্ল্যাশ লাইভ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | জেমিনি 2.0 ফ্ল্যাশ লাইভের জন্য স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-04-01 | এর আগে আর নেই 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | জেমিনি 2.0 ফ্ল্যাশ লাইভের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-09 | নির্ধারণ করা |
2 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন ভার্টেক্স এআই জেমিনি এপিআই দ্বারা সমর্থিত নয়।
ইমেজ মডেল নাম
আপনার প্ল্যাটফর্মের জন্য সূচনা উদাহরণগুলির জন্য, ইমেজেন গাইড সহ উত্পন্ন চিত্রগুলি দেখুন।
রিলিজের পর্যায়ে (বিশেষত ব্যবহারের ক্ষেত্রে এবং বিলিংয়ের জন্য) সম্পর্কে বিশদগুলির জন্য, মডেল সংস্করণ এবং নামকরণের নিদর্শনগুলি দেখুন।
4 মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4.0-generate-001 | ইমেজেন 4 এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে কোনও আগে নেই |
imagen-4.0-generate-preview-06-06 | ইমেজেন 4 এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
4 টি দ্রুত মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | ইমেজেন 4 ফাস্টের স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে কোনও আগে নেই |
imagen-4.0-fast-generate-preview-06-06 3 | ইমেজেন 4 দ্রুতের পূর্বরূপ সংস্করণ (শীঘ্রই অবসর গ্রহণ করা হবে - ব্যবহার করবেন না) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
4 আল্ট্রা মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | ইমেজেন 4 আল্ট্রা এর স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-08-14 | 2026-08-14 এর আগে কোনও আগে নেই |
imagen-4.0-ultra-generate-preview-06-06 | ইমেজেন 4 আল্ট্রা এর পূর্বরূপ সংস্করণ (শীঘ্রই অবসর গ্রহণ করা হবে - ব্যবহার করবেন না) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
ইমেজ 3 মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-generate-002 | ইমেজেন 3 এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-01-23 | 2026-01-23 এর আগে কোনও আগে নেই |
imagen-3.0-generate-001 3 | ইমেজেন 3 এর প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে কোনও আগে নেই |
ইমেজ 3 দ্রুত মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | ইমেজেন 3 দ্রুতের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে কোনও আগে নেই |
3 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন মিথুন বিকাশকারী এপিআই দ্বারা সমর্থিত নয়।
ইমেজ 3 সক্ষমতা মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-capability-001 3 | ইমেজেন 3 সামর্থ্যের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-12-10 | 2025-12-10 এর আগে কোনও আগে নেই |
3 আপনি কীভাবে এটি অ্যাক্সেস করেন না কেন মিথুন বিকাশকারী এপিআই দ্বারা সমর্থিত নয়।
সমর্থিত ভাষা
মিথুন
সমস্ত জেমিনি মডেলগুলি নিম্নলিখিত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আরবি (এআর), বাংলা (বিএন), বুলগেরিয়ান (বিজি), চীনা সরল ও traditional তিহ্যবাহী (জেডএইচ), ক্রোয়েশিয়ান (এইচআর), চেক (সিএস), ডেনিশ (ডিএ), ডাচ (এনএল), ইংলিশ (এন), এস্তোনিয়ান (ইটি), ফিনিশ (এফআই), জার্মান (ডি), জার্মান (ডি) (হু), ইন্দোনেশিয়ান (আইডি), ইতালিয়ান (আইটি), জাপানি (জেএ), কোরিয়ান (কেও), লাত্ভিয়ান (এলভি), লিথুয়ানিয়ান (এলটি), নরওয়েজিয়ান (এনও), পোলিশ (পিএল), পর্তুগিজ (পিটি), রোমানিয়ান (আরও), রাশিয়ান (আরইউ), সার্বিয়ান (এসআর), স্লোভাক (এসকে), স্লোভেনিয়ান (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু) (ইউকে), ভিয়েতনামী (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
চিত্র
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about older models
মডেল | ইনপুট | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
These are the input and output types when using each model with Firebase AI Logic :
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
ইনপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
নথিপত্র (PDFs or plain-text) | |||||||
ছবি | |||||||
ভিডিও | |||||||
অডিও | |||||||
Audio (streaming) | |||||||
আউটপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
স্ট্রাকচার্ড আউটপুট (like JSON) | |||||||
Images, Video, and Audio |
These are the capabilities and features when using each model with Firebase AI Logic :
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | |
---|---|---|---|---|
Generate text from text-only input | ||||
Generate text from multimodal input | ||||
ছবি তৈরি করুন | ||||
অডিও জেনারেট করুন | ||||
Generate structured output (like JSON) | ||||
নথি বিশ্লেষণ করুন (PDFs or plain-text) | ||||
Analyze images (vision) | ||||
Analyze video (vision) | ||||
Analyze audio | ||||
Multi-turn chat | ||||
Function calling (tools) | ||||
Count tokens and billable characters | ||||
সিস্টেম নির্দেশাবলী | ||||
Bidirectional multimodal streaming |
These are the specifications and limitations when using each model with Firebase AI Logic :
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 2,097,152 tokens | 1,048,576 tokens | 16,384 tokens | 32,760 tokens | |||
Output token limit * | 8,192 tokens | 8,192 tokens | 2,048 tokens | 8,192 tokens | |||
জ্ঞান কাটঅফ তারিখ | মে 2024 | মে 2024 | ফেব্রুয়ারি 2023 | ফেব্রুয়ারি 2023 | |||
PDFs (per request) | |||||||
Max number of input PDF files ** | 3,000 files | 3,000 files | 16টি ফাইল | --- | |||
Max number of pages per input PDF file ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 16 পৃষ্ঠা | --- | |||
সর্বোচ্চ আকার per input PDF file | 50 এমবি | 50 এমবি | 50 এমবি | --- | |||
Images (per request) | |||||||
Max number of input images | 3,000 images | 3,000 images | 16টি ছবি | --- | |||
Max number of output images | --- | --- | --- | --- | |||
সর্বোচ্চ আকার per input base64-encoded image | 7 এমবি | 7 এমবি | 7 এমবি | --- | |||
Video (per request) | |||||||
Max number of input video files | 10টি ফাইল | 10টি ফাইল | 1 ফাইল | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all input video (frames only) | ~60 minutes | ~60 minutes | 2 মিনিট | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all input video (frames+audio) | ~45 মিনিট | ~45 মিনিট | --- | --- | |||
Audio (per request) | |||||||
Max number of input audio files | 1 ফাইল | 1 ফাইল | --- | --- | |||
Max number of output audio files | --- | --- | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all input audio | ~8.4 hours | ~8.4 hours | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all output audio | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
Gemini 1.5 Pro model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-pro-002 | Latest stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Initial stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-pro | Points to the latest stable version of 1.5 Pro (currently gemini-1.5-pro-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-flash-002 | Latest stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Initial stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-flash | Points to the latest stable version of 1.5 Flash (currently gemini-1.5-flash-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-vision-001 | Latest stable version of Gemini 1.0 Pro Vision | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro-vision | Points to the latest stable version of 1.5 Pro Vision (currently gemini-1.5-pro-vision-001 ) | অবসরপ্রাপ্ত | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-002 | Latest stable version of Gemini 1.0 Pro | অবসরপ্রাপ্ত | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Stable version of Gemini 1.0 Pro | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro | Points to the latest stable version of 1.0 Pro (currently gemini-1.0-pro-002 ) | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
পরবর্তী পদক্ষেপ
Try out the capabilities of the Gemini API
- Build multi-turn conversations (chat) .
- Generate text from text-only prompts .
- Generate text by prompting with various file types, like images , PDFs , video , and audio .
- Generate structured output (like JSON) from both text and multimodal prompts.
- Generate images from text prompts ( Gemini or Imagen ).
- Stream input and output (including audio) using the Gemini Live API .
- Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.
For mobile and web apps, the Firebase AI Logic SDKs let you interact with the supported Gemini models and Imagen models directly from your app.
Gemini models are considered multimodal because they're capable of processing and even generating multiple modalities, including text, code, PDFs, images, video, and audio. Imagen models can be prompted with text to generate images.
The following table is a brief overview of supported models for Firebase AI Logic and their latest stable model names. This table also lists preview and experimental models that are available for prototyping use cases.
Also, review our FAQ about all the models that Firebase AI Logic supports and does not support.
মিথুন মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
Gemini models with stable versions | |||
Gemini 2.5 Progemini-2.5-pro | text, code, PDFs, images, video, audio | text, code, JSON | Our most advanced reasoning model, capable of solving complex problems. |
মিথুন 2.5 ফ্ল্যাশgemini-2.5-flash | text, code, PDFs, images, video, audio | text, code, JSON | Our thinking model that offers great, well-rounded capabilities. It's designed to offer a balance between price and performance. |
Gemini 2.5 Flash-Litegemini-2.5-flash-lite | text, code, PDFs, images, video, audio | text, code, JSON | Our most balanced Gemini model, optimized for low-latency use cases and cost-conscious apps. |
মিথুন 2.5 ফ্ল্যাশ চিত্রgemini-2.5-flash-image | text, code, PDFs, images | images, text & images | Our standard Flash model upgraded for rapid creative workflows with image generation and conversational, multi-turn editing capabilities. (aka "nano banana") |
Gemini 2.0 Flashgemini-2.0-flash-001 | text, code, PDFs, images, video, audio | text, code, JSON | Our multimodal model with next-gen features and improved capabilities, including superior speed, built-in tool use, and a 1M token context window |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001 | text, code, PDFs, images, video, audio | text, code, JSON | Our fastest and most cost efficient Flash model. It's an upgrade path for 1.5 Flash users who want better quality for the same price and speed. |
Gemini models with only preview and experimental versions (recommended for prototyping use cases only) | |||
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation | text, code, PDFs, images | images, text & images | Our multimodal model that supports multimodal input and image output. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | text (streaming), audio (streaming) | text (streaming), audio (streaming) | Our multimodal model that supports low-latency realtime streaming of multimodal inputs and outputs. |
1 Additional model names support the Live API depending on your chosen Gemini API provider and access (see the Live API page ).
ইমেজ মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
Imagen models with stable versions | |||
চিত্র 4imagen-4.0-generate-001 | পাঠ্য | ছবি | Generates realistic, high-quality images from natural language text prompts |
Imagen 4 Fastimagen-4.0-fast-generate-001 | পাঠ্য | ছবি | Generates images for prototyping or low-latency use cases |
চিত্র 4 আল্ট্রাimagen-4.0-ultra-generate-001 | পাঠ্য | ছবি | Generates realistic, high-quality images from natural language text prompts |
চিত্র 3imagen-3.0-generate-002 | পাঠ্য | ছবি | Generates realistic, high-quality images from natural language text prompts |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | পাঠ্য | ছবি | Generates images for prototyping or low-latency use cases |
Imagen 3 Capability 2imagen-3.0-capability-001 | text, images | ছবি | Edits and generates images; supports both mask-based editing and customization using reference images |
Imagen models with only preview and experimental versions (recommended for prototyping use cases only) | |||
--- | --- | --- | --- |
2 Not supported by the Gemini Developer API no matter how you access it.
The remainder of this page provides detailed information about the models supported by Firebase AI Logic .
- Supported input and output
- High-level comparison of the supported capabilities
- Specifications and limitations, for example max input tokens or max length of input video
Description of how models are versioned , specifically their stable , auto-updated , preview , and experimental versions
Lists of available model names to include in your code during initialization
Lists of supported languages for the models
At the bottom of this page, you can view detailed information about older models .
মডেল তুলনা করুন
Each model has different capabilities to support various use cases. Note that each of tables in this section describe each model when used with Firebase AI Logic . Each model might have additional capabilities that aren't available when using our SDKs.
If you can't find the information you're looking for in the following sub-sections, you can find even more information in your chosen API provider documentation:
Gemini Developer API : Gemini models and Imagen models
Vertex AI Gemini API : Gemini models and Imagen models
Supported input and output
These are the supported input and output types when using each model with Firebase AI Logic :
মিথুন 2.5 Pro, Flash, Flash-Lite | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 Flash- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 Flash- লাইভ | Imagen (generate) | Imagen (capability) | |
---|---|---|---|---|---|---|---|---|
ইনপুট প্রকার | ||||||||
পাঠ্য | ||||||||
Text (streaming) | ||||||||
কোড | ||||||||
নথিপত্র (PDFs or plain-text) | ||||||||
ছবি | ||||||||
ভিডিও | ||||||||
অডিও | ||||||||
Audio (streaming) | ||||||||
আউটপুট প্রকার | ||||||||
পাঠ্য | ||||||||
Text (streaming) | ||||||||
কোড | ||||||||
স্ট্রাকচার্ড আউটপুট (like JSON) | ||||||||
ছবি | ||||||||
অডিও | ||||||||
Audio (streaming) |
To learn about supported file types, see Supported input files and requirements .
Supported capabilities and features
These are the supported capabilities and features when using each model with Firebase AI Logic :
মিথুন 2.5 Pro, Flash, Flash-Lite | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 Flash- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 Flash- লাইভ | Imagen (generate) | Imagen (capability) | |
---|---|---|---|---|---|---|---|---|
ভাবছেন | ||||||||
Generate text from text-only or multimodal inputs | interleaved or as part of image | interleaved or as part of image | শুধুমাত্র স্ট্রিমিং | |||||
ছবি তৈরি করুন ( Gemini or Imagen ) | ||||||||
ছবি সম্পাদনা করুন ( Gemini or Imagen ) | ||||||||
অডিও জেনারেট করুন | শুধুমাত্র স্ট্রিমিং | |||||||
Generate structured output (like JSON) | ||||||||
নথি বিশ্লেষণ করুন (PDFs or plain-text) | ||||||||
Analyze images (vision) | ||||||||
Analyze video (vision) | ||||||||
Analyze audio | শুধুমাত্র স্ট্রিমিং | |||||||
Multi-turn chat | ||||||||
Bidirectional multimodal streaming | ||||||||
ফাংশন কলিং | ||||||||
কোড এক্সিকিউশন | ||||||||
Google অনুসন্ধানের সাথে গ্রাউন্ডিং | ||||||||
সিস্টেম নির্দেশাবলী | ||||||||
টোকেন গণনা করুন |
Specifications and limitations
These are the specifications and limitations when using each model with Firebase AI Logic :
সম্পত্তি | মিথুন 2.5 Pro, Flash, Flash-Lite | মিথুন 2.5 ফ্ল্যাশ ছবি | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 Flash- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 Flash- লাইভ | Imagen (generate) | Imagen (capability) |
---|---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 1,048,576 tokens | 32,768 tokens | 1,048,576 tokens | 1,048,576 tokens | 32,768 tokens | 32,768 tokens | 480 tokens | 480 tokens |
Output token limit * | 65,536 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | --- | --- |
জ্ঞান কাটঅফ তারিখ | জানুয়ারী 2025 | জুন 2025 | জুন 2024 | জুন 2024 | আগস্ট 2024 | আগস্ট 2024 | --- | --- |
PDFs (per request) | ||||||||
Max number of input PDF files ** | 3,000 files | 3টি ফাইল | 3,000 files | 3,000 files | 3,000 files | --- | --- | --- |
Max number of pages per input PDF file ** | 1,000 পৃষ্ঠা | 3 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | --- | --- | --- |
সর্বোচ্চ আকার per input PDF file | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | --- | --- | --- |
Images (per request) | ||||||||
Max number of input images | 3,000 images | 3টি ছবি | 3,000 images | 3,000 images | 3,000 images | --- | --- | 4টি ছবি |
Max number of output images | --- | 10টি ছবি | --- | --- | 10টি ছবি | --- | 4টি ছবি | 4টি ছবি |
সর্বোচ্চ আকার per input base64-encoded image | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | --- | --- | --- |
Video (per request) | ||||||||
Max number of input video files | 10টি ফাইল | --- | 10টি ফাইল | 10টি ফাইল | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য of all input video (frames only) | ~60 minutes | --- | ~60 minutes | ~60 minutes | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য of all input video (frames+audio) | ~45 মিনিট | --- | ~45 মিনিট | ~45 মিনিট | --- | --- | --- | --- |
Audio (per request) | ||||||||
Max number of input audio files | 1 ফাইল | --- | 1 ফাইল | 1 ফাইল | --- | --- | --- | --- |
Max number of output audio files | --- | --- | --- | --- | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য of all input audio | ~8.4 hours | ~8.4 hours | ~8.4 hours | ~8.4 hours | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য of all output audio | --- | --- | --- | --- | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Find additional detailed information
Quotas and pricing are different for each model. Pricing also depends on input and output.
Learn about supported input file types, how to specify MIME type, and how to make sure that your input files and multimodal requests meet the requirements and follow best practices in Supported input files and requirements .
Model versioning and naming patterns
Models are offered in stable , preview , and experimental versions. For convenience, aliases without explicit version values are supported.
To find specific model names to use in your code, see the "available model names" section later on this page.
Version type / মুক্তির মঞ্চ | বর্ণনা | Model name pattern | |
---|---|---|---|
স্থিতিশীল | Stable versions are available and supported for production use starting on the release date. A stable model version is typically released with a retirement date, which indicates the last day that the model is available. After this date, the model is no longer accessible or supported by Google. |
| |
Auto-updated stable alias ( Gemini 2.0 models only) | Auto-updated stable aliases always point to the latest stable version of that model. If a new stable version is released, the auto-updated alias automatically starts pointing to that new stable version. | Gemini 2.0 models only উদাহরণ: | |
পূর্বরূপ | Preview versions have new capabilities and are considered not stable . These models are not recommended for production use, come with more restrictive rate limits, and may have billing requirements. For the Vertex AI Gemini API , preview models released after June 2025 usually require you to set the model's location to | Model names of preview versions are appended with উদাহরণ: | |
পরীক্ষামূলক | Experimental versions have new capabilities and are considered not stable . These models are not recommended for production use and come with more restrictive rate limits. Experimental models are intended for gathering feedback and to enable experimentation with our latest features. For the Vertex AI Gemini API , experimental models released after June 2025 require you to set the model's location to | Model names of experimental versions are appended with উদাহরণ: | |
অবসরপ্রাপ্ত | Retired versions are past their retirement date and have been permanently deactivated. Retired models are no longer accessible or supported by Google, and requests referencing a retired model ID typically returns a 404 error. | --- |
Available model names
Model names are the explicit values that you include in your code during initialization of the model.
Gemini model names Jump to Imagen model names Jump to
Programmatically list all available models
You can list all available models names using the REST API:
Gemini Developer API : Call the
models.list
endpointVertex AI Gemini API : Call the
publishers.models.list
endpoint
Note that this returned list will include all models supported by the API providers, but Firebase AI Logic only supports the Gemini and Imagen models described on this page. Also note that auto-updated aliases (for example, gemini-2.0-flash
) aren't listed because they're a convenience alias for the base model.
Gemini model names
For initialization examples for your platform, see the getting started guide .
For details about the release stages (especially for use cases and billing), see model versioning and naming patterns .
Gemini 2.5 Pro model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.5-pro | Stable version of Gemini 2.5 Pro | স্থিতিশীল | 2025-06-17 | No earlier than 2026-06-17 |
Gemini 2.5 Flash model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.5-flash | Stable version of Gemini 2.5 Flash | স্থিতিশীল | 2025-06-17 | No earlier than 2026-06-17 |
Gemini 2.5 Flash‑Lite model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.5-flash-lite | Stable version of Gemini 2.5 Flash‑Lite | স্থিতিশীল | 2025-07-22 | No earlier than 2026-07-22 |
Gemini 2.5 Flash Image model names (aka "nano banana")
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.5-flash-image | Stable version for Gemini 2.5 Flash Image (aka "nano banana") | স্থিতিশীল | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | Preview version for Gemini 2.5 Flash Image (aka "nano banana") | পূর্বরূপ | 2025-08-26 | 2025-10-31 |
Gemini 2.5 Flash Live model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-live-2.5-flash | Stable version for Gemini 2.5 Flash Live | স্থিতিশীল (private GA) 1 | 2025-06-01 | No earlier than 2026-06-01 |
gemini-live-2.5-flash-preview 2 | Preview version for Gemini 2.5 Flash Live | পূর্বরূপ | 2025-06-01 | নির্ধারণ করা |
Take note that in the 2.5 model names for the Live API , the live
segment immediately follows the gemini
segment.
Firebase AI Logic does not yet support the native audio models (like gemini-2.5-flash-native-audio-preview-09-2025
).
1 Reach out to your Google Cloud account team representative to request access.
2 Not supported by the Vertex AI Gemini API no matter how you access it.
Gemini 2.0 Flash model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.0-flash-001 | Latest stable version of Gemini 2.0 Flash | স্থিতিশীল | 2025-02-05 | No earlier than 2026-02-05 |
gemini-2.0-flash | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash (currently gemini-2.0-flash-001 ) | স্থিতিশীল | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Latest stable version of Gemini 2.0 Flash‑Lite | স্থিতিশীল | 2025-02-25 | No earlier than 2026-02-25 |
gemini-2.0-flash-lite | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash‑Lite (currently gemini-2.0-flash-lite-001 ) | স্থিতিশীল | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | Preview version for Gemini 2.0 Flash Image Generation | পূর্বরূপ | 2025-05-06 | 2025-10-31 |
Gemini 2.0 Flash Live model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | Stable version for Gemini 2.0 Flash Live | স্থিতিশীল | 2025-04-01 | No earlier than 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | Preview version for Gemini 2.0 Flash Live | পূর্বরূপ | 2025-04-09 | নির্ধারণ করা |
2 Not supported by the Vertex AI Gemini API no matter how you access it.
Imagen model names
For initialization examples for your platform, see the generate images with Imagen guide .
For details about the release stages (especially for use cases and billing), see model versioning and naming patterns .
Imagen 4 model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
imagen-4.0-generate-001 | Stable version of Imagen 4 | স্থিতিশীল | 2025-08-14 | No earlier than 2026-08-14 |
imagen-4.0-generate-preview-06-06 | Preview version of Imagen 4 | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
Imagen 4 Fast model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | Stable version of Imagen 4 Fast | স্থিতিশীল | 2025-08-14 | No earlier than 2026-08-14 |
imagen-4.0-fast-generate-preview-06-06 3 | Preview version of Imagen 4 Fast (will be retired soon - do not use) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
Imagen 4 Ultra model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Stable version of Imagen 4 Ultra | স্থিতিশীল | 2025-08-14 | No earlier than 2026-08-14 |
imagen-4.0-ultra-generate-preview-06-06 | Preview version of Imagen 4 Ultra (will be retired soon - do not use) | পূর্বরূপ | 2025-06-06 | যত তাড়াতাড়ি 2025-08-14 |
Imagen 3 model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
imagen-3.0-generate-002 | Latest stable version of Imagen 3 | স্থিতিশীল | 2025-01-23 | No earlier than 2026-01-23 |
imagen-3.0-generate-001 3 | Initial stable version of Imagen 3 | স্থিতিশীল | 2024-07-31 | No earlier than 2025-07-31 |
Imagen 3 Fast model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Initial stable version of Imagen 3 Fast | স্থিতিশীল | 2024-07-31 | No earlier than 2025-07-31 |
3 Not supported by the Gemini Developer API no matter how you access it.
Imagen 3 Capability model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
imagen-3.0-capability-001 3 | Initial stable version of Imagen 3 Capability | স্থিতিশীল | 2024-12-10 | No earlier than 2025-12-10 |
3 Not supported by the Gemini Developer API no matter how you access it.
সমর্থিত ভাষা
মিথুন
All the Gemini models can understand and respond in the following languages:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
চিত্র
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about older models
মডেল | ইনপুট | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
These are the input and output types when using each model with Firebase AI Logic :
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
ইনপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
নথিপত্র (PDFs or plain-text) | |||||||
ছবি | |||||||
ভিডিও | |||||||
অডিও | |||||||
Audio (streaming) | |||||||
আউটপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
স্ট্রাকচার্ড আউটপুট (like JSON) | |||||||
Images, Video, and Audio |
These are the capabilities and features when using each model with Firebase AI Logic :
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | |
---|---|---|---|---|
Generate text from text-only input | ||||
Generate text from multimodal input | ||||
ছবি তৈরি করুন | ||||
অডিও জেনারেট করুন | ||||
Generate structured output (like JSON) | ||||
নথি বিশ্লেষণ করুন (PDFs or plain-text) | ||||
Analyze images (vision) | ||||
Analyze video (vision) | ||||
Analyze audio | ||||
Multi-turn chat | ||||
Function calling (tools) | ||||
Count tokens and billable characters | ||||
সিস্টেম নির্দেশাবলী | ||||
Bidirectional multimodal streaming |
These are the specifications and limitations when using each model with Firebase AI Logic :
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 2,097,152 tokens | 1,048,576 tokens | 16,384 tokens | 32,760 tokens | |||
Output token limit * | 8,192 tokens | 8,192 tokens | 2,048 tokens | 8,192 tokens | |||
জ্ঞান কাটঅফ তারিখ | মে 2024 | মে 2024 | ফেব্রুয়ারি 2023 | ফেব্রুয়ারি 2023 | |||
PDFs (per request) | |||||||
Max number of input PDF files ** | 3,000 files | 3,000 files | 16টি ফাইল | --- | |||
Max number of pages per input PDF file ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 16 পৃষ্ঠা | --- | |||
সর্বোচ্চ আকার per input PDF file | 50 এমবি | 50 এমবি | 50 এমবি | --- | |||
Images (per request) | |||||||
Max number of input images | 3,000 images | 3,000 images | 16টি ছবি | --- | |||
Max number of output images | --- | --- | --- | --- | |||
সর্বোচ্চ আকার per input base64-encoded image | 7 এমবি | 7 এমবি | 7 এমবি | --- | |||
Video (per request) | |||||||
Max number of input video files | 10টি ফাইল | 10টি ফাইল | 1 ফাইল | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all input video (frames only) | ~60 minutes | ~60 minutes | 2 মিনিট | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all input video (frames+audio) | ~45 মিনিট | ~45 মিনিট | --- | --- | |||
Audio (per request) | |||||||
Max number of input audio files | 1 ফাইল | 1 ফাইল | --- | --- | |||
Max number of output audio files | --- | --- | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all input audio | ~8.4 hours | ~8.4 hours | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য of all output audio | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
Gemini 1.5 Pro model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-pro-002 | Latest stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Initial stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-pro | Points to the latest stable version of 1.5 Pro (currently gemini-1.5-pro-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-flash-002 | Latest stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Initial stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-flash | Points to the latest stable version of 1.5 Flash (currently gemini-1.5-flash-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-vision-001 | Latest stable version of Gemini 1.0 Pro Vision | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro-vision | Points to the latest stable version of 1.5 Pro Vision (currently gemini-1.5-pro-vision-001 ) | অবসরপ্রাপ্ত | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro model names
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | Retirement date |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-002 | Latest stable version of Gemini 1.0 Pro | অবসরপ্রাপ্ত | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Stable version of Gemini 1.0 Pro | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro | Points to the latest stable version of 1.0 Pro (currently gemini-1.0-pro-002 ) | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
পরবর্তী পদক্ষেপ
Try out the capabilities of the Gemini API
- Build multi-turn conversations (chat) .
- Generate text from text-only prompts .
- Generate text by prompting with various file types, like images , PDFs , video , and audio .
- Generate structured output (like JSON) from both text and multimodal prompts.
- Generate images from text prompts ( Gemini or Imagen ).
- Stream input and output (including audio) using the Gemini Live API .
- Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.