สำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ Firebase AI Logic SDK ช่วยให้คุณโต้ตอบ กับGeminiโมเดลและImagenโมเดลที่รองรับ ได้โดยตรงจากแอป
Gemini ถือเป็นโมเดลแบบหลายรูปแบบเนื่องจากสามารถ ประมวลผลและแม้กระทั่งสร้างรูปแบบต่างๆ ได้ รวมถึงข้อความ โค้ด PDF รูปภาพ วิดีโอ และเสียง Imagen สามารถป้อนพรอมต์ด้วยข้อความเพื่อ สร้างรูปภาพได้
นอกจากนี้ โปรดอ่านคำถามที่พบบ่อย เกี่ยวกับโมเดลทั้งหมดที่ Firebase AI Logic รองรับและไม่รองรับ
โมเดลการใช้งานทั่วไป
ไปที่การเปรียบเทียบรูปแบบการระบุแหล่งที่มา
Gemini 3 Pro
gemini-3-pro-preview
โมเดลที่ดีที่สุดของเราสำหรับการทำความเข้าใจข้อมูลหลายรูปแบบ รวมถึงโมเดลแบบเป็น Agent และโมเดลการเขียนโค้ดตามฟีลที่ทรงพลังที่สุดของเราในปัจจุบัน ซึ่งให้ภาพที่สมบูรณ์ยิ่งขึ้นและการโต้ตอบที่ลึกซึ้งยิ่งขึ้น ทั้งหมดนี้สร้างขึ้นบนพื้นฐานของการให้เหตุผลที่ล้ำสมัย
Gemini 3 Flash
gemini-3-flash-preview
โมเดลที่ชาญฉลาดที่สุดของเราสร้างขึ้นเพื่อความเร็ว ประสิทธิภาพ และต้นทุน
โดยจะช่วยให้งานประจำวันง่ายขึ้นด้วยการให้เหตุผลที่ดียิ่งขึ้น ในขณะที่ยังคงรับมือกับเวิร์กโฟลว์แบบ Agent ที่ซับซ้อนที่สุดได้
Gemini 2.5 Pro
gemini-2.5-pro
โมเดลการคิดที่ล้ำสมัยของเราสามารถให้เหตุผลเกี่ยวกับ
ปัญหาที่ซับซ้อนในโค้ด คณิตศาสตร์ และ STEM รวมถึงวิเคราะห์ชุดข้อมูลขนาดใหญ่
ฐานของโค้ด และเอกสารโดยใช้บริบทแบบยาว
Gemini 2.5 Flash
gemini-2.5-flash
โมเดลที่ดีที่สุดของเราในแง่ของราคาและประสิทธิภาพ ซึ่งมี
ความสามารถที่ครอบคลุม 2.5 Flash เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่
งานที่มีปริมาณมากและมีเวลาในการตอบสนองต่ำซึ่งต้องใช้ความคิด และ Use Case ที่เป็นตัวแทน
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
โมเดลแฟลชที่เร็วที่สุดของเราซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่าและ
ปริมาณงานสูง
โมเดลสร้างรูปภาพ
คุณสร้างรูปภาพได้ด้วยโมเดล Gemini หรือ Imagen
ไปที่การเปรียบเทียบรูปแบบการระบุแหล่งที่มา
Gemini
รูปภาพ Gemini 3 Pro (หรือที่เรียกว่า nano banana pro)
gemini-3-pro-image-preview
ออกแบบมาเพื่อการผลิตชิ้นงานระดับมืออาชีพและคำสั่งที่ซับซ้อน
โดยมีพื้นฐานจากโลกแห่งความเป็นจริงโดยใช้ Google Search
กระบวนการ "การคิด" เริ่มต้นที่ปรับแต่งองค์ประกอบก่อน
การสร้าง และสร้างรูปภาพที่มีความละเอียดสูงสุด 4K ได้
รูปภาพ Gemini 2.5 Flash (หรือที่เรียกว่า Nano Banana)
gemini-2.5-flash-image
ออกแบบมาเพื่อความเร็วและประสิทธิภาพ โดยได้รับการเพิ่มประสิทธิภาพสำหรับ
งานที่มีปริมาณมากและมีเวลาในการตอบสนองต่ำ และสร้างรูปภาพที่ความละเอียด 1024 พิกเซล
Imagen
Imagen 4
imagen-4.0-generate-001
สร้างรูปภาพคุณภาพสูงที่สมจริงจากพรอมต์ข้อความในภาษาธรรมชาติ
Imagen 4 Fast
imagen-4.0-fast-generate-001
สร้างรูปภาพสำหรับการสร้างต้นแบบหรือกรณีการใช้งานที่มีเวลาในการตอบสนองต่ำ
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
สร้างรูปภาพคุณภาพสูงที่สมจริงจากพรอมต์ข้อความในภาษาธรรมชาติ
โมเดลการสร้างเสียง
คุณสร้างเสียงสตรีมได้ด้วยโมเดลที่รองรับ Gemini Live API
ไปที่การเปรียบเทียบรูปแบบการระบุแหล่งที่มา
Gemini 2.5 Flash พร้อมเสียงดั้งเดิมของ Gemini Live API
Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025
Vertex AI Gemini API: gemini-live-2.5-flash-native-audio
ช่วยให้โต้ตอบด้วยเสียงและวิดีโอแบบเรียลไทม์ที่มีเวลาในการตอบสนองต่ำกับโมเดล Gemini ที่สื่อสารได้ทั้ง 2 ทาง
ส่วนที่เหลือของหน้านี้จะให้ข้อมูลโดยละเอียดเกี่ยวกับโมเดลที่ Firebase AI Logic รองรับ
-
- อินพุตและเอาต์พุตที่รองรับ
- การเปรียบเทียบความสามารถที่รองรับในระดับสูง
- ข้อกำหนดและข้อจำกัด เช่น โทเค็นอินพุตสูงสุดหรือความยาวสูงสุด ของวิดีโออินพุต
คำอธิบายวิธีกำหนดเวอร์ชันของโมเดล โดยเฉพาะเวอร์ชัน เสถียร อัปเดตอัตโนมัติ ตัวอย่าง และทดลอง
รายการชื่อโมเดลที่ใช้ได้เพื่อรวมไว้ใน โค้ดระหว่างการเริ่มต้น
รายการภาษาที่รองรับสำหรับโมเดล
ที่ด้านล่างของหน้านี้ คุณจะดูข้อมูลโดยละเอียดเกี่ยวกับโมเดลรุ่นก่อนหน้าได้
เปรียบเทียบโมเดล
แต่ละโมเดลมีความสามารถแตกต่างกันเพื่อรองรับกรณีการใช้งานที่หลากหลาย โปรดทราบว่าตารางแต่ละตารางในส่วนนี้จะอธิบายแต่ละโมเดลเมื่อใช้กับ Firebase AI Logic แต่ละโมเดลอาจมีความสามารถเพิ่มเติม ที่ใช้ไม่ได้เมื่อใช้ SDK ของเรา
หากไม่พบข้อมูลที่ต้องการในส่วนย่อยต่อไปนี้ คุณจะดูข้อมูลเพิ่มเติมได้ในเอกสารประกอบของผู้ให้บริการ API ที่เลือก
Gemini Developer API: Gemini รุ่น และImagen รุ่น
Vertex AI Gemini API: Gemini รุ่น และImagen รุ่น
อินพุตและเอาต์พุตที่รองรับ
ต่อไปนี้คือประเภทอินพุตและเอาต์พุตที่รองรับ เมื่อใช้แต่ละโมเดลกับ Firebase AI Logic
|
<span="notranslate">Gemini 3 Pro, Flash </span"notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen (สร้าง) | Imagen (ความสามารถ) | |
|---|---|---|---|---|---|---|---|
| ประเภทอินพุต | |||||||
| ข้อความ | (สตรีมมิง) | ||||||
| รหัส | |||||||
| เอกสาร (PDF หรือข้อความธรรมดา) |
|||||||
| รูปภาพ | |||||||
| วิดีโอ | (สตรีมมิง) | ||||||
| เสียง | (สตรีมมิง) | ||||||
| ประเภทเอาต์พุต | |||||||
| ข้อความ | |||||||
| ข้อความ (การสตรีม) | (การถอดเสียง) | ||||||
| รหัส | |||||||
| เอาต์พุตที่มีโครงสร้าง (เช่น JSON) |
|||||||
| รูปภาพ | |||||||
| เสียง | (สตรีมมิง) | ||||||
ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ไฟล์อินพุตที่รองรับและข้อกำหนด
ความสามารถและฟีเจอร์ที่รองรับ
ความสามารถและฟีเจอร์ที่รองรับ เมื่อใช้แต่ละโมเดลกับ Firebase AI Logic มีดังนี้
|
<span="notranslate">Gemini 3 Pro, Flash </span"notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen (สร้าง) | Imagen (ความสามารถ) | |
|---|---|---|---|---|---|---|---|
| การคิด | |||||||
| สร้างข้อความจาก อินพุตที่เป็นข้อความเท่านั้นหรืออินพุตแบบหลายรูปแบบ | แทรกหรือเป็นส่วนหนึ่งของรูปภาพ | แทรกหรือเป็นส่วนหนึ่งของรูปภาพ | การถอดเสียงเป็นคำเท่านั้น | ||||
|
สร้างรูปภาพ (Gemini หรือ Imagen) |
|||||||
|
แก้ไขรูปภาพ (Gemini หรือ Imagen) |
|||||||
| สร้างเสียง | สตรีมมิงเท่านั้น | ||||||
|
สร้าง
เอาต์พุตที่มีโครงสร้าง
(เช่น JSON) |
|||||||
|
วิเคราะห์เอกสาร
(PDF หรือข้อความธรรมดา) |
|||||||
| วิเคราะห์รูปภาพ (Vision) | |||||||
| วิเคราะห์วิดีโอ (Vision) | สตรีมมิงเท่านั้น | ||||||
| วิเคราะห์เสียง | สตรีมมิงเท่านั้น | ||||||
| แชทแบบหลายรอบ | สตรีมมิงเท่านั้น | ||||||
| การสตรีมมัลติโมดัลแบบ 2 ทาง | |||||||
| การเรียกใช้ฟังก์ชัน | |||||||
| การรันโค้ด | |||||||
| การเชื่อมต่อแหล่งข้อมูลกับ Google Search | |||||||
| คำสั่งของระบบ | |||||||
| นับโทเค็น |
ข้อกำหนดและข้อจำกัด
ต่อไปนี้เป็นข้อกำหนดและข้อจำกัด เมื่อใช้แต่ละโมเดลกับ Firebase AI Logic
| พร็อพเพอร์ตี้ |
<span="notranslate">Gemini 3 Pro, Flash </span"notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen (สร้าง) | Imagen (ความสามารถ) |
|---|---|---|---|---|---|---|---|
| ขีดจำกัดโทเค็นอินพุต * | 1,048,576 โทเค็น | 65,536 โทเค็น | 1,048,576 โทเค็น | 32,768 โทเค็น | โทเค็น 32,000 รายการ (ค่าเริ่มต้น อัปเกรดเป็น 128,000 รายการได้) | 480 โทเค็น | 480 โทเค็น |
| ขีดจำกัดโทเค็นเอาต์พุต * | 65,536 โทเค็น | 32,768 โทเค็น | 65,536 โทเค็น | 8,192 โทเค็น | โทเค็น 64,000 รายการ | --- | --- |
| วันที่ตัดข้อมูล | มกราคม 2025 | มกราคม 2025 | มกราคม 2025 | มิถุนายน 2025 | มกราคม 2025 | --- | --- |
| PDF (ตามคำขอ) | |||||||
| จำนวนไฟล์ PDF ที่ป้อนสูงสุด ** |
900 ไฟล์ | 14 ไฟล์ | 3,000 ไฟล์ | 3 ไฟล์ | --- | --- | --- |
| จำนวนหน้าสูงสุด ต่อไฟล์ PDF ที่ป้อน ** |
900 หน้า | 14 หน้า | 1,000 หน้า | 3 หน้า | --- | --- | --- |
| ขนาดสูงสุด ต่อไฟล์ PDF ที่ป้อน |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | --- |
| รูปภาพ (ต่อคำขอ) | |||||||
| จำนวนสูงสุด ของรูปภาพอินพุต |
รูปภาพ 1,000 รูป | รูปภาพ 14 รูป | 3,000 รูปภาพ | รูปภาพ 3 รูป | --- | --- | รูปภาพ 4 รูป |
| จำนวนรูปภาพ เอาต์พุตสูงสุด |
--- | รูปภาพ 10 รูป | --- | รูปภาพ 10 รูป | --- | รูปภาพ 4 รูป | รูปภาพ 4 รูป |
| ขนาดสูงสุด ต่อรูปภาพที่เข้ารหัส Base64 ที่ป้อน |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | --- |
| วิดีโอ (ต่อคำขอ) | |||||||
| จำนวนไฟล์วิดีโออินพุตสูงสุด |
10 ไฟล์ | --- | 10 ไฟล์ | --- | --- | --- | --- |
| ความยาวสูงสุด ของวิดีโออินพุตทั้งหมด (เฟรมเท่านั้น) |
ประมาณ 60 นาที | --- | ประมาณ 60 นาที | --- | --- | --- | --- |
| ความยาวสูงสุด ของวิดีโออินพุตทั้งหมด (เฟรม + เสียง) |
ประมาณ 45 นาที | --- | ประมาณ 45 นาที | --- | --- | --- | --- |
| เสียง (ต่อคำขอ) | |||||||
| จำนวนไฟล์เสียง อินพุตสูงสุด |
1 ไฟล์ | --- | 1 ไฟล์ | --- | --- | --- | --- |
| จำนวนไฟล์เสียง เอาต์พุตสูงสุด |
--- | --- | --- | --- | --- | --- | --- |
| ความยาวสูงสุด ของเสียงอินพุตทั้งหมด |
ประมาณ 8.4 ชั่วโมง | --- | ประมาณ 8.4 ชั่วโมง | --- | --- | --- | --- |
| ความยาวสูงสุด ของเสียงเอาต์พุตทั้งหมด |
--- | --- | --- | --- | --- | --- | --- |
*
สำหรับโมเดล Gemini ทั้งหมด โทเค็นจะเทียบเท่ากับอักขระประมาณ 4 ตัว
ดังนั้นโทเค็น 100 รายการจึงเทียบเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ สำหรับโมเดล Gemini คุณสามารถ
กำหนดจำนวนโทเค็นทั้งหมดในคำขอได้โดยใช้
countTokens
** ระบบจะถือว่า PDF เป็นรูปภาพ ดังนั้น PDF 1 หน้าจึงถือเป็นรูปภาพ 1 รูป ระบบจำกัดจำนวนหน้าเว็บที่อนุญาตในคำขอตามจำนวน รูปภาพที่โมเดลรองรับ
*** โมเดล Gemini 2.5 Flash-Live เป็นโมเดลเสียงดั้งเดิมที่รองรับ Gemini Live API
ดูข้อมูลโดยละเอียดเพิ่มเติม
โควต้าและราคาจะแตกต่างกันไป ในแต่ละโมเดล นอกจากนี้ ราคาจะขึ้นอยู่กับอินพุตและเอาต์พุตด้วย
ดูข้อมูลเกี่ยวกับประเภทไฟล์อินพุตที่รองรับ วิธีระบุประเภท MIME และวิธีตรวจสอบว่าไฟล์อินพุตและคำขอแบบมัลติโมดัลเป็นไปตามข้อกำหนดและแนวทางปฏิบัติแนะนำในไฟล์อินพุตและข้อกำหนดที่รองรับ
รูปแบบการตั้งชื่อและการกำหนดเวอร์ชันของโมเดล
โมเดลมีให้บริการในเวอร์ชันเสถียร ตัวอย่าง และทดลอง เพื่อความสะดวก ระบบรองรับชื่อแทนที่ไม่มีค่าเวอร์ชันที่ชัดเจน
หากต้องการค้นหาชื่อโมเดลที่เฉพาะเจาะจงเพื่อใช้ในโค้ด โปรดดูส่วน"ชื่อโมเดลที่ใช้ได้"ในหน้านี้
| ประเภทเวอร์ชัน / ระยะการเผยแพร่ |
คำอธิบาย | รูปแบบชื่อโมเดล | |
|---|---|---|---|
| เสถียร |
เวอร์ชันเสถียรพร้อมใช้งานและรองรับ
สำหรับการใช้งานจริงตั้งแต่วันที่เผยแพร่
|
|
|
| นามแฝงเสถียรที่อัปเดตอัตโนมัติ (รุ่น Gemini 2.0 เท่านั้น) |
นามแฝงที่เสถียรซึ่งอัปเดตอัตโนมัติจะชี้ไปยังเวอร์ชันเสถียรล่าสุดของโมเดลนั้นเสมอ
|
Gemini 2.0 โมเดลเท่านั้น
ตัวอย่าง: |
|
| ตัวอย่าง |
เวอร์ชันตัวอย่างมีฟีเจอร์ใหม่ๆ และถือว่าไม่เสถียร
|
ชื่อโมเดลของเวอร์ชันตัวอย่างจะต่อท้ายด้วย
ตัวอย่าง |
|
| ทดลอง |
เวอร์ชันทดลองมีฟีเจอร์ใหม่ๆ
และถือว่าไม่เสถียร
|
ชื่อโมเดลของเวอร์ชันทดลองจะต่อท้ายด้วย
ตัวอย่าง: |
|
| เลิกใช้งานแล้ว |
เวอร์ชันที่เลิกใช้งานแล้วเลยวันที่เลิกใช้งาน
และถูกปิดใช้งานอย่างถาวร
|
--- |
|
ชื่อโมเดลที่พร้อมให้บริการ
ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณใส่ในโค้ดระหว่าง การเริ่มต้นโมเดล
ข้ามไปยังGeminiชื่อโมเดล ข้ามไปยังImagenชื่อโมเดล
แสดงรายการโมเดลทั้งหมดที่พร้อมใช้งานโดยใช้โปรแกรม
คุณแสดงชื่อโมเดลทั้งหมดที่พร้อมใช้งานได้โดยใช้ REST API ดังนี้
Gemini Developer API: เรียกใช้
models.listปลายทางVertex AI Gemini API: เรียกใช้
publishers.models.listปลายทาง
โปรดทราบว่ารายการที่แสดงนี้จะมีรุ่นทั้งหมดที่ผู้ให้บริการ API รองรับ แต่ Firebase AI Logic รองรับเฉพาะรุ่น Gemini และ Imagen ที่อธิบายไว้ในหน้านี้
โปรดทราบว่าระบบจะไม่แสดงชื่อแทนที่อัปเดตอัตโนมัติ (เช่น gemini-2.0-flash) เนื่องจากเป็นชื่อแทนที่สะดวกสำหรับโมเดลพื้นฐาน
Gemini ชื่อรุ่น
ดูตัวอย่างการเริ่มต้นใช้งานสำหรับแพลตฟอร์มของคุณได้ที่คู่มือเริ่มต้นใช้งาน
ดูรายละเอียดเกี่ยวกับระยะการเปิดตัว (โดยเฉพาะกรณีการใช้งาน การเรียกเก็บเงิน และการเลิกใช้งาน) ได้ที่การควบคุมเวอร์ชันและการตั้งชื่อโมเดล
Gemini 3 Pro ชื่อรุ่น
ต้องใช้แพ็กเกจราคา Blaze แบบจ่ายเมื่อใช้ ไม่ว่าคุณจะใช้ผู้ให้บริการ Gemini API รายใด
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-3-pro-preview |
เวอร์ชันตัวอย่างของ Gemini 3 Pro | แสดงตัวอย่าง | 2025-11-18 | จะแจ้งให้ทราบภายหลัง |
Gemini 3 Flash ชื่อรุ่น
ไม่จำเป็นต้องใช้แพ็กเกจการกำหนดราคา Blaze แบบจ่ายตามการใช้งานหากคุณ ใช้ Gemini Developer API (โดยปกติแล้วโมเดลเวอร์ชันตัวอย่างต้องใช้แพ็กเกจแบบชำระเงิน)
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-3-flash-preview |
เวอร์ชันตัวอย่างของ Gemini 3 Flash | แสดงตัวอย่าง | 2025-12-17 | จะแจ้งให้ทราบภายหลัง |
Gemini 3 Pro Image ชื่อโมเดล (หรือที่เรียกว่า "nano banana pro")
ต้องใช้แพ็กเกจราคา Blaze แบบจ่ายเมื่อใช้ ไม่ว่าคุณจะใช้ผู้ให้บริการ Gemini API รายใด
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-3-pro-image-preview |
เวอร์ชันตัวอย่างของ Gemini 3 Pro Image (หรือที่เรียกว่า "nano banana pro") |
แสดงตัวอย่าง | 2025-11-20 | จะแจ้งให้ทราบภายหลัง |
Gemini 2.5 Pro ชื่อรุ่น
ไม่จำเป็นต้องใช้แพ็กเกจราคา Blaze แบบจ่ายเมื่อใช้หากคุณใช้ Gemini Developer API
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro เวอร์ชันเสถียร | สังกัด | 2025-06-17 | ไม่เร็วกว่า 2026-06-17 |
Gemini 2.5 Flash ชื่อรุ่น
ไม่จำเป็นต้องใช้แพ็กเกจราคา Blaze แบบจ่ายเมื่อใช้หากคุณใช้ Gemini Developer API
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash เวอร์ชันเสถียร | สังกัด | 2025-06-17 | ไม่เร็วกว่า 2026-06-17 |
Gemini 2.5 Flash‑Lite ชื่อรุ่น
ไม่จำเป็นต้องใช้แพ็กเกจราคา Blaze แบบจ่ายเมื่อใช้หากคุณใช้ Gemini Developer API
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Gemini 2.5 Flash‑Lite เวอร์ชันเสถียร | สังกัด | 2025-07-22 | ไม่เร็วกว่า 2026-07-22 |
Gemini 2.5 Flash Image ชื่อโมเดล (หรือที่เรียกว่า "nano banana")
ต้องใช้แพ็กเกจราคา Blaze แบบจ่ายเมื่อใช้ ไม่ว่าคุณจะใช้ผู้ให้บริการ Gemini API รายใด
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-flash-image |
เวอร์ชันเสถียรสำหรับ Gemini 2.5 Flash Image (หรือที่เรียกว่า "nano banana") | สังกัด | 2025-10-02 | ไม่เร็วกว่า 2026-10-02 |
Gemini 2.5 Flash Live ชื่อรุ่น
ไม่จำเป็นต้องใช้แพ็กเกจการกำหนดราคา Blaze แบบจ่ายตามการใช้งานหากคุณ ใช้ Gemini Developer API (โดยปกติแล้วโมเดลเวอร์ชันตัวอย่างต้องใช้แพ็กเกจแบบชำระเงิน)
Gemini 2.5 Flash Live เป็นโมเดลเสียงเนทีฟที่รองรับ Gemini Live API แม้ว่าโมเดลจะมีชื่อรุ่นที่แตกต่างกันไปตามGemini ผู้ให้บริการ API แต่ลักษณะการทำงานและฟีเจอร์ของโมเดลจะเหมือนกัน
| Gemini Developer API ชื่อโมเดล |
คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 |
เวอร์ชันตัวอย่างล่าสุดสำหรับ Live API ใน Gemini Developer API | แสดงตัวอย่าง | 2025-12-12 | จะแจ้งให้ทราบภายหลัง |
gemini-2.5-flash-native-audio-preview-09-2025 1 |
เวอร์ชันตัวอย่างเริ่มต้นสำหรับ Live API ใน Gemini Developer API | แสดงตัวอย่าง | 2025-09-18 | จะแจ้งให้ทราบภายหลัง |
| Vertex AI Gemini API ชื่อโมเดล |
คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 |
เวอร์ชันเสถียรสำหรับ Live API ใน Vertex AI Gemini API | สังกัด | 2025-12-12 | ไม่เร็วกว่า 2026-12-12 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 |
เวอร์ชันตัวอย่างสำหรับ Live API ใน Vertex AI Gemini API | แสดงตัวอย่าง | 2025-09-18 | จะแจ้งให้ทราบภายหลัง |
1 รองรับโดย Gemini Developer API เท่านั้น
นอกจากนี้ แม้ว่าจะเป็นโมเดลเวอร์ชันตัวอย่าง แต่โมเดลเหล่านี้ก็พร้อมใช้งานใน "ระดับฟรี" ของ Gemini Developer API
2 รองรับเท่านั้นโดย Vertex AI Gemini API
นอกจากนี้ โมเดลเหล่านี้ยังไม่รองรับในสถานที่ตั้ง global
Imagen ชื่อรุ่น
ดูตัวอย่างการเริ่มต้นสำหรับแพลตฟอร์มของคุณได้ที่คู่มือสร้างรูปภาพด้วย Imagen
ดูรายละเอียดเกี่ยวกับระยะการเปิดตัว (โดยเฉพาะกรณีการใช้งาน การเรียกเก็บเงิน และการเลิกใช้งาน) ได้ที่การควบคุมเวอร์ชันและการตั้งชื่อโมเดล
Imagen 4 ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Imagen 4 เวอร์ชันเสถียร | สังกัด | 2025-08-14 | ไม่เร็วกว่าวันที่ 14-08-2026 |
Imagen 4 Fast ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Imagen 4 Fast เวอร์ชันเสถียร | สังกัด | 2025-08-14 | ไม่เร็วกว่าวันที่ 14-08-2026 |
Imagen 4 Ultra ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Imagen 4 Ultra เวอร์ชันเสถียร | สังกัด | 2025-08-14 | ไม่เร็วกว่าวันที่ 14-08-2026 |
Imagen 3 Capability ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-3.0-capability-001 2 |
Imagen 3 Capability เวอร์ชันเสถียรเริ่มต้น | สังกัด | 2024-12-10 | ไม่เร็วกว่าวันที่ 10-12-2025 |
2 Gemini Developer API ไม่รองรับไม่ว่าคุณจะเข้าถึงด้วยวิธีใดก็ตาม
ภาษาที่สนับสนุน
Gemini
โมเดล Gemini ทั้งหมดเข้าใจและตอบกลับได้ในภาษาต่อไปนี้
อารบิก (ar), เบงกาลี (bn), บัลแกเรีย (bg), จีนตัวย่อและตัวเต็ม (zh), โครเอเชีย (hr), เช็ก (cs), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), ฮินดี (hi), ฮังการี (hu), อินโดนีเซีย (id), อิตาลี (it), ญี่ปุ่น (ja), เกาหลี (ko), ลัตเวีย (lv), ลิทัวเนีย (lt), นอร์เวย์ (no), โปแลนด์ (pl), โปรตุเกส (pt), โรมาเนีย (ro), รัสเซีย (ru), เซอร์เบีย (sr), สโลวัก (sk), สโลวีเนีย (sl), สเปน (es), สวาฮิลี (sw), สวีเดน (sv), ไทย (th), ตุรกี (tr), ยูเครน (uk), เวียดนาม (vi)
โมเดล Gemini 2.0 Flash, Gemini 1.5 Pro และ Gemini 1.5 Flash สามารถเข้าใจและตอบกลับในภาษาเพิ่มเติมต่อไปนี้
แอฟริกาใต้ (af), อัมฮารา (am), อัสสัม (as), อาเซอร์ไบจาน (az), เบลารุส (be), บอสเนีย (bs), คาตาลัน (ca), เซบูอาโน (ceb), คอร์ซิกา (co), เวลส์ (cy), มัลดีฟส์ (dv), เอสเปรันโต (eo), บาสก์ (eu), เปอร์เซีย (fa), ฟิลิปปินส์ (ตากาล็อก) (fil), ฟรีเซีย (fy), ไอริช (ga), สก็อตแลนด์ (gd), กาลิเซีย (gl), คุชราต (gu), เฮาซา (ha), ฮาวาย (haw), ม้ง (hmn), เฮติ (ht), อาร์เมเนีย (hy), อิกโบ (ig), ไอซ์แลนด์ (is), ชวา (jv), จอร์เจีย (ka), คาซัค (kk), เขมร (km), กันนาดา (kn), คริโอ (kri), เคิร์ด (ku), คีร์กีซ (ky), ละติน (la), ลักเซมเบิร์ก (lb), ลาว (lo), มาดากัสการ์ (mg), เมารี (mi), มาซิโดเนีย (mk), มาลายาลัม (ml), มองโกเลีย (mn), ไมเตลอน (มณีปุระ) (mni-Mtei), มราฐี (mr), มาเลย์ (ms), มอลตา (mt), พม่า (my), เนปาล (ne), ญานจา (ชิเชวา) (ny), โอเดีย (โอริยา) (or), ปัญจาบ (pa), ปาทาน (ps), สินธี (sd), สิงหล (si), ซามัว (sm), โชนา (sn), โซมาเลีย (so), แอลเบเนีย (sq), โซโท (st), ซุนดา (su), ทมิฬ (ta), เตลูกู (te), ทาจิก (tg), อุยกูร์ (ug), อูรดู (ur), อุซเบก (uz), โคซา (xh), ยิดดิช (yi), โยรูบา (yo), ซูลู (zu)
Imagen
พร้อมให้บริการแก่ผู้ใช้ทั่วไป: ภาษาอังกฤษ
ตัวอย่าง: จีน (ตัวย่อ), จีน (ตัวเต็ม), ฮินดี, ญี่ปุ่น, เกาหลี, โปรตุเกส, สเปน
ข้อมูลเกี่ยวกับโมเดลก่อนหน้า
รุ่นต่อไปนี้ยังใช้งานได้ แต่เป็นรุ่นก่อนหน้า เราขอแนะนำให้ใช้รุ่นล่าสุดแทนหากเป็นไปได้
รุ่น Gemini
gemini-2.0-flash-001(และนามแฝงที่อัปเดตอัตโนมัติgemini-2.0-flash)gemini-2.0-flash-lite-001(และนามแฝงที่อัปเดตอัตโนมัติgemini-2.0-flash-lite)
ดูข้อมูลเกี่ยวกับรุ่นเก่าของ Gemini Live API ได้ในเอกสารประกอบของผู้ให้บริการ Gemini API
รุ่น Imagen
imagen-3.0-generate-002imagen-3.0-fast-generate-001
ขั้นตอนถัดไป
ลองใช้ความสามารถของ Gemini API
- สร้างการสนทนาแบบหลายรอบ (แชท)
- สร้างข้อความจากพรอมต์ข้อความเท่านั้น
- สร้างข้อความโดยการป้อนพรอมต์ด้วยไฟล์ประเภทต่างๆ เช่น รูปภาพ PDF วิดีโอ และ เสียง
- สร้างเอาต์พุตที่มีโครงสร้าง (เช่น JSON) จากทั้งข้อความและพรอมต์มัลติโมดัล
- สร้างรูปภาพจากพรอมต์ข้อความ (Gemini หรือ Imagen)
- สตรีมอินพุตและเอาต์พุต (รวมถึงเสียง) โดยใช้ Gemini Live API
- ใช้เครื่องมือต่างๆ (เช่น การเรียกใช้ฟังก์ชัน และการอ้างอิงจาก Google Search) เพื่อเชื่อมต่อโมเดล Gemini กับส่วนอื่นๆ ของแอปและระบบ และข้อมูลภายนอก