สำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ Firebase AI Logic SDK ช่วยให้คุณโต้ตอบ กับGeminiโมเดลและImagenโมเดลที่รองรับ ได้โดยตรงจากแอป
Gemini ถือเป็นโมเดลแบบหลายรูปแบบเนื่องจากสามารถ ประมวลผลและแม้กระทั่งสร้างรูปแบบต่างๆ ได้ รวมถึงข้อความ โค้ด PDF รูปภาพ วิดีโอ และเสียง Imagen สามารถป้อนพรอมต์ด้วยข้อความเพื่อ สร้างรูปภาพได้
นอกจากนี้ โปรดอ่านคำถามที่พบบ่อย เกี่ยวกับโมเดลทั้งหมดที่ Firebase AI Logic รองรับและไม่รองรับ
โมเดลการใช้งานทั่วไป
ไปที่การเปรียบเทียบรูปแบบการระบุแหล่งที่มา
Gemini 3 Pro
gemini-3-pro-preview
โมเดลที่ดีที่สุดของเราสำหรับการทำความเข้าใจแบบมัลติโมดัล และโมเดลเอเจนต์และการเขียนโค้ดตามฟีลที่ทรงพลังที่สุดของเรา ซึ่งให้ภาพที่สมบูรณ์ยิ่งขึ้นและ การโต้ตอบที่ลึกซึ้งยิ่งขึ้น ทั้งหมดนี้สร้างขึ้นบนพื้นฐานของ การให้เหตุผลที่ล้ำสมัย (ต้องมีการเรียกเก็บเงิน)
Gemini 2.5 Pro
gemini-2.5-pro
โมเดลการคิดที่ล้ำสมัยของเราสามารถให้เหตุผลเกี่ยวกับ ปัญหาที่ซับซ้อนในโค้ด คณิตศาสตร์ และ STEM รวมถึงวิเคราะห์ชุดข้อมูลขนาดใหญ่ ฐานของโค้ด และเอกสารโดยใช้บริบทแบบยาว
Gemini 2.5 Flash
gemini-2.5-flash
โมเดลที่ดีที่สุดของเราในแง่ของราคาต่อประสิทธิภาพ ซึ่งมีความสามารถรอบด้าน 2.5 Flash เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ งานที่มีปริมาณมากและมีเวลาในการตอบสนองต่ำซึ่งต้องใช้ความคิด และ Use Case ที่เป็นตัวแทน
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
โมเดลแฟลชที่เร็วที่สุดของเราซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่าและ ปริมาณงานสูง
โมเดลสร้างรูปภาพ
คุณสร้างรูปภาพได้ด้วยโมเดล Gemini หรือ Imagen
ไปที่การเปรียบเทียบรูปแบบการระบุแหล่งที่มา
Gemini
รูปภาพ Gemini 3 Pro (หรือที่เรียกว่า nano banana pro)
gemini-3-pro-image-preview
ออกแบบมาเพื่อการผลิตชิ้นงานระดับมืออาชีพและคำสั่งที่ซับซ้อน โดยมีพื้นฐานจากโลกแห่งความเป็นจริงโดยใช้ Google Search กระบวนการ "การคิด" เริ่มต้นที่ปรับแต่งองค์ประกอบก่อน การสร้าง และสร้างรูปภาพที่มีความละเอียดสูงสุด 4K ได้ (ต้องมีการเรียกเก็บเงิน)
รูปภาพ Gemini 2.5 Flash (หรือที่เรียกว่า nano banana)
gemini-2.5-flash-image
ออกแบบมาเพื่อความเร็วและประสิทธิภาพ โดยได้รับการเพิ่มประสิทธิภาพสำหรับ งานที่มีปริมาณมากและมีเวลาในการตอบสนองต่ำ และสร้างรูปภาพที่ความละเอียด 1024 พิกเซล (ต้องมีการเรียกเก็บเงิน)
Imagen
Imagen 4
imagen-4.0-generate-001
สร้างรูปภาพคุณภาพสูงที่สมจริงจากพรอมต์ข้อความภาษาธรรมชาติ (ต้องมีการเรียกเก็บเงิน)
Imagen 4 Fast
imagen-4.0-fast-generate-001
สร้างรูปภาพสำหรับการสร้างต้นแบบหรือกรณีการใช้งานที่มีเวลาในการตอบสนองต่ำ (ต้องมีการเรียกเก็บเงิน)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
สร้างรูปภาพคุณภาพสูงที่สมจริงจากพรอมต์ข้อความภาษาธรรมชาติ (ต้องมีการเรียกเก็บเงิน)
โมเดลรุ่นก่อนหน้า
รุ่นต่อไปนี้ยังใช้งานได้ แต่เป็นรุ่นก่อนหน้า เราขอแนะนำให้ใช้ รุ่นล่าสุดรุ่นใดรุ่นหนึ่งแทนหากเป็นไปได้
ไปที่การเปรียบเทียบรูปแบบการระบุแหล่งที่มา
โมเดล Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
โมเดลรุ่นที่ 2 ที่ทำงานหนักของเรา ซึ่งมีหน้าต่างบริบทขนาด 1 ล้านโทเค็น มอบฟีเจอร์รุ่นถัดไปและความสามารถที่ได้รับการปรับปรุง รวมถึงความเร็วที่เหนือกว่าและการใช้เครื่องมือเนทีฟ
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
โมเดลขนาดเล็กที่ทำงานหนักรุ่นที่ 2 ของเราที่มีหน้าต่างบริบทขนาด 1 ล้านโทเค็น เพิ่มประสิทธิภาพเพื่อความคุ้มค่าและเวลาในการตอบสนองต่ำ
ส่วนที่เหลือของหน้านี้จะให้ข้อมูลโดยละเอียดเกี่ยวกับโมเดลที่ Firebase AI Logic รองรับ
-
- อินพุตและเอาต์พุตที่รองรับ
- การเปรียบเทียบความสามารถที่รองรับในระดับสูง
- ข้อกำหนดและข้อจำกัด เช่น โทเค็นอินพุตสูงสุดหรือความยาวสูงสุด ของวิดีโออินพุต
คำอธิบายวิธีควบคุมเวอร์ชันของโมเดล โดยเฉพาะเวอร์ชัน เสถียร อัปเดตอัตโนมัติ ตัวอย่าง และทดลอง
รายการชื่อโมเดลที่ใช้ได้เพื่อรวมไว้ใน โค้ดระหว่างการเริ่มต้น
รายการภาษาที่รองรับสำหรับโมเดล
ที่ด้านล่างของหน้านี้ คุณจะดูข้อมูลโดยละเอียดเกี่ยวกับโมเดลรุ่นก่อนหน้าได้
เปรียบเทียบโมเดล
แต่ละโมเดลมีความสามารถแตกต่างกันเพื่อรองรับกรณีการใช้งานที่หลากหลาย โปรดทราบว่าตารางแต่ละตารางในส่วนนี้จะอธิบายแต่ละโมเดลเมื่อใช้กับ Firebase AI Logic แต่ละโมเดลอาจมีความสามารถเพิ่มเติม ที่ใช้ไม่ได้เมื่อใช้ SDK ของเรา
หากไม่พบข้อมูลที่ต้องการในส่วนย่อยต่อไปนี้ คุณจะดูข้อมูลเพิ่มเติมได้ในเอกสารประกอบของผู้ให้บริการ API ที่เลือก
Gemini Developer API: Gemini รุ่น และImagen รุ่น
Vertex AI Gemini API: Gemini รุ่น และImagen รุ่น
อินพุตและเอาต์พุตที่รองรับ
ต่อไปนี้คือประเภทอินพุตและเอาต์พุตที่รองรับ เมื่อใช้แต่ละโมเดลกับ Firebase AI Logic
|
<span="notranslate">Gemini 3 Pro </span"notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (สร้าง) | Imagen (ความสามารถ) | |
|---|---|---|---|---|---|---|---|
| ประเภทอินพุต | |||||||
| ข้อความ | |||||||
| ข้อความ (การสตรีม) | |||||||
| รหัส | |||||||
| เอกสาร (PDF หรือข้อความธรรมดา) |
|||||||
| รูปภาพ | |||||||
| วิดีโอ | |||||||
| เสียง | |||||||
| เสียง (สตรีมมิง) | |||||||
| ประเภทเอาต์พุต | |||||||
| ข้อความ | |||||||
| ข้อความ (การสตรีม) | |||||||
| รหัส | |||||||
| เอาต์พุตที่มีโครงสร้าง (เช่น JSON) |
|||||||
| รูปภาพ | |||||||
| เสียง | |||||||
| เสียง (สตรีมมิง) | |||||||
ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ ไฟล์อินพุตที่รองรับและข้อกำหนด
ความสามารถและฟีเจอร์ที่รองรับ
ความสามารถและฟีเจอร์ที่รองรับ เมื่อใช้แต่ละโมเดลกับ Firebase AI Logic มีดังนี้
|
<span="notranslate">Gemini 3 Pro </span"notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (สร้าง) | Imagen (ความสามารถ) | |
|---|---|---|---|---|---|---|---|
| การคิด | |||||||
| สร้างข้อความจาก อินพุตที่เป็นข้อความเท่านั้นหรืออินพุตแบบหลายรูปแบบ | แทรกสลับหรือเป็นส่วนหนึ่งของรูปภาพ | แทรกสลับหรือเป็นส่วนหนึ่งของรูปภาพ | สตรีมมิงเท่านั้น | ||||
|
สร้างรูปภาพ (Gemini หรือ Imagen) |
|||||||
|
แก้ไขรูปภาพ (Gemini หรือ Imagen) |
|||||||
| สร้างเสียง | สตรีมมิงเท่านั้น | ||||||
|
สร้าง
เอาต์พุตที่มีโครงสร้าง
(เช่น JSON) |
|||||||
|
วิเคราะห์เอกสาร
(PDF หรือข้อความธรรมดา) |
|||||||
| วิเคราะห์รูปภาพ (Vision) | |||||||
| วิเคราะห์วิดีโอ (Vision) | |||||||
| วิเคราะห์เสียง | สตรีมมิงเท่านั้น | ||||||
| แชทแบบหลายรอบ | |||||||
| การสตรีมมัลติโมดัลแบบ 2 ทาง | |||||||
| การเรียกใช้ฟังก์ชัน | |||||||
| การรันโค้ด | |||||||
| การเชื่อมต่อแหล่งข้อมูลกับ Google Search | |||||||
| คำสั่งของระบบ | |||||||
| นับโทเค็น |
ข้อกำหนดและข้อจำกัด
ต่อไปนี้เป็นข้อกำหนดและข้อจำกัด เมื่อใช้แต่ละโมเดลกับ Firebase AI Logic
| พร็อพเพอร์ตี้ |
<span="notranslate">Gemini 3 Pro </span"notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (สร้าง) | Imagen (ความสามารถ) |
|---|---|---|---|---|---|---|---|
| ขีดจำกัดโทเค็นอินพุต * | 1,048,576 โทเค็น | 65,536 โทเค็น | 1,048,576 โทเค็น | 32,768 โทเค็น | 32,768 โทเค็น | 480 โทเค็น | 480 โทเค็น |
| ขีดจำกัดโทเค็นเอาต์พุต * | 65,536 โทเค็น | 32,768 โทเค็น | 65,536 โทเค็น | 8,192 โทเค็น | 8,192 โทเค็น | --- | --- |
| วันที่ตัดข้อมูล | มกราคม 2025 | มกราคม 2025 | มกราคม 2025 | มิถุนายน 2025 | สิงหาคม 2024 | --- | --- |
| PDF (ตามคำขอ) | |||||||
| จำนวนไฟล์ PDF ที่ป้อนสูงสุด ** |
900 ไฟล์ | 14 ไฟล์ | 3,000 ไฟล์ | 3 ไฟล์ | --- | --- | --- |
| จำนวนหน้าสูงสุด ต่อไฟล์ PDF ที่ป้อน ** |
900 หน้า | 14 หน้า | 1,000 หน้า | 3 หน้า | --- | --- | --- |
| ขนาดสูงสุด ต่อไฟล์ PDF ที่ป้อน |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | --- |
| รูปภาพ (ต่อคำขอ) | |||||||
| จำนวนสูงสุด ของรูปภาพอินพุต |
1,000 รูปภาพ | รูปภาพ 14 รูป | 3,000 รูปภาพ | รูปภาพ 3 รูป | --- | --- | รูปภาพ 4 รูป |
| จำนวนรูปภาพ เอาต์พุตสูงสุด |
--- | รูปภาพ 10 รูป | --- | รูปภาพ 10 รูป | --- | รูปภาพ 4 รูป | รูปภาพ 4 รูป |
| ขนาดสูงสุด ต่อรูปภาพที่เข้ารหัส Base64 ของอินพุต |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | --- |
| วิดีโอ (ต่อคำขอ) | |||||||
| จำนวนไฟล์วิดีโออินพุตสูงสุด |
10 ไฟล์ | --- | 10 ไฟล์ | --- | --- | --- | --- |
| ความยาวสูงสุด ของวิดีโออินพุตทั้งหมด (เฟรมเท่านั้น) |
ประมาณ 60 นาที | --- | ประมาณ 60 นาที | --- | --- | --- | --- |
| ความยาวสูงสุด ของวิดีโออินพุตทั้งหมด (เฟรม + เสียง) |
ประมาณ 45 นาที | --- | ประมาณ 45 นาที | --- | --- | --- | --- |
| เสียง (ต่อคำขอ) | |||||||
| จำนวนไฟล์เสียง อินพุตสูงสุด |
1 ไฟล์ | --- | 1 ไฟล์ | --- | --- | --- | --- |
| จำนวนไฟล์เสียง เอาต์พุตสูงสุด |
--- | --- | --- | --- | --- | --- | --- |
| ความยาวสูงสุด ของเสียงอินพุตทั้งหมด |
ประมาณ 8.4 ชั่วโมง | --- | ประมาณ 8.4 ชั่วโมง | --- | --- | --- | --- |
| ความยาวสูงสุด ของเสียงเอาต์พุตทั้งหมด |
--- | --- | --- | --- | --- | --- | --- |
*
สำหรับโมเดล Gemini ทั้งหมด โทเค็น 1 รายการจะเทียบเท่ากับอักขระประมาณ 4 ตัว
ดังนั้นโทเค็น 100 รายการจึงเทียบเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ สำหรับโมเดล Gemini คุณสามารถ
กำหนดจำนวนโทเค็นทั้งหมดในคำขอได้โดยใช้
countTokens
** ระบบจะถือว่า PDF เป็นรูปภาพ ดังนั้น PDF 1 หน้าจึงถือเป็นรูปภาพ 1 รูป ระบบจำกัดจำนวนหน้าเว็บที่อนุญาตในคำขอตามจำนวน รูปภาพที่โมเดลรองรับ
ดูข้อมูลโดยละเอียดเพิ่มเติม
โควต้าและราคาจะแตกต่างกันไป ในแต่ละโมเดล นอกจากนี้ ราคาจะขึ้นอยู่กับอินพุตและเอาต์พุตด้วย
ดูข้อมูลเกี่ยวกับประเภทไฟล์อินพุตที่รองรับ วิธีระบุประเภท MIME และวิธีตรวจสอบว่าไฟล์อินพุตและคำขอแบบมัลติโมดัลเป็นไปตามข้อกำหนดและแนวทางปฏิบัติแนะนำในไฟล์อินพุตและข้อกำหนดที่รองรับ
รูปแบบการตั้งชื่อและการกำหนดเวอร์ชันของโมเดล
โมเดลมีให้บริการในเวอร์ชันเสถียร ตัวอย่าง และทดลอง เพื่อความสะดวก ระบบรองรับชื่อแทนที่ไม่มีค่าเวอร์ชันที่ชัดเจน
หากต้องการค้นหาชื่อโมเดลที่เฉพาะเจาะจงเพื่อใช้ในโค้ด โปรดดูส่วน"ชื่อโมเดลที่ใช้ได้"ในหน้านี้
| ประเภทเวอร์ชัน / ระยะการเผยแพร่ |
คำอธิบาย | รูปแบบชื่อโมเดล | |
|---|---|---|---|
| เสถียร |
เวอร์ชันเสถียรพร้อมใช้งานและได้รับการสนับสนุน
สำหรับการใช้งานจริงตั้งแต่วันที่วางจำหน่าย
|
|
|
| นามแฝงเสถียรที่อัปเดตอัตโนมัติ (รุ่น Gemini 2.0 เท่านั้น) |
นามแฝงที่เสถียรซึ่งอัปเดตอัตโนมัติจะชี้ไปยัง
เวอร์ชันเสถียรล่าสุดของโมเดลนั้นเสมอ
|
Gemini 2.0 โมเดลเท่านั้น
ตัวอย่างเช่น |
|
| ตัวอย่าง |
เวอร์ชันตัวอย่างมีฟีเจอร์ใหม่ๆ และถือว่าไม่เสถียร
|
ชื่อโมเดลของเวอร์ชันตัวอย่างจะต่อท้ายด้วย
ตัวอย่าง |
|
| ทดลอง |
เวอร์ชันทดลองมีฟีเจอร์ใหม่ๆ
และถือว่าไม่เสถียร
|
ชื่อโมเดลของเวอร์ชันทดลองจะต่อท้ายด้วย
ตัวอย่าง: |
|
| เลิกใช้งานแล้ว |
เวอร์ชันที่เลิกใช้งานแล้วเลยวันที่เลิกใช้งาน
และถูกปิดใช้งานอย่างถาวร
|
--- |
|
ชื่อโมเดลที่พร้อมให้บริการ
ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณใส่ในโค้ดระหว่าง การเริ่มต้นโมเดล
ข้ามไปยังGeminiชื่อโมเดล ข้ามไปยังImagenชื่อโมเดล
แสดงรายการโมเดลทั้งหมดที่พร้อมใช้งานโดยใช้โปรแกรม
คุณแสดงชื่อโมเดลทั้งหมดที่พร้อมใช้งานได้โดยใช้ REST API ดังนี้
Gemini Developer API: เรียกใช้
models.listปลายทางVertex AI Gemini API: เรียกใช้
publishers.models.listปลายทาง
โปรดทราบว่ารายการที่แสดงนี้จะมีรุ่นทั้งหมดที่ผู้ให้บริการ API รองรับ แต่ Firebase AI Logic รองรับเฉพาะรุ่น Gemini และ Imagen ที่อธิบายไว้ในหน้านี้
โปรดทราบว่าระบบจะไม่แสดงชื่อแทนที่อัปเดตอัตโนมัติ (เช่น gemini-2.0-flash) เนื่องจากเป็นชื่อแทนที่สะดวกสำหรับโมเดลพื้นฐาน
Gemini ชื่อรุ่น
ดูตัวอย่างการเริ่มต้นใช้งานสำหรับแพลตฟอร์มของคุณได้ที่คู่มือเริ่มต้นใช้งาน
ดูรายละเอียดเกี่ยวกับระยะการเผยแพร่ (โดยเฉพาะกรณีการใช้งาน การเรียกเก็บเงิน และ การเลิกใช้งาน) ได้ที่ การควบคุมเวอร์ชันและการตั้งชื่อโมเดล
Gemini 3 Pro ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-3-pro-preview |
เวอร์ชันตัวอย่างของ Gemini 3 Pro | แสดงตัวอย่าง | 2025-11-18 | จะแจ้งให้ทราบภายหลัง |
Gemini 3 Pro Image ชื่อโมเดล (หรือที่เรียกว่า "nano banana pro")
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-3-pro-image-preview |
เวอร์ชันตัวอย่างของ Gemini 3 Pro Image | แสดงตัวอย่าง | 2025-11-20 | จะแจ้งให้ทราบภายหลัง |
Gemini 2.5 Pro ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro เวอร์ชันเสถียร | สังกัด | 2025-06-17 | ไม่ก่อน 2026-06-17 |
Gemini 2.5 Flash ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash เวอร์ชันเสถียร | สังกัด | 2025-06-17 | ไม่ก่อน 2026-06-17 |
Gemini 2.5 Flash‑Lite ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Gemini 2.5 Flash‑Lite เวอร์ชันเสถียร | สังกัด | 2025-07-22 | ไม่เร็วกว่า 2026-07-22 |
Gemini 2.5 Flash Image ชื่อโมเดล (หรือที่เรียกว่า "nano banana")
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.5-flash-image |
เวอร์ชันเสถียรสำหรับ Gemini 2.5 Flash Image (หรือที่เรียกว่า "nano banana") | สังกัด | 2025-10-02 | ไม่ก่อน 2026-10-02 |
Gemini 2.5 Flash Live ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-live-2.5-flash |
เวอร์ชันเสถียรสำหรับ Gemini 2.5 Flash Live | เสถียร (GA แบบส่วนตัว) 1 |
2025-06-01 | ไม่ก่อน 2026-06-01 |
gemini-live-2.5-flash-preview 2 |
เวอร์ชันตัวอย่างสำหรับ Gemini 2.5 Flash Live | แสดงตัวอย่าง | 2025-06-01 | จะแจ้งให้ทราบภายหลัง |
Firebase AI Logic ยังไม่รองรับโมเดลเสียงดั้งเดิม (เช่น gemini-2.5-flash-native-audio-preview-09-2025)
1 ติดต่อตัวแทนทีมดูแลลูกค้าของ Google Cloud เพื่อขอสิทธิ์เข้าถึง 2 Vertex AI Gemini API ไม่รองรับไม่ว่าคุณจะเข้าถึงด้วยวิธีใดก็ตาม
Gemini 2.0 Flash Live ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
เวอร์ชันเสถียรสำหรับ Gemini 2.0 Flash Live | สังกัด | 2025-04-01 | ไม่ก่อน 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 |
เวอร์ชันตัวอย่างสำหรับ Gemini 2.0 Flash Live | แสดงตัวอย่าง | 2025-04-09 | จะแจ้งให้ทราบภายหลัง |
2 Vertex AI Gemini API ไม่รองรับไม่ว่าคุณจะเข้าถึงด้วยวิธีใดก็ตาม
Imagen ชื่อรุ่น
ดูตัวอย่างการเริ่มต้นสำหรับแพลตฟอร์มของคุณได้ที่คู่มือสร้างรูปภาพด้วย Imagen
ดูรายละเอียดเกี่ยวกับระยะการเผยแพร่ (โดยเฉพาะกรณีการใช้งาน การเรียกเก็บเงิน และ การเลิกใช้งาน) ได้ที่ การควบคุมเวอร์ชันและการตั้งชื่อโมเดล
Imagen 4 ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Imagen 4 เวอร์ชันเสถียร | สังกัด | 2025-08-14 | ไม่เร็วกว่า 14-08-2026 |
Imagen 4 Fast ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Imagen 4 Fast เวอร์ชันเสถียร | สังกัด | 2025-08-14 | ไม่เร็วกว่า 14-08-2026 |
Imagen 4 Ultra ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Imagen 4 Ultra เวอร์ชันเสถียร | สังกัด | 2025-08-14 | ไม่เร็วกว่า 14-08-2026 |
Imagen 3 Capability ชื่อรุ่น
| ชื่อโมเดล | คำอธิบาย | สถานะการเผยแพร่ | วันที่เปิดตัว | วันที่เลิกใช้งาน |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Imagen 3 Capability เวอร์ชันเสถียรเริ่มต้น | สังกัด | 2024-12-10 | ไม่เร็วกว่า 2025-12-10 |
3 Gemini Developer API ไม่รองรับไม่ว่าคุณจะเข้าถึงด้วยวิธีใดก็ตาม
ภาษาที่สนับสนุน
Gemini
โมเดล Gemini ทั้งหมดเข้าใจและตอบกลับได้ในภาษาต่อไปนี้
อารบิก (ar), เบงกาลี (bn), บัลแกเรีย (bg), จีนตัวย่อและตัวเต็ม (zh), โครเอเชีย (hr), เช็ก (cs), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), ฮินดี (hi), ฮังการี (hu), อินโดนีเซีย (id), อิตาลี (it), ญี่ปุ่น (ja), เกาหลี (ko), ลัตเวีย (lv), ลิทัวเนีย (lt), นอร์เวย์ (no), โปแลนด์ (pl), โปรตุเกส (pt), โรมาเนีย (ro), รัสเซีย (ru), เซอร์เบีย (sr), สโลวัก (sk), สโลวีเนีย (sl), สเปน (es), สวาฮิลี (sw), สวีเดน (sv), ไทย (th), ตุรกี (tr), ยูเครน (uk), เวียดนาม (vi)
โมเดล Gemini 2.0 Flash, Gemini 1.5 Pro และ Gemini 1.5 Flash สามารถเข้าใจและตอบกลับในภาษาเพิ่มเติมต่อไปนี้
แอฟริกาใต้ (af), อัมฮารา (am), อัสสัม (as), อาเซอร์ไบจาน (az), เบลารุส (be), บอสเนีย (bs), คาตาลัน (ca), เซบูอาโน (ceb), คอร์ซิกา (co), เวลส์ (cy), มัลดีฟส์ (dv), เอสเปรันโต (eo), บาสก์ (eu), เปอร์เซีย (fa), ฟิลิปปินส์ (ตากาล็อก) (fil), ฟรีเซีย (fy), ไอริช (ga), สก็อตแลนด์ (gd), กาลิเซีย (gl), คุชราต (gu), เฮาซา (ha), ฮาวาย (haw), ม้ง (hmn), เฮติ (ht), อาร์เมเนีย (hy), อิกโบ (ig), ไอซ์แลนด์ (is), ชวา (jv), จอร์เจีย (ka), คาซัค (kk), เขมร (km), กันนาดา (kn), คริโอ (kri), เคิร์ด (ku), คีร์กีซ (ky), ละติน (la), ลักเซมเบิร์ก (lb), ลาว (lo), มาดากัสการ์ (mg), เมารี (mi), มาซิโดเนีย (mk), มาลายาลัม (ml), มองโกเลีย (mn), ไมเตลอน (มณีปุระ) (mni-Mtei), มราฐี (mr), มาเลย์ (ms), มอลตา (mt), พม่า (my), เนปาล (ne), ญานจา (ชิเชวา) (ny), โอเดีย (โอริยา) (or), ปัญจาบ (pa), ปาทาน (ps), สินธี (sd), สิงหล (si), ซามัว (sm), โชนา (sn), โซมาเลีย (so), แอลเบเนีย (sq), โซโท (st), ซุนดา (su), ทมิฬ (ta), เตลูกู (te), ทาจิก (tg), อุยกูร์ (ug), อูรดู (ur), อุซเบก (uz), โคซา (xh), ยิดดิช (yi), โยรูบา (yo), ซูลู (zu)
Imagen
พร้อมให้บริการแก่ผู้ใช้ทั่วไป: ภาษาอังกฤษ
ตัวอย่าง: จีน (ตัวย่อ), จีน (ตัวเต็ม), ฮินดี, ญี่ปุ่น, เกาหลี, โปรตุเกส, สเปน
ข้อมูลเกี่ยวกับโมเดลก่อนหน้า
รุ่นต่อไปนี้ยังใช้งานได้ แต่เป็นรุ่นก่อนหน้า เราขอแนะนำให้ใช้รุ่นล่าสุดแทนหากเป็นไปได้
รุ่น Gemini
| รุ่น | อินพุต | เอาต์พุต | คำอธิบาย |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | โมเดลแบบมัลติโมดัลของเราที่มีฟีเจอร์รุ่นถัดไปและความสามารถที่ได้รับการปรับปรุง ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือในตัว และหน้าต่างบริบทขนาด 1 ล้านโทเค็น |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | โมเดล Flash ที่เร็วที่สุดและคุ้มค่าที่สุดของเรา ซึ่งเป็นเส้นทางการอัปเกรด สำหรับผู้ใช้ 1.5 Flash ที่ต้องการคุณภาพที่ดีขึ้นในราคาและความเร็วเท่าเดิม |
รุ่น Imagen
| รุ่น | อินพุต | เอาต์พุต | คำอธิบาย |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
ข้อความ | รูปภาพ | สร้างรูปภาพคุณภาพสูงที่สมจริงจากพรอมต์ข้อความในภาษาธรรมชาติ |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
ข้อความ | รูปภาพ | สร้างรูปภาพสำหรับการสร้างต้นแบบหรือกรณีการใช้งานที่มีเวลาในการตอบสนองต่ำ |
2 Gemini Developer API ไม่รองรับไม่ว่าคุณจะเข้าถึงด้วยวิธีใดก็ตาม
ขั้นตอนถัดไป
ลองใช้ความสามารถของ Gemini API
- สร้างการสนทนาแบบหลายรอบ (แชท)
- สร้างข้อความจากพรอมต์ข้อความเท่านั้น
- สร้างข้อความโดยการป้อนพรอมต์ด้วยไฟล์ประเภทต่างๆ เช่น รูปภาพ PDF วิดีโอ และ เสียง
- สร้างเอาต์พุตที่มีโครงสร้าง (เช่น JSON) จากทั้งข้อความและพรอมต์แบบมัลติโมดัล
- สร้างรูปภาพจากพรอมต์ข้อความ (Gemini หรือ Imagen)
- สตรีมอินพุตและเอาต์พุต (รวมถึงเสียง) โดยใช้ Gemini Live API
- ใช้เครื่องมือต่างๆ (เช่น การเรียกใช้ฟังก์ชัน และการอ้างอิงจาก Google Search) เพื่อเชื่อมต่อโมเดล Gemini กับส่วนอื่นๆ ของแอปและระบบ และข้อมูลภายนอก