ดูข้อมูลเกี่ยวกับโมเดล Gemini

ชุดโมเดลของ Gemini ถือว่าเป็นแบบหลายโมดัล เนื่องจากสามารถประมวลผลข้อมูลจากหลายรูปแบบได้ ซึ่งรวมถึงรูปภาพ วิดีโอ และข้อความ เช่น คุณสามารถส่งรูปภาพจานคุกกี้ให้โมเดลของ Gemini แล้วขอให้บอกสูตรคุกกี้เหล่านั้น

พรอมต์ การตอบกลับ
Give me a recipe for these cookies.

รูปภาพคุกกี้ช็อกโกแลตชิปหลายชิ้น
**INGREDIENTS**
- 1 c. (2 sticks) unsalted butter, softened
- 3/4 c. granulated sugar
- 3/4 c. brown sugar, packed
- 1 tsp . vanilla extract
- 2 large eggs
- 2 1/4 c. all-purpose flour
- 1 tsp. baking soda
- 1 tsp. salt
...

คุณสามารถโต้ตอบกับกลุ่มผลิตภัณฑ์โมเดล Gemini ได้โดยใช้ Gemini API ที่ Vertex AI ให้บริการใน Google Cloud สําหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ คุณสามารถใช้ Vertex AI in FirebaseSDK เพื่อเรียกใช้ Gemini API และโต้ตอบกับโมเดล Gemini จากแอปโดยตรง

หน้านี้มีข้อมูลต่อไปนี้เกี่ยวกับโมเดล Gemini

รุ่นที่ใช้ได้

คุณใช้ Gemini รุ่นใดก็ได้ต่อไปนี้กับ Vertex AI in Firebase

  • Gemini 1.5 Flash
    โมเดลมัลติโมดัลที่รองรับประเภทอินพุตและเอาต์พุตแบบเดียวกับ 1.5 Pro แต่มีการทําความเข้าใจบริบทแบบยาวที่ 1 ล้านโทเค็น Gemini 1.5 Flash ออกแบบมาโดยเฉพาะสําหรับแอปพลิเคชันที่มีปริมาณมากและประหยัดต้นทุน

  • Gemini 1.5 Pro
    โมเดลมัลติโมดัลที่รองรับการเพิ่มรูปภาพ เสียง วิดีโอ และไฟล์ PDF ในพรอมต์ข้อความหรือแชทเพื่อรับคำตอบที่เป็นข้อความหรือโค้ด นอกจากนี้ยังรองรับการทำความเข้าใจบริบทแบบยาวด้วยโทเค็น 2 ล้านรายการ

  • Gemini 1.0 Pro Vision
    โมเดลมัลติโมดัลที่ออกแบบมาเพื่อจัดการข้อความ รวมถึงรูปภาพและวิดีโอสำหรับการตอบกลับด้วยข้อความหรือโค้ด ใช้สำหรับแชทไม่ได้

  • Gemini 1.0 Pro
    โมเดลที่ออกแบบมาเพื่อจัดการงานภาษาธรรมชาติ แชทแบบหลายรอบด้วยข้อความและโค้ด รวมถึงการสร้างโค้ด

ข้ามไปที่ชื่อโมเดลเพื่อรวมไว้ในโค้ด

กรณีการใช้งานและความสามารถของโมเดลแต่ละรุ่น

Gemini แต่ละรุ่นมีความสามารถที่แตกต่างกันเพื่อรองรับกรณีการใช้งานที่หลากหลาย ดูข้อมูลเพิ่มเติมได้ในGoogle Cloudเอกสารประกอบเกี่ยวกับรุ่น Gemini แต่ละรุ่น

อินพุตและเอาต์พุตที่รองรับสำหรับแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
ประเภทอินพุต
ข้อความ
รหัส
รูปภาพ
PDF
วิดีโอ (เฟรมเท่านั้น)
วิดีโอ (เฟรมและเสียง)
เสียง
ประเภทเอาต์พุต
ข้อความ
เอาต์พุตที่มีโครงสร้าง (เช่น JSON) โดยใช้สคีมาคำตอบ
รหัส

ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API

ความสามารถที่รองรับและฟีเจอร์ทั่วไปสำหรับแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
การสร้างข้อความจากอินพุตที่เป็นข้อความเท่านั้น
การสร้างข้อความจากอินพุตหลายโมดัล
เอาต์พุตที่มีโครงสร้าง (เช่น JSON) โดยใช้สคีมาการตอบกลับ
แชทแบบหลายรอบ
การเรียกใช้ฟังก์ชัน
การเรียกฟังก์ชันพื้นฐาน
การเรียกฟังก์ชันพร้อมกัน
โหมดการเรียกฟังก์ชัน
นับโทเค็นและอักขระที่เรียกเก็บเงินได้
วิธีการของระบบ
จะไม่รองรับ

ข้อมูลโดยละเอียดเกี่ยวกับแต่ละรุ่น

พร็อพเพอร์ตี้ Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
ขีดจํากัดโทเค็นทั้งหมด (อินพุตและเอาต์พุตรวมกัน) * โทเค็น 1,048,576 รายการ โทเค็น 2,097,152 รายการ โทเค็น 16,384 รายการ โทเค็น 32,760 รายการ
ขีดจํากัดโทเค็นเอาต์พุต * โทเค็น 8,192 รายการ โทเค็น 8,192 รายการ โทเค็น 2,048 รายการ โทเค็น 8,192 รายการ
จํานวนรูปภาพสูงสุดต่อคําขอ 3,000 รูปภาพ 3,000 รูปภาพ รูปภาพ 16 รูป ไม่มี
ขนาดรูปภาพสูงสุดที่เข้ารหัส Base64 7 MB 7 MB 7 MB ไม่มี
ขนาด PDF สูงสุด 30 MB 30 MB 30 MB ไม่มี
จำนวนไฟล์วิดีโอสูงสุดต่อคำขอ ไฟล์วิดีโอ 10 ไฟล์ ไฟล์วิดีโอ 10 ไฟล์ ไฟล์วิดีโอ 1 ไฟล์ ไม่มี
ความยาววิดีโอสูงสุด (เฟรมเท่านั้น) วิดีโอความยาวประมาณ 60 นาที วิดีโอความยาวประมาณ 60 นาที 2 นาที ไม่มี
ความยาววิดีโอสูงสุด (เฟรมและเสียง) วิดีโอความยาวประมาณ 45 นาที วิดีโอความยาวประมาณ 45 นาที ไม่มี ไม่มี
จำนวนไฟล์เสียงสูงสุดต่อคำขอ ไฟล์เสียง 1 ไฟล์ ไฟล์เสียง 1 ไฟล์ ไม่มี ไม่มี
ความยาวเสียงสูงสุด เสียงที่ยาวประมาณ 8.4 ชั่วโมง เสียงที่ยาวประมาณ 8.4 ชั่วโมง ไม่มี ไม่มี

* สำหรับ Gemini ทุกรุ่น โทเค็นจะเท่ากับประมาณ 4 อักขระ ดังนั้น 100 โทเค็นจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ คุณระบุจํานวนโทเค็นทั้งหมดในคําขอได้โดยใช้ countTokens

ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับ วิธีระบุประเภท MIME และวิธีตรวจสอบว่าไฟล์และคำขอแบบหลายรูปแบบเป็นไปตามข้อกำหนดและแนวทางปฏิบัติแนะนำในไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API

การกำหนดเวอร์ชันของโมเดล

โมเดล Gemini มีให้บริการในเวอร์ชันเสถียร อัปเดตอัตโนมัติ และเวอร์ชันตัวอย่าง

  • เวอร์ชันเสถียรจะถือว่าพร้อมให้บริการสำหรับผู้ใช้ทั่วไป

    • เวอร์ชันที่เสถียรจะมีชื่อรุ่นต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักที่เฉพาะเจาะจง เช่น gemini-1.5-pro-002
  • เวอร์ชันอัปเดตอัตโนมัติจะชี้ไปยังเวอร์ชันเสถียรล่าสุดของโมเดลนั้นเสมอ หากมีการเผยแพร่เวอร์ชันเสถียรใหม่ เวอร์ชันอัปเดตอัตโนมัติจะเริ่มชี้ไปยังเวอร์ชันเสถียรใหม่นั้นโดยอัตโนมัติ

    • เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อรูปแบบที่ไม่มีส่วนต่อท้าย เช่น gemini-1.5-pro
  • เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่ๆ และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปยังโมเดลนั้นในเวอร์ชันตัวอย่างล่าสุดเสมอ หากมีการเผยแพร่เวอร์ชันตัวอย่างใหม่ เวอร์ชันตัวอย่างที่มีอยู่จะเริ่มชี้ไปยังเวอร์ชันตัวอย่างใหม่นั้นโดยอัตโนมัติ

    • เวอร์ชันตัวอย่างจะมีชื่อรุ่นต่อท้ายด้วย -preview พร้อมกับวันที่เปิดตัวครั้งแรกของรุ่น (-MMDD) เช่น gemini-1.5-pro-preview-0409 (เปิดตัวเมื่อวันที่ 9 เมษายน 2024)

ดูข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันของรูปแบบ Gemini ที่มีและวงจรการใช้งานในเอกสารประกอบ Google Cloud

ชื่อรุ่นที่ใช้ได้

ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณรวมไว้ในโค้ดระหว่างการเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียกใช้ Gemini API) ดูตัวอย่างการเริ่มต้นภาษาของคุณได้ในคู่มือเริ่มต้นใช้งาน

ชื่อโมเดล Gemini 1.5 Flash

ชื่อโมเดล คำอธิบาย ระยะการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่หยุดให้บริการ
เวอร์ชันเสถียร
gemini-1.5-flash-002 Gemini 1.5 Flash เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-09-24 ไม่เกินวันที่ 24-09-2025
gemini-1.5-flash-001 เวอร์ชันเสถียรเริ่มต้นของ Gemini 1.5 Flash สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกินวันที่ 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-flash ชี้ไปยัง 1.5 Flash เวอร์ชันเสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-flash-002)
สำหรับผู้ใช้ทั่วไป 2024-09-24 ---

ชื่อรุ่น Gemini 1.5 Pro

ชื่อโมเดล คำอธิบาย ระยะการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่หยุดให้บริการ
เวอร์ชันเสถียร
gemini-1.5-pro-002 Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-09-24 ไม่เกินวันที่ 24-09-2025
gemini-1.5-pro-001 เวอร์ชันเสถียรเริ่มต้นของ Gemini 1.5 Pro สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกินวันที่ 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-pro ชี้ไปยัง 1.5 Pro เวอร์ชันเสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-pro-002)
สำหรับผู้ใช้ทั่วไป 2024-09-24 ---

ชื่อรุ่น Gemini 1.0 Pro Vision

ชื่อโมเดล คำอธิบาย ระยะการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่หยุดให้บริการ
เวอร์ชันเสถียร
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกินวันที่ 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro-vision ชี้ไปที่ ProVision 1.5 เวอร์ชันเสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-pro-vision-001)
สำหรับผู้ใช้ทั่วไป 2024-01-04 ---

ชื่อรุ่น Gemini 1.0 Pro

ชื่อโมเดล คำอธิบาย ระยะการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่หยุดให้บริการ
เวอร์ชันเสถียร
gemini-1.0-pro-002 Gemini 1.0 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-04-09 ไม่เกินวันที่ 09-04-2025
gemini-1.0-pro-001 Gemini 1.0 Pro เวอร์ชันเสถียร สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกินวันที่ 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro ชี้ไปยังเวอร์ชัน 1.0 Proที่เสถียรล่าสุด
(ปัจจุบันคือ gemini-1.0-pro-002)
สำหรับผู้ใช้ทั่วไป 2024-02-15 ---

ภาษาที่สนับสนุน

  • Gemini ทุกรุ่นจะเข้าใจและตอบกลับเป็นภาษาต่อไปนี้ได้

    อาหรับ (ar), เบงกอล (bn), บัลแกเรีย (bg), จีน (ตัวย่อและตัวเต็ม) (zh), โครเอเชีย (hr), เช็ก (cs), ญี่ปุ่น (ja), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), ฮินดี (hi), ฮังการี (hu), อินโดนีเซีย (id), อิตาลี (it), เกาหลี (ko), ลัตเวีย (lv), ลิทัวเนีย (lt), นอร์เวย์ (no), โปแลนด์ (pl), โปรตุเกส (pt), โรมาเนีย (ro), รัสเซีย (ru), เซอร์เบีย (sr), สโลวาเกีย (sk), สโลวีเนีย (sl), สเปน (es), สวาฮิลี (sw), สวีเดน (sv), ไทย (th), ตุรกี (tr), ยูเครน (uk), เวียดนาม (vi)

  • โมเดล Gemini 1.5 Pro และ Gemini 1.5 Flash สามารถเข้าใจและตอบเป็นภาษาเพิ่มเติมต่อไปนี้

    อาหรับ (ar), ไอซ์แลนด์ (is), อินโดนีเซีย (id), อุษาครี (ur), อุซเบก (uz), อังกฤษ (en), อิตาลี (it), อินเดีย (ฮินดี) (hi), อินเดีย (อูรดู) (ur), อินเดีย (ทมิฬ) (ta), อินเดีย (เตลูกู) (te), อินเดีย (มราฐี) (mr), อินเดีย (คุชราต) (gu), อินเดีย (เบงกาลี) (bn), อินเดีย (ปัญจาบ) (pa), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (ม

หากจําเป็น

ขั้นตอนถัดไป

ลองใช้ความสามารถของ Gemini API