משפחת המודלים של Gemini נחשבת מרובה מצבים כי היא מסוגלת לעבד מידע ממספר מצבים, כולל תמונות, סרטונים וטקסט. לדוגמה, אפשר לשלוח למודל של Gemini תמונה של צלחת עם עוגיות ולבקש ממנו לשלוח לכם מתכון לעוגיות האלה.
הנחיה | תגובה |
תן לי מתכון לעוגיות האלה. |
**מצרכים** - 1 כוס (2 מקלות) חמאה לא מלוחה, רכה - 3/4 כוס סוכר גס - 3/4 כוס סוכר חום, דחוס - כפית אחת . תמצית וניל - 2 ביצים גדולות - 2 1/4 כוסות קמח לבן - כפית סודה לשתייה - כפית מלח ... |
אפשר ליצור אינטראקציה עם משפחת המודלים של Gemini באמצעות Gemini API שסופקה על ידי Vertex AI ב-Google Cloud. באפליקציות לנייד ולאינטרנט, אפשר להשתמש ב-SDKs של Vertex AI in Firebase כדי לבצע קריאה ל-Gemini API ולנהל אינטראקציה עם המודלים של Gemini ישירות מהאפליקציה.
בדף הזה מופיע המידע הבא על המודלים של Gemini:
השוואה ברמה גבוהה של תרחישים לדוגמה למודלים השונים של Gemini, כולל סוגי הקלט הנתמכים.
השוואה בין הפרטים של כל מודל, למשל מספר האסימונים המקסימלי להזנה או אורך הסרטון המקסימלי.
תיאור של האופן שבו מסווגות הגרסאות של המודלים של Gemini, במיוחד הגרסאות היציבות, המעודכנות באופן אוטומטי והגרסאות המקדימות.
רשימות של שמות מודלים זמינים שאפשר לכלול בקוד במהלך האינטראקציה הראשונית.
רשימת השפות הנתמכות במודלים של Gemini.
המודלים הזמינים
אתם יכולים להשתמש בכל אחד מהמודלים הבאים של Gemini עם Vertex AI in Firebase:
Gemini 1.5 Flash
מודל רב-מודלי שתומך באותם סוגי קלט ופלט כמו 1.5 Pro, אבל עם הבנה של הקשר ארוך של מיליון אסימונים. Gemini 1.5 Flash מיועד במיוחד לאפליקציות עם נפח גבוה וחסכוניות.Gemini 1.5 Pro
מודל רב-מודלי שתומך בהוספת תמונות, קובצי אודיו, סרטונים וקובצי PDF בהנחיות בטקסט או בצ'אט, כדי לקבל תגובה בטקסט או בקוד. בנוסף, הוא תומך בהבנה של הקשר ארוך עם 2 מיליון אסימונים.Gemini 1.0 Pro Vision
מודל רב-אופני שמיועד לטפל בטקסט, תמונות ווידאו כדי לקבל תשובה באמצעות טקסט או קוד. אי אפשר להשתמש בהם לצ'אט.Gemini 1.0 Pro
מודל שמיועד לטיפול במשימות בשפה טבעית, בצ'אט עם כמה תשובות בטקסט ובקוד וביצירת קוד.
מעבר אל שמות המודלים שרוצים לכלול בקוד
תרחישים לדוגמה ויכולות של כל מודל
לכל מודל של Gemini יש יכולות שונות שתומכות בתרחישים לדוגמה שונים. מידע נוסף על כל אחד מהמודלים של Gemini זמין במסמכי התיעוד של Google Cloud.
קלט ופלט נתמכים לכל מודל
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
סוגי קלט | ||||
טקסט | ||||
קוד | ||||
תמונה | ||||
וידאו (פריימים בלבד) | ||||
וידאו (פריימים ואודיו) | ||||
אודיו | ||||
סוגי פלט | ||||
טקסט | ||||
פלט מובנה (כמו JSON) באמצעות סכימת תגובה | ||||
קוד |
מידע נוסף על סוגי הקבצים הנתמכים מופיע במאמר קובצי קלט נתמכים ודרישות ב-Vertex AI Gemini API.
יכולות נתמכות ותכונות כלליות בכל דגם
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
יצירת טקסט מקלט טקסט בלבד | |||||
יצירת טקסט מקלט מרובה מצבים | |||||
פלט מובנה (כמו JSON) באמצעות סכימת תגובות | |||||
שיחה עם זיכרון | |||||
קריאה לפונקציה | |||||
קריאה בסיסית לפונקציה | |||||
קריאה לפונקציות במקביל | |||||
מצב קריאה לפונקציה | |||||
ספירת אסימונים ותווים לחיוב | |||||
הוראות למערכת |
מידע מפורט על כל מודל
נכס | Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|---|
מגבלת האסימונים הכוללת (קלט ופלט משולבים) * | 1,048,576 אסימונים | 2,097,152 אסימונים | 16,384 אסימונים | 32,760 אסימונים |
מגבלת אסימון הפלט * | 8,192 אסימונים | 8,192 אסימונים | 2,048 אסימונים | 8,192 אסימונים |
מספר התמונות המקסימלי בכל בקשה | 3,000 תמונות | 3,000 תמונות | 16 תמונות | לא רלוונטי |
גודל תמונה מקסימלי בקידוד base64 | 7MB | 7MB | 7MB | לא רלוונטי |
גודל PDF מקסימלי | 30MB | 30MB | 30MB | לא רלוונטי |
מספר הקבצים המקסימלי של סרטונים בכל בקשה | 10 קובצי וידאו | 10 קובצי וידאו | קובץ סרטון אחד | לא רלוונטי |
אורך הסרטון המקסימלי (פריימים בלבד) | כ-60 דקות של סרטון | כ-60 דקות של סרטון | 2 דקות | לא רלוונטי |
אורך הסרטון המקסימלי (פריימים ואודיו) | כ-45 דקות של סרטון | כ-45 דקות של סרטון | לא רלוונטי | לא רלוונטי |
המספר המקסימלי של קובצי אודיו בכל בקשה | קובץ אודיו אחד | קובץ אודיו אחד | לא רלוונטי | לא רלוונטי |
אורך האודיו המקסימלי | כ-8.4 שעות אודיו | כ-8.4 שעות אודיו | לא רלוונטי | לא רלוונטי |
* בכל המודלים של Gemini, האסימון שווה ל-4 תווים,
ולכן 100 אסימונים הם בין 60 ל-80 מילים באנגלית. אפשר לקבוע את המספר הכולל של הטוקנים בבקשות באמצעות countTokens
.
במאמר קובצי קלט נתמכים ודרישות ל-Vertex AI Gemini API מוסבר על סוגי הקבצים הנתמכים, איך לציין סוג MIME ואיך לוודא שהקבצים והבקשות מרובות מצבים עומדים בדרישות ולפעול לפי השיטות המומלצות.
ניהול גרסאות של המודלים
המודלים של Gemini זמינים בגרסאות יציבות, עדכניות ובטא.
גרסאות יציבות נחשבות לזמינות לכולם.
- לגרסאות יציבות יש שמות דגמים עם מספר גרסה ספציפי בן שלוש ספרות, לדוגמה
.gemini-1.5-pro-002
- לגרסאות יציבות יש שמות דגמים עם מספר גרסה ספציפי בן שלוש ספרות, לדוגמה
גרסאות מתעדכנות תמיד מפנות לגרסה היציבה האחרונה של הדגם הזה. אם תופץ גרסה יציבה חדשה, הגרסה המעודכנת תתחיל להפנות באופן אוטומטי לגרסה היציבה החדשה.
- לגרסאות שמתעדכנות באופן אוטומטי יש שמות מודלים ללא סיומת, למשל
.gemini-1.5-pro
- לגרסאות שמתעדכנות באופן אוטומטי יש שמות מודלים ללא סיומת, למשל
לגרסאות טרום-השקה יש יכולות חדשות והן נחשבות לא יציבות. חשוב לזכור שגרסאות תצוגה מקדימה תמיד מפנות לגרסת התצוגה המקדימה האחרונה של המודל. אם תפורסם גרסה חדשה של תצוגה מקדימה, כל גרסה קיימת של תצוגה מקדימה תתחיל להפנות באופן אוטומטי לגרסה החדשה של תצוגה מקדימה.
- לגרסאות המקדימות מצורף שם המודל עם הסיומת
ותאריך הפרסום הראשוני של המודל (-preview
). לדוגמה:-MMDD
(פורסם ב-9 באפריל 2024).gemini-1.5-pro-preview-0409
- לגרסאות המקדימות מצורף שם המודל עם הסיומת
מידע נוסף על הגרסאות הזמינות של המודל של Gemini ומחזור החיים שלהן זמין במסמכי התיעוד של Google Cloud.
שמות המודלים הזמינים
שמות המודלים הם הערכים המפורשים שכוללים בקוד במהלך האינטוליזציה של המודל הגנרטיבי (שלב נדרש כדי לקרוא לפונקציה Gemini API). דוגמאות לאינטוליזציה בשפה שלכם מפורטות במדריך למתחילים.
שמות של דגמים של Flash ב-Gemini 1.5
שם הדגם | תיאור | שלב השקה | תאריך ההשקה של הגרסה הראשונית | תאריך ההוצאה משימוש |
---|---|---|---|---|
גרסאות יציבות | ||||
gemini-1.5-flash-002 |
הגרסה היציבה האחרונה של Gemini 1.5 Flash | זמינות לכלל המשתמשים (GA) | 2024-09-24 | לא לפני 24 בספטמבר 2025 |
gemini-1.5-flash-001 |
הגרסה היציבה הראשונית של Gemini 1.5 Flash | זמינות לכלל המשתמשים (GA) | 2024-05-24 | לא לפני 24 במאי 2025 |
גרסה מתעדכנת אוטומטית | ||||
gemini-1.5-flash |
מפנה אל gemini-1.5-flash-001 כדי לגשת אל gemini-1.5-flash-002 |
זמינות לכלל המשתמשים (GA) | 2024-05-24 | --- |
שמות המודלים של Gemini 1.5 Pro
שם הדגם | תיאור | שלב השקה | תאריך ההשקה של הגרסה הראשונית | תאריך ההוצאה משימוש |
---|---|---|---|---|
גרסאות יציבות | ||||
gemini-1.5-pro-002 |
הגרסה היציבה האחרונה של Gemini 1.5 Pro | זמינות לכלל המשתמשים (GA) | 2024-09-24 | לא לפני 24 בספטמבר 2025 |
gemini-1.5-pro-001 |
הגרסה היציבה הראשונית של Gemini 1.5 Pro | זמינות לכלל המשתמשים (GA) | 2024-05-24 | לא לפני 24 במאי 2025 |
גרסה עם עדכונים אוטומטיים | ||||
gemini-1.5-pro |
מפנה אל gemini-1.5-pro-001 כדי לגשת אל gemini-1.5-pro-002 |
זמינות לכלל המשתמשים (GA) | 2024-05-24 | --- |
שמות הדגמים של Gemini 1.0 Pro Vision
שם המודל | תיאור | שלב השקה | תאריך ההשקה של הגרסה הראשונית | תאריך ההוצאה משימוש |
---|---|---|---|---|
גרסאות יציבות | ||||
gemini-1.0-pro-vision-001 |
הגרסה היציבה האחרונה של Gemini 1.0 Pro Vision | זמינות לכלל המשתמשים (GA) | 2024-02-15 | לא לפני 15 בפברואר 2025 |
גרסה עם עדכונים אוטומטיים | ||||
gemini-1.0-pro-vision |
מפנה לגרסה היציבה האחרונה של 1.5 Pro Vision (כרגע gemini-1.5-pro-vision-001 |
זמינות לכלל המשתמשים (GA) | 2024-01-04 | --- |
שמות המודלים של Gemini 1.0 Pro
שם הדגם | תיאור | שלב השקה | תאריך ההשקה של הגרסה הראשונית | תאריך ההוצאה משימוש |
---|---|---|---|---|
גרסאות יציבות | ||||
gemini-1.0-pro-002 |
הגרסה היציבה האחרונה של Gemini 1.0 Pro | זמינות לכלל המשתמשים (GA) | 2024-04-09 | לא לפני 9 באפריל 2025 |
gemini-1.0-pro-001 |
גרסה יציבה של Gemini 1.0 Pro | זמינות לכלל המשתמשים (GA) | 2024-02-15 | לא לפני 15 בפברואר 2025 |
גרסה עם עדכונים אוטומטיים | ||||
gemini-1.0-pro |
מפנה לגרסה היציבה האחרונה של 1.0 Pro (כרגע gemini-1.0-pro-002 |
זמינות לכלל המשתמשים (GA) | 2024-02-15 | --- |
שפות נתמכות
כל הדגמים של Gemini יכולים להבין ולענות בשפות הבאות:
ערבית (ar), בנגלית (bn), בולגרית (bg), סינית פשוטה ומסורתית (zh), קרואטית (hr), צ'כית (cs), דנית (da), הולנדית (nl), אנגלית (en), אסטונית (et), פינית (fi), צרפתית (fr), גרמנית (de), יוונית (el), עברית (iw), הינדי (hi), הונגרית (hu), אינדונזית (id), איטלקית (it), יפנית (ja), קוריאנית (ko), לטבית (lv), ליטאית (lt), נורווגית (no), פולנית (pl), פורטוגזית (pt), רומנית (ro), רוסית (ru), סרבית (sr), סלובקית (sk), סלובנית (sl), ספרדית (es), סוואהילית (sw), שוודית (sv), תאילנדית (th), טורקית (tr), אוקראינית (uk), וייטנאמית (vi)
המודלים של Gemini 1.5 Pro ו-Gemini 1.5 יכולים להבין את הנתונים ולקבל תשובות בשפות הנוספות האלה:
אפריקאנס (af), אמהריית (am), אסאמית (as), אזרית (az), בלארוסית (be), בוסנית (bs), קטלאנית (ca), צ'בואנו (ceb), קורסיקאית (co), וולשית (cy), דיווהי (dv), ספרדית (es), אסטונית (et), אספניולת (es), אסטונית (et), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es),
השלבים הבאים
כדאי לנסות את היכולות של Gemini API
- ליצור שיחות עם זיכרון (צ'אט).
- יצירת טקסט מהנחיות עם טקסט בלבד.
- יצירת טקסט באמצעות הנחיות מרובות מצבים (כולל טקסט, תמונות, קובצי PDF, וידאו ואודיו).
- יצירת פלט מובנה (כמו JSON) גם מהנחיות טקסט וגם מהנחיות מולטימודליות.
- משתמשים בקריאה לפונקציה כדי לחבר מודלים גנרטיביים למערכות ולמידע חיצוניים.