針對行動和網頁應用程式,Vertex AI in Firebase SDK 可讓您直接透過應用程式與支援的 Gemini 模型和 Imagen 3 模型互動。
Gemini 模型屬於多模態,因為它們能夠處理甚至產生多種型態,包括文字、程式碼、PDF、圖片、影片和音訊。Imagen 3 模型可透過文字提示產生圖片。
下表簡要概述 Vertex AI in Firebase 支援的型號,以及最新的穩定型號名稱。這份表格也會列出可用於原型設計用途的預覽和實驗模型。
模型 | 輸入 | 輸出 | 說明 |
---|---|---|---|
Gemini 穩定版本的模型 | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON (圖片和音訊即將推出!) |
我們的多模態模型提供新一代功能和強化功能,包括優異的速度、內建工具使用方式,以及 100 萬個符號上下文視窗 (多模態生成功能即將推出!) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 最快速且最具成本效益的 Flash 模型。這是 1.5 Flash 使用者升級的途徑,可讓他們以相同的價格和速度獲得更優質的品質。 |
Gemini 模型,僅包含預覽和實驗版本 (僅建議用於原型設計用途) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | Google 最先進的推理模型,可以解決複雜問題。 |
Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 我們的推理模型提供全面的優異功能。這項服務旨在兼顧價格和效能。 |
Gemini 2.0 Flash‑Livegemini-2.0-flash-live-preview-04-09
|
文字 (串流)、 音訊 (串流) |
文字 (串流)、 音訊 (串流) |
我們的多模態模型支援低延遲即時串流的多模態輸入和輸出。 |
Imagen 3 模型 (與 Vertex AI in Firebase 搭配使用時) | |||
Imagen 3imagen-3.0-generate-002 |
文字 | 圖片 | 根據自然語言文字提示生成逼真且高品質的圖片 |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
文字 | 圖片 | 產生圖像,用於原型設計或低延遲用途 |
Vertex AI in Firebase 是否支援舊型號,例如 Gemini 1.5 和 Gemini 1.0 型號?
是的,Vertex AI in Firebase 支援所有 Gemini 型號,包括舊型號。
模型 | 輸入 | 輸出 | 適合用途 |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 支援需要更多智慧的複雜推理工作; 200 萬個長脈絡 |
Gemini 1.5 Flashgemini-1.5-flash-002 |
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 在各種任務中提供快速且多功能的效能 |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Vertex AI in Firebase 僅支援 Imagen 3 型號。不支援舊版 Imagen 型號 (例如 Imagen 2)。
你可以在本頁底部查看舊型機型的詳細資訊。請參閱常見問題,瞭解 Vertex AI in Firebase 支援和不支援的所有型號。
本頁的其餘部分會提供 Vertex AI in Firebase 支援的模型詳細資訊:
比較模式:
- 支援的輸入和輸出
- 支援功能的概略比較
- 規格和限制,例如輸入符記上限或輸入影片長度上限
說明模型的版本編號方式,特別是穩定版、自動更新版和預覽版
在初始化期間要納入程式碼的可用模型名稱清單
模型支援的語言清單
你可以在本頁底部查看舊型機型的詳細資訊。
比較模式
每個模型的功能各有不同,可支援各種用途。請注意,本節中的每個表格都會說明與 Vertex AI in Firebase 搭配使用時的每個模型。每個模型可能都有額外功能,這些功能在使用 SDK 時無法使用。
如果您在下列子章節中找不到所需資訊,請參閱 Google Cloud 說明文件,進一步瞭解 Gemini 模型和 Imagen 3 模型。
支援的輸入和輸出
以下是搭配 Vertex AI in Firebase 使用各個模型時支援的輸入和輸出類型:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|||
---|---|---|---|---|---|---|---|---|
輸入類型 | ||||||||
文字 | ||||||||
文字 (串流) | ||||||||
程式碼 | ||||||||
文件 (PDF 或純文字) |
||||||||
圖片 | ||||||||
影片 | ||||||||
音訊 | ||||||||
音訊 (串流) | ||||||||
輸出類型 | ||||||||
文字 | ||||||||
文字 (串流) | ||||||||
程式碼 | ||||||||
結構化輸出內容 (例如 JSON) |
||||||||
圖片 | 敬請期待! | |||||||
音訊 | 敬請期待! | |||||||
音訊 (串流) |
如要瞭解支援的檔案類型,請參閱「Vertex AI Gemini API 支援的輸入檔案和相關規定」。
支援的功能
以下是搭配 Vertex AI in Firebase 使用各個模型時支援的功能和功能:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
從純文字或多模態輸入內容生成文字 | 僅限串流 | |||||
產生圖片 (Imagen 3) |
敬請期待! | |||||
生成音訊 | 敬請期待! | 僅限串流 | ||||
產生結構化輸出內容
(例如 JSON) |
||||||
分析文件
(PDF 或純文字) |
||||||
分析圖片 (視覺) | ||||||
分析影片 (視覺) | ||||||
分析音訊 | 僅限串流 | |||||
多輪對話 | ||||||
函式呼叫 (工具) | ||||||
計算符號數 | ||||||
系統指示 | ||||||
雙向多模態串流 |
規格和限制
以下是將每個模型與 Vertex AI in Firebase 搭配使用時的規格和限制:
屬性 |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
脈絡窗口 * 總符記限制 (輸入 + 輸出) |
1,048,576 個符記 | 1,048,576 個符記 | 1,048,576 個符記 | 1,048,576 個符記 | 32,768 個符記 | 480 個符記 | |
輸出符記限制 * | 65,536 個符記 | 65,536 個符記 | 8,192 個符記 | 8,192 個符記 | --- | --- | |
知識截點日期 | 2025 年 1 月 | 2025 年 1 月 | 2024 年 6 月 | 2024 年 6 月 | 2024 年 8 月 | --- | |
PDF (每項要求) | |||||||
輸入 PDF 檔案的最大數量 ** |
3,000 個檔案 | 3,000 個檔案 | 3,000 個檔案 | 3,000 個檔案 | --- | --- | |
每個輸入 PDF 檔案的 頁數 上限 ** |
1,000 頁 | 1,000 頁 | 1,000 頁 | 1,000 頁 | --- | --- | |
每個輸入 PDF 檔案的大小上限 |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | |
圖片 (每個要求) | |||||||
輸入圖片 數量上限 |
3,000 張圖片 | 3,000 張圖片 | 3,000 張圖片 | 3,000 張圖片 | --- | --- | |
輸出圖片的最大數量 |
--- | --- | 敬請期待! | --- | --- | 4 張圖片 | |
每張輸入 Base64 編碼圖片的最大大小 |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | |
影片 (每項要求) | |||||||
輸入影片檔案的數量上限 |
10 個檔案 | 10 個檔案 | 10 個檔案 | 10 個檔案 | --- | --- | |
所有輸入影片 的長度上限 (僅限影格) |
約 60 分鐘 | 約 60 分鐘 | 約 60 分鐘 | 約 60 分鐘 | --- | --- | |
所有輸入影片 的長度上限 (影格 + 音訊) |
約 45 分鐘 | 約 45 分鐘 | 約 45 分鐘 | 約 45 分鐘 | --- | --- | |
音訊 (依要求) | |||||||
輸入音訊檔案的 數量上限 |
1 個檔案 | 1 個檔案 | 1 個檔案 | 1 個檔案 | --- | --- | |
輸出音訊檔案的 數量上限 |
--- | --- | 敬請期待! | --- | --- | --- | |
所有輸入音訊的長度上限 |
約 8.4 小時 | 約 8.4 小時 | 約 8.4 小時 | 約 8.4 小時 | --- | --- | |
所有輸出音訊的長度上限 |
--- | --- | 敬請期待! | --- | --- | --- |
*
對於所有 Gemini 模型,一個符記相當於約 4 個字元,因此 100 個符記相當於約 60 到 80 個英文單字。針對 Gemini 模型,您可以使用 countTokens
判斷要求中的權杖總數。
** PDF 會視為圖片,因此 PDF 的單頁會視為一張圖片。要求中允許的頁面數量,不得超過模型可支援的圖片數量。
取得其他詳細資訊
請參閱「支援的輸入檔案類型和相關規定」,瞭解支援的輸入檔案類型、如何指定 MIME 類型,以及如何確保輸入檔案和多模態要求符合規定並遵循最佳做法。
模型版本管理和命名模式
模型提供穩定、預覽和實驗版本。為方便起見,系統支援不含明確版本值的別名。
如要找出要在程式碼中使用的特定型號名稱,請參閱本頁後文的「可用的型號名稱」一節。
版本類型 / 發布階段 |
說明 | 模型名稱模式 | |
---|---|---|---|
穩定版 |
穩定版已推出,並自發布日期起可供正式環境使用。 穩定版模型通常會在退役日期前發布,退役日期是指模型可用的最後一天。在該日期之後,Google 將不再提供這項模型的存取權或支援。 |
穩定版的模型名稱會附加特定的三位數版本號碼
示例: |
|
自動更新的穩定別名 | 自動更新的穩定別名一律會指向該模型的最新穩定版本。如果發布新的穩定版,自動更新別名會自動開始指向該新穩定版。 |
別名的模型名稱沒有附加字串
示例: |
|
預覽 |
預覽版具有新功能,且被視為不穩定。 預覽版本一律會指向該模型的最新 預覽版本。如果發布新的預先發布版,所有現有的預先發布版都會自動開始指向該新版。 這些模型不建議用於實際工作環境,且有更嚴格的費率限制,可能還有計費要求。 |
預覽版的模型名稱會附上
範例: |
|
實驗功能 |
實驗版本具有新功能,且被視為不穩定。 這些模型不建議用於實際工作環境,且有更嚴格的速率限制。實驗模型的用意是收集意見回饋,並讓您試用最新功能。 |
實驗版本的型號名稱會加上
示例: |
|
退休 |
已停用的版本已過停用日期,並已永久停用。 Google 已不再提供舊型機型的存取權,也不再支援這些機型。 參照已停用的模型 ID 的要求通常會傳回 404 錯誤。 |
--- |
如要進一步瞭解可用的模型版本及其生命週期 (Gemini) 或 Imagen,請參閱 Google Cloud 說明文件。
可用的型號名稱
模型名稱是在初始化模型時,在程式碼中加入的明確值。
您可以使用 publishers.models.list
端點列出所有可用的模型名稱。請注意,這個傳回清單會包含 Vertex AI 支援的所有模型,但 Vertex AI in Firebase 只支援本頁所述的 Gemini 和 Imagen 模型。另請注意,系統不會列出自動更新的別名 (例如 gemini-2.0-flash
),因為這些是基礎模型的方便別名。
Gemini 模型名稱
如需平台的初始化範例,請參閱入門指南。
Gemini 2.5 Pro 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
沒有可用的穩定版 | --- | --- | --- | --- |
自動更新的穩定別名 | ||||
沒有可用的自動更新穩定別名 | --- | --- | --- | --- |
預覽版本 | ||||
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro 的預覽版 | 預覽 | 2025-05-06 | 待定 |
gemini-2.5-pro-preview-03-25 |
指向 gemini-2.5-pro-preview-05-06 (這是最新的預先發布版) |
預覽 | 2025-03-25 | 待定 |
實驗功能版本 | ||||
gemini-2.5-pro-exp-03-25 |
Gemini 2.5 Pro 的實驗版 | 實驗功能 | 2025-03-28 | 待定 |
Gemini 2.5 Flash 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
沒有可用的穩定版 | --- | --- | --- | --- |
自動更新的穩定別名 | ||||
沒有可用的自動更新穩定別名 | --- | --- | --- | --- |
預覽版本 | ||||
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash 的預覽版 | 預覽 | 2025-04-17 | 待定 |
實驗功能版本 | ||||
沒有可用的實驗版 | --- | --- | --- | --- |
Gemini 2.0 Flash 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-2.0-flash-001 |
Gemini 2.0 Flash 的最新穩定版 | 穩定 | 2025-02-05 | 2026-02-05 以後 |
自動更新的穩定別名 | ||||
gemini-2.0-flash |
指向 2.0 Flash 的最新穩定版 (目前為 gemini-2.0-flash-001 |
穩定 | 2025-02-10 | --- |
預覽版本 | ||||
沒有可用的預覽版本 | --- | --- | --- | --- |
實驗功能版本 | ||||
沒有可用的實驗版 | --- | --- | --- | --- |
Gemini 2.0 Flash‑Lite 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite 的最新穩定版 | 穩定 | 2025-02-25 | 不得早於 2026-02-25 |
自動更新的穩定別名 | ||||
gemini-2.0-flash-lite |
指向 2.0 版 Flash-Lite 的最新穩定版本 (目前為 gemini-2.0-flash-lite-001 |
穩定 | 2025-02-25 | --- |
預覽版本 | ||||
沒有可用的預覽版本 | --- | --- | --- | --- |
實驗功能版本 | ||||
沒有可用的實驗版 | --- | --- | --- | --- |
Gemini 2.0 Flash‑Live 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
沒有可用的穩定版 | --- | --- | --- | --- |
自動更新的穩定別名 | ||||
沒有可用的自動更新穩定別名 | --- | --- | --- | --- |
預覽版本 | ||||
gemini-2.0-flash-live-preview-04-09 |
Gemini 2.0 Flash‑Live 的預覽版本 | 預覽 | 2025-04-09 | 待定 |
實驗功能版本 | ||||
沒有可用的實驗版 | --- | --- | --- | --- |
Imagen 模型名稱
如需平台的初始化範例,請參閱「使用 Imagen 產生圖片」指南。
目前,所有 Imagen 3 模型都沒有可用的預覽或實驗版本。
Imagen 3 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
imagen-3.0-generate-002 |
Imagen 3 的最新穩定版 | 穩定 | 2025-01-23 | 最早於 2026 年 1 月 23 日 |
imagen-3.0-generate-001 |
Imagen 3 的初始穩定版本 | 穩定 | 2024-07-31 | 最早於 2025-07-31 |
Imagen 3 Fast 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
imagen-3.0-fast-generate-001 |
Imagen 3 Fast 的初始穩定版本 | 穩定 | 2024-07-31 | 最早於 2025-07-31 |
支援的語言
Gemini
所有 Gemini 模型都能以以下語言理解及回應:
阿拉伯文 (ar)、孟加拉文 (bn)、保加利亞文 (bg)、簡體中文和繁體中文 (zh)、克羅埃西亞文 (hr)、捷克文 (cs)、丹麥文 (da)、荷蘭文 (nl)、英文 (en)、愛沙尼亞文 (et)、芬蘭文 (fi)、法文 (fr)、德文 (de)、希臘文 (el)、希伯來文 (iw)、北印度文 (hi)、匈牙利文 (hu)、印尼文 (id)、義大利文 (it)、日文 (ja)、韓文 (ko)、拉脫維亞文 (lv)、立陶宛文 (lt)、挪威文 (no)、波蘭文 (pl)、葡萄牙文 (pt)、羅馬尼亞文 (ro)、俄文 (ru)、塞爾維亞文 (sr)、斯洛伐克文 (sk)、斯洛維尼亞文 (sl)、西班牙文 (es)、斯瓦希里文 (sw)、瑞典文 (sv)、泰文 (th)、土耳其文 (tr)、烏克蘭文 (uk)、越南文 (vi)
Gemini 2.0 Flash、Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型可使用下列其他語言進行理解和回應:
Afrikaans (af)、Amharic (am)、Assamese (as)、Azerbaijani (az)、 Belarusian (be)、Bosnian (bs)、Catalan (ca)、Cebuano (ceb)、Corsican (co)、 Welsh (cy)、Dhivehi (dv)、Esperanto (eo)、Basque (eu)、Persian (fa)、 Filipino (Tagalog) (fil)、Frisian (fy)、Irish (ga)、Scots Gaelic (gd)、 Galician (gl)、Gujarati (gu)、Hausa (ha)、Hawaiian (haw)、Hmong (hmn)、 Haitian Creole (ht)、Armenian (hy)、Igbo (ig)、Icelandic (is)、Javanese (jv)、 Georgian (ka)、Kazakh (kk)、Khmer (km)、Kannada (kn)、Krio (kri)、 Kurdish (ku)、Kyrgyz (ky)、Latin (la)、Luxembourgish (lb)、Lao (lo)、 Malagasy (mg)、Maori (mi)、Macedonian (mk)、Malayalam (ml)、Mongolian (mn)、 Meiteilon (Manipuri) (mni-Mtei)、Marathi (mr)、Malay (ms)、Maltese (mt)、 Myanmar (Burmese) (my)、Nepali (ne)、Nyanja (Chichewa) (ny)、 Odia (Oriya) (or)、Punjabi (pa)、Pashto (ps)、Sindhi (sd)、 Sinhala (Sinhalese) (si)、Samoan (sm)、Shona (sn)、Somali (so)、Albanian (sq)、 Sesotho (st)、Sundanese (su)、Tamil (ta)、Telugu (te)、Tajik (tg)、 Uyghur (ug)、Urdu (ur)、Uzbek (uz)、Xhosa (xh)、Yiddish (yi)、Yoruba (yo)、 Zulu (zu)
Imagen
正式發布:英文
預覽:簡體中文、繁體中文、北印度文、日文、韓文、葡萄牙文、西班牙文
舊型機型相關資訊
Vertex AI in Firebase 支援所有 Gemini 型號,包括 Gemini 1.5 型號和 Gemini 1.0 型號等舊型號。
Vertex AI in Firebase 僅支援 Imagen 3 型號。不支援舊版 Imagen 型號 (例如 Imagen 2)。
查看舊型裝置支援的輸入和輸出
以下是與 Vertex AI in Firebase 搭配使用各個模型時的輸入和輸出類型:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | ||||
---|---|---|---|---|---|---|---|
輸入類型 | |||||||
文字 | |||||||
程式碼 | |||||||
文件 (PDF 或純文字) |
|||||||
圖片 | |||||||
影片 | |||||||
音訊 | |||||||
音訊 (串流) | |||||||
輸出類型 | |||||||
文字 | |||||||
程式碼 | |||||||
結構化輸出內容 (例如 JSON) |
|||||||
圖片、影片和音訊 |
舊型機型支援的功能
以下是搭配 Vertex AI in Firebase 使用各個模型時的功能和功能:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | |
---|---|---|---|---|
從文字輸入內容產生文字 | ||||
從多模態輸入內容產生文字 | ||||
產生圖片 | ||||
生成音訊 | ||||
產生結構化輸出內容
(例如 JSON) |
||||
分析文件
(PDF 或純文字) |
||||
分析圖片 (視覺) | ||||
分析影片 (視覺) | ||||
分析音訊 | ||||
多輪對話 | ||||
函式呼叫 (工具) | ||||
計算符記和可計費的字元 | ||||
系統指示 | ||||
雙向多模態串流 |
舊型機型的規格和限制
以下是將每個模型與 Vertex AI in Firebase 搭配使用時的規格和限制:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | ||||
---|---|---|---|---|---|---|---|
脈絡窗口 * 總符記限制 (輸入 + 輸出) |
2,097,152 個符記 | 1,048,576 個符記 | 16,384 個符記 | 32,760 個符記 | |||
輸出符記限制 * | 8,192 個符記 | 8,192 個符記 | 2,048 個符記 | 8,192 個符記 | |||
知識截點日期 | 2024 年 5 月 | 2024 年 5 月 | 2023 年 2 月 | 2023 年 2 月 | |||
PDF (每項要求) | |||||||
輸入 PDF 檔案的最大數量 ** |
3,000 個檔案 | 3,000 個檔案 | 16 個檔案 | --- | |||
每個輸入 PDF 檔案的 頁數上限 ** |
1,000 頁 | 1,000 頁 | 16 頁 | --- | |||
每個輸入 PDF 檔案的大小上限 |
50 MB | 50 MB | 50 MB | --- | |||
圖片 (每個要求) | |||||||
輸入圖片 數量上限 |
3,000 張圖片 | 3,000 張圖片 | 16 張圖片 | --- | |||
輸出圖片的最大數量 |
--- | --- | --- | --- | |||
每張輸入 Base64 編碼圖片的最大大小 |
7 MB | 7 MB | 7 MB | --- | |||
影片 (每項要求) | |||||||
輸入影片檔案的數量上限 |
10 個檔案 | 10 個檔案 | 1 個檔案 | --- | |||
所有輸入影片 的長度上限 (僅限影格) |
約 60 分鐘 | 約 60 分鐘 | 2 分鐘 | --- | |||
所有輸入影片 的長度上限 (影格 + 音訊) |
約 45 分鐘 | 約 45 分鐘 | --- | --- | |||
音訊 (依要求) | |||||||
輸入音訊檔案的 數量上限 |
1 個檔案 | 1 個檔案 | --- | --- | |||
輸出音訊檔案的 數量上限 |
--- | --- | --- | --- | |||
所有輸入音訊的長度上限 |
約 8.4 小時 | 約 8.4 小時 | --- | --- | |||
所有輸出音訊的長度上限 |
--- | --- | --- | --- |
*
對於所有 Gemini 模型,一個符記相當於約 4 個字元,因此 100 個符記相當於約 60 到 80 個英文單字。針對 Gemini 模型,您可以使用 countTokens
判斷要求中的權杖總數。
** PDF 會視為圖片,因此 PDF 的單頁會視為一張圖片。要求中允許的頁面數量,不得超過模型可支援的圖片數量。
舊型號的可用型號名稱 (包括停產日期)
模型名稱是在初始化模型時,在程式碼中加入的明確值。
Gemini 1.5 Pro 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.5-pro-002 |
Gemini 1.5 Pro 的最新穩定版 | 即將淘汰 | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 |
Gemini 1.5 Pro 的初始穩定版本 | 即將淘汰 | 2024-05-24 | 2025-05-24 |
自動更新的穩定別名 | ||||
gemini-1.5-pro |
指向 1.5 Pro 的最新穩定版 (目前為 gemini-1.5-pro-002 |
即將淘汰 | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.5-flash-002 |
Gemini 1.5 Flash 的最新穩定版 | 即將淘汰 | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 |
Gemini 1.5 Flash 的初始穩定版本 | 即將淘汰 | 2024-05-24 | 2025-05-24 |
自動更新的穩定別名 | ||||
gemini-1.5-flash |
指向 1.5 Flash 的最新穩定版 (目前為 gemini-1.5-flash-002 |
即將淘汰 | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision 的最新穩定版 | 退休 | 2024-02-15 | 2025-04-21 |
自動更新的穩定別名 | ||||
gemini-1.0-pro-vision |
指向 1.5 Pro Vision 的最新穩定版 (目前為 gemini-1.5-pro-vision-001 |
退休 | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro 模型名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 退休日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro 的最新穩定版 | 退休 | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 |
Gemini 1.0 Pro 的穩定版 | 退休 | 2024-02-15 | 2025-04-21 |
自動更新的穩定別名 | ||||
gemini-1.0-pro |
指向 1.0 Pro 的最新穩定版本 (目前為 gemini-1.0-pro-002 |
退休 | 2024-02-15 | 2025-04-21 |
後續步驟
試用 Gemini API 的功能
- 建構多輪對話 (聊天)。
- 使用文字提示來生成文字。
- 透過提示各種檔案類型 (例如圖片、PDF 檔案、影片和音訊) 產生文字。
- 從文字和多模態提示產生結構化輸出內容 (例如 JSON)。
- 使用文字提示生成圖片。
- 使用 Gemini Live API 串流輸入和輸出 (包括音訊)。
- 使用函式呼叫,將生成模型連結至外部系統和資訊。