The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

使用裝置端和雲端代管模型，在網頁應用程式中建構混合式體驗

運用混合式推論，使用 Firebase AI Logic 建構 AI 技術輔助網頁應用程式和功能。混合式推論功能可讓您在裝置端模型可用時，使用該模型執行推論，否則會順暢地改用雲端代管模型 (反之亦然)。

本頁說明如何開始使用用戶端 SDK。完成這項標準設定後，請查看其他設定選項和功能 (例如結構化輸出)。

請注意，在電腦版 Chrome 上執行的網頁應用程式支援裝置端推論。

直接查看程式碼範例

建議用途和支援的功能

建議用途：

使用裝置端模型進行推論：
- 強化隱私權
- 查看當地特色
- 免付費推論
- 離線功能
使用混合功能方案：
- 無論裝置端模型是否可用或是否連上網際網路，都能觸及 100% 的目標對象

裝置端推論支援的功能：

裝置端推論僅支援單輪文字生成 (不支援對話)，輸出結果可串流或非串流。支援的文字生成功能如下：

根據純文字輸入內容生成文字
根據文字和圖片輸入內容生成文字，具體來說，輸入的圖片類型為 JPEG 和 PNG

您也可以產生結構化輸出內容，包括 JSON 和列舉。

事前準備

請注意下列事項：

使用裝置端模型進行推論時，會使用 Chrome 的提示 API；使用雲端託管模型進行推論時，則會使用您選擇的Gemini API供應商 (Gemini Developer API 或 Vertex AI Gemini API)。
本頁說明如何開始使用 localhost 進行開發 (如要進一步瞭解如何在 localhost 上使用 API，請參閱 Chrome 說明文件)。

完成這項標準設定後，請查看其他設定選項和功能 (例如結構化輸出)。
實作功能後，您可以讓使用者在實際應用程式中試用功能。

在 localhost 上開始使用

這些入門步驟說明傳送任何支援的提示要求時，所需的一般設定。

步驟 1：設定 Chrome 和 Prompt API，以便在裝置端進行推論

確認你使用的是新版 Chrome。前往 chrome://settings/help 更新。
Chrome 139 以上版本支援裝置端推論。
將下列標記設為「Enabled」，即可啟用裝置端多模態模型：
- chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
重新啟動 Chrome。
(選用) 在發出第一個要求前，先下載裝置端模型。

Prompt API 已內建於 Chrome，但預設不會提供裝置端模型。如果您尚未下載模型，就首次要求進行裝置端推論，系統會自動在背景啟動模型下載作業。

注意： 下載模型可能需要幾分鐘，因此等待系統在收到第一個要求時自動下載模型，可能會大幅延遲該要求的相關回應。
查看如何下載裝置端模型的說明
1. 開啟「開發人員工具」>「控制台」。
2. 執行以下指令：
```
await LanguageModel.availability();
```
3. 確認輸出結果為 available、downloading 或 downloadable。
4. 如果輸出內容為 downloadable，請執行下列指令，開始下載模型：
```
await LanguageModel.create();
```
5. 您可以透過下列 monitor 回呼監聽下載進度，並確保模型處於 available 狀態，再提出要求：
```
const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});
```

步驟 2：設定 Firebase 專案，並將應用程式連結至 Firebase

登入 Firebase 控制台，然後選取 Firebase 專案。
還沒有 Firebase 專案嗎？

如果您還沒有 Firebase 專案，請按一下按鈕建立新的 Firebase 專案，然後使用下列任一選項：
- 選項 1：在工作流程的第一個步驟中輸入新專案名稱，即可建立全新的 Firebase 專案 (以及底層的Google Cloud專案)。
- 選項 2：點按「將 Firebase 新增到 Google Cloud 專案」(頁面底部)，將 Firebase 新增至現有的 Google Cloud 專案。在工作流程的第一個步驟中，開始輸入現有專案的專案名稱，然後從顯示的清單中選取專案。
完成畫面上的工作流程，建立 Firebase 專案。請注意，系統提示時，您不需要設定 Google Analytics 即可使用 Firebase AI Logic SDK。
在 Firebase 控制台中，依序前往「AI Services」(AI 服務) >「AI Logic」(AI 邏輯)。
按一下「開始使用」，啟動導覽工作流程，協助您為專案設定必要 API 和資源。
設定專案以使用「Gemini API」供應商。

建議您先使用 Gemini Developer API。 您隨時可以設定 Vertex AI Gemini API (以及帳單的相關規定)。

對於 Gemini Developer API，主控台會啟用必要的 API，並在專案中建立 Gemini API 金鑰。
請勿將這個 Gemini API 金鑰加入應用程式的程式碼集。 瞭解詳情。
如果控制台的工作流程中出現提示，請按照畫面上的指示註冊應用程式，並將其連結至 Firebase。
請繼續按照本指南的下一個步驟，將 SDK 新增至應用程式。

步驟 3：新增 SDK

Firebase 程式庫提供 API，可與生成模型互動。這個程式庫是 Firebase JavaScript SDK for Web 的一部分。

使用 npm 安裝適用於網頁的 Firebase JS SDK：
```
npm install firebase
```

在應用程式中初始化 Firebase：

import { initializeApp } from "firebase/app";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

步驟 4：初始化服務並建立模型例項

按一下 Gemini API 供應商，即可在這個頁面查看供應商專屬內容和程式碼。

傳送提示要求給模型前，請先完成下列設定。

為所選 API 供應商初始化服務。
建立 GenerativeModel 執行個體。請務必完成以下事項：
1. 在getGenerativeModel 使用者互動後或期間 (例如點選按鈕) 呼叫。這是 inferenceMode 的先決條件。
2. 將 mode 設為下列其中一個值：
  - PREFER_ON_DEVICE：如果裝置端模型可用，請使用該模型；否則改用雲端代管模型。
  - ONLY_ON_DEVICE：如果裝置端提供模型，請使用該模型；否則擲回例外狀況。
  - PREFER_IN_CLOUD：如可使用雲端主機代管模型，請使用該模型；否則改用裝置端模型。
  - ONLY_IN_CLOUD：如果雲端主機代管模型可用，請使用該模型；否則擲回例外狀況。
  注意： 如果要求傳送至裝置端模型，請確認裝置端推論功能支援該要求。
  如果是從其他裝置傳送要求，裝置必須連上網路。此外，預設的雲端代管模型為 gemini-2.5-flash-lite，但您可以覆寫預設值。

import { initializeApp } from "firebase/app"; import { getAI, getGenerativeModel, GoogleAIBackend, InferenceMode } from "firebase/ai"; // TODO(developer) Replace the following with your app's Firebase configuration // See: https://firebase.google.com/docs/web/learn-more#config-object const firebaseConfig = { // ... }; // Initialize FirebaseApp const firebaseApp = initializeApp(firebaseConfig); // Initialize the Gemini Developer API backend service const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() }); // Create a `GenerativeModel` instance // Call `getGenerativeModel` after or on an end-user interaction // Set the mode (for example, use the on-device model if it's available) const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });

注意： 下載裝置端模型可能需要幾分鐘的時間。
如果您尚未在首次要求裝置端推論前下載模型，要求會自動在背景啟動模型下載作業 (這可能會大幅延遲收到該要求的回應)。

步驟 5：將提示要求傳送至模型

本節將說明如何傳送各種輸入內容，生成不同類型的輸出內容，包括：

使用純文字輸入生成文字

透過文字和圖片 (多模態) 輸入內容生成文字

如要生成結構化輸出內容 (例如 JSON 或列舉)，請使用下列其中一個「生成文字」範例，並將模型設定為根據提供的結構定義回覆。

使用純文字輸入生成文字

嘗試這個範例前，請務必先完成本指南的「開始使用」一節。

您可以使用 generateContent() 從含有文字的提示生成文字：

// Imports + initialization of FirebaseApp and backend service + creation of model instance // Wrap in an async function so you can use await async function run() { // Provide a prompt that contains text const prompt = "Write a story about a magic backpack." // To generate text output, call `generateContent` with the text input const result = await model.generateContent(prompt); const response = result.response; const text = response.text(); console.log(text); } run();

請注意，Firebase AI Logic 也支援使用 generateContentStream (而非 generateContent) 串流傳輸文字回應。

根據文字和圖片 (多模態) 輸入內容生成文字

嘗試這個範例前，請務必先完成本指南的「開始使用」一節。

您可以使用 generateContent() 從含有文字和圖片檔案的提示生成文字，並提供每個輸入檔案的 mimeType 和檔案本身。

裝置端推論支援的輸入圖片類型為 PNG 和 JPEG。

重要事項： 裝置端推論的符記上限為 6000 個。
// Imports + initialization of FirebaseApp and backend service + creation of model instance // Converts a File object to a Part object. async function fileToGenerativePart(file) { const base64EncodedDataPromise = new Promise((resolve) => { const reader = new FileReader(); reader.onloadend = () => resolve(reader.result.split(',')[1]); reader.readAsDataURL(file); }); return { inlineData: { data: await base64EncodedDataPromise, mimeType: file.type }, }; } async function run() { // Provide a text prompt to include with the image const prompt = "Write a poem about this picture:"; const fileInputEl = document.querySelector("input[type=file]"); const imagePart = await fileToGenerativePart(fileInputEl.files[0]); // To generate text output, call `generateContent` with the text and image const result = await model.generateContent([prompt, imagePart]); const response = result.response; const text = response.text(); console.log(text); } run();

請注意，Firebase AI Logic 也支援使用 generateContentStream (而非 generateContent) 串流傳輸文字回應。

讓使用者試用您的功能

如要讓使用者在應用程式中試用您的功能，您必須註冊 Chrome 原始碼試用計畫。請注意，這些試用方案有時間和用量限制。

註冊參加 Prompt API Chrome 來源試用。系統會提供權杖。

在要啟用試用功能的每個網頁上提供權杖。請使用下列其中一種方式：

在 <head> 標記中以中繼標記的形式提供權杖： <meta http-equiv="origin-trial" content="TOKEN">

以 HTTP 標頭形式提供權杖： Origin-Trial: TOKEN

以程式輔助方式提供權杖。

你還能做些什麼？

您可以為混合式體驗使用各種額外的設定選項和功能：

設定推論模式

覆寫預設的雲端代管備援模型

使用模型設定控制回覆內容 (例如溫度參數)

產生結構化輸出內容 (例如 JSON)

目前尚未支援裝置端推論的功能

由於這是搶先體驗版，因此並非所有 Web SDK 功能都適用於裝置端推論。下列功能尚未支援裝置端推論 (但通常適用於雲端推論)。

注意： 對於許多功能，如果將模式設為 PREFER_ON_DEVICE，SDK 會自動改用雲端代管模型，處理這些尚未推出的功能。

從 JPEG 和 PNG 以外的圖片檔案輸入類型生成文字

可以改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。

從音訊、影片和文件 (例如 PDF) 輸入內容生成文字

可以改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。

使用 Gemini 或 Imagen 模型生成圖片

可以改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。

在多模態要求中，使用網址提供檔案。您必須以內嵌資料的形式，將檔案提供給裝置端模型。

多輪對話

可以改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。

透過 Gemini Live API 進行雙向串流

提供工具給模型，協助生成回覆 (例如函式呼叫、程式碼執行、網址內容、Google Search 基礎和 Google Maps 基礎)

計算詞元數

一律會擲回錯誤。雲端代管和裝置端模型之間的計數方式不同，因此沒有直覺式的備援機制。

在 Firebase 控制台中監控裝置端推論的 AI。

請注意，使用雲端主機代管模型進行的任何推論，都可以像使用 Firebase AI Logic 用戶端網頁 SDK 進行的其他推論一樣受到監控。

提供有關 Firebase AI Logic 的使用體驗意見回饋

使用裝置端和雲端代管模型，在網頁應用程式中建構混合式體驗 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

建議用途和支援的功能

事前準備

在 localhost 上開始使用

步驟 1：設定 Chrome 和 Prompt API，以便在裝置端進行推論

步驟 2：設定 Firebase 專案，並將應用程式連結至 Firebase

步驟 3：新增 SDK

步驟 4：初始化服務並建立模型例項

步驟 5：將提示要求傳送至模型

使用純文字輸入生成文字

根據文字和圖片 (多模態) 輸入內容生成文字

讓使用者試用您的功能

你還能做些什麼？

目前尚未支援裝置端推論的功能

使用裝置端和雲端代管模型，在網頁應用程式中建構混合式體驗