Watch demos on how to build & run AI-powered apps with Firebase at Demo Day '24. Watch now.

本頁面由 Cloud Translation API 翻譯而成。

使用 Gemini-API，根據多模態提示生成文字

使用 Vertex AI in Firebase SDK 從應用程式呼叫 Gemini API 時，您可以提示 Gemini 模型根據多模態輸入內容產生文字。多模態提示可包含多種模態 (或輸入類型)，例如文字、圖片、PDF、影片和音訊。

如要測試及重複使用多模式提示，建議您使用 Vertex AI Studio。

其他與 Gemini API 相關的選項

您可以選擇嘗試 Gemini API
的「Google AI」替代版本，使用 Google AI Studio 和 Google AI 用戶端 SDK 取得免付費存取權 (在限制範圍內且適用情況下)。這些 SDK 應僅用於行動應用程式和網頁應用程式中的原型設計。

熟悉 Gemini API 的運作方式後，請遷移至我們的 Vertex AI in Firebase SDK (本說明文件)，其中提供許多對行動和網頁應用程式重要的額外功能，例如使用 Firebase App Check 保護 API 免於遭到濫用，以及支援要求中的大型媒體檔案。

視需要呼叫 Vertex AI Gemini API 伺服器端 (例如使用 Python、Node.js 或 Go)
使用伺服器端 Vertex AI SDK、Firebase Genkit 或 Firebase Extensions 來處理 Gemini API。

事前準備

如果您尚未完成，請完成 Vertex AI in Firebase SDK 的入門指南。請確認您已完成下列所有操作：

設定新的或現有的 Firebase 專案，包括使用 Blaze 定價方案和啟用必要的 API。
將應用程式連結至 Firebase，包括註冊應用程式，以及將 Firebase 設定新增至應用程式。
新增 SDK，並在應用程式中初始化 Vertex AI 服務和生成式模型。

將應用程式連結至 Firebase、新增 SDK 並初始化 Vertex AI 服務和生成模型後，您就可以呼叫 Gemini API。

使用文字和單一圖片生成文字
使用文字和多張圖片生成文字
從文字和影片生成文字

使用文字和單一圖片生成文字

請先完成本指南的「事前準備」一節，再嘗試使用這個範例。

您可以使用含有文字和單一檔案 (例如圖片，如本範例所示) 的多模態提示呼叫 Gemini API。針對這些呼叫，您必須使用支援多模態提示的模型 (例如 Gemini 1.5 Pro)。

支援的檔案類型包括圖片、PDF、影片、音訊等。請務必詳閱輸入檔案的規定和建議。

選擇要串流回應 (generateContentStream)，還是等待回應產生完整結果 (generateContent)。

串流

您可以不等待模型產生的完整結果，改用串流處理部分結果，藉此加快互動速度。

不使用串流

或者，您可以等待整個結果，而不是串流；只有在模型完成整個產生程序後，系統才會傳回結果。

瞭解如何選擇適合用途和應用程式的 Gemini 模型，以及選用位置。

使用文字和多張圖片生成文字

請先完成本指南的「事前準備」一節，再嘗試使用這個範例。

您可以使用含有文字和多個檔案 (例如圖片，如本範例所示) 的多模態提示呼叫 Gemini API。針對這些呼叫，您必須使用支援多模態提示的模型 (例如 Gemini 1.5 Pro)。

支援的檔案類型包括圖片、PDF、影片、音訊等。請務必詳閱輸入檔案的規定和建議。

選擇要串流回應 (generateContentStream)，還是等待回應產生完整結果 (generateContent)。

串流

您可以不等待模型產生的完整結果，改用串流處理部分結果，藉此加快互動速度。

不使用串流

或者，您也可以改為等待整個結果，而不是串流；結果只會在模型完成整個產生程序後傳回。

瞭解如何選擇適合用途和應用程式的 Gemini 模型，以及選用位置。

使用文字和影片生成文字

請先完成本指南的「事前準備」一節，再嘗試使用這個範例。

您可以使用含有文字和單一影片的多模態提示呼叫 Gemini API (如本範例所示)。針對這些呼叫，您必須使用支援多模態提示的模型 (例如 Gemini 1.5 Pro)。

請務必詳閱輸入檔案的規定和建議。

選擇要串流回應 (generateContentStream)，還是等待回應產生完整結果 (generateContent)。

串流

您可以不等待模型產生的完整結果，改用串流處理部分結果，藉此加快互動速度。

不使用串流

或者，您可以等待整個結果，而不是串流；只有在模型完成整個產生程序後，系統才會傳回結果。

瞭解如何選擇適合用途和應用程式的 Gemini 模型，以及選用位置。

輸入檔案的規定和建議

如要瞭解支援的檔案類型、如何指定 MIME 類型，以及如何確保檔案和多模態要求符合規定並遵循最佳做法，請參閱「支援的輸入檔案和 Vertex AI Gemini API 的相關規定」。

你還可以做些什麼？

瞭解如何在向模型傳送長提示之前，計算符記。
設定 Cloud Storage for Firebase，即可使用 Cloud Storage 網址在多模態要求中加入大型檔案。檔案可包含圖片、PDF、影片和音訊。
開始著手準備正式版，包括設定 Firebase App Check，以防範未經授權的用戶端濫用 Gemini API。

試用 Gemini API 的其他功能

建構多輪對話 (聊天)。
使用文字提示來生成文字。
從文字和多模態提示產生結構化輸出內容 (例如 JSON)。
使用函式呼叫功能，將生成模型連結至外部系統和資訊。

瞭解如何控管內容產生

瞭解提示設計，包括最佳做法、策略和提示範例。
設定模型參數，例如溫度和輸出符記數量上限。
使用安全性設定，調整可能會收到有害回應的機率。

您也可以使用 Vertex AI Studio 嘗試使用提示和模型設定。

進一步瞭解 Gemini 模型

瞭解可用於各種用途的模型，以及相關配額和定價。

針對 Vertex AI in Firebase 的使用體驗提供意見回饋