使用 您可以透過 Vertex AI for Firebase SDK,輸入提示給 Gemini 模型生成文字 根據多模態輸入內容多模態提示可以包含多個模態 例如文字、圖片、PDF、影片和音訊
如果是輸入內容的非文字部分 (例如媒體檔案),您必須使用 指定支援的 MIME 類型,並確認 檔案和多模態要求,並且符合這些需求條件,並遵循最佳做法。
支援的輸入檔案因模型而異,可能包含圖片、PDF、影片和 音訊。
- 請注意,支援的影片輸入來源也會因模型而異, 或含有音訊的影格。
輸入檔案和多模態要求的規定和最佳做法:
於 進一步瞭解 Gemini 模型。 您可以參閱簡短摘要,瞭解支援檔案的需求條件 (例如檔案數量上限和檔案大小上限)。
您可以參閱 Google Cloud 說明文件,瞭解詳細資訊。 關於 相關規定 和 最佳做法 用於輸入檔案和多模態要求 (例如支援的 MIME 類型) 以及在要求中提供輸入檔案的時機)。
Vertex AI for Firebase SDK 的具體規定
在 Vertex AI for Firebase SDK 中,要求大小上限為 20 MB。如果要求過大,您會收到 HTTP 413 錯誤。
如果檔案大小會導致要求總大小超過 20 MB,則 使用 Cloud Storage for Firebase 網址在多模態要求中加入檔案。
如果檔案很小,通常可以透過內嵌資料直接傳遞。 但請注意,以內嵌資料形式提供的檔案會編碼成 base64 ,這會增加要求的大小。舉例說明如何 將檔案納入內嵌資料,請參閱 使用 Gemini API,根據多模態提示生成文字。