使用 Gemini API 進行函式呼叫


生成式模型可有效解決許多類型的問題。不過,這類服務受到下列限制:

  • 這些知識會在訓練後凍結,導致知識過時。
  • 但無法查詢或修改外部資料。

函式呼叫可協助您克服部分限制。函式呼叫有時會被稱為「工具使用」,因為這項功能可讓模型使用外部工具 (例如 API 和函式) 產生最終回應。

您可以在 Google Cloud 說明文件中進一步瞭解函式呼叫,包括函式呼叫的用途實用的清單。

Gemini 1.0 Pro、Gemini 1.5 Pro 和 Gemini 1.5 Flash 支援函式呼叫。

本指南說明如何實作函式呼叫設定,類似於本頁下一節所述的範例。整體來說,以下是設定應用程式中函式呼叫的步驟:

  1. 編寫函式,為模型提供產生最終回應所需的資訊 (例如,函式可以呼叫外部 API)。

  2. 建立函式宣告,說明函式及其參數。

  3. 在模型初始化期間提供函式宣告,讓模型知道如何在必要時使用函式。

  4. 設定應用程式,讓模型可傳送必要資訊,以便應用程式呼叫函式。

  5. 將函式的回應傳回模型,以便模型產生最終回應。

跳至程式碼導入程序

函式呼叫範例總覽

向模型傳送要求時,您也可以為模型提供一組「工具」(例如函式),讓模型用於產生最終回應。為了使用這些函式並進行呼叫 (稱為「函式呼叫」),模型和應用程式需要彼此來回傳遞資訊,因此建議您透過多回合即時通訊介面使用函式呼叫功能。

假設您有一個應用程式,使用者可以輸入類似以下的提示:What was the weather in Boston on October 17, 2024?

Gemini 模型可能不知道這項天氣資訊,但假設您知道有可提供這項資訊的外部天氣服務 API。您可以使用函式呼叫,為 Gemini 模型提供該 API 和天氣資訊的路徑。

首先,您要在應用程式中編寫函式 fetchWeather,與這個假設的外部 API 互動,該 API 具有以下輸入和輸出:

參數 類型 必要 說明
輸入
location 物件 要取得天氣資訊的城市名稱和州。
僅支援美國境內的城市。必須一律為 citystate 的巢狀物件。
date 字串 擷取天氣資料的日期 (一律須為 YYYY-MM-DD 格式)。
輸出
temperature 整數 溫度 (華氏)
chancePrecipitation 字串 降雨/降雪機率 (以百分比表示)
cloudConditions 字串 雲端條件 (clearpartlyCloudymostlyCloudycloudy 之一)

初始化模型時,您會告知模型這個 fetchWeather 函式存在,以及如何在必要時使用該函式處理傳入的要求。這稱為「函式宣告」。模型不會直接呼叫函式。相反地,當模型處理傳入的要求時,會決定 fetchWeather 函式是否可協助回應要求。如果模型判斷函式確實有用,就會產生結構化資料,協助應用程式呼叫函式

再次查看收到的要求:What was the weather in Boston on October 17, 2024?。模型很可能會判斷 fetchWeather 函式可協助產生回覆。模型會查看 fetchWeather 需要哪些輸入參數,然後為函式產生大致如下所示的結構化輸入資料:

{
  functionName: fetchWeather,
  location: {
    city: Boston,
    state: Massachusetts  // the model can infer the state from the prompt
  },
  date: 2024-10-17
}

模型會將這項結構化輸入資料傳遞至您的應用程式,讓應用程式能夠呼叫 fetchWeather 函式。當應用程式從 API 接收天氣狀況時,就會將資訊傳遞給模型。這項天氣資訊可讓模型完成最終處理作業,並針對 What was the weather in Boston on October 17, 2024? 的初始要求產生回應

模型可能會提供最終的自然語言回應,例如: On October 17, 2024, in Boston, it was 38 degrees Fahrenheit with partly cloudy skies.

圖表:說明函式呼叫如何涉及模型與應用程式中函式的互動 

實作函式呼叫

事前準備

如果您尚未完成,請完成 Vertex AI in Firebase SDK 的入門指南。請確認您已完成下列所有操作:

  1. 設定新的或現有的 Firebase 專案,包括使用 Blaze 定價方案和啟用必要的 API。

  2. 將應用程式連結至 Firebase,包括註冊應用程式,以及將 Firebase 設定新增至應用程式。

  3. 新增 SDK,並在應用程式中初始化 Vertex AI 服務和生成式模型。

將應用程式連結至 Firebase、新增 SDK 並初始化 Vertex AI 服務和生成模型後,您就可以呼叫 Gemini API

本指南的其餘步驟會說明如何實作函式呼叫設定,類似於「函式呼叫範例簡介」(請參閱本頁頂端部分) 所述的工作流程。

您可以在本頁稍後的部分查看此函式呼叫範例的完整程式碼範例

步驟 1:編寫函式

假設您有一個應用程式,使用者可以輸入類似以下的提示:What was the weather in Boston on October 17, 2024?。Gemini 模型可能不知道這項天氣資訊,但假設您知道有可提供這項資訊的外部天氣服務 API。本指南的範例會依賴這個假設的外部 API。

在應用程式中編寫函式,以便與假設的外部 API 互動,並為模型提供產生最終要求所需的資訊。在這個天氣範例中,會是 fetchWeather 函式呼叫這個假設的外部 API。

// This function calls a hypothetical external API that returns
// a collection of weather information for a given location on a given date.
func fetchWeather(city: String, state: String, date: String) -> JSONObject {

  // TODO(developer): Write a standard function that would call an external weather API.

  // For demo purposes, this hypothetical response is hardcoded here in the expected format.
  return [
    "temperature": .number(38),
    "chancePrecipitation": .string("56%"),
    "cloudConditions": .string("partlyCloudy"),
  ]
}

步驟 2:建立函式宣告

建立稍後要提供給模型的函式宣告 (本指南的下一個步驟)。

在宣告中,請盡可能在函式及其參數的說明中加入詳細資料。

模型會使用函式宣告中的資訊,判斷要選取哪個函式,以及如何為實際函式呼叫提供參數值。請參閱本頁後續的其他行為和選項,瞭解模型如何在函式之間做出選擇,以及如何控管這項選擇。

請注意下列提供的結構定義事項:

  • 您必須以與 OpenAPI 結構定義相容的結構定義格式提供函式宣告。Vertex AI 僅提供部分 OpenAPI 結構定義支援。

    • 支援的屬性如下:typenullablerequiredformatdescriptionpropertiesitemsenum

    • 系統支援下列屬性:defaultoptionalmaximumoneOf

  • 根據預設,對於 Vertex AI in Firebase SDK,除非您在 optionalProperties 陣列中將所有欄位指定為選用欄位,否則系統會將所有欄位視為必要欄位。對於這些選用欄位,模型可以填入欄位或略過欄位。請注意,這與 Vertex AI Gemini API 的預設行為相反

如要瞭解函式宣告的最佳做法,包括名稱和說明的提示,請參閱 Google Cloud 說明文件中的「最佳做法」。

以下說明如何編寫函式宣告:

let fetchWeatherTool = FunctionDeclaration(
  name: "fetchWeather",
  description: "Get the weather conditions for a specific city on a specific date.",
  parameters: [
    "location": .object(
      properties: [
        "city": .string(description: "The city of the location."),
        "state": .string(description: "The US state of the location."),
      ],
      description: """
      The name of the city and its state for which to get the weather. Only cities in the
      USA are supported.
      """
    ),
    "date": .string(
      description: """
      The date for which to get the weather. Date must be in the format: YYYY-MM-DD.
      """
    ),
  ]
)

步驟 3:在模型初始化期間提供函式宣告

您透過要求提供的函式宣告數量上限為 128 個。請參閱本頁後續的其他行為和選項,瞭解模型如何在函式之間進行選擇,以及如何控制該選擇 (使用 toolConfig 設定函式呼叫模式)。

import FirebaseVertexAI

// Initialize the Vertex AI service and the generative model.
// Use a model that supports function calling, like a Gemini 1.5 model.
let model = VertexAI.vertexAI().generativeModel(
  modelName: "gemini-1.5-flash",
  // Provide the function declaration to the model.
  tools: [.functionDeclarations([fetchWeatherTool])]
)

瞭解如何選擇適合您用途和應用程式的 Gemini 模型,以及選用位置

步驟 4:呼叫函式以叫用外部 API

如果模型判斷 fetchWeather 函式確實可協助產生最終回應,則應用程式需要使用模型提供的結構化輸入資料,實際呼叫該函式。

由於資訊需要在模型和應用程式之間來回傳遞,因此建議您透過多輪對話介面使用函式呼叫功能。

以下程式碼片段說明如何告知應用程式模型想要使用 fetchWeather 函式。這也表示模型已為函式呼叫 (及其基礎外部 API) 提供必要的輸入參數值。

在這個例子中,傳入的要求包含提示 What was the weather in Boston on October 17, 2024?。根據這個提示,模型推斷出 fetchWeather 函式所需的輸入參數 (即 citystatedate)。

let chat = model.startChat()
let prompt = "What was the weather in Boston on October 17, 2024?"

// Send the user's question (the prompt) to the model using multi-turn chat.
let response = try await chat.sendMessage(prompt)

var functionResponses = [FunctionResponsePart]()

// When the model responds with one or more function calls, invoke the function(s).
for functionCall in response.functionCalls {
  if functionCall.name == "fetchWeather" {
    // TODO(developer): Handle invalid arguments.
    guard case let .object(location) = functionCall.args["location"] else { fatalError() }
    guard case let .string(city) = location["city"] else { fatalError() }
    guard case let .string(state) = location["state"] else { fatalError() }
    guard case let .string(date) = functionCall.args["date"] else { fatalError() }

    functionResponses.append(FunctionResponsePart(
      name: functionCall.name,
      // Forward the structured input data prepared by the model
      // to the hypothetical external API.
      response: fetchWeather(city: city, state: state, date: date)
    ))
  }
  // TODO(developer): Handle other potential function calls, if any.
}

步驟 5:將函式的輸出內容提供給模型,以產生最終回覆

fetchWeather 函式傳回天氣資訊後,應用程式需要將其傳回模型。

接著,模型會執行最終處理作業,並產生最終的自然語言回應,例如:On October 17, 2024 in Boston, it was 38 degrees Fahrenheit with partly cloudy skies.

// Send the response(s) from the function back to the model
// so that the model can use it to generate its final response.
let finalResponse = try await chat.sendMessage(
  [ModelContent(role: "function", parts: functionResponses)]
)

// Log the text response.
print(finalResponse.text ?? "No text in response.")

其他行為和選項

以下是您需要在程式碼中納入的函式呼叫其他行為,以及可控制的選項。

模型可能會要求再次呼叫函式或其他函式。

如果單一函式呼叫的回應不足以讓模型產生最終回應,模型可能會要求額外的函式呼叫,或要求呼叫完全不同的函式。後者只有在您在函式宣告清單中為模型提供多個函式時才會發生。

您的應用程式必須支援模型可能要求的額外函式呼叫。

模型可能會要求同時呼叫多個函式。

您可以在函式宣告清單中向模型提供最多 128 個函式。因此,模型可能會判斷需要多個函式才能產生最終回覆。並可能決定同時呼叫其中部分函式,這稱為平行函式呼叫

您的應用程式必須能夠因應模型可能同時要求執行多個函式,並且需要將函式提供的所有回應傳回模型。

Gemini 1.5 Pro 和 Gemini 1.5 Flash 支援並行函式呼叫。

您可以控制模型是否可以要求呼叫函式,以及呼叫函式的做法。

您可以設定一些限制,規範模型應如何使用提供的函式宣告,以及是否應使用這些宣告。這稱為設定函式呼叫模式。例如:

  • 您可以強制模型一律使用函式呼叫,而非允許模型選擇立即的自然語言回應和函式呼叫。這稱為強制函式呼叫

  • 如果您提供多個函式宣告,可以限制模型只使用提供的函式子集。

您可以透過新增工具設定 (toolConfig) 以及提示和函式宣告,實作這些限制 (或模式)。在工具設定中,您可以指定下列任一模式。最實用的模式是 ANY

模式 說明
AUTO 預設模型行為。模型會決定是否使用函式呼叫或自然語言回應。
ANY 模型必須使用函式呼叫 (「強制函式呼叫」)。如要將模型限制為部分函式,請在 allowedFunctionNames 中指定允許的函式名稱。
NONE 模型不得使用函式呼叫。這項行為等同於模型要求,但沒有任何相關聯的函式宣告。

Gemini 1.5 Pro 和 Gemini 1.5 Flash 支援函式呼叫模式。

其他功能

試用 Gemini API 的其他功能

瞭解如何控管內容產生

您也可以使用 Vertex AI Studio 嘗試使用提示和模型設定。

進一步瞭解 Gemini 模型

瞭解可用於各種用途的模型,以及相關配額和定價


針對使用 Vertex AI in Firebase 的體驗提供意見回饋