The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

在 Apple 应用中构建混合体验，使用设备端模型和云端托管模型

您可以使用混合推理构建 AI 赋能的 Apple 应用和功能，使用 Firebase AI Logic。混合推理支持在设备端模型（特别是 Apple 的基础模型框架）可用时使用该模型运行推理，否则无缝回退到云托管的 Google 模型（反之亦然）。

本页面介绍了如何开始使用客户端 SDK，并展示了其他配置选项和功能，例如温度。

请注意，只有使用 Firebase AI Logic SDK v12.13.0+ 且在启用了 Apple Intelligence 的设备上运行的 Apple 应用才支持通过 Firebase AI Logic 进行设备端推理。它受 Apple 的基础模型框架的合理使用要求约束。

支持的功能、API 和设备

在使用 Firebase AI Logic 实现混合推理和设备端推理之前，请查看本部分，了解 Apple 应用支持哪些功能。

设备端推理支持的功能

设备端推理仅支持文本生成，具体而言，支持以下文本生成功能：

根据纯文本输入生成文本
根据纯文本输入流式传输文本

请务必查看本页底部尚未支持的混合推理或设备端推理的详细列表。

支持的 API 和设备

云端推理使用您选择的 Gemini API 提供商（ Gemini Developer API 或 Vertex AI Gemini API）。
设备端推理使用 Apple 的基础模型框架，该框架仅在启用了 Apple Intelligence 的设备上可用。启用 Apple Intelligence 后，系统会自动下载设备端模型。

**重要提示** ：设备端模型的使用受 Apple 的基础模型框架的合理使用要求约束。

开始使用

请确保您已查看上面介绍支持的功能、API 和设备的部分。

这些入门步骤介绍了您要发送的任何受支持的提示请求所需的一般设置。

第 1 步：设置 Firebase 项目并将应用连接到 Firebase

登录 Firebase 控制台，然后选择您的 Firebase 项目。
还没有 Firebase 项目？

如果您还没有 Firebase 项目，请点击该按钮以创建一个新的 Firebase 项目，然后使用以下任一选项：
- 选项 1：在工作流的第一步中输入新项目名称，创建一个全新的 Firebase 项目（该操作会自动创建相应的底层 Google Cloud 项目）。
- 选项 2：点击将 Firebase 添加到 Google Cloud 项目（位于页面底部），将 Firebase 添加到现有 Google Cloud 项目。在工作流的第一步中，开始输入现有项目的项目名称 ，然后从显示的列表中选择该项目。
完成屏幕上工作流的剩余步骤，以创建 Firebase 项目。请注意，在出现提示时，您无需设置 Google Analytics 即可使用 Firebase AI Logic SDK。
在 Firebase 控制台中，依次前往 AI 服务 > AI Logic。
点击开始使用 ，启动引导式工作流，帮助您为项目设置所需的 API 和资源。
将项目设置为使用“Gemini API”提供方。

我们建议您先使用 Gemini Developer API。 您可以随时设置 Vertex AI Gemini API （及其结算要求）。

对于 Gemini Developer API，控制台将在您的项目中启用所需的 API 并创建 Gemini API 密钥。
请勿将此 Gemini API 密钥添加到应用的代码库中。了解详情。
如果控制台的工作流中出现提示，请按照屏幕上的说明注册您的应用并将其连接到 Firebase。
继续执行本指南中的下一步，将 SDK 添加到您的应用。

第 2 步：添加所需的 SDK

使用 Swift Package Manager (SPM) 安装和管理 Xcode 依赖项。只有在使用 SPM 时，才能获得混合支持。

Firebase AI Logic 库提供对用于与生成式模型交互的 API 的访问权限。该库作为适用于 Apple 平台的 Firebase SDK (firebase-ios-sdk) 的一部分提供。

如果您已在使用 Firebase，请确保您的 Firebase 软件包是 v12.13.0 或更高版本。

在 Xcode 中打开您的应用项目，依次点击 File > Add Package Dependencies 。
出现提示时，添加 Firebase Apple 平台 SDK 代码库：
```
https://github.com/firebase/firebase-ios-sdk
```
选择最新的 SDK 版本。
选择 FirebaseAILogic 库。

完成之后，Xcode 将会自动开始在后台解析和下载您的依赖项。

第 3 步：初始化服务并创建模型会话实例

点击您的 Gemini API 提供商，以查看此页面上特定于提供商的内容和代码。

在向模型发送提示请求之前，请进行以下设置。

为您选择的 Gemini API 提供商初始化服务。
使用 HybridModel 创建 GenerativeModelSession 实例。
根据您的偏好设置 primary 和 secondary 模型。您可以设置尝试推理的顺序：
- 先尝试设备端推理，但允许回退到云端：将 primary设置为“系统”模型，并将secondary设置为云端模型。
- 先尝试云端推理，但允许回退到设备端: 将 primary 设置为云端模型，并将 secondary 设置为“系统”模型。
请注意，SDK 仅支持设置单个 model，这意味着 SDK 将仅尝试设备端推理或云端推理。不过，如需获得混合体验，您需要创建 HybridModel 并设置 primary 和 secondary 模型。

如需详细了解“推理模式”（尝试推理的顺序）的行为，请参阅配置选项。

以下示例展示了如何先尝试设备端推理，但允许回退到云托管的模型：

// Initialize the Gemini Developer API backend service
let ai = FirebaseAI.firebaseAI(backend: .googleAI())

// Initialize a cloud model that supports your use case
let cloudModel = ai.geminiModel(name: "GEMINI_MODEL_NAME")
// Initialize an on-device model that supports your use case
let systemModel = FirebaseAI.SystemLanguageModel.default

// Create a Hybrid Model
// Provide your preferred model as `primary` and your fallback model as `secondary`
// In this example, attempt to use on-device model; otherwise, fall back to cloud.
let hybridModel = HybridModel(
  primary: systemModel,
  secondary: cloudModel
)

// Create a GenerativeModelSession with the HybridModel created earlier.
let session = firebaseAI.generativeModelSession(
  model: hybridModel,
)

第 4 步：向模型发送提示请求

本部分将向您展示如何执行以下操作：

根据纯文本输入生成文本
根据纯文本输入流式传输文本

根据纯文本输入生成文本

在尝试此示例之前，请确保您已完成本指南的 “开始使用”部分。

如需根据包含文本的提示生成文本，请使用 respond(to:)，如下所示：

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To generate text output, call `respond(to:)` with the text input
let response = try await session.respond(to: prompt)
print(response.content)

根据纯文本输入流式传输文本

在尝试此示例之前，请确保您已完成本指南的 “开始使用”部分。

您可以不等待模型生成整个结果，而是使用流式传输来处理部分结果，从而实现更快的互动。如需根据包含文本的提示流式传输生成的文本，请使用 streamResponse(to:)，如下所示：

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To stream generated text output, call `streamResponse(to:)` with the text input
let stream = session.streamResponse(to: prompt)
for try await snapshot in stream {
  print(snapshot.content)
}

您还可以做什么？

您可以为混合体验使用各种其他配置选项和功能：

混合推理或设备端推理尚未支持的功能

作为实验性版本，Firebase AI Logic 或云托管的模型并非支持所有功能。

以下功能不支持混合实现或设备端实现：Imagen 模型、Gemini Live API 和提示模板。此外，不应依赖于词元计数，因为云托管模型和设备端模型的计数会有所不同，因此没有直观的回退。
以下功能尚未支持设备端推理。 如果您想使用其中任何功能，建议您仅使用云托管的模型，以获得更一致的体验。
- 根据多模态输入（例如图片、音频、视频和文档 (PDF)）生成文本
- 生成媒体，例如图片、音频或视频
- 发送超过 4096 个词元（或大约 3000 个英文单词）的请求。
- 为设备端模型提供内置工具，以帮助其生成响应（例如代码执行、网址上下文和使用 Google 搜索进行接地）
注意：设备端推理支持函数调用和生成结构化输出。有关实现这些体验的文档即将推出！
Firebase 控制台中的 AI 监控不会显示任何设备端推理数据（包括设备端日志）。不过，任何使用云托管模型的推理都可以像其他通过进行 Firebase AI Logic的推理一样进行监控。

其他限制

除了上述限制之外，设备端 推理还有以下限制：

您的应用的最终用户必须使用启用了 Apple Intelligence 的设备。
只有当您的应用在前台运行时，您的应用才能运行设备端推理。

提供反馈有关您的使用体验Firebase AI Logic