The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Crie experiências híbridas em apps da Apple com modelos hospedados na nuvem e no dispositivo

É possível criar apps e recursos com tecnologia de IA para Apple com inferência híbrida usando Firebase AI Logic. A inferência híbrida permite executar a inferência usando modelos no dispositivo (especificamente o framework Foundation Models da Apple) quando disponível e fazer o fallback para modelos do Google hospedados na nuvem (e vice-versa).

Esta página descreve como começar a usar o SDK do cliente, além de mostrar outras opções e recursos de configuração, como a temperatura.

A inferência no dispositivo via Firebase AI Logic é compatível com apps da Apple que usam o SDK do Firebase AI Logic v12.13.0 ou mais recente e são executados em dispositivos com o Apple Intelligence ativado. Ela é regida pelos requisitos de uso aceitável do framework Foundation Models da Apple.

Casos de uso recomendados

O uso de um modelo no dispositivo para inferência oferece:
- Privacidade aprimorada
- Inferência sem custo financeiro
- Funcionalidade off-line
O uso da funcionalidade híbrida oferece:
- Oferecer a todos os clientes uma experiência de app semelhante, independentemente do dispositivo do usuário final
- Melhorar a disponibilidade de recursos de IA generativa, independentemente da conectividade com a Internet, das limitações de cota ou dos recursos do dispositivo

Recursos, APIs e dispositivos compatíveis

Antes de implementar a inferência híbrida e no dispositivo usando o Firebase AI Logic, revise esta seção para entender o que é compatível com apps da Apple.

Recursos e funcionalidades compatíveis com a inferência no dispositivo

A inferência no dispositivo oferece suporte apenas à geração de texto, especificamente os seguintes recursos de geração de texto:

Gerar texto com base em entradas somente de texto
Fazer streaming de texto com base em entradas somente de texto

Confira a lista detalhada de inferência híbrida ou no dispositivo ainda não compatível na parte de baixo desta página.

APIs e dispositivos compatíveis

A inferência na nuvem usa o provedor Gemini API escolhido (a Gemini Developer API ou a Vertex AI Gemini API).
A inferência no dispositivo usa o framework Foundation Models da Apple, que está disponível apenas em dispositivos com o Apple Intelligence ativado. O modelo no dispositivo é baixado automaticamente quando o Apple Intelligence está ativado.

**Importante** :o uso de modelos no dispositivo é regido pelos requisitos de uso aceitável do framework Foundation Models da Apple.

Primeiros passos

Confira se você revisou a seção acima que descreve os recursos, APIs e dispositivos compatíveis.

Estas etapas de primeiros passos descrevem a configuração geral necessária para qualquer solicitação de comando compatível que você queira enviar.

Etapa 1: configurar um projeto do Firebase e conectar seu app ao Firebase

Faça login no Firebase console, e selecione seu projeto.
Ainda não tem um projeto do Firebase?

Se você ainda não tiver um projeto do Firebase, clique no botão para criar um novo e use uma das seguintes opções:
- Opção 1: crie um projeto do Firebase totalmente novo (e o projeto subjacente Google Cloud automaticamente) inserindo um novo nome de projeto na primeira etapa do fluxo de trabalho.
- Opção 2: "Adicione o Firebase" a um projeto Google Cloud existente clicando em Adicionar o Firebase ao projeto do Google Cloud (na parte de baixo da página). Na primeira etapa do fluxo de trabalho, comece a digitar o nome do projeto e selecione-o na lista exibida.
Conclua as etapas restantes do fluxo de trabalho na tela para criar um projeto do Firebase. Quando solicitado, não é necessário configurar Google Analytics para usar os Firebase AI Logic SDKs.
No console do Firebase, acesse Serviços de IA > Lógica de IA.
Clique em Primeiros passos para iniciar um fluxo de trabalho guiado que ajuda a configurar as APIs necessárias e os recursos para seu projeto.
Se solicitado, siga as instruções na tela para registrar seu app e adicionar a configuração do Firebase.
Quando solicitado a escolher um "provedor da API Gemini", recomendamos selecionar a API Gemini Developer, que permite começar rapidamente sem custo financeiro.

A qualquer momento, você pode sempre configurar a Vertex AI Gemini API (e o requisito de faturamento dela).
Continue no fluxo de trabalho para configurar as APIs necessárias e os serviços associados para Firebase AI Logic.

A partir do início de julho de 2026, essa etapa do fluxo de trabalho vai aplicar automaticamente o Firebase App Check para o AI Logic, que é um serviço essencial para ajudar a proteger a Gemini API quando ela é acessada diretamente do seu app. Como parte dos primeiros passos (consulte as etapas mais adiante neste guia), você precisará configurar o App Check provedor de depuração para desenvolvimento local quando o App Check for aplicado.

Observação: para lançar o recurso de IA do seu app para usuários finais, é necessário registrar o app com um provedor de atestação App Check de produção para que eles possam usar o recurso quando App Check for aplicado.
Continue para a próxima etapa deste guia para adicionar os SDKs necessários ao seu app.

Etapa 2: adicionar os SDKs necessários

Use o Swift Package Manager (SPM) para instalar e gerenciar dependências do Xcode. O suporte híbrido só está disponível ao usar o SPM.

A biblioteca Firebase AI Logic oferece acesso às APIs para interagir com modelos generativos. A biblioteca está incluída como parte do SDK do Firebase para plataformas Apple (firebase-ios-sdk).

Se você já estiver usando o Firebase, verifique se o pacote do Firebase é a versão 12.13.0 ou mais recente.

No Xcode, com seu projeto do app aberto, navegue até File > Add Package Dependencies.
Quando solicitado, adicione o repositório do SDK do Firebase para as plataformas Apple:
```
https://github.com/firebase/firebase-ios-sdk
```
Selecione a versão mais recente do SDK.
Selecione as bibliotecas FirebaseAILogic e FirebaseAppCheck.

Quando terminar, o Xcode vai começar a resolver e fazer o download das dependências em segundo plano automaticamente.

Etapa 3: configurar o provedor de depuração App Check para desenvolvimento local

A partir do início de julho de 2026, como parte do fluxo de trabalho de configuração guiada para AI Logic no console, Firebase App Check será aplicado automaticamente para proteger a Gemini API. Para o desenvolvimento local, é necessário configurar o App Check provedor de depuração para ignorar a atestação, mantendo a aplicação de App Check.

Veja como usar o provedor de depuração ao executar seu app em um simulador de forma interativa (por exemplo, durante o desenvolvimento local):

No projeto do Xcode, importe FirebaseAppCheck e inicialize App Check com a fábrica do provedor de depuração antes de configurar Firebase.

import SwiftUI
import FirebaseCore
import FirebaseAppCheck

@main
struct YourApp: App {
  init() {
    let providerFactory = AppCheckDebugProviderFactory()
    AppCheck.setAppCheckProviderFactory(providerFactory)
    FirebaseApp.configure()
  }

  var body: some Scene {
    WindowGroup {
      NavigationView {
        ContentView()
      }
    }
  }
}

Receba o token de depuração:
1. Inicie o app no simulador ou no dispositivo de teste.
2. Abra o console do Xcode e procure o App Check token de depuração. Exemplo:
```
<Warning> [AppCheckCore][I-GAC004001] App Check debug token: '123a4567-b89c-12d3-e456-789012345678'.
```
3. Copie o token (por exemplo, 123a4567-b89c-12d3-e456-789012345678).
Registre o token de depuração no App Check:
1. No console do Firebase, acesse a guia Segurança > App Check > Apps.
2. Encontre seu app, clique no menu flutuante () e selecione Gerenciar tokens de depuração.
3. Siga as instruções na tela para registrar o token de depuração.

Para mais detalhes sobre o provedor de depuração (incluindo como receber um novo token de depuração), consulte a documentação App Check oficial.

Etapa 4: inicializar o serviço e criar uma instância de sessão do modelo

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Configure o seguinte antes de enviar uma solicitação de comando ao modelo.

Inicialize o serviço para o provedor Gemini API escolhido.
Crie uma instância GenerativeModelSession com um HybridModel.
Defina os modelos primary e secondary com base nas suas preferências. Você pode definir a ordem da inferência tentada:
- Tentar a inferência no dispositivo primeiro, mas permitir o fallback para a nuvem: defina primary como um modelo "de sistema" e secondary como um modelo de nuvem.
- Tentar a inferência na nuvem primeiro, mas permitir o fallback para o dispositivo: defina primary como um modelo de nuvem e secondary como um "de sistema".
O SDK oferece suporte à definição apenas de um único model, o que significa que o SDK só vai tentar a inferência no dispositivo ou na nuvem. No entanto, para uma experiência híbrida, é necessário criar um HybridModel e definir os modelos primary e secondary.

Saiba mais sobre o comportamento dos "modos de inferência" (a ordem da inferência tentada) inferência) em Opções de configuração.

O exemplo a seguir mostra como tentar a inferência no dispositivo primeiro, mas permitir o fallback para o modelo hospedado na nuvem:

// Initialize the Gemini Developer API backend service
let ai = FirebaseAI.firebaseAI(backend: .googleAI())

// Initialize a cloud model that supports your use case
let cloudModel = ai.geminiModel(name: "GEMINI_MODEL_NAME")
// Initialize an on-device model that supports your use case
let systemModel = FirebaseAI.SystemLanguageModel.default

// Create a Hybrid Model
// Provide your preferred model as `primary` and your fallback model as `secondary`
// In this example, attempt to use on-device model; otherwise, fall back to cloud.
let hybridModel = HybridModel(
  primary: systemModel,
  secondary: cloudModel
)

// Create a GenerativeModelSession with the HybridModel created earlier.
let session = firebaseAI.generativeModelSession(
  model: hybridModel,
)

Etapa 5: enviar uma solicitação de comando a um modelo

Esta seção mostra como:

Gerar texto com base em entradas somente de texto
Fazer streaming de texto com base em entradas somente de texto

Gerar texto com base em entradas somente de texto

Antes de tentar este exemplo, confira se você concluiu a Primeiros passos seção deste guia.

Para gerar texto com base em um comando que contém texto, use respond(to:) da seguinte maneira:

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To generate text output, call `respond(to:)` with the text input
let response = try await session.respond(to: prompt)
print(response.content)

Fazer streaming de texto com base em entradas somente de texto

Antes de tentar este exemplo, confira se você concluiu a Primeiros passos seção deste guia.

É possível conseguir interações mais rápidas sem esperar o resultado completo da geração do modelo e, em vez disso, usar o streaming para processar resultados parciais. Para transmitir texto gerado com base em um comando que contém texto, use streamResponse(to:) da seguinte maneira:

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To stream generated text output, call `streamResponse(to:)` with the text input
let stream = session.streamResponse(to: prompt)
for try await snapshot in stream {
  print(snapshot.content)
}

O que mais você sabe fazer?

Você pode usar várias outras opções e recursos de configuração para suas experiências híbridas:

Recursos ainda não compatíveis com a inferência híbrida ou no dispositivo

Como um lançamento experimental, nem todos os recursos do Firebase AI Logic ou dos modelos hospedados na nuvem são compatíveis.

Os seguintes itens não são compatíveis com implementações híbridas ou no dispositivo implementações: modelos Imagen, a API Gemini Live e modelos de comandos modelos. Além disso, não é possível confiar na contagem de tokens porque ela vai variar entre modelos hospedados na nuvem e no dispositivo, então não há um fallback intuitivo.
Os recursos a seguir ainda não são compatíveis com a inferência no dispositivo. Se você quiser usar algum desses recursos, recomendamos usar apenas um modelo hospedado na nuvem para uma experiência mais consistente.
- Gerar texto com base em entradas multimodais, como imagens, áudio, vídeo e documentos (PDFs)
- Gerar mídia, como imagens, áudio ou vídeo
- Enviar solicitações que excedam 4.096 tokens (ou aproximadamente 3.000 palavras em inglês).
- Fornecer ao modelo no dispositivo ferramentas integradas para ajudar a gerar a resposta (como execução de código, contexto de URL e Grounding com a Pesquisa Google)
Observação: a chamada de função e a geração de saída estruturada são compatíveis com a inferência no dispositivo. A documentação para implementar essas experiências será lançada em breve.
O monitoramento de IA no console Firebase não mostra dados para inferência no dispositivo (incluindo registros no dispositivo). No entanto, qualquer inferência que use um modelo hospedado na nuvem pode ser monitorada como outras inferências via Firebase AI Logic.

Outras limitações

Além do acima, a inferência no dispositivo tem as seguintes limitações:

O usuário final do seu app precisa usar um dispositivo com o Apple Intelligence ativado.
Seu app só pode executar a inferência no dispositivo quando estiver em primeiro plano.

Enviar feedback sobre sua experiência com Firebase AI Logic