The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Crie experiências híbridas em apps da Apple com modelos hospedados na nuvem e no dispositivo

É possível criar apps e recursos da Apple com tecnologia de IA e inferência híbrida usando o Firebase AI Logic. A inferência híbrida permite executar a inferência usando modelos no dispositivo (especificamente a estrutura de modelos de fundação da Apple) quando disponível e fazer fallback sem problemas para modelos do Google hospedados na nuvem caso contrário (e vice-versa).

Nesta página, descrevemos como começar a usar o SDK do cliente e mostramos outras opções e recursos de configuração, como temperatura.

A inferência no dispositivo via Firebase AI Logic é compatível com apps da Apple que usam o SDK do Firebase AI Logic v12.13.0 ou mais recente e são executados em dispositivos com o Apple Intelligence ativado. Ele é regido pelos Requisitos de uso aceitável para a estrutura de modelos de fundação da Apple.

Casos de uso recomendados

Usar um modelo no dispositivo para inferência oferece:
- Privacidade reforçada
- Inferência sem custo financeiro
- Funcionalidade off-line
Usar a funcionalidade híbrida oferece:
- Oferecer a todos os clientes uma experiência de app semelhante, independente do dispositivo do usuário final
- Melhorar a disponibilidade dos recursos de IA generativa, independente da conectividade com a Internet, das limitações de cota ou dos recursos do dispositivo

Recursos, APIs e dispositivos compatíveis

Antes de implementar a inferência híbrida e no dispositivo usando o Firebase AI Logic, revise esta seção para entender o que é compatível com apps da Apple.

Recursos e funcionalidades compatíveis para inferência no dispositivo

A inferência no dispositivo só é compatível com a geração de texto, especificamente com os seguintes recursos:

Gerar texto com base em entradas somente de texto
Streaming de texto com entrada somente de texto

Confira a lista detalhada de inferência híbrida ou no dispositivo ainda não compatível na parte de baixo desta página.

APIs e dispositivos compatíveis

A inferência na nuvem usa o provedor de Gemini API escolhido (Gemini Developer API ou Vertex AI Gemini API).
A inferência no dispositivo usa a estrutura de modelos de fundação da Apple, que está disponível apenas em dispositivos com o Apple Intelligence ativado. O modelo no dispositivo é baixado automaticamente quando a Apple Intelligence é ativada.

Importante: o uso de modelos no dispositivo é regido pelos requisitos de uso aceitável da estrutura de modelos de fundação da Apple.

Primeiros passos

Confira se você revisou a seção acima que descreve os recursos, APIs e dispositivos compatíveis.

Estas etapas iniciais descrevem a configuração geral necessária para qualquer solicitação de comando compatível que você queira enviar.

Etapa 1: configurar um projeto do Firebase e conectar seu app a ele

Faça login no console do Firebase e selecione seu projeto do Firebase.
Ainda não tem um projeto do Firebase?

Se você ainda não tem um projeto do Firebase, clique no botão para criar um novo e use uma das seguintes opções:
- Opção 1: crie um projeto do Firebase totalmente novo (e o projeto do Google Cloud automaticamente) inserindo um novo nome na primeira etapa do fluxo de trabalho.
- Opção 2: "Adicionar o Firebase" a um projeto Google Cloud clicando em Adicionar o Firebase ao projeto do Google Cloud (na parte de baixo da página). Na primeira etapa do fluxo de trabalho, comece a digitar o nome do projeto e selecione-o na lista exibida.
Conclua as etapas restantes do fluxo de trabalho na tela para criar um projeto do Firebase. Observe que, quando solicitado, você não precisa configurar o Google Analytics para usar os SDKs do Firebase AI Logic.
No console do Firebase, acesse Serviços de IA > Lógica de IA.
Clique em Começar para iniciar um fluxo de trabalho guiado que ajuda a configurar as APIs necessárias e os recursos do projeto.
Configure seu projeto para usar um provedor "Gemini API".

Recomendamos começar usando o Gemini Developer API. A qualquer momento, você pode configurar o Vertex AI Gemini API (e o requisito de faturamento dele).

Para o Gemini Developer API, o console vai ativar as APIs necessárias e criar uma chave de API Gemini no seu projeto.
Não adicione essa chave de API Gemini à base de código do seu app. Saiba mais.
Se solicitado no fluxo de trabalho do console, siga as instruções na tela para registrar seu app e conectá-lo ao Firebase.
Continue para a próxima etapa deste guia e adicione o SDK ao app.

Etapa 2: adicionar os SDKs necessários

Use o Swift Package Manager (SPM) para instalar e gerenciar dependências do Xcode. O suporte híbrido só está disponível ao usar o SPM.

A biblioteca Firebase AI Logic oferece acesso às APIs para interagir com modelos generativos. A biblioteca está incluída no SDK do Firebase para plataformas Apple (firebase-ios-sdk).

Se você já usa o Firebase, verifique se o pacote dele é v12.13.0 ou mais recente.

No Xcode, com seu projeto do app aberto, navegue até File > Add Package Dependencies.
Quando solicitado, adicione o repositório do SDK do Firebase para as plataformas Apple:
```
https://github.com/firebase/firebase-ios-sdk
```
Selecione a versão mais recente do SDK.
Selecione a biblioteca FirebaseAILogic.

Quando terminar, o Xcode vai começar a resolver e fazer o download das dependências em segundo plano automaticamente.

Etapa 3: inicializar o serviço e criar uma instância de sessão do modelo

Clique no seu provedor de Gemini API para conferir o conteúdo e o código específicos do provedor nesta página.

Configure o seguinte antes de enviar uma solicitação de comando ao modelo.

Inicialize o serviço para o provedor Gemini API escolhido.
Crie uma instância GenerativeModelSession com um HybridModel.
Defina os modelos primary e secondary com base nas suas preferências. É possível definir a ordem da inferência tentada:
- Tente primeiro a inferência no dispositivo, mas permita o fallback para a nuvem: defina primary como um modelo "system" e secondary como um modelo de nuvem.
- Tente primeiro a inferência na nuvem, mas permita o fallback para o dispositivo: defina primary como um modelo de nuvem e secondary como um modelo "system".
Observação: o SDK permite definir apenas um único model, o que significa que ele apenas tentará fazer inferências no dispositivo ou na nuvem. No entanto, para uma experiência híbrida, é necessário criar um HybridModel e definir os modelos primary e secondary.

Saiba mais sobre o comportamento dos "modos de inferência" (a ordem da inferência tentada) em Opções de configuração.

O exemplo a seguir mostra como tentar primeiro a inferência no dispositivo, mas permitir o fallback para o modelo hospedado na nuvem:

// Initialize the Gemini Developer API backend service
let ai = FirebaseAI.firebaseAI(backend: .googleAI())

// Initialize a cloud model that supports your use case
let cloudModel = ai.geminiModel(name: "GEMINI_MODEL_NAME")
// Initialize an on-device model that supports your use case
let systemModel = FirebaseAI.SystemLanguageModel.default

// Create a Hybrid Model
// Provide your preferred model as `primary` and your fallback model as `secondary`
// In this example, attempt to use on-device model; otherwise, fall back to cloud.
let hybridModel = HybridModel(
  primary: systemModel,
  secondary: cloudModel
)

// Create a GenerativeModelSession with the HybridModel created earlier.
let session = firebaseAI.generativeModelSession(
  model: hybridModel,
)

Etapa 4: enviar uma solicitação de comando a um modelo

Nesta seção, mostramos como fazer o seguinte:

Gerar texto com base em entradas somente de texto
Transmitir texto de entrada somente de texto

Gerar texto com base em entradas somente de texto

Antes de testar este exemplo, confira se você concluiu a seção Começar deste guia.

Para gerar texto com base em um comando que contém texto, use respond(to:) da seguinte maneira:

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To generate text output, call `respond(to:)` with the text input
let response = try await session.respond(to: prompt)
print(response.content)

Transmitir texto de uma entrada somente de texto

Antes de testar este exemplo, confira se você concluiu a seção Começar deste guia.

Para ter interações mais rápidas, não espere o resultado completo da geração do modelo. Em vez disso, use o streaming para processar resultados parciais. Para fazer streaming de texto gerado com base em um comando que contém texto, use streamResponse(to:) desta forma:

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To stream generated text output, call `streamResponse(to:)` with the text input
let stream = session.streamResponse(to: prompt)
for try await snapshot in stream {
  print(snapshot.content)
}

O que mais você sabe fazer?

Você pode usar várias opções e recursos de configuração adicionais para suas experiências híbridas:

Recursos ainda não disponíveis para inferência híbrida ou no dispositivo

Como é uma versão experimental, nem todos os recursos do Firebase AI Logic ou dos modelos hospedados na nuvem são compatíveis.

Os seguintes recursos indisponíveis para implementações híbridas ou no dispositivo: modelos Imagen, API Gemini Live e modelos de comando. Além disso, não é recomendável confiar na contagem de tokens porque ela difere entre modelos hospedados na nuvem e no dispositivo. Portanto, não há um fallback intuitivo.
Os recursos a seguir ainda não são compatíveis com a inferência no dispositivo. Se você quiser usar algum desses recursos, recomendamos usar apenas um modelo hospedado na nuvem para uma experiência mais consistente.
- Gerar texto com base em entradas multimodais, como imagens, áudio, vídeo e documentos (PDFs)
- Gerar mídia, como imagens, áudio ou vídeo
- Enviar solicitações que excedam 4.096 tokens (ou aproximadamente 3.000 palavras em inglês).
- Fornecer ao modelo no dispositivo ferramentas integradas para ajudar a gerar a resposta (como execução de código, contexto de URL e embasamento com a Pesquisa Google)
Observação: a chamada de função e a geração de saída estruturada são compatíveis com a inferência no dispositivo. A documentação para implementar essas experiências será disponibilizada em breve.
O AI monitoring no console do Firebase não mostra dados de inferência no dispositivo (incluindo registros no dispositivo). No entanto, qualquer inferência que use um modelo hospedado na nuvem pode ser monitorada como outras inferências via Firebase AI Logic.

Outras limitações

Além disso, a inferência no dispositivo tem as seguintes limitações:

O usuário final do seu app precisa usar um dispositivo com o Apple Intelligence ativado.
O app só pode executar inferências no dispositivo quando está em primeiro plano.

Enviar feedback sobre sua experiência com Firebase AI Logic