É possível criar apps e recursos da Apple com tecnologia de IA e inferência híbrida usando o Firebase AI Logic. A inferência híbrida permite executar a inferência usando modelos no dispositivo (especificamente a estrutura de modelos de fundação da Apple) quando disponível e fazer fallback sem problemas para modelos do Google hospedados na nuvem caso contrário (e vice-versa).
Nesta página, descrevemos como começar a usar o SDK do cliente e mostramos outras opções e recursos de configuração, como temperatura.
A inferência no dispositivo via Firebase AI Logic é compatível com apps da Apple que usam o SDK do Firebase AI Logic v12.13.0 ou mais recente e são executados em dispositivos com o Apple Intelligence ativado. Ele é regido pelos Requisitos de uso aceitável para a estrutura de modelos de fundação da Apple.
Casos de uso recomendados
Usar um modelo no dispositivo para inferência oferece:
- Privacidade reforçada
- Inferência sem custo financeiro
- Funcionalidade off-line
Usar a funcionalidade híbrida oferece:
- Oferecer a todos os clientes uma experiência de app semelhante, independente do dispositivo do usuário final
- Melhorar a disponibilidade dos recursos de IA generativa, independente da conectividade com a Internet, das limitações de cota ou dos recursos do dispositivo
Recursos, APIs e dispositivos compatíveis
Antes de implementar a inferência híbrida e no dispositivo usando o Firebase AI Logic, revise esta seção para entender o que é compatível com apps da Apple.
Recursos e funcionalidades compatíveis para inferência no dispositivo
A inferência no dispositivo só é compatível com a geração de texto, especificamente com os seguintes recursos:
Confira a lista detalhada de inferência híbrida ou no dispositivo ainda não compatível na parte de baixo desta página.
APIs e dispositivos compatíveis
A inferência na nuvem usa o provedor de Gemini API escolhido (Gemini Developer API ou Vertex AI Gemini API).
A inferência no dispositivo usa a estrutura de modelos de fundação da Apple, que está disponível apenas em dispositivos com o Apple Intelligence ativado. O modelo no dispositivo é baixado automaticamente quando a Apple Intelligence é ativada.
Primeiros passos
Confira se você revisou a seção acima que descreve os recursos, APIs e dispositivos compatíveis.
Estas etapas iniciais descrevem a configuração geral necessária para qualquer solicitação de comando compatível que você queira enviar.
Etapa 1: configurar um projeto do Firebase e conectar seu app a ele
Faça login no console do Firebase e selecione seu projeto do Firebase.
No console do Firebase, acesse Serviços de IA > Lógica de IA.
Clique em Começar para iniciar um fluxo de trabalho guiado que ajuda a configurar as APIs necessárias e os recursos do projeto.
Configure seu projeto para usar um provedor "Gemini API".
Recomendamos começar usando o Gemini Developer API. A qualquer momento, você pode configurar o Vertex AI Gemini API (e o requisito de faturamento dele).
Para o Gemini Developer API, o console vai ativar as APIs necessárias e criar uma chave de API Gemini no seu projeto.
Não adicione essa chave de API Gemini à base de código do seu app. Saiba mais.Se solicitado no fluxo de trabalho do console, siga as instruções na tela para registrar seu app e conectá-lo ao Firebase.
Continue para a próxima etapa deste guia e adicione o SDK ao app.
Etapa 2: adicionar os SDKs necessários
Use o Swift Package Manager (SPM) para instalar e gerenciar dependências do Xcode. O suporte híbrido só está disponível ao usar o SPM.
A biblioteca Firebase AI Logic oferece acesso às APIs para interagir
com modelos generativos. A biblioteca está incluída no SDK do Firebase
para plataformas Apple (firebase-ios-sdk).
Se você já usa o Firebase, verifique se o pacote dele é v12.13.0 ou mais recente.
No Xcode, com seu projeto do app aberto, navegue até File > Add Package Dependencies.
Quando solicitado, adicione o repositório do SDK do Firebase para as plataformas Apple:
https://github.com/firebase/firebase-ios-sdkSelecione a versão mais recente do SDK.
Selecione a biblioteca
FirebaseAILogic.
Quando terminar, o Xcode vai começar a resolver e fazer o download das dependências em segundo plano automaticamente.
Etapa 3: inicializar o serviço e criar uma instância de sessão do modelo
|
Clique no seu provedor de Gemini API para conferir o conteúdo e o código específicos do provedor nesta página. |
Configure o seguinte antes de enviar uma solicitação de comando ao modelo.
Inicialize o serviço para o provedor Gemini API escolhido.
Crie uma instância
GenerativeModelSessioncom umHybridModel.Defina os modelos
primaryesecondarycom base nas suas preferências. É possível definir a ordem da inferência tentada:Tente primeiro a inferência no dispositivo, mas permita o fallback para a nuvem: defina
primarycomo um modelo "system" esecondarycomo um modelo de nuvem.Tente primeiro a inferência na nuvem, mas permita o fallback para o dispositivo: defina
primarycomo um modelo de nuvem esecondarycomo um modelo "system".
Observação: o SDK permite definir apenas um único
model, o que significa que ele apenas tentará fazer inferências no dispositivo ou na nuvem. No entanto, para uma experiência híbrida, é necessário criar umHybridModele definir os modelosprimaryesecondary.Saiba mais sobre o comportamento dos "modos de inferência" (a ordem da inferência tentada) em Opções de configuração.
O exemplo a seguir mostra como tentar primeiro a inferência no dispositivo, mas permitir o fallback para o modelo hospedado na nuvem:
// Initialize the Gemini Developer API backend service
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a cloud model that supports your use case
let cloudModel = ai.geminiModel(name: "GEMINI_MODEL_NAME")
// Initialize an on-device model that supports your use case
let systemModel = FirebaseAI.SystemLanguageModel.default
// Create a Hybrid Model
// Provide your preferred model as `primary` and your fallback model as `secondary`
// In this example, attempt to use on-device model; otherwise, fall back to cloud.
let hybridModel = HybridModel(
primary: systemModel,
secondary: cloudModel
)
// Create a GenerativeModelSession with the HybridModel created earlier.
let session = firebaseAI.generativeModelSession(
model: hybridModel,
)
Etapa 4: enviar uma solicitação de comando a um modelo
Nesta seção, mostramos como fazer o seguinte:
Gerar texto com base em entradas somente de texto
| Antes de testar este exemplo, confira se você concluiu a seção Começar deste guia. |
Para gerar texto com base em um comando que contém texto, use respond(to:) da seguinte maneira:
// Imports + initialization of Gemini API backend service + creation of model session
// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."
// To generate text output, call `respond(to:)` with the text input
let response = try await session.respond(to: prompt)
print(response.content)
Transmitir texto de uma entrada somente de texto
| Antes de testar este exemplo, confira se você concluiu a seção Começar deste guia. |
Para ter interações mais rápidas, não espere o resultado completo da
geração do modelo. Em vez disso, use o streaming para processar resultados parciais. Para
fazer streaming de texto gerado com base em um comando que contém texto, use
streamResponse(to:) desta forma:
// Imports + initialization of Gemini API backend service + creation of model session
// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."
// To stream generated text output, call `streamResponse(to:)` with the text input
let stream = session.streamResponse(to: prompt)
for try await snapshot in stream {
print(snapshot.content)
}
O que mais você sabe fazer?
Você pode usar várias opções e recursos de configuração adicionais para suas experiências híbridas:
Determine se a inferência no dispositivo ou na nuvem foi usada.
Use a configuração do modelo para controlar respostas (como temperatura).
Recursos ainda não disponíveis para inferência híbrida ou no dispositivo
Como é uma versão experimental, nem todos os recursos do Firebase AI Logic ou dos modelos hospedados na nuvem são compatíveis.
Os seguintes recursos indisponíveis para implementações híbridas ou no dispositivo: modelos Imagen, API Gemini Live e modelos de comando. Além disso, não é recomendável confiar na contagem de tokens porque ela difere entre modelos hospedados na nuvem e no dispositivo. Portanto, não há um fallback intuitivo.
Os recursos a seguir ainda não são compatíveis com a inferência no dispositivo. Se você quiser usar algum desses recursos, recomendamos usar apenas um modelo hospedado na nuvem para uma experiência mais consistente.
Gerar texto com base em entradas multimodais, como imagens, áudio, vídeo e documentos (PDFs)
Gerar mídia, como imagens, áudio ou vídeo
Enviar solicitações que excedam 4.096 tokens (ou aproximadamente 3.000 palavras em inglês).
Fornecer ao modelo no dispositivo ferramentas integradas para ajudar a gerar a resposta (como execução de código, contexto de URL e embasamento com a Pesquisa Google)
O AI monitoring no console do Firebase não mostra dados de inferência no dispositivo (incluindo registros no dispositivo). No entanto, qualquer inferência que use um modelo hospedado na nuvem pode ser monitorada como outras inferências via Firebase AI Logic.
Outras limitações
Além disso, a inferência no dispositivo tem as seguintes limitações:
O usuário final do seu app precisa usar um dispositivo com o Apple Intelligence ativado.
O app só pode executar inferências no dispositivo quando está em primeiro plano.
Enviar feedback sobre sua experiência com Firebase AI Logic