The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Recursos disponíveis ao acessar a API Gemini usando a estrutura Foundation Models da Apple

Os exemplos nesta página pressupõem que você concluiu o artigo Introdução: acessar a Gemini API pelo framework Foundation Models da Apple.

Este guia mostra como enviar vários tipos de solicitações ao Gemini API pelo framework Foundation Models da Apple usando o Firebase AI Logic SDK para plataformas Apple.

Esta página mostra exemplos de como enviar os seguintes tipos de solicitações:

Gerar texto com base em entrada somente de texto
Gerar texto durante uma sessão multiturno (chat)
Gerar texto com base em entrada multimodal (como imagens)
Gerar imagens com base em entrada somente de texto

Gerar saída JSON estruturada

Gerar texto

Gemini modelos oferecem suporte aos seguintes recursos para gerar texto:

Gerar texto com base em entrada somente de texto
Gerar texto durante uma sessão multiturno (chat)
Gerar texto com base em entrada multimodal (como imagens)

Modelos que oferecem suporte a esse recurso

gemini-3.1-pro-preview
gemini-3.5-flash
gemini-3.1-flash-lite

Gerar texto com base em entrada somente de texto

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Você pode pedir a um Gemini modelo para gerar texto com base em uma entrada somente de texto.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")

// Provide a prompt that contains text.
let prompt = "Write a story about a magic backpack."

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

// Generate a text response to the prompt.
let response = try await session.respond(to: prompt)
print(response.content)

Transmitir a resposta

É possível ter interações mais rápidas sem esperar o resultado completo da geração do modelo. Em vez disso, use o streaming para processar resultados parciais. Para transmitir a resposta, use streamResponse(to:) em vez de respond(to:).

// imports
// initialization of Gemini API backend service and a `geminiLanguageModel`

// Provide a prompt that contains text.
let prompt = "Write a story about a magic backpack."

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

// Generate a text response to the prompt.
// To stream the response, use `streamResponse(to:)` instead of `respond(to:)`
let stream = session.streamResponse(to: "Write a story about a magic backpack.")
var response = ""
for try await snapshot in stream {
  // The snapshot contains *all* content generated so far.
  response = snapshot.content
}

Gerar texto durante uma sessão multiturno (chat)

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// The session maintains state between each request.
let session = LanguageModelSession(model: model)

// Generate a text response to an initial prompt.
let response = try await session.respond(to: "Hello! I'd like to learn more about Albert Einstein.")
print(response.content)  // Example response from model: "What would you like to know?"

// Continue using the existing session. Each prompt and response is added to the transcript.
let response2 = try await session.respond(to: "When was he born?")
print(response2.content)  // Example response from model: "March 14, 1879"

Gerar texto com base em entrada multimodal (como imagens)

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Você pode pedir a um modelo Gemini para gerar texto com base em texto e um arquivo, como uma imagem ou um PDF.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

let cgImage: CGImage = // ... fetch CGImage from your datasource.
let response = try await session.respond {
  "What are the dominant colors of this image, in order?"
  Attachment(cgImage)
}
print(response.content)

Transmitir a resposta

// imports
// initialization of Gemini API backend service and a `geminiLanguageModel`

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

let cgImage: CGImage = // ... fetch CGImage from your datasource.
let stream = session.streamResponse {
  "What are the dominant colors of this image, in order?"
  Attachment(cgImage)
}

var response = ""
for try await snapshot in stream {
  // The snapshot contains *all* content generated so far.
  response = snapshot.content
}
print(response)

Gerar imagens (usando modelos "Nano Banana")

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Modelos que oferecem suporte a esse recurso

gemini-3-pro-image (também conhecido como "Nano Banana Pro")
gemini-3.1-flash-image (também conhecido como "Nano Banana 2")

Você pode pedir a um modelo de geração de imagens Gemini (como um modelo "Nano Banana" ) para gerar uma imagem com base em uma entrada somente de texto.

O exemplo a seguir mostra como gerar apenas uma imagem, mas os Gemini modelos de geração de imagens podem gerar imagens e texto.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini image-generating model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.1-flash-image"
    options:
      GeminiGenerationOptions(responseModalities: .image)
)

let session = LanguageModelSession(model: model)
let response = try await session.respond(
          to: "Generate an image of the Eiffel tower with fireworks in the background."
        )

var generatedImage: CIImage?
// Find the image in the transcriptEntries.
for entry in response.transcriptEntries {
  if case let .response(response) = entry {
    for segment in response.segments {
      if case let .attachment(attachment) = segment,
          case let .image(image) = attachment.content {
        generatedImage = image.ciImage
      }
    }
  }
}

Gerar saída JSON estruturada

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Modelos que oferecem suporte a esse recurso

gemini-3.1-pro-preview
gemini-3.5-flash
gemini-3.1-flash-lite
gemini-3-pro-image

Gemini modelos retornam respostas como texto não estruturado por padrão. No entanto, alguns casos de uso exigem texto estruturado, como JSON. Por exemplo, você pode estar usando a resposta para outras tarefas downstream que exigem um esquema de dados estabelecido.

É possível configurar o modelo para formatar a resposta de acordo com um esquema JSON fornecido. Para mais detalhes, práticas recomendadas e casos de uso para gerar saída JSON estruturada, consulte o guia geral Gerar saída estruturada guide.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

@Generable(description: "Basic profile information about a cat")
struct CatProfile {
  var name: String
  @Guide(description: "The age of the cat", .range(0 ... 20))
  var age: Int
  @Guide(description: "A one sentence profile about the cat's personality")
  var profile: String
}

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")
let session = LanguageModelSession(model: model)

let response = try await session.respond(
  to: "Generate a cute rescue cat profile with an Elvish theme",
  generating: CatProfile.self
)
let cat = response.content

Envie feedback sobre o acesso ao Gemini API pelo framework Foundation Models da Apple

Recursos disponíveis ao acessar a API Gemini usando a estrutura Foundation Models da Apple Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Gerar texto

Modelos que oferecem suporte a esse recurso

Gerar texto com base em entrada somente de texto

Transmitir a resposta

Gerar texto durante uma sessão multiturno (chat)

Gerar texto com base em entrada multimodal (como imagens)

Transmitir a resposta

Gerar imagens (usando modelos "Nano Banana")

Modelos que oferecem suporte a esse recurso

Gerar saída JSON estruturada

Modelos que oferecem suporte a esse recurso

Recursos disponíveis ao acessar a API Gemini usando a estrutura Foundation Models da Apple