Recursos disponíveis ao acessar a API Gemini usando a estrutura Foundation Models da Apple


Os exemplos nesta página pressupõem que você concluiu o artigo Introdução: acessar a Gemini API pelo framework Foundation Models da Apple.


Este guia mostra como enviar vários tipos de solicitações ao Gemini API pelo framework Foundation Models da Apple usando o Firebase AI Logic SDK para plataformas Apple.

Esta página mostra exemplos de como enviar os seguintes tipos de solicitações:



Gerar texto

Gemini modelos oferecem suporte aos seguintes recursos para gerar texto:

Modelos que oferecem suporte a esse recurso

  • gemini-3.1-pro-preview
  • gemini-3.5-flash
  • gemini-3.1-flash-lite

Gerar texto com base em entrada somente de texto

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Você pode pedir a um Gemini modelo para gerar texto com base em uma entrada somente de texto.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")

// Provide a prompt that contains text.
let prompt = "Write a story about a magic backpack."

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

// Generate a text response to the prompt.
let response = try await session.respond(to: prompt)
print(response.content)

Transmitir a resposta

É possível ter interações mais rápidas sem esperar o resultado completo da geração do modelo. Em vez disso, use o streaming para processar resultados parciais. Para transmitir a resposta, use streamResponse(to:) em vez de respond(to:).

// imports
// initialization of Gemini API backend service and a `geminiLanguageModel`

// Provide a prompt that contains text.
let prompt = "Write a story about a magic backpack."

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

// Generate a text response to the prompt.
// To stream the response, use `streamResponse(to:)` instead of `respond(to:)`
let stream = session.streamResponse(to: "Write a story about a magic backpack.")
var response = ""
for try await snapshot in stream {
  // The snapshot contains *all* content generated so far.
  response = snapshot.content
}

Gerar texto durante uma sessão multiturno (chat)

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// The session maintains state between each request.
let session = LanguageModelSession(model: model)

// Generate a text response to an initial prompt.
let response = try await session.respond(to: "Hello! I'd like to learn more about Albert Einstein.")
print(response.content)  // Example response from model: "What would you like to know?"

// Continue using the existing session. Each prompt and response is added to the transcript.
let response2 = try await session.respond(to: "When was he born?")
print(response2.content)  // Example response from model: "March 14, 1879"

Gerar texto com base em entrada multimodal (como imagens)

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Você pode pedir a um modelo Gemini para gerar texto com base em texto e um arquivo, como uma imagem ou um PDF.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

let cgImage: CGImage = // ... fetch CGImage from your datasource.
let response = try await session.respond {
  "What are the dominant colors of this image, in order?"
  Attachment(cgImage)
}
print(response.content)

Transmitir a resposta

É possível ter interações mais rápidas sem esperar o resultado completo da geração do modelo. Em vez disso, use o streaming para processar resultados parciais. Para transmitir a resposta, use streamResponse em vez de respond.

// imports
// initialization of Gemini API backend service and a `geminiLanguageModel`

// Create a session by injecting the model into Apple's `LanguageModelSession`.
// For a single-turn interaction, create a new session each time you call the model.
let session = LanguageModelSession(model: model)

let cgImage: CGImage = // ... fetch CGImage from your datasource.
let stream = session.streamResponse {
  "What are the dominant colors of this image, in order?"
  Attachment(cgImage)
}

var response = ""
for try await snapshot in stream {
  // The snapshot contains *all* content generated so far.
  response = snapshot.content
}
print(response)



Gerar imagens (usando modelos "Nano Banana")

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Modelos que oferecem suporte a esse recurso

  • gemini-3-pro-image (também conhecido como "Nano Banana Pro")
  • gemini-3.1-flash-image (também conhecido como "Nano Banana 2")

Você pode pedir a um modelo de geração de imagens Gemini (como um modelo "Nano Banana" ) para gerar uma imagem com base em uma entrada somente de texto.

O exemplo a seguir mostra como gerar apenas uma imagem, mas os Gemini modelos de geração de imagens podem gerar imagens e texto.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini image-generating model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.1-flash-image"
    options:
      GeminiGenerationOptions(responseModalities: .image)
)

let session = LanguageModelSession(model: model)
let response = try await session.respond(
          to: "Generate an image of the Eiffel tower with fireworks in the background."
        )

var generatedImage: CIImage?
// Find the image in the transcriptEntries.
for entry in response.transcriptEntries {
  if case let .response(response) = entry {
    for segment in response.segments {
      if case let .attachment(attachment) = segment,
          case let .image(image) = attachment.content {
        generatedImage = image.ciImage
      }
    }
  }
}



Gerar saída JSON estruturada

Clique no provedor Gemini API para conferir o conteúdo específico do provedor e o código nesta página.

Modelos que oferecem suporte a esse recurso

  • gemini-3.1-pro-preview
  • gemini-3.5-flash
  • gemini-3.1-flash-lite
  • gemini-3-pro-image

Gemini modelos retornam respostas como texto não estruturado por padrão. No entanto, alguns casos de uso exigem texto estruturado, como JSON. Por exemplo, você pode estar usando a resposta para outras tarefas downstream que exigem um esquema de dados estabelecido.

É possível configurar o modelo para formatar a resposta de acordo com um esquema JSON fornecido. Para mais detalhes, práticas recomendadas e casos de uso para gerar saída JSON estruturada, consulte o guia geral Gerar saída estruturada guide.

import FoundationModels
import FirebaseCore
import FirebaseAILogic

@Generable(description: "Basic profile information about a cat")
struct CatProfile {
  var name: String
  @Guide(description: "The age of the cat", .range(0 ... 20))
  var age: Int
  @Guide(description: "A one sentence profile about the cat's personality")
  var profile: String
}

// Initialize the Gemini Developer API backend service.
let ai = FirebaseAI.firebaseAI(backend: .googleAI())
// Initialize a `geminiLanguageModel` with a Gemini model that supports your use case.
let model = ai.geminiLanguageModel(name: "gemini-3.5-flash")
let session = LanguageModelSession(model: model)

let response = try await session.respond(
  to: "Generate a cute rescue cat profile with an Elvish theme",
  generating: CatProfile.self
)
let cat = response.content


Envie feedback sobre o acesso ao Gemini API pelo framework Foundation Models da Apple