The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Crea experiencias híbridas en apps para Android con modelos alojados en la nube y en el dispositivo

Puedes compilar apps y funciones para Android potenciadas por IA con inferencia híbrida usando Firebase AI Logic. La inferencia híbrida permite ejecutar la inferencia con modelos integrados en el dispositivo cuando están disponibles y recurrir sin problemas a los modelos alojados en la nube en otros casos (y viceversa).

En esta página, se describe cómo comenzar a usar el SDK del cliente y se muestran opciones y capacidades de configuración adicionales, como la temperatura.

Ten en cuenta que la inferencia integrado en el dispositivo a través de Firebase AI Logic es compatible con las apps para Android que se ejecutan en dispositivos específicos y se rige por las condiciones de ML Kit, así como por las condiciones específicas de los aspectos de IA generativa de ML Kit.

Casos de uso recomendados y funciones compatibles

Casos de uso recomendados

Usar un modelo integrado en el dispositivo para la inferencia ofrece las siguientes ventajas:
- Privacidad mejorada
- Contexto local
- Inferencia sin costo
- Funcionalidad sin conexión
El uso de la funcionalidad híbrida ofrece lo siguiente:
- Llega a más usuarios de tu público objetivo teniendo en cuenta la disponibilidad del modelo integrado en el dispositivo y la conectividad a Internet

Funciones y capacidades compatibles con la inferencia integrada en el dispositivo

La inferencia integrada en el dispositivo solo admite la generación de texto de un solo turno (no chat), con salida de transmisión o sin transmisión. Admite las siguientes capacidades de generación de texto:

Generar texto a partir de una entrada de solo texto
Generar texto a partir de una entrada de texto y una imagen, específicamente una sola imagen Bitmap como entrada

Asegúrate de revisar la lista de funciones aún no disponibles para la inferencia integrada en el dispositivo que se encuentra al final de esta página.

Antes de comenzar

Observa lo siguiente:

APIs compatibles:
- La inferencia en la nube usa el proveedor de Gemini API que elijas (Gemini Developer API o Vertex AI Gemini API).
- La inferencia integrado en el dispositivo usa la API de Prompt de ML Kit, que se encuentra en versión beta y solo está disponible en dispositivos específicos.
  
  El uso de los modelos integrados en el dispositivo se rige por las condiciones de ML Kit, así como por las condiciones específicas de los aspectos de IA generativa de ML Kit.
En esta página, se describe cómo comenzar.

Después de completar esta configuración estándar, consulta las opciones y capacidades de configuración adicionales (como establecer la temperatura).

Dispositivos Android compatibles y sus modelos integrados en el dispositivo

Para la inferencia en el dispositivo (que usa la API de Prompt de ML Kit), puedes encontrar una lista de los dispositivos compatibles y sus modelos integrados en el dispositivo en la documentación de ML Kit.

Comenzar

En estos pasos para comenzar, se describe la configuración general necesaria para cualquier solicitud de instrucciones admitida que desees enviar.

Paso 1: Configura un proyecto de Firebase y conecta tu app a Firebase

Accede a la consola de Firebase y, luego, selecciona tu proyecto de Firebase.
¿Aún no tienes un proyecto de Firebase?

Si aún no tienes un proyecto de Firebase, haz clic en el botón para crear uno nuevo y, luego, usa una de las siguientes opciones:
- Opción 1: Crea un proyecto de Firebase completamente nuevo (y su proyecto subyacente de Google Cloud automáticamente) ingresando un nuevo nombre de proyecto en el primer paso del flujo de trabajo.
- Opción 2: Haz clic en Agregar Firebase al proyecto de Google Cloud (en la parte inferior de la página) para “agregar Firebase” a un proyecto existente de Google Cloud. En el primer paso del flujo de trabajo, comienza a ingresar el nombre del proyecto existente y, luego, selecciónalo en la lista que aparece.
Completa los pasos restantes del flujo de trabajo en pantalla para crear un proyecto de Firebase. Ten en cuenta que, cuando se te solicite, no es necesario que configures Google Analytics para usar los SDKs de Firebase AI Logic.
En la consola de Firebase, ve a Servicios de IA > Lógica de IA.
Haz clic en Comenzar para iniciar un flujo de trabajo guiado que te ayudará a configurar las APIs requeridas y los recursos para tu proyecto.
Configura tu proyecto para usar un proveedor de "Gemini API".

Te recomendamos que comiences con Gemini Developer API. En cualquier momento, puedes configurar el Vertex AI Gemini API (y su requisito de facturación).

En el caso de Gemini Developer API, la consola habilitará las APIs necesarias y creará una clave de API de Gemini en tu proyecto.
No agregues esta clave de API de Gemini a la base de código de tu app. Obtén más información.
Si se te solicita en el flujo de trabajo de la consola, sigue las instrucciones en pantalla para registrar tu app y conectarla a Firebase.
Continúa con el siguiente paso de esta guía para agregar el SDK a tu app.

Paso 2: Agrega los SDKs requeridos

El SDK de Firebase AI Logic para Android (firebase-ai) junto con el SDK de Firebase AI Logic On-Device (firebase-ai-ondevice) proporcionan acceso a las APIs para interactuar con modelos generativos.

En el archivo Gradle del módulo (nivel de la app) (como <project>/<app-module>/build.gradle.kts), agrega las dependencias de las bibliotecas de Firebase AI Logic para Android:

Kotlin

dependencies {
  // ... other androidx dependencies

  // Add the dependencies for the Firebase AI Logic libraries
  // Note that the on-device SDK is not yet included in the Firebase Android BoM
  implementation("com.google.firebase:firebase-ai:17.11.0")
  implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta01")
}

Java

En el caso de Java, debes agregar dos bibliotecas adicionales.

dependencies {
  // ... other androidx dependencies

  // Add the dependencies for the Firebase AI Logic libraries
  // Note that the on-device SDK is not yet included in the Firebase Android BoM
  implementation("com.google.firebase:firebase-ai:17.11.0")
  implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta01")

  // Required for one-shot operations (to use `ListenableFuture` from Guava Android)
  implementation("com.google.guava:guava:31.0.1-android")

  // Required for streaming operations (to use `Publisher` from Reactive Streams)
  implementation("org.reactivestreams:reactive-streams:1.0.4")
}

Paso 3: Verifica si el modelo integrado en el dispositivo está disponible

Con FirebaseAIOnDevice, verifica si el modelo integrado en el dispositivo está disponible y descárgalo si no lo está.

Una vez que se descargue, AICore mantendrá el modelo actualizado automáticamente. Consulta las notas después del fragmento para obtener más detalles sobre AICore y la administración de la descarga del modelo integrado en el dispositivo.

Kotlin

val status = FirebaseAIOnDevice.checkStatus()
when (status) {
  OnDeviceModelStatus.UNAVAILABLE -> {
    Log.w(TAG, "On-device model is unavailable")
  }

  OnDeviceModelStatus.DOWNLOADABLE -> {
    FirebaseAIOnDevice.download().collect { status ->
      when (status) {
        is DownloadStatus.DownloadStarted ->
          Log.w(TAG, "Starting download - ${status.bytesToDownload}")

        is DownloadStatus.DownloadInProgress ->
          Log.w(TAG, "Download in progress ${status.totalBytesDownloaded} bytes downloaded")

        is DownloadStatus.DownloadCompleted ->
          Log.w(TAG, "On-device model download complete")

        is DownloadStatus.DownloadFailed ->
          Log.e(TAG, "Download failed ${status}")
      }
    }
  }
  OnDeviceModelStatus.DOWNLOADING -> {
    Log.w(TAG, "On-device model is being downloaded")
  }

  OnDeviceModelStatus.AVAILABLE -> {
    Log.w(TAG, "On-device model is available")
  }
}

Java

Checking for and downloading the model is not yet available for Java.

However, all other APIs and interactions in this guide are available for Java.

Ten en cuenta lo siguiente sobre la descarga del modelo integrado en el dispositivo:

El tiempo que tarda en descargarse el modelo integrado en el dispositivo depende de muchos factores, incluida tu red.
Si tu código usa un modelo integrado en el dispositivo para la inferencia principal o de resguardo, asegúrate de que el modelo se descargue al principio del ciclo de vida de tu app para que esté disponible antes de que los usuarios finales se encuentren con el código en tu app.
Si el modelo integrado en el dispositivo no está disponible cuando se realiza una solicitud de inferencia integrada en el dispositivo, el SDK no activará automáticamente la descarga del modelo integrado en el dispositivo. El SDK recurrirá al modelo alojado en la nube o arrojará una excepción (consulta los detalles sobre el comportamiento de los modos de inferencia).
AICore (un servicio del sistema Android) administra por ti qué modelo y versión se descargan, mantiene el modelo actualizado, etcétera. Ten en cuenta que el dispositivo solo tendrá un modelo descargado, por lo que, si otra app del dispositivo descargó correctamente el modelo integrado en el dispositivo, esta verificación mostrará que el modelo está disponible.

Optimización de la latencia

Para optimizar la primera llamada de inferencia, puedes hacer que tu app llame a warmup(). Esto carga el modelo integrado en el dispositivo en la memoria y, luego, inicializa los componentes del tiempo de ejecución.

Paso 4: Inicializa el servicio y crea una instancia del modelo

Haz clic en tu proveedor de Gemini API para ver el contenido y el código específicos del proveedor en esta página.

Configura lo siguiente antes de enviar una solicitud de instrucción al modelo.

Inicializa el servicio para el proveedor de la API que elegiste.
Crea una instancia de GenerativeModel y establece mode en uno de los siguientes valores. Las descripciones aquí son muy generales, pero puedes obtener detalles sobre el comportamiento de estos modos en Cómo establecer un modo de inferencia.
- PREFER_ON_DEVICE: Intenta usar el modelo integrado en el dispositivo; de lo contrario, recurre al modelo alojado en la nube.
- ONLY_ON_DEVICE: Intenta usar el modelo integrado en el dispositivo; de lo contrario, lanza una excepción.
- PREFER_IN_CLOUD: Intenta usar el modelo alojado en la nube; de lo contrario, recurre al modelo integrado en el dispositivo.
- ONLY_IN_CLOUD: Intenta usar el modelo alojado en la nube; de lo contrario, lanza una excepción.
Nota: Ten en cuenta lo siguiente:
- Para usar un modelo integrado en el dispositivo, asegúrate de revisar la lista de funciones aún no disponibles que se encuentra en la parte inferior de esta página.
- Para usar un modelo alojado en la nube, el dispositivo debe estar en línea y debes especificar explícitamente un modelo alojado en la nube para usar.
- Como parte de la respuesta, el SDK te indica si se usó la inferencia integrado en el dispositivo o en la nube.

Kotlin

// Using this SDK to access on-device inference is an Experimental release and requires opt-in
@OptIn(PublicPreviewAPI::class)

// ...

// Initialize the Gemini Developer API backend service
// Create a GenerativeModel instance with a model that supports your use case
// Set the inference mode (like PREFER_ON_DEVICE to use the on-device model if available)
val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        modelName = "MODEL_NAME",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
    )

Java

// Initialize the Gemini Developer API backend service
// Create a GenerativeModel instance with a model that supports your use case
// Set the inference mode (like PREFER_ON_DEVICE to use the on-device model if available)
GenerativeModel ai = FirebaseAI.getInstance(GenerativeBackend.googleAI())
    .generativeModel(
        "MODEL_NAME",
        new OnDeviceConfig(InferenceMode.PREFER_ON_DEVICE)
    );

// Use the GenerativeModelFutures Java compatibility layer which offers
// support for ListenableFuture and Publisher APIs
GenerativeModelFutures model = GenerativeModelFutures.from(ai);

Paso 5: Envía una solicitud de instrucción a un modelo

En esta sección, se muestra cómo enviar varios tipos de entrada para generar diferentes tipos de salida, incluidos los siguientes:

Genera texto a partir de una entrada de solo texto
Genera texto a partir de entradas de texto y de imágenes (multimodales)

Generar texto a partir de entrada de solo texto

Antes de probar este ejemplo, asegúrate de haber completado la sección Comienza ahora de esta guía.

Puedes usar generateContent() para generar texto a partir de una instrucción que contenga texto:

Kotlin

// Imports + initialization of Gemini API backend service + creation of model instance

// Provide a prompt that contains text
val prompt = "Write a story about a magic backpack."

// To generate text output, call generateContent with the text input
val response = model.generateContent(prompt)
print(response.text)

Java

// Imports + initialization of Gemini API backend service + creation of model instance

// Provide a prompt that contains text
Content prompt = new Content.Builder()
    .addText("Write a story about a magic backpack.")
    .build();

// To generate text output, call generateContent with the text input
ListenableFuture<GenerateContentResponse> response = model.generateContent(prompt);
Futures.addCallback(response, new FutureCallback<GenerateContentResponse>() {
    @Override
    public void onSuccess(GenerateContentResponse result) {
        String resultText = result.getText();
        System.out.println(resultText);
    }

    @Override
    public void onFailure(Throwable t) {
        t.printStackTrace();
    }
}, executor);

Ten en cuenta que Firebase AI Logic también admite la transmisión de respuestas de texto con generateContentStream (en lugar de generateContent).

Genera texto a partir de entradas de texto y de imágenes (multimodales)

Antes de probar este ejemplo, asegúrate de haber completado la sección Comienza ahora de esta guía.

Puedes usar generateContent() para generar texto a partir de una instrucción que contenga texto y hasta un archivo de imagen (solo mapa de bits). Para ello, proporciona el mimeType de cada archivo de entrada y el archivo en sí.

Kotlin

// Imports + initialization of Gemini API backend service + creation of model instance

// Loads an image from the app/res/drawable/ directory
val bitmap: Bitmap = BitmapFactory.decodeResource(resources, R.drawable.sparky)

// Provide a prompt that includes the image specified above and text
val prompt = content {
  image(bitmap)
  text("What developer tool is this mascot from?")
}

// To generate text output, call generateContent with the prompt
val response = model.generateContent(prompt)
print(response.text)

Java

// Imports + initialization of Gemini API backend service + creation of model instance

Bitmap bitmap = BitmapFactory.decodeResource(getResources(), R.drawable.sparky);

// Provide a prompt that includes the image specified above and text
Content content = new Content.Builder()
        .addImage(bitmap)
        .addText("What developer tool is this mascot from?")
        .build();

// To generate text output, call generateContent with the prompt
ListenableFuture<GenerateContentResponse> response = model.generateContent(content);
Futures.addCallback(response, new FutureCallback<GenerateContentResponse>() {
    @Override
    public void onSuccess(GenerateContentResponse result) {
        String resultText = result.getText();
        System.out.println(resultText);
    }

    @Override
    public void onFailure(Throwable t) {
        t.printStackTrace();
    }
}, executor);

Ten en cuenta que Firebase AI Logic también admite la transmisión de respuestas de texto con generateContentStream (en lugar de generateContent).

¿Qué más puedes hacer?

Puedes usar varias opciones y capacidades de configuración adicionales para tus experiencias híbridas:

Funciones aún no disponibles para la inferencia integrada en el dispositivo

Como lanzamiento experimental, no todas las capacidades de los modelos en la nube están disponibles para la inferencia integrada en el dispositivo.

Las funciones que se enumeran en esta sección aún no están disponibles para la inferencia integrada en el dispositivo. Si quieres usar alguna de estas funciones, te recomendamos que uses el modo de inferencia ONLY_IN_CLOUD para obtener una experiencia más coherente.

Generar resultados estructurados (como JSON o enumeraciones)
Generar texto a partir de tipos de entrada de archivos de imagen que no sean de mapa de bits (imagen cargada en la memoria)
Genera texto a partir de más de un archivo de imagen
Generar texto a partir de entradas de audio, video y documentos (como PDFs)
Genera imágenes con los modelos de Gemini o Imagen
Proporcionar archivos con URLs en solicitudes multimodales Debes proporcionar archivos como datos intercalados a los modelos integrados en el dispositivo
Enviar solicitudes que superen los 4,000 tokens (o aproximadamente 3,000 palabras en inglés)
Chat de varios turnos
Proporcionar herramientas al modelo para ayudarlo a generar su respuesta (como llamadas a funciones, ejecución de código, contexto de URL y fundamentación con la Búsqueda de Google)

La supervisión de la IA en la consola de Firebase no muestra ningún dato sobre la inferencia integrado en el dispositivo (incluidos los registros del dispositivo). Sin embargo, cualquier inferencia que use un modelo alojado en la nube se puede supervisar como cualquier otra inferencia a través de Firebase AI Logic.

Limitaciones adicionales

Además de lo anterior, la inferencia integrada en el dispositivo tiene las siguientes limitaciones (obtén más información en la documentación de ML Kit):

El usuario final de tu app debe usar un dispositivo compatible para la inferencia integrada en el dispositivo.
Tu app solo puede ejecutar la inferencia integrado en el dispositivo cuando está en primer plano.
Solo se validaron el inglés y el coreano para la inferencia integrada en el dispositivo.
El límite máximo de tokens para toda la solicitud de inferencia integrado en el dispositivo es de 4,000 tokens. Si es posible que tus solicitudes superen este límite, asegúrate de configurar un modo de inferencia que pueda usar un modelo alojado en la nube.
Te recomendamos que evites los casos de uso de inferencia integrado en el dispositivo que requieran una salida extensa (más de 256 tokens).
AICore (un servicio del sistema Android que administra los modelos integrados en el dispositivo) aplica una cuota de inferencia por app. Si realizas demasiadas solicitudes a la API en un período breve, recibirás una respuesta ErrorCode.BUSY. Si recibes este error, considera usar la retirada exponencial para reintentar la solicitud. Además, se puede devolver ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED si una app supera una cuota de larga duración (por ejemplo, la cuota diaria).

Enviar comentarios sobre tu experiencia con Firebase AI Logic

Crea experiencias híbridas en apps para Android con modelos alojados en la nube y en el dispositivo Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Casos de uso recomendados y funciones compatibles

Casos de uso recomendados

Funciones y capacidades compatibles con la inferencia integrada en el dispositivo

Antes de comenzar

Dispositivos Android compatibles y sus modelos integrados en el dispositivo

Comenzar

Paso 1: Configura un proyecto de Firebase y conecta tu app a Firebase

Paso 2: Agrega los SDKs requeridos

Kotlin

Java

Paso 3: Verifica si el modelo integrado en el dispositivo está disponible

Kotlin

Java

Optimización de la latencia

Paso 4: Inicializa el servicio y crea una instancia del modelo

Kotlin

Java

Paso 5: Envía una solicitud de instrucción a un modelo

Generar texto a partir de entrada de solo texto

Kotlin

Java

Genera texto a partir de entradas de texto y de imágenes (multimodales)

Kotlin

Java

¿Qué más puedes hacer?

Funciones aún no disponibles para la inferencia integrada en el dispositivo

Limitaciones adicionales

Crea experiencias híbridas en apps para Android con modelos alojados en la nube y en el dispositivo