Firebase is back at Cloud Next on April 9 - 11. Register now.

Se usó la API de Cloud Translation para traducir esta página.

Más información sobre los modelos compatibles

En el caso de las apps para dispositivos móviles y la Web, los SDK de Vertex AI in Firebase te permiten interactuar con los modelos Gemini compatibles directamente desde tu app.

Los modelos Gemini se consideran multimodales porque son capaces de procesar e incluso generar varias modalidades, como texto, código, archivos PDF, imágenes, video y audio.

A continuación, se incluye una breve descripción general de los modelos compatibles con Vertex AI in Firebase y sus versiones estables más recientes. En las secciones posteriores de esta página, se proporcionan comparaciones y detalles más detallados.

Modelo	Entrada	Salida	Optimizado para
Modelos Gemini
Gemini 2.0 Flash `gemini-2.0-flash-001`	texto, código, PDF, imágenes, video y audio	texto, código, JSON (próximamente imágenes y audio)	Funciones, velocidad y generación multimodal de nueva generación para una gran variedad de tareas
Gemini 1.5 Pro `gemini-1.5-pro-002`	texto, código, PDF, imágenes, video y audio	texto, código, JSON	Tareas de razonamiento complejas que requieren más inteligencia
Gemini 1.5 Flash `gemini-1.5-flash-002`	texto, código, PDF, imágenes, video y audio	texto, código, JSON	Rendimiento rápido y versátil en una amplia variedad de tareas

¿Vertex AI in Firebase admite modelos más antiguos, como los modelos Gemini 1.0?

Sí, Vertex AI in Firebase admite todos los modelos Gemini, incluidos los más antiguos.

Modelo	Entrada	Salida	Optimizado para
Gemini 1.0 Pro Vision `gemini-1.0-pro-vision-001`	texto, código, archivos PDF, imágenes y video (solo fotogramas)	texto, código	Controla el texto, las imágenes y el video para las respuestas de texto o código. No se puede usar para chatear.
Gemini 1.0 Pro `gemini-1.0-pro-002`	texto, código	texto, código	Tareas de lenguaje natural, chat de código y texto de varios turnos, y generación de código

En la parte inferior de esta página, puedes ver información detallada sobre los modelos más antiguos. Consulta nuestras Preguntas frecuentes sobre todos los modelos que Vertex AI in Firebase admite y no admite.

En el resto de esta página, se proporciona información detallada sobre los modelos que admite Vertex AI in Firebase:

Comparar modelos:
- Entradas y salidas compatibles
- Comparación de alto nivel de las funciones compatibles
- Especificaciones y limitaciones, por ejemplo, la cantidad máxima de tokens de entrada o la duración máxima del video de entrada
Descripción de cómo se crean versiones de los modelos, en particular, sus versiones estables, actualizadas automáticamente y preliminares
Listas de nombres de modelos disponibles para incluir en tu código durante la inicialización
Listas de los idiomas admitidos para los modelos

En la parte inferior de esta página, puedes ver información detallada sobre los modelos más antiguos.

Compara modelos

Cada modelo tiene diferentes capacidades para admitir varios casos de uso. Ten en cuenta que cada una de las tablas de esta sección describe cada modelo cuando se usa con Vertex AI in Firebase. Cada modelo puede tener funciones adicionales que no están disponibles cuando se usan nuestros SDKs.

Puedes obtener más información sobre cada uno de los modelos Gemini en la documentación de Google Cloud.

Entradas y salidas compatibles

Estos son los tipos de entrada y salida compatibles cuando se usa cada modelo con Vertex AI in Firebase:

	Gemini 2.0 Flash	Gemini 1.5 Pro	Gemini 1.5 Flash
Tipos de entrada
Texto
Código
Documentos (PDF o texto sin formato)
Imágenes, video y audio
Audio (transmisión)	próximamente
Tipos de salida
Texto
Resultados estructurados (como JSON)
Código
Imágenes	próximamente
Audio	próximamente
Audio (transmisión)	próximamente

Para obtener información sobre los tipos de archivos compatibles, consulta Archivos de entrada y requisitos compatibles para Vertex AI Gemini API.

Funciones y capacidades compatibles

Estas son las funciones y capacidades compatibles cuando se usa cada modelo con Vertex AI in Firebase:

		Gemini 2.0 Flash
Genera texto a partir de entradas de texto o multimodales
Generar imágenes		próximamente
Genera audio		próximamente
Genera un resultado estructurado (como JSON).
Analizar imágenes y videos (visión)
Cómo analizar audio
Analiza documentos (PDF o texto sin formato)
Chat de varios turnos
Llamadas a función (herramientas)
	Llamadas a funciones básicas
	Llamadas a función paralelas
	Modo de llamada a función
Recuento de tokens y caracteres facturables
Instrucciones del sistema
API de Multimodal Live (transmisión bidireccional)		próximamente

Especificaciones y limitaciones

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Vertex AI in Firebase:

Propiedad	Gemini 2.0 Flash	Gemini 1.5 Pro	Gemini 1.5 Flash
Ventana de contexto * Límite total de tokens (entrada y salida combinadas)	1,048,576 tokens	2,097,152 tokens	1,048,576 tokens
Límite de tokens de salida *	8,192 tokens	8,192 tokens	8,192 tokens
Fecha límite de conocimiento	Junio de 2024	Mayo de 2024	Mayo de 2024
Imágenes (por solicitud)
Cantidad máxima de imágenes de entrada	3,000 imágenes	3,000 imágenes	3,000 imágenes
Cantidad máxima de imágenes de salida	próximamente	---	---
Tamaño máximo por imagen codificada en base64 de entrada	7 MB	7 MB	7 MB
PDF (si se solicita)
Cantidad máxima de archivos PDF de entrada **	3,000 archivos	3,000 archivos	3,000 archivos
Cantidad máxima de páginas por archivo PDF de entrada **	1,000 páginas	1,000 páginas	1,000 páginas
Tamaño máximo por archivo PDF de entrada	50 MB	50 MB	50 MB
Video (por solicitud)
Cantidad máxima de archivos de video de entrada	10 archivos	10 archivos	10 archivos
Es la duración máxima de todo el video de entrada (solo fotogramas).	Aproximadamente 60 minutos	Aproximadamente 60 minutos	Aproximadamente 60 minutos
Es la duración máxima de todo el video de entrada (fotogramas y audio).	45 minutos aprox.	45 minutos aprox.	45 minutos aprox.
Audio (por solicitud)
Cantidad máxima de archivos de audio de entrada	1 archivo	1 archivo	1 archivo
Cantidad máxima de archivos de audio de salida	próximamente	---	---
Es la duración máxima de todo el audio de entrada.	Aprox. 8.4 horas	Aprox. 8.4 horas	Aprox. 8.4 horas
Es la duración máxima de todo el audio de salida.	próximamente	---	---

^{* En todos los modelos, un token equivale a alrededor de 4 caracteres, por lo que 100 tokens son entre 60 y 80 palabras en inglés. En el caso de los modelos de Gemini, puedes determinar el recuento total de tokens en tus solicitudes con countTokens.}

^{** Los archivos PDF se tratan como imágenes, por lo que una sola página de un PDF se considera una sola imagen. La cantidad de páginas permitidas en una solicitud se limita a la cantidad

de imágenes que puede admitir el modelo.}

Obtén información detallada adicional

Las cuotas y los precios son diferentes para cada modelo. Los precios también dependen de las entradas y salidas.
Obtén información sobre los tipos de archivos de entrada admitidos, cómo especificar el tipo de MIME y cómo asegurarte de que tus archivos de entrada y solicitudes multimodales cumplan con los requisitos y sigan las prácticas recomendadas en Requisitos y tipos de archivos de entrada admitidos para Vertex AI Gemini API.

Patrones de nombres y control de versiones de modelos

Los modelos se ofrecen en versiones estables, actualizadas automáticamente y de versión preliminar.

Las versiones estables se consideran de disponibilidad general.
- Las versiones estables tienen nombres de modelos a los que se les agrega un número de versión específico de tres dígitos, por ejemplo, gemini-2.0-flash-001 .
Las versiones actualizadas automáticamente siempre apuntan a la versión estable más reciente de ese modelo. Si se lanza una nueva versión estable, la versión actualizada automáticamente comienza a apuntar automáticamente a esa nueva versión estable.
- Las versiones actualizadas automáticamente tienen nombres de modelos sin ningún tipo de terminación, por ejemplo, gemini-2.0-flash.
Las versiones de vista previa tienen funciones nuevas y se consideran no estables. Ten en cuenta que las versiones preliminares siempre apuntan a la versión preliminar más reciente de ese modelo. Si se lanza una versión preliminar nueva, cualquier versión preliminar existente comienza a apuntar automáticamente a esa versión preliminar nueva.
- Las versiones preliminares tienen nombres de modelos agregados con -preview junto con la fecha de lanzamiento inicial del modelo (-MMDD), por ejemplo, gemini-1.5-pro-preview-0409 (lanzado el 9 de abril de 2024).

Obtén más información sobre las versiones de modelos disponibles y su ciclo de vida (Gemini) en la documentación de Google Cloud.

Nombres de modelos disponibles

Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo generativo (que es un paso obligatorio para llamar a la Gemini API).

Puedes usar el extremo publishers.models.list para enumerar todos los nombres de modelos disponibles. Ten en cuenta que esta lista incluirá todos los modelos que admite Vertex AI, pero Vertex AI in Firebase solo admite los modelos Gemini que se describen en esta página. Además, ten en cuenta que las versiones actualizadas automáticamente (por ejemplo, gemini-2.0-flash) no se enumeran porque son un alias conveniente para el modelo estable base.

Nombres de los modelos Gemini

Para ver ejemplos de inicialización en tu idioma, consulta la guía de introducción.

Nombres de los modelos Gemini 2.0 Flash

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-2.0-flash-001`	La versión estable más reciente de Gemini 2.0 Flash	Disponibilidad general	2025-02-05	Sin establecer
Versión actualizada automáticamente
`gemini-2.0-flash`	Hace referencia a la versión estable más reciente de Flash 2.0 (actualmente, `gemini-2.0-flash-001`).	Disponibilidad general	2025-02-10	---

Nombres de los modelos Gemini 1.5 Pro

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.5-pro-002`	La versión estable más reciente de Gemini 1.5 Pro	Disponibilidad general	2024-09-24	A partir del 24 de septiembre de 2025
`gemini-1.5-pro-001`	Versión estable inicial de Gemini 1.5 Pro	Disponibilidad general	2024-05-24	A partir del 24/05/2025
Versión actualizada automáticamente
`gemini-1.5-pro`	Hace referencia a la versión estable más reciente de 1.5 Pro (actualmente, `gemini-1.5-pro-002`).	Disponibilidad general	2024-09-24	---

Nombres de los modelos Gemini 1.5 Flash

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.5-flash-002`	La versión estable más reciente de Gemini 1.5 Flash	Disponibilidad general	2024-09-24	A partir del 24 de septiembre de 2025
`gemini-1.5-flash-001`	Versión estable inicial de Gemini 1.5 Flash	Disponibilidad general	2024-05-24	A partir del 24/05/2025
Versión actualizada automáticamente
`gemini-1.5-flash`	Hace referencia a la versión estable más reciente de Flash 1.5 (actualmente, `gemini-1.5-flash-002`).	Disponibilidad general	2024-09-24	---

Idiomas admitidos

Gemini

Todos los modelos de Gemini pueden comprender y responder en los siguientes idiomas:

Árabe (ar), bengalí (bn), búlgaro (bg), chino simplificado y tradicional (zh), croata (hr), checo (cs), danés (da), neerlandés (nl), español (es), estonio (et), finlandés (fi), francés (fr), alemán (de), griego (el), hebreo (iw), hindi (hi), húngaro (hu), indonesio (id), italiano (it), japonés (ja), coreano (ko), letón (lv), lituano (lt), noruego (no), polaco (pl), portugués (pt), rumano (ro), ruso (ru), serbio (sr), eslovaco (sk), esloveno (sl), sueco (sv), tailandés (th), turco (tr), ucraniano (uk) y vietnamita (vi)
Los modelos Gemini 1.5 Pro y Gemini 1.5 Flash pueden comprender y responder en los siguientes idiomas adicionales:

Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)

Información sobre modelos más antiguos

Vertex AI in Firebase admite todos los modelos Gemini, incluidos los más antiguos, como Gemini 1.0 Pro y Gemini 1.0 Pro Vision. Sin embargo, te recomendamos que uses un modelo más reciente con nuestros SDKs. Estos modelos más antiguos de Gemini están próximos a su fecha de baja y no ofrecen todas las capacidades de los modelos más nuevos.

Cómo ver las entradas y salidas compatibles de modelos más antiguos

Estos son los tipos de entrada y salida cuando se usa cada modelo con Vertex AI in Firebase:

	Gemini 1.0 Pro Vision	Gemini 1.0 Pro
Tipos de entrada
Texto
Código
Imagen
Documentos (PDF o texto sin formato)
Video (solo fotogramas)
Video (fotogramas y audio)
Audio
Tipos de salida
Texto
Código
Imágenes, video y audio

Funciones y capacidades compatibles de modelos más antiguos

Estas son las funciones y capacidades cuando se usa cada modelo con Vertex AI in Firebase:

		Gemini 1.0 Pro Vision	Gemini 1.0 Pro
Genera texto a partir de una entrada de solo texto
Genera texto a partir de una entrada multimodal
Genera imágenes, videos o audio
Genera un resultado estructurado (como JSON) con el esquema de respuesta
Chat de varios turnos
Llamadas a función (herramientas)
	Llamadas a funciones básicas
	Llamadas a función paralelas
	Modo de llamada a función
Recuento de tokens y caracteres facturables
Instrucciones del sistema

Especificaciones y limitaciones de los modelos más antiguos

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Vertex AI in Firebase:

Propiedad	Gemini 1.0 Pro Vision	Gemini 1.0 Pro
Ventana de contexto * Límite total de tokens (entrada y salida combinadas)	16,384 tokens	32,760 tokens
Límite de tokens de salida *	2,048 tokens	8,192 tokens
Fecha de corte de Knowledge	Febrero de 2023	Febrero de 2023
Imágenes (por solicitud)
Cantidad máxima de imágenes de entrada	16 imágenes	---
Tamaño máximo por imagen de entrada codificada en base64	7 MB	---
PDF (si se solicita)
Cantidad máxima de archivos PDF de entrada **	16 archivos	---
Cantidad máxima de páginas por archivo PDF de entrada **	16 páginas	---
Tamaño máximo por archivo PDF de entrada	50 MB	---
Video (por solicitud)
Cantidad máxima de archivos de video de entrada	1 archivo	---
Es la duración máxima de todo el video de entrada (solo fotogramas).	2 minutos	---
Es la duración máxima de todo el video de entrada (fotogramas y audio).	---	---
Audio (por solicitud)
Cantidad máxima de archivos de audio de entrada	---	---
Es la duración máxima de todo el audio de entrada.	---	---

Nombres de modelos disponibles de modelos más antiguos

Nombres de los modelos Gemini 1.0 Pro Vision

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.0-pro-vision-001`	La versión estable más reciente de Gemini 1.0 Pro Vision	Disponibilidad general	2024-02-15	No antes del 15/02/2025
Versión actualizada automáticamente
`gemini-1.0-pro-vision`	Hace referencia a la versión estable más reciente de 1.5 Pro Vision (actualmente, `gemini-1.5-pro-vision-001`).	Disponibilidad general	2024-01-04	---

Nombres de los modelos Gemini 1.0 Pro

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento inicial	Fecha de descontinuación
Versiones estables
`gemini-1.0-pro-002`	La versión estable más reciente de Gemini 1.0 Pro	Disponibilidad general	2024-04-09	A partir del 9/04/2025
`gemini-1.0-pro-001`	Versión estable de Gemini 1.0 Pro	Disponibilidad general	2024-02-15	No antes del 15/02/2025
Versión actualizada automáticamente
`gemini-1.0-pro`	Apunta a la versión estable más reciente de 1.0 Pro (actualmente, `gemini-1.0-pro-002`).	Disponibilidad general	2024-02-15	---

Próximos pasos

Prueba las capacidades de Gemini API

Crea conversaciones de varios turnos (chat).
Genera texto a partir de instrucciones de solo texto.
Genera texto a partir de instrucciones multimodales (incluidos texto, imágenes, PDF, video y audio).
Genera resultados estructurados (como JSON) a partir de instrucciones multimodales y de texto.
Usa las llamadas a función para conectar los modelos generativos a sistemas y datos externos.