Для мобильных и веб-приложений пакеты Firebase AI Logic SDK позволяют взаимодействовать с поддерживаемыми моделями Gemini и моделями Imagen непосредственно из вашего приложения.
Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать различные модальности, включая текст, код, PDF-файлы, изображения, видео и аудио. Модели Imagen могут генерировать изображения, используя текстовые подсказки.
В таблице ниже представлен краткий обзор поддерживаемых моделей Firebase AI Logic и их последних стабильных названий. В этой таблице также перечислены предварительные и экспериментальные модели, доступные для создания прототипов.
Также ознакомьтесь с нашими часто задаваемыми вопросами обо всех моделях, которые Firebase AI Logic поддерживает и не поддерживает.
Модели Близнецов
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Gemini со стабильными версиями | |||
Джемини 2.5 Проgemini-2.5-pro | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая продвинутая модель рассуждения, способная решать сложные проблемы. |
Близнецы 2.5 Флэшgemini-2.5-flash | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша модель мышления предлагает великолепные, комплексные возможности. Она разработана для достижения баланса между ценой и производительностью. |
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая сбалансированная модель Gemini , оптимизированная для случаев использования с низкой задержкой и экономичных приложений. |
Флэш-изображение Gemini 2.5gemini-2.5-flash-image | текст, код, PDF-файлы, изображения | изображения, текст и изображения | Наша стандартная модель Flash модернизирована для ускорения творческих рабочих процессов с возможностью создания изображений и диалогового многопоточного редактирования. (также известная как «нано-банан»). |
Gemini 2.0 Flashgemini-2.0-flash-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша мультимодальная модель с функциями нового поколения и улучшенными возможностями, включая превосходную скорость, встроенное использование инструментов и контекстное окно токенов размером 1 млн. |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая быстрая и экономичная модель Flash. Это вариант обновления для пользователей 1.5 Flash, которым нужно лучшее качество по той же цене и скорости. |
Модели Gemini , доступные только в виде предварительных и экспериментальных версий (рекомендуется использовать только для создания прототипов) | |||
Генерация Flash-изображений Gemini 2.0gemini-2.0-flash-preview-image-generation | текст, код, PDF-файлы, изображения | изображения, текст и изображения | Наша многомодальная модель, которая поддерживает многомодальный ввод и вывод изображений. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | текст (потоковый), аудио (потоковое) | текст (потоковый), аудио (потоковое) | Наша многомодальная модель поддерживает потоковую передачу многомодальных входов и выходов в реальном времени с малой задержкой. |
1 Дополнительные названия моделей поддерживают Live API в зависимости от выбранного вами поставщика API Gemini и доступа (см. страницу Live API ).
Модели изображений
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Imagen со стабильными версиями | |||
Имидж 4imagen-4.0-generate-001 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Imagen 4 Fastimagen-4.0-fast-generate-001 | текст | изображения | Генерирует изображения для создания прототипов или использования с малой задержкой |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Имидж 3imagen-3.0-generate-002 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | текст | изображения | Генерирует изображения для создания прототипов или использования с малой задержкой |
Imagen 3 Возможности 2imagen-3.0-capability-001 | текст, изображения | изображения | Редактирует и генерирует изображения; поддерживает как редактирование на основе масок, так и настройку с использованием эталонных изображений. |
Модели Imagen только с предварительными и экспериментальными версиями (рекомендуется только для создания прототипов) | |||
--- | --- | --- | --- |
2 Не поддерживается API разработчика Gemini независимо от способа доступа к нему.
Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Firebase AI Logic .
- Поддерживаемый ввод и вывод
- Высокоуровневое сравнение поддерживаемых возможностей
- Характеристики и ограничения, например, максимальное количество входных токенов или максимальная длина входного видео.
Описание того, как создаются версии моделей , в частности их стабильные , автоматически обновляемые , предварительные и экспериментальные версии.
Списки доступных названий моделей для включения в код во время инициализации
Списки поддерживаемых языков для моделей
Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .
Сравнить модели
Каждая модель обладает различными возможностями для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Firebase AI Logic . Каждая модель может обладать дополнительными возможностями, недоступными при использовании наших SDK.
Если вы не нашли нужную информацию в следующих подразделах, вы можете найти еще больше информации в документации выбранного вами поставщика API:
API разработчика Gemini : модели Gemini и модели Imagen
Vertex AI Gemini API : модели Gemini и модели Imagen
Поддерживаемый ввод и вывод
Ниже приведены поддерживаемые типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (генерировать) | Imagen (возможность) | |
---|---|---|---|---|---|---|---|---|
Типы входных данных | ||||||||
Текст | ||||||||
Текст (потоковый) | ||||||||
Код | ||||||||
Документы (PDF-файлы или обычный текст) | ||||||||
Изображения | ||||||||
Видео | ||||||||
Аудио | ||||||||
Аудио (потоковое) | ||||||||
Типы выходных данных | ||||||||
Текст | ||||||||
Текст (потоковый) | ||||||||
Код | ||||||||
Структурированный вывод (например, JSON) | ||||||||
Изображения | ||||||||
Аудио | ||||||||
Аудио (потоковое) |
Информацию о поддерживаемых типах файлов см. в разделе Поддерживаемые входные файлы и требования .
Поддерживаемые возможности и функции
Ниже перечислены поддерживаемые возможности и функции при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (генерировать) | Imagen (возможность) | |
---|---|---|---|---|---|---|---|---|
Мышление | ||||||||
Генерация текста из текстовых или многомодальных входных данных | чередующийся или как часть изображения | чередующийся или как часть изображения | только потоковая передача | |||||
Генерировать изображения ( Близнецы или Имидж ) | ||||||||
Редактировать изображения ( Близнецы или Имидж ) | ||||||||
Генерировать аудио | только потоковая передача | |||||||
Генерация структурированного вывода (например, JSON) | ||||||||
Анализировать документы (PDF-файлы или обычный текст) | ||||||||
Анализ изображений (зрение) | ||||||||
Анализ видео (зрение) | ||||||||
Анализировать аудио | только потоковая передача | |||||||
Многооборотный чат | ||||||||
Двунаправленная мультимодальная потоковая передача | ||||||||
Вызов функции | ||||||||
Выполнение кода | ||||||||
Заземление с помощью поиска Google | ||||||||
Системные инструкции | ||||||||
Подсчет токенов |
Характеристики и ограничения
Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :
Свойство | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (генерировать) | Imagen (возможность) |
---|---|---|---|---|---|---|---|---|
Контекстное окно * Общий лимит токенов (комбинированный вход+выход) | 1 048 576 токенов | 32,768 токенов | 1 048 576 токенов | 1 048 576 токенов | 32,768 токенов | 32,768 токенов | 480 токенов | 480 токенов |
Лимит выходных токенов * | 65 536 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | --- | --- |
Дата окончания сбора знаний | Январь 2025 г. | Июнь 2025 г. | Июнь 2024 г. | Июнь 2024 г. | Август 2024 г. | Август 2024 г. | --- | --- |
PDF-файлы (по запросу) | ||||||||
Максимальное количество входных PDF-файлов ** | 3000 файлов | 3 файла | 3000 файлов | 3000 файлов | 3000 файлов | --- | --- | --- |
Максимальное количество страниц за каждый входной PDF-файл ** | 1000 страниц | 3 страницы | 1000 страниц | 1000 страниц | 1000 страниц | --- | --- | --- |
Максимальный размер на каждый входной PDF-файл | 50 МБ | 50 МБ | 50 МБ | 50 МБ | 50 МБ | --- | --- | --- |
Изображения (по запросу) | ||||||||
Максимальное количество входных изображений | 3000 изображений | 3 изображения | 3000 изображений | 3000 изображений | 3000 изображений | --- | --- | 4 изображения |
Максимальное количество выходных изображений | --- | 10 изображений | --- | --- | 10 изображений | --- | 4 изображения | 4 изображения |
Максимальный размер на входное изображение, закодированное в формате base64 | 7 МБ | 7 МБ | 7 МБ | 7 МБ | 7 МБ | --- | --- | --- |
Видео (по запросу) | ||||||||
Максимальное количество входных видеофайлов | 10 файлов | --- | 10 файлов | 10 файлов | --- | --- | --- | --- |
Максимальная длина всех входных видео (только кадры) | ~60 минут | --- | ~60 минут | ~60 минут | --- | --- | --- | --- |
Максимальная длина всех входных видео (кадры+аудио) | ~45 минут | --- | ~45 минут | ~45 минут | --- | --- | --- | --- |
Аудио (по запросу) | ||||||||
Максимальное количество входных аудиофайлов | 1 файл | --- | 1 файл | 1 файл | --- | --- | --- | --- |
Максимальное количество выходных аудиофайлов | --- | --- | --- | --- | --- | --- | --- | --- |
Максимальная длина всех входных аудиосигналов | ~8,4 часа | ~8,4 часа | ~8,4 часа | ~8,4 часа | --- | --- | --- | --- |
Максимальная длина всех выходных аудиосигналов | --- | --- | --- | --- | --- | --- | --- | --- |
* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов соответствуют примерно 60–80 английским словам. Для моделей Gemini общее количество токенов в запросах можно определить с помощью countTokens
.
** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, поддерживаемых моделью.
Найти дополнительную подробную информацию
Квоты и цены различаются для каждой модели. Цена также зависит от входных и выходных данных.
Узнайте о поддерживаемых типах входных файлов, о том, как указать тип MIME и как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям, а также о том, как следовать передовым практикам в разделе Поддерживаемые входные файлы и требования .
Модели управления версиями и именования
Модели доступны в стабильной , предварительной и экспериментальной версиях. Для удобства поддерживаются псевдонимы без явного указания версии.
Чтобы найти конкретные названия моделей для использования в вашем коде, см. раздел «Доступные названия моделей» далее на этой странице.
Тип версии / Стадия релиза | Описание | Шаблон названия модели | |
---|---|---|---|
Стабильный | Стабильные версии доступны и поддерживаются для использования в производственной среде, начиная с даты выпуска. Стабильная версия модели обычно выпускается с датой окончания срока службы, которая обозначает последний день, когда модель доступна. После этой даты модель больше не доступна и не поддерживается Google. |
| |
Автоматически обновляемый стабильный псевдоним (только модели Gemini 2.0 ) | Автоматически обновляемые стабильные псевдонимы всегда указывают на последнюю стабильную версию данной модели. При выходе новой стабильной версии автоматически обновляемый псевдоним автоматически начинает указывать на неё. | Только модели Gemini 2.0 Пример: | |
Предварительный просмотр | Предварительные версии обладают новыми возможностями и считаются нестабильными . Эти модели не рекомендуются для использования в производственной среде, имеют более строгие ограничения по скорости и могут иметь требования к выставлению счетов. Для API Vertex AI Gemini предварительные модели, выпущенные после июня 2025 года, обычно требуют установки | Названия моделей предварительных версий дополнены Пример: | |
Экспериментальный | Экспериментальные версии обладают новыми возможностями и считаются нестабильными . Эти модели не рекомендуются для использования в производственной среде и имеют более строгие ограничения по скорости. Экспериментальные модели предназначены для сбора отзывов и экспериментов с нашими новейшими функциями. Для API Vertex AI Gemini экспериментальные модели, выпущенные после июня 2025 года, требуют установки | Названия моделей экспериментальных версий дополнены Пример: | |
Ушедший на пенсию | Устаревшие версии уже вышли из эксплуатации и были окончательно деактивированы. Устаревшие модели больше не доступны и не поддерживаются Google, а запросы, ссылающиеся на идентификатор устаревшей модели, обычно возвращают ошибку 404. | --- |
Доступные названия моделей
Имена моделей — это явные значения, которые вы включаете в код во время инициализации модели.
Gemini Перейти к названиям моделей Imagen Перейти к названиям моделей
Программно вывести список всех доступных моделей
Вы можете получить список всех доступных названий моделей, используя REST API:
API разработчика Gemini : вызов конечной точки
models.list
API Vertex AI Gemini : вызов конечной точки
publishers.models.list
Обратите внимание, что этот возвращаемый список будет включать все модели, поддерживаемые поставщиками API, но Firebase AI Logic поддерживает только модели Gemini и Imagen , описанные на этой странице. Также обратите внимание, что автоматически обновляемые псевдонимы (например, gemini-2.0-flash
) не перечислены, поскольку они являются вспомогательным псевдонимом для базовой модели.
Названия моделей Gemini
Примеры инициализации для вашей платформы см. в руководстве по началу работы .
Подробную информацию об этапах выпуска (особенно в части вариантов использования и выставления счетов) см. в разделе «Шаблоны управления версиями и именования моделей» .
Названия моделей Gemini 2.5 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-pro | Стабильная версия Gemini 2.5 Pro | Стабильный | 2025-06-17 | Не ранее чем 2026-06-17 |
Названия моделей Gemini 2.5 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash | Стабильная версия Gemini 2.5 Flash | Стабильный | 2025-06-17 | Не ранее чем 2026-06-17 |
Названия моделей Gemini 2.5 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-lite | Стабильная версия Gemini 2.5 Flash‑Lite | Стабильный | 2025-07-22 | Не ранее чем 2026-07-22 |
Названия моделей изображений Gemini 2.5 Flash (также известных как «nano banana»)
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-image | Стабильная версия для образа Gemini 2.5 Flash (также известного как «nano banana») | Стабильный | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | Предварительная версия образа Gemini 2.5 Flash (также известного как «nano banana») | Предварительный просмотр | 2025-08-26 | 31 октября 2025 г. |
Названия моделей Gemini 2.5 Flash Live
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-live-2.5-flash | Стабильная версия для Gemini 2.5 Flash Live | Стабильный (частный GA) 1 | 2025-06-01 | Не ранее чем 2026-06-01 |
gemini-live-2.5-flash-preview 2 | Предварительная версия для Gemini 2.5 Flash Live | Предварительный просмотр | 2025-06-01 | Будет определено |
Обратите внимание, что в названиях моделей 2.5 для Live API сегмент live
следует сразу за сегментом gemini
.
Firebase AI Logic пока не поддерживает собственные аудиомодели (например gemini-2.5-flash-native-audio-preview-09-2025
).
1. Обратитесь к представителю вашей команды по работе с клиентами Google Cloud , чтобы запросить доступ.
2 Не поддерживается API Vertex AI Gemini независимо от способа доступа к нему.
Названия моделей Gemini 2.0 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-001 | Последняя стабильная версия Gemini 2.0 Flash | Стабильный | 2025-02-05 | Не ранее чем 2026-02-05 |
gemini-2.0-flash | Автоматически обновленный псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash (в настоящее время gemini-2.0-flash-001 ) | Стабильный | 2025-02-10 | --- |
Названия моделей Gemini 2.0 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Последняя стабильная версия Gemini 2.0 Flash‑Lite | Стабильный | 2025-02-25 | Не ранее чем 2026-02-25 |
gemini-2.0-flash-lite | Автоматически обновляемый псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash‑Lite (в настоящее время gemini-2.0-flash-lite-001 ) | Стабильный | 2025-02-25 | --- |
Названия моделей генерации изображений Flash Gemini 2.0
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | Предварительная версия для создания Flash-изображений Gemini 2.0 | Предварительный просмотр | 2025-05-06 | 31 октября 2025 г. |
Названия моделей Gemini 2.0 Flash Live
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | Стабильная версия для Gemini 2.0 Flash Live | Стабильный | 2025-04-01 | Не ранее чем 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | Предварительная версия для Gemini 2.0 Flash Live | Предварительный просмотр | 2025-04-09 | Будет определено |
2 Не поддерживается API Vertex AI Gemini независимо от способа доступа к нему.
Названия моделей Imagen
Примеры инициализации для вашей платформы см. в руководстве по созданию изображений с помощью Imagen .
Подробную информацию об этапах выпуска (особенно в части вариантов использования и выставления счетов) см. в разделе «Шаблоны управления версиями и именования моделей» .
Названия моделей Imagen 4
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-generate-001 | Стабильная версия Imagen 4 | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-generate-preview-06-06 | Предварительная версия Imagen 4 | Предварительный просмотр | 2025-06-06 | Еще в начале 2025-08-14 |
Названия моделей Imagen 4 Fast
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | Стабильная версия Imagen 4 Fast | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-fast-generate-preview-06-06 3 | Предварительная версия Imagen 4 Fast (скоро будет выведен из эксплуатации — не использовать) | Предварительный просмотр | 2025-06-06 | Еще в начале 2025-08-14 |
Названия моделей Imagen 4 Ultra
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Стабильная версия Imagen 4 Ultra | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-ultra-generate-preview-06-06 | Предварительная версия Imagen 4 Ultra (скоро будет выведен из эксплуатации — не использовать) | Предварительный просмотр | 2025-06-06 | Еще в начале 2025-08-14 |
Названия моделей Imagen 3
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-generate-002 | Последняя стабильная версия Imagen 3 | Стабильный | 2025-01-23 | Не ранее 23.01.2026 |
imagen-3.0-generate-001 3 | Первоначальная стабильная версия Imagen 3 | Стабильный | 2024-07-31 | Не ранее 31.07.2025 |
Названия моделей Imagen 3 Fast
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Первоначальная стабильная версия Imagen 3 Fast | Стабильный | 2024-07-31 | Не ранее 31.07.2025 |
3 Не поддерживается API разработчика Gemini независимо от способа доступа к нему.
Названия моделей возможностей Imagen 3
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-capability-001 3 | Первоначальная стабильная версия Imagen 3 Возможности | Стабильный | 2024-12-10 | Не ранее 10 декабря 2025 г. |
3 Не поддерживается API разработчика Gemini независимо от способа доступа к нему.
Поддерживаемые языки
Близнецы
Все модели Gemini понимают и могут отвечать на следующих языках:
Арабский (ar), бенгальский (bn), болгарский (bg), китайский упрощенный и традиционный (zh), хорватский (hr), чешский (cs), датский (da), голландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), иврит (iw), хинди (hi), венгерский (hu), индонезийский (id), итальянский (it), японский (ja), корейский (ko), латышский (lv), литовский (lt), норвежский (no), польский (pl), португальский (pt), румынский (ro), русский (ru), сербский (sr), словацкий (sk), словенский (sl), испанский (es), суахили (sw), шведский (sv), тайский (th), турецкий (tr), украинский (uk), вьетнамский (vi)
Модели Gemini 2.0 Flash , Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:
Африкаанс (af), амхарский (am), ассамский (as), азербайджанский (az), белорусский (be), боснийский (bs), каталанский (ca), кебуанский (ceb), корсиканский (co), валлийский (cy), дивехи (dv), эсперанто (eo), баскский (eu), персидский (fa), филиппинский (тагальский) (fil), фризский (fy), ирландский (ga), шотландский гэльский (gd), галисийский (gl), гуджарати (gu), хауса (ha), гавайский (haw), хмонг (hmn), гаитянский креольский (ht), армянский (hy), игбо (ig), исландский (is), яванский (jv), грузинский (ka), казахский (kk), кхмерский (km), каннада (kn), крио (kri), курдский (ku), кыргызский (ky), латынь (la), люксембургский (lb), лаосский (lo), Малагасийский (мг), маори (ми), македонский (mk), малаялам (ml), монгольский (mn), Meiteilon (Manipuri) (mni-Mtei), маратхи (mr), малайский (ms), мальтийский (mt), мьянманский (бирманский) (my), непальский (ne), ньянджа (чичева) (ny), одиа (ория) (или), пенджабский (pa), пушту (ps), синдхи (sd), сингальский (сингальский) (si), самоанский (sm), шона (sn), сомалийский (so), албанский (sq), сесото (st), суданский (su), тамильский (ta), телугу (te), таджикский (tg), уйгурский (ug), урду (ur), узбекский (uz), коса (xh), идиш (yi), йоруба (yo), зулу (zu)
Имиджен
Общая доступность : английский
Предварительный просмотр : китайский (упрощенный), китайский (традиционный), хинди, японский, корейский, португальский, испанский
Информация о старых моделях
Модель | Вход | Выход | Оптимизировано для |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
Это типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Gemini 1.0 Pro Vision | Джемини 1.0 Про | ||||
---|---|---|---|---|---|---|---|
Типы входных данных | |||||||
Текст | |||||||
Код | |||||||
Документы (PDF-файлы или обычный текст) | |||||||
Изображения | |||||||
Видео | |||||||
Аудио | |||||||
Аудио (потоковое) | |||||||
Типы выходных данных | |||||||
Текст | |||||||
Код | |||||||
Структурированный вывод (например, JSON) | |||||||
Изображения, видео и аудио |
Ниже приведены возможности и функции при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Gemini 1.0 Pro Vision | Джемини 1.0 Про | |
---|---|---|---|---|
Генерация текста из введенных данных | ||||
Генерация текста из многомодального ввода | ||||
Генерировать изображения | ||||
Генерировать аудио | ||||
Генерация структурированного вывода (например, JSON) | ||||
Анализировать документы (PDF-файлы или обычный текст) | ||||
Анализ изображений (зрение) | ||||
Анализ видео (зрение) | ||||
Анализировать аудио | ||||
Многооборотный чат | ||||
Вызов функций (инструменты) | ||||
Подсчет токенов и оплачиваемых символов | ||||
Системные инструкции | ||||
Двунаправленная мультимодальная потоковая передача |
Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Gemini 1.0 Pro Vision | Джемини 1.0 Про | ||||
---|---|---|---|---|---|---|---|
Контекстное окно * Общий лимит токенов (комбинированный вход+выход) | 2 097 152 токенов | 1 048 576 токенов | 16 384 токенов | 32,760 токенов | |||
Лимит выходных токенов * | 8,192 токенов | 8,192 токенов | 2048 токенов | 8,192 токенов | |||
Дата окончания сбора знаний | Май 2024 г. | Май 2024 г. | Февраль 2023 г. | Февраль 2023 г. | |||
PDF-файлы (по запросу) | |||||||
Максимальное количество входных PDF-файлов ** | 3000 файлов | 3000 файлов | 16 файлов | --- | |||
Максимальное количество страниц во входном PDF-файле ** | 1000 страниц | 1000 страниц | 16 страниц | --- | |||
Максимальный размер на каждый входной PDF-файл | 50 МБ | 50 МБ | 50 МБ | --- | |||
Изображения (по запросу) | |||||||
Максимальное количество входных изображений | 3000 изображений | 3000 изображений | 16 изображений | --- | |||
Максимальное количество выходных изображений | --- | --- | --- | --- | |||
Максимальный размер на входное изображение, закодированное в формате base64 | 7 МБ | 7 МБ | 7 МБ | --- | |||
Видео (по запросу) | |||||||
Максимальное количество входных видеофайлов | 10 файлов | 10 файлов | 1 файл | --- | |||
Максимальная длина всех входных видео (только кадры) | ~60 минут | ~60 минут | 2 минуты | --- | |||
Максимальная длина всех входных видео (кадры+аудио) | ~45 минут | ~45 минут | --- | --- | |||
Аудио (по запросу) | |||||||
Максимальное количество входных аудиофайлов | 1 файл | 1 файл | --- | --- | |||
Максимальное количество выходных аудиофайлов | --- | --- | --- | --- | |||
Максимальная длина всех входных аудиосигналов | ~8,4 часа | ~8,4 часа | --- | --- | |||
Максимальная длина всех выходных аудиосигналов | --- | --- | --- | --- |
* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов соответствуют примерно 60–80 английским словам. Для моделей Gemini общее количество токенов в запросах можно определить с помощью countTokens
.
** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, поддерживаемых моделью.
Имена моделей — это явные значения, которые вы включаете в код во время инициализации модели.
Названия моделей Gemini 1.5 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.5-pro-002 | Последняя стабильная версия Gemini 1.5 Pro | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Первоначальная стабильная версия Gemini 1.5 Pro | Предстоящий выход на пенсию | 2024-05-24 | 2025-05-24 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.5-pro | Указывает на последнюю стабильную версию 1.5 Pro (в настоящее время gemini-1.5-pro-002 ) | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
Названия моделей Gemini 1.5 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.5-flash-002 | Последняя стабильная версия Gemini 1.5 Flash | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Первоначальная стабильная версия Gemini 1.5 Flash | Предстоящий выход на пенсию | 2024-05-24 | 2025-05-24 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.5-flash | Указывает на последнюю стабильную версию 1.5 Flash (в настоящее время gemini-1.5-flash-002 ) | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
Названия моделей Gemini 1.0 Pro Vision
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.0-pro-vision-001 | Последняя стабильная версия Gemini 1.0 Pro Vision | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.0-pro-vision | Указывает на последнюю стабильную версию 1.5 Pro Vision (в настоящее время gemini-1.5-pro-vision-001 ) | Ушедший на пенсию | 2024-01-04 | 2025-04-21 |
Названия моделей Gemini 1.0 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.0-pro-002 | Последняя стабильная версия Gemini 1.0 Pro | Ушедший на пенсию | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Стабильная версия Gemini 1.0 Pro | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.0-pro | Указывает на последнюю стабильную версию 1.0 Pro (в настоящее время gemini-1.0-pro-002 ) | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Следующие шаги
Попробуйте возможности API Gemini
- Создавайте многовариантные беседы (чаты) .
- Генерация текста из текстовых подсказок .
- Сгенерируйте текст, используя различные типы файлов, такие как изображения , PDF-файлы , видео и аудио .
- Генерируйте структурированный вывод (например, JSON) из текстовых и многомодальных запросов.
- Генерация изображений из текстовых подсказок ( Gemini или Imagen ).
- Потоковая передача входных и выходных данных (включая аудио) с использованием Gemini Live API .
- Используйте инструменты (например, вызов функций и привязку к Google Search ) для подключения модели Gemini к другим частям вашего приложения, внешним системам и информации.
Для мобильных и веб-приложений пакеты Firebase AI Logic SDK позволяют взаимодействовать с поддерживаемыми моделями Gemini и моделями Imagen непосредственно из вашего приложения.
Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать различные модальности, включая текст, код, PDF-файлы, изображения, видео и аудио. Модели Imagen могут генерировать изображения, используя текстовые подсказки.
В таблице ниже представлен краткий обзор поддерживаемых моделей Firebase AI Logic и их последних стабильных названий. В этой таблице также перечислены предварительные и экспериментальные модели, доступные для создания прототипов.
Также ознакомьтесь с нашими часто задаваемыми вопросами обо всех моделях, которые Firebase AI Logic поддерживает и не поддерживает.
Модели Близнецов
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Gemini со стабильными версиями | |||
Джемини 2.5 Проgemini-2.5-pro | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая продвинутая модель рассуждения, способная решать сложные проблемы. |
Близнецы 2.5 Флэшgemini-2.5-flash | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша модель мышления предлагает великолепные, комплексные возможности. Она разработана для достижения баланса между ценой и производительностью. |
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая сбалансированная модель Gemini , оптимизированная для случаев использования с низкой задержкой и экономичных приложений. |
Флэш-изображение Gemini 2.5gemini-2.5-flash-image | текст, код, PDF-файлы, изображения | изображения, текст и изображения | Наша стандартная модель Flash модернизирована для ускорения творческих рабочих процессов с возможностью создания изображений и диалогового многопоточного редактирования. (также известная как «нано-банан»). |
Gemini 2.0 Flashgemini-2.0-flash-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша мультимодальная модель с функциями нового поколения и улучшенными возможностями, включая превосходную скорость, встроенное использование инструментов и контекстное окно токенов размером 1 млн. |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая быстрая и экономичная модель Flash. Это вариант обновления для пользователей 1.5 Flash, которым нужно лучшее качество по той же цене и скорости. |
Модели Gemini , доступные только в виде предварительных и экспериментальных версий (рекомендуется использовать только для создания прототипов) | |||
Генерация Flash-изображений Gemini 2.0gemini-2.0-flash-preview-image-generation | текст, код, PDF-файлы, изображения | изображения, текст и изображения | Наша многомодальная модель, которая поддерживает многомодальный ввод и вывод изображений. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | текст (потоковый), аудио (потоковое) | текст (потоковый), аудио (потоковое) | Наша многомодальная модель поддерживает потоковую передачу многомодальных входов и выходов в реальном времени с малой задержкой. |
1 Дополнительные названия моделей поддерживают Live API в зависимости от выбранного вами поставщика API Gemini и доступа (см. страницу Live API ).
Модели изображений
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Imagen со стабильными версиями | |||
Имидж 4imagen-4.0-generate-001 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Imagen 4 Fastimagen-4.0-fast-generate-001 | текст | изображения | Генерирует изображения для создания прототипов или использования с малой задержкой |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Имидж 3imagen-3.0-generate-002 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | текст | изображения | Генерирует изображения для создания прототипов или использования с малой задержкой |
Imagen 3 Возможности 2imagen-3.0-capability-001 | текст, изображения | изображения | Редактирует и генерирует изображения; поддерживает как редактирование на основе масок, так и настройку с использованием эталонных изображений. |
Модели Imagen только с предварительными и экспериментальными версиями (рекомендуется только для создания прототипов) | |||
--- | --- | --- | --- |
2 Не поддерживается API разработчика Gemini независимо от способа доступа к нему.
Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Firebase AI Logic .
- Поддерживаемый ввод и вывод
- Высокоуровневое сравнение поддерживаемых возможностей
- Характеристики и ограничения, например, максимальное количество входных токенов или максимальная длина входного видео.
Описание того, как создаются версии моделей , в частности их стабильные , автоматически обновляемые , предварительные и экспериментальные версии.
Списки доступных названий моделей для включения в код во время инициализации
Списки поддерживаемых языков для моделей
Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .
Сравнить модели
Каждая модель обладает различными возможностями для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Firebase AI Logic . Каждая модель может обладать дополнительными возможностями, недоступными при использовании наших SDK.
Если вы не нашли нужную информацию в следующих подразделах, вы можете найти еще больше информации в документации выбранного вами поставщика API:
API разработчика Gemini : модели Gemini и модели Imagen
Vertex AI Gemini API : модели Gemini и модели Imagen
Поддерживаемый ввод и вывод
Ниже приведены поддерживаемые типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (генерировать) | Imagen (возможность) | |
---|---|---|---|---|---|---|---|---|
Типы входных данных | ||||||||
Текст | ||||||||
Текст (потоковый) | ||||||||
Код | ||||||||
Документы (PDF-файлы или обычный текст) | ||||||||
Изображения | ||||||||
Видео | ||||||||
Аудио | ||||||||
Аудио (потоковое) | ||||||||
Типы выходных данных | ||||||||
Текст | ||||||||
Текст (потоковый) | ||||||||
Код | ||||||||
Структурированный вывод (например, JSON) | ||||||||
Изображения | ||||||||
Аудио | ||||||||
Аудио (потоковое) |
Информацию о поддерживаемых типах файлов см. в разделе Поддерживаемые входные файлы и требования .
Поддерживаемые возможности и функции
Ниже перечислены поддерживаемые возможности и функции при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (генерировать) | Imagen (возможность) | |
---|---|---|---|---|---|---|---|---|
Мышление | ||||||||
Генерация текста из текстовых или многомодальных входных данных | чередующийся или как часть изображения | чередующийся или как часть изображения | только потоковая передача | |||||
Генерировать изображения ( Близнецы или Имидж ) | ||||||||
Редактировать изображения ( Близнецы или Имидж ) | ||||||||
Генерировать аудио | только потоковая передача | |||||||
Генерация структурированного вывода (например, JSON) | ||||||||
Анализировать документы (PDF-файлы или обычный текст) | ||||||||
Анализ изображений (зрение) | ||||||||
Анализ видео (зрение) | ||||||||
Анализировать аудио | только потоковая передача | |||||||
Многооборотный чат | ||||||||
Двунаправленная мультимодальная потоковая передача | ||||||||
Вызов функции | ||||||||
Выполнение кода | ||||||||
Заземление с помощью поиска Google | ||||||||
Системные инструкции | ||||||||
Подсчет токенов |
Характеристики и ограничения
Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :
Свойство | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (генерировать) | Imagen (возможность) |
---|---|---|---|---|---|---|---|---|
Контекстное окно * Общий лимит токенов (комбинированный вход+выход) | 1 048 576 токенов | 32,768 токенов | 1 048 576 токенов | 1 048 576 токенов | 32,768 токенов | 32,768 токенов | 480 токенов | 480 токенов |
Лимит выходных токенов * | 65 536 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | --- | --- |
Дата окончания сбора знаний | Январь 2025 г. | Июнь 2025 г. | Июнь 2024 г. | Июнь 2024 г. | Август 2024 г. | Август 2024 г. | --- | --- |
PDF-файлы (по запросу) | ||||||||
Максимальное количество входных PDF-файлов ** | 3000 файлов | 3 файла | 3000 файлов | 3000 файлов | 3000 файлов | --- | --- | --- |
Максимальное количество страниц за каждый входной PDF-файл ** | 1000 страниц | 3 страницы | 1000 страниц | 1000 страниц | 1000 страниц | --- | --- | --- |
Максимальный размер на каждый входной PDF-файл | 50 МБ | 50 МБ | 50 МБ | 50 МБ | 50 МБ | --- | --- | --- |
Изображения (по запросу) | ||||||||
Максимальное количество входных изображений | 3000 изображений | 3 изображения | 3000 изображений | 3000 изображений | 3000 изображений | --- | --- | 4 изображения |
Максимальное количество выходных изображений | --- | 10 изображений | --- | --- | 10 изображений | --- | 4 изображения | 4 изображения |
Максимальный размер на входное изображение, закодированное в формате base64 | 7 МБ | 7 МБ | 7 МБ | 7 МБ | 7 МБ | --- | --- | --- |
Видео (по запросу) | ||||||||
Максимальное количество входных видеофайлов | 10 файлов | --- | 10 файлов | 10 файлов | --- | --- | --- | --- |
Максимальная длина всех входных видео (только кадры) | ~60 минут | --- | ~60 минут | ~60 минут | --- | --- | --- | --- |
Максимальная длина всех входных видео (кадры+аудио) | ~45 минут | --- | ~45 минут | ~45 минут | --- | --- | --- | --- |
Аудио (по запросу) | ||||||||
Максимальное количество входных аудиофайлов | 1 файл | --- | 1 файл | 1 файл | --- | --- | --- | --- |
Максимальное количество выходных аудиофайлов | --- | --- | --- | --- | --- | --- | --- | --- |
Максимальная длина всех входных аудиосигналов | ~8,4 часа | ~8,4 часа | ~8,4 часа | ~8,4 часа | --- | --- | --- | --- |
Максимальная длина всех выходных аудиосигналов | --- | --- | --- | --- | --- | --- | --- | --- |
* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов соответствуют примерно 60–80 английским словам. Для моделей Gemini общее количество токенов в запросах можно определить с помощью countTokens
.
** PDF-файлы рассматриваются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.
Найти дополнительную подробную информацию
Квоты и цены различны для каждой модели. Цена также зависит от ввода и вывода.
Узнайте о поддерживаемых типах входных файлов, о том, как указать тип MIME и как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям, и следуйте рекомендациям в разделе Поддерживаемые входные файлы и требования .
Модели управления версиями и шаблоны именования
Модели предлагаются в стабильной , предварительной и экспериментальной версиях. Для удобства поддерживаются псевдонимы без явных значений версии.
Чтобы найти конкретные имена моделей для использования в вашем коде, см. раздел «Доступные имена моделей» ниже на этой странице.
Тип версии / Стадия релиза | Описание | Образец названия модели | |
---|---|---|---|
Стабильный | Стабильные версии доступны и поддерживаются для промышленного использования, начиная с даты выпуска. Стабильная версия модели обычно выпускается с датой выхода из эксплуатации, которая указывает на последний день доступности модели. После этой даты модель больше не будет доступна и не будет поддерживаться Google. |
| |
Автоматически обновляемый стабильный псевдоним (Только модели Gemini 2.0 ) | Автоматически обновляемые псевдонимы стабильных версий всегда указывают на последнюю стабильную версию этой модели. Если выпускается новая стабильная версия, автоматически обновляемый псевдоним автоматически начинает указывать на эту новую стабильную версию. | Только модели Gemini 2.0 Пример: | |
Предварительный просмотр | Предварительные версии имеют новые возможности и считаются нестабильными . Эти модели не рекомендуются для промышленного использования, имеют более строгие ограничения по тарифам и могут предъявлять требования к выставлению счетов. Для Vertex AI Gemini API модели предварительной версии, выпущенные после июня 2025 года, обычно требуют установки | Названия моделей предварительных версий добавляются с помощью Пример: | |
Экспериментальный | Экспериментальные версии имеют новые возможности и считаются не стабильными . Эти модели не рекомендуются для промышленного использования и имеют более строгие ограничения по скорости. Экспериментальные модели предназначены для сбора отзывов и возможности экспериментировать с нашими новейшими функциями. Для API Vertex AI Gemini экспериментальные модели, выпущенные после июня 2025 года, требуют установки | Названия моделей экспериментальных версий добавляются через Пример: | |
Ушедший на пенсию | Срок годности устаревших версий истек, и они были окончательно деактивированы. Устаревшие модели больше не доступны и не поддерживаются Google, а запросы, ссылающиеся на идентификатор устаревшей модели, обычно возвращают ошибку 404. | --- |
Доступные названия моделей
Имена моделей — это явные значения, которые вы включаете в свой код во время инициализации модели.
Gemini Перейти к названиям моделей Imagen Перейти к названиям моделей
Программно перечислить все доступные модели
Вы можете перечислить все доступные имена моделей, используя REST API:
API разработчика Gemini : вызов конечной точки
models.list
API Vertex AI Gemini : вызов конечной
publishers.models.list
.
Обратите внимание, что этот возвращаемый список будет включать все модели, поддерживаемые поставщиками API, но Firebase AI Logic поддерживает только модели Gemini и Imagen , описанные на этой странице. Также обратите внимание, что автоматически обновляемые псевдонимы (например, gemini-2.0-flash
) не указаны, поскольку они являются удобным псевдонимом для базовой модели.
Названия моделей Gemini
Примеры инициализации для вашей платформы см. в руководстве по началу работы .
Подробные сведения об этапах выпуска (особенно о вариантах использования и выставлении счетов) см. в разделе шаблоны управления версиями и именованиями моделей .
Названия моделей Gemini 2.5 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-pro | Стабильная версия Gemini 2.5 Pro | Стабильный | 2025-06-17 | Не ранее, чем 17.06.2026 |
Названия моделей Gemini 2.5 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash | Стабильная версия Gemini 2.5 Flash | Стабильный | 2025-06-17 | Не ранее, чем 2026-06-17 |
Названия моделей Gemini 2.5 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-lite | Стабильная версия Gemini 2.5 Flash‑Lite | Стабильный | 2025-07-22 | Не ранее, чем 2026-07-22 |
Названия моделей флэш-изображений Gemini 2.5 (также известные как «нано-банан»)
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-image | Стабильная версия для флэш-образа Gemini 2.5 (также известного как «нано-банан») | Стабильный | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | Предварительная версия флэш-изображения Gemini 2.5 (также известного как «нано-банан») | Предварительный просмотр | 2025-08-26 | 31 октября 2025 г. |
Названия моделей Gemini 2.5 Flash Live
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-live-2.5-flash | Стабильная версия для Gemini 2.5 Flash Live | Стабильный (частный GA) 1 | 2025-06-01 | Не ранее, чем 01.06.2026 |
gemini-live-2.5-flash-preview 2 | Предварительная версия для Gemini 2.5 Flash Live | Предварительный просмотр | 2025-06-01 | Будет определено |
Обратите внимание, что в названиях моделей 2.5 для Live API сегмент live
следует сразу за сегментом gemini
.
Firebase AI Logic пока не поддерживает собственные модели звука (например gemini-2.5-flash-native-audio-preview-09-2025
).
1. Обратитесь к представителю вашей группы по работе с аккаунтами Google Cloud и запросите доступ.
2 Не поддерживается API Vertex AI Gemini, независимо от способа доступа к нему.
Названия моделей Gemini 2.0 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-001 | Последняя стабильная версия Gemini 2.0 Flash | Стабильный | 2025-02-05 | Не ранее, чем 2026-02-05 |
gemini-2.0-flash | Автоматически обновляемый псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash. (в настоящее время gemini-2.0-flash-001 ) | Стабильный | 2025-02-10 | --- |
Названия моделей Gemini 2.0 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Последняя стабильная версия Gemini 2.0 Flash‑Lite | Стабильный | 2025-02-25 | Не ранее, чем 2026-02-25 |
gemini-2.0-flash-lite | Автоматически обновляемый псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash‑Lite. (в настоящее время gemini-2.0-flash-lite-001 ) | Стабильный | 2025-02-25 | --- |
Названия моделей Gemini 2.0 Flash Image Generation
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | Предварительная версия для создания флэш-изображений Gemini 2.0 | Предварительный просмотр | 2025-05-06 | 31 октября 2025 г. |
Названия моделей Gemini 2.0 Flash Live
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | Стабильная версия для Gemini 2.0 Flash Live | Стабильный | 2025-04-01 | Не ранее, чем 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | Предварительная версия для Gemini 2.0 Flash Live | Предварительный просмотр | 2025-04-09 | Будет определено |
2 Не поддерживается API Vertex AI Gemini, независимо от способа доступа к нему.
Названия моделей изображений
Примеры инициализации для вашей платформы см. в руководстве по созданию изображений с помощью Imagen .
Подробные сведения об этапах выпуска (особенно о вариантах использования и выставлении счетов) см. в разделе шаблоны управления версиями и именованиями моделей .
Изображение 4 названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-generate-001 | Стабильная версия Imagen 4 | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-generate-preview-06-06 | Предварительная версия Imagen 4 | Предварительный просмотр | 2025-06-06 | Уже как 2025-08-14 |
Изображение 4 Быстрые названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | Стабильная версия Imagen 4 Fast | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-fast-generate-preview-06-06 3 | Предварительная версия Imagen 4 Fast (скоро будет удален - не используйте) | Предварительный просмотр | 2025-06-06 | Уже как 2025-08-14 |
Названия моделей Imagen 4 Ultra
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Стабильная версия Imagen 4 Ultra | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-ultra-generate-preview-06-06 | Предварительная версия Imagen 4 Ultra (скоро будет удален - не используйте) | Предварительный просмотр | 2025-06-06 | Уже как 2025-08-14 |
Изображение 3 названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-generate-002 | Последняя стабильная версия Imagen 3 | Стабильный | 2025-01-23 | Не ранее 23 января 2026 г. |
imagen-3.0-generate-001 3 | Первоначальная стабильная версия Imagen 3 | Стабильный | 2024-07-31 | Не ранее 31 июля 2025 г. |
Изображение 3 Быстрые названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Начальная стабильная версия Imagen 3 Fast | Стабильный | 2024-07-31 | Не ранее 31 июля 2025 г. |
3 Не поддерживается API разработчика Gemini, независимо от способа доступа к нему.
Изображение 3. Названия моделей возможностей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-capability-001 3 | Первоначальная стабильная версия Imagen 3 Capability | Стабильный | 2024-12-10 | Не ранее 10 декабря 2025 г. |
3 Не поддерживается API разработчика Gemini, независимо от способа доступа к нему.
Поддерживаемые языки
Близнецы
Все модели Gemini понимают и отвечают на следующих языках:
Арабский (ar), бенгальский (bn), болгарский (bg), китайский упрощенный и традиционный (zh), хорватский (hr), чешский (cs), датский (da), голландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), иврит (iw), хинди (hi), венгерский (hu), индонезийский (id), итальянский (it), японский (ja), корейский (ko), латышский (lv), литовский (lt), норвежский (no), польский (pl), португальский (pt), румынский (ro), русский (ru), сербский (ср), словацкий (sk), словенский (sl), испанский (es), суахили (sw), шведский (sv), тайский (th), турецкий (tr), украинский (uk), вьетнамский (vi)
Модели Gemini 2.0 Flash , Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Имиджен
Общая доступность : английский
Предварительный просмотр : китайский (упрощенный), китайский (традиционный), хинди, японский, корейский, португальский, испанский.
Информация о старых моделях
Модель | Вход | Выход | Оптимизирован для |
---|---|---|---|
gemini-1.5-pro-002 | | | Поддерживает сложные логические задачи, требующие большего интеллекта; Контекст длиной 2 млн. |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | Обрабатывает текст, изображения и видео для текстовых или кодовых ответов. Невозможно использовать для чата. |
gemini-1.0-pro-002 | | | |
Это типы ввода и вывода при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Близнецы 1.0 Про Видение | Близнецы 1.0 Про | ||||
---|---|---|---|---|---|---|---|
Типы ввода | |||||||
Текст | |||||||
Код | |||||||
Документы (PDF-файлы или обычный текст) | |||||||
Изображения | |||||||
Видео | |||||||
Аудио | |||||||
Аудио (потоковое) | |||||||
Типы вывода | |||||||
Текст | |||||||
Код | |||||||
Структурированный вывод (например, JSON) | |||||||
Изображения, видео и аудио |
Вот возможности и особенности при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Близнецы 1.0 Про Видение | Близнецы 1.0 Про | |
---|---|---|---|---|
Генерировать текст из текстового ввода | ||||
Генерировать текст из мультимодального ввода | ||||
Генерировать изображения | ||||
Генерировать аудио | ||||
Генерация структурированного вывода (например, JSON) | ||||
Анализировать документы (PDF-файлы или обычный текст) | ||||
Анализ изображений (зрение) | ||||
Анализировать видео (видение) | ||||
Анализируйте аудио | ||||
Многоходовой чат | ||||
Вызов функций (инструменты) | ||||
Подсчет токенов и оплачиваемых персонажей | ||||
Системные инструкции | ||||
Двунаправленная мультимодальная потоковая передача |
Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Близнецы 1.0 Про Видение | Близнецы 1.0 Про | ||||
---|---|---|---|---|---|---|---|
Контекстное окно * Общий лимит токенов (комбинированный ввод+выход) | 2 097 152 жетона | 1 048 576 токенов | 16 384 жетона | 32 760 токенов | |||
Лимит выходных токенов * | 8 192 жетона | 8 192 жетона | 2048 токенов | 8 192 жетона | |||
Дата прекращения знаний | Май 2024 г. | Май 2024 г. | Февраль 2023 г. | Февраль 2023 г. | |||
PDF-файлы (по запросу) | |||||||
Максимальное количество входных PDF-файлов ** | 3000 файлов | 3000 файлов | 16 файлов | --- | |||
Максимальное количество страниц на входной PDF-файл ** | 1000 страниц | 1000 страниц | 16 страниц | --- | |||
Максимальный размер за входной PDF-файл | 50 МБ | 50 МБ | 50 МБ | --- | |||
Изображения (по запросу) | |||||||
Максимальное количество входных изображений | 3000 изображений | 3000 изображений | 16 изображений | --- | |||
Максимальное количество выходных изображений | --- | --- | --- | --- | |||
Максимальный размер на каждое входное изображение в кодировке Base64 | 7 МБ | 7 МБ | 7 МБ | --- | |||
Видео (по запросу) | |||||||
Максимальное количество входных видеофайлов | 10 файлов | 10 файлов | 1 файл | --- | |||
Максимальная длина всего входного видео (только рамки) | ~60 минут | ~60 минут | 2 минуты | --- | |||
Максимальная длина всего входного видео (кадры+звук) | ~45 минут | ~45 минут | --- | --- | |||
Аудио (по запросу) | |||||||
Максимальное количество входных аудиофайлов | 1 файл | 1 файл | --- | --- | |||
Максимальное количество выходных аудиофайлов | --- | --- | --- | --- | |||
Максимальная длина всего входного аудио | ~8,4 часа | ~8,4 часа | --- | --- | |||
Максимальная длина всего выходного аудио | --- | --- | --- | --- |
* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов — это примерно 60–80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens
.
** PDF-файлы рассматриваются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.
Имена моделей — это явные значения, которые вы включаете в свой код во время инициализации модели.
Названия моделей Gemini 1.5 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.5-pro-002 | Последняя стабильная версия Gemini 1.5 Pro | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Начальная стабильная версия Gemini 1.5 Pro | Предстоящий выход на пенсию | 2024-05-24 | 2025-05-24 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.5-pro | Указывает на последнюю стабильную версию 1.5 Pro. (в настоящее время gemini-1.5-pro-002 ) | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
Названия моделей Gemini 1.5 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.5-flash-002 | Последняя стабильная версия Gemini 1.5 Flash | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Начальная стабильная версия Gemini 1.5 Flash | Предстоящий выход на пенсию | 2024-05-24 | 2025-05-24 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.5-flash | Указывает на последнюю стабильную версию 1.5 Flash. (в настоящее время gemini-1.5-flash-002 ) | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
Названия моделей Gemini 1.0 Pro Vision
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.0-pro-vision-001 | Последняя стабильная версия Gemini 1.0 Pro Vision | Ушедший на пенсию | 15 февраля 2024 г. | 2025-04-21 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.0-pro-vision | Указывает на последнюю стабильную версию 1.5 Pro Vision. (в настоящее время gemini-1.5-pro-vision-001 ) | Ушедший на пенсию | 2024-01-04 | 2025-04-21 |
Названия моделей Gemini 1.0 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.0-pro-002 | Последняя стабильная версия Gemini 1.0 Pro | Ушедший на пенсию | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Стабильная версия Gemini 1.0 Pro | Ушедший на пенсию | 15 февраля 2024 г. | 2025-04-21 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.0-pro | Указывает на последнюю стабильную версию 1.0 Pro. (в настоящее время gemini-1.0-pro-002 ) | Ушедший на пенсию | 15 февраля 2024 г. | 2025-04-21 |
Следующие шаги
Опробуйте возможности Gemini API
- Стройте многоходовые разговоры (чат) .
- Генерация текста из текстовых подсказок .
- Создавайте текст, предлагая различные типы файлов, например изображения , PDF-файлы , видео и аудио .
- Генерируйте структурированный вывод (например, JSON) как из текстовых, так и из мультимодальных подсказок.
- Генерируйте изображения из текстовых подсказок ( Gemini или Imagen ).
- Потоковый ввод и вывод (включая аудио) с помощью Gemini Live API .
- Используйте инструменты (например, вызов функций и заземление с помощью Google Search ), чтобы связать модель Gemini с другими частями вашего приложения, внешними системами и информацией.
Для мобильных и веб-приложений SDK Firebase AI Logic позволяют взаимодействовать с поддерживаемыми моделями Gemini и моделями Imagen непосредственно из вашего приложения.
Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF-файлы, изображения, видео и аудио. В моделях изображений можно указать текст для создания изображений.
В следующей таблице представлен краткий обзор поддерживаемых моделей Firebase AI Logic и названий их последних стабильных моделей. В этой таблице также перечислены предварительные и экспериментальные модели, доступные для сценариев использования прототипов.
Также ознакомьтесь с нашими часто задаваемыми вопросами обо всех моделях, которые поддерживает и не поддерживает Firebase AI Logic .
Модели Близнецов
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Gemini со стабильными версиями | |||
Джемини 2.5 Проgemini-2.5-pro | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая продвинутая модель рассуждения, способная решать сложные проблемы. |
Близнецы 2.5 Флэшgemini-2.5-flash | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша модель мышления, предлагающая великолепные и всесторонние возможности. Он разработан, чтобы обеспечить баланс между ценой и производительностью. |
Близнецы 2.5 Flash‑Litegemini-2.5-flash-lite | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая сбалансированная модель Gemini , оптимизированная для сценариев использования с малой задержкой и экономичных приложений. |
Флэш-изображение Gemini 2.5gemini-2.5-flash-image | текст, код, PDF-файлы, изображения | изображения, текст и изображения | Наша стандартная модель Flash обновлена для ускорения творческих рабочих процессов благодаря созданию изображений и возможностям диалогового многоэтапного редактирования. (он же «нанобанан») |
Gemini 2.0 Flashgemini-2.0-flash-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша мультимодальная модель с функциями нового поколения и улучшенными возможностями, включая превосходную скорость, встроенные инструменты и контекстное окно токена 1M. |
Близнецы 2.0 Flash‑Litegemini-2.0-flash-lite-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая быстрая и экономичная модель Flash. Это вариант обновления для пользователей Flash 1.5, которым нужно лучшее качество по той же цене и скорости. |
Модели Gemini только с предварительной и экспериментальной версиями (рекомендуется только для случаев использования прототипов) | |||
Gemini 2.0 Создание флэш-изображенийgemini-2.0-flash-preview-image-generation | текст, код, PDF-файлы, изображения | изображения, текст и изображения | Наша мультимодальная модель, поддерживающая мультимодальный ввод и вывод изображений. |
Близнецы 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | текст (потоковая передача), аудио (потоковое) | текст (потоковая передача), аудио (потоковое) | Наша мультимодальная модель, которая поддерживает потоковую передачу мультимодальных входных и выходных данных в реальном времени с малой задержкой. |
1 Дополнительные названия моделей поддерживают Live API в зависимости от выбранного вами поставщика Gemini API и доступа (см. страницу Live API ).
Модели изображений
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Imagen со стабильными версиями | |||
Имидж 4imagen-4.0-generate-001 | текст | изображения | Генерирует реалистичные высококачественные изображения из текстовых подсказок на естественном языке. |
Imagen 4 Fastimagen-4.0-fast-generate-001 | текст | изображения | Генерирует изображения для прототипирования или сценариев использования с малой задержкой. |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | текст | изображения | Генерирует реалистичные высококачественные изображения из текстовых подсказок на естественном языке. |
Имидж 3imagen-3.0-generate-002 | текст | изображения | Генерирует реалистичные высококачественные изображения из текстовых подсказок на естественном языке. |
Изображение 3 Быстрое 2imagen-3.0-fast-generate-001 | текст | изображения | Генерирует изображения для прототипирования или сценариев использования с малой задержкой. |
Изображение 3 Возможность 2imagen-3.0-capability-001 | текст, изображения | изображения | Редактирует и генерирует изображения; поддерживает как редактирование на основе маски, так и настройку с использованием эталонных изображений |
Модели Imagen только с предварительной и экспериментальной версиями (рекомендуется только для случаев использования прототипов) | |||
--- | --- | --- | --- |
2 Не поддерживается API разработчика Gemini, независимо от способа доступа к нему.
Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Firebase AI Logic .
- Поддерживаемый ввод и вывод
- Высокоуровневое сравнение поддерживаемых возможностей
- Характеристики и ограничения, например максимальное количество входных токенов или максимальная длина входного видео.
Описание того, как создаются версии моделей , в частности их стабильные , автоматически обновляемые , предварительные и экспериментальные версии.
Списки доступных названий моделей для включения в ваш код во время инициализации.
Списки поддерживаемых языков для моделей
Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .
Сравнить модели
Каждая модель имеет разные возможности для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Firebase AI Logic . Каждая модель может иметь дополнительные возможности, недоступные при использовании наших SDK.
Если вы не можете найти нужную информацию в следующих подразделах, вы можете найти еще больше информации в документации выбранного вами поставщика API:
Gemini Developer API : модели Gemini и модели Imagen
Vertex AI Gemini API : модели Gemini и модели Imagen
Поддерживаемый ввод и вывод
Ниже приведены поддерживаемые типы ввода и вывода при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Pro, Флэш, Флэш-Лайт | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Флэш- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Флэш- Жить | Изображение (сгенерировать) | Изображение (возможность) | |
---|---|---|---|---|---|---|---|---|
Типы ввода | ||||||||
Текст | ||||||||
Текст (потоковая передача) | ||||||||
Код | ||||||||
Документы (PDF-файлы или обычный текст) | ||||||||
Изображения | ||||||||
Видео | ||||||||
Аудио | ||||||||
Аудио (потоковое) | ||||||||
Типы вывода | ||||||||
Текст | ||||||||
Текст (потоковая передача) | ||||||||
Код | ||||||||
Структурированный вывод (например, JSON) | ||||||||
Изображения | ||||||||
Аудио | ||||||||
Аудио (потоковое) |
Дополнительные сведения о поддерживаемых типах файлов см. в разделе Поддерживаемые входные файлы и требования .
Поддерживаемые возможности и функции
Ниже приведены поддерживаемые возможности и функции при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Pro, Флэш, Флэш-Лайт | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Флэш- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Флэш- Жить | Изображение (сгенерировать) | Изображение (возможность) | |
---|---|---|---|---|---|---|---|---|
Мышление | ||||||||
Генерация текста из текстовых или мультимодальных входных данных | чередующиеся или как часть изображения | чередующиеся или как часть изображения | только потоковая передача | |||||
Генерировать изображения ( Близнецы или Образ ) | ||||||||
Редактировать изображения ( Близнецы или Образ ) | ||||||||
Генерировать аудио | только потоковая передача | |||||||
Генерация структурированного вывода (например, JSON) | ||||||||
Анализировать документы (PDF-файлы или обычный текст) | ||||||||
Анализ изображений (зрение) | ||||||||
Анализировать видео (видение) | ||||||||
Анализируйте аудио | только потоковая передача | |||||||
Многоходовой чат | ||||||||
Двунаправленная мультимодальная потоковая передача | ||||||||
Вызов функции | ||||||||
Выполнение кода | ||||||||
Заземление с помощью поиска Google | ||||||||
Системные инструкции | ||||||||
Подсчитайте жетоны |
Технические характеристики и ограничения
Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :
Свойство | Близнецы 2.5 Pro, Флэш, Флэш-Лайт | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Флэш- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Флэш- Жить | Изображение (сгенерировать) | Изображение (возможность) |
---|---|---|---|---|---|---|---|---|
Контекстное окно * Общий лимит токенов (комбинированный ввод+выход) | 1 048 576 токенов | 32 768 токенов | 1 048 576 токенов | 1 048 576 токенов | 32 768 токенов | 32 768 токенов | 480 жетонов | 480 жетонов |
Лимит выходных токенов * | 65 536 токенов | 8 192 жетона | 8 192 жетона | 8 192 жетона | 8 192 жетона | 8 192 жетона | --- | --- |
Дата прекращения знаний | Январь 2025 г. | Июнь 2025 г. | Июнь 2024 г. | Июнь 2024 г. | Август 2024 г. | Август 2024 г. | --- | --- |
PDF-файлы (по запросу) | ||||||||
Максимальное количество входных PDF-файлов ** | 3000 файлов | 3 файла | 3000 файлов | 3000 файлов | 3000 файлов | --- | --- | --- |
Максимальное количество страниц за входной PDF-файл ** | 1000 страниц | 3 страницы | 1000 страниц | 1000 страниц | 1000 страниц | --- | --- | --- |
Максимальный размер за входной PDF-файл | 50 МБ | 50 МБ | 50 МБ | 50 МБ | 50 МБ | --- | --- | --- |
Изображения (по запросу) | ||||||||
Максимальное количество входных изображений | 3000 изображений | 3 изображения | 3000 изображений | 3000 изображений | 3000 изображений | --- | --- | 4 изображения |
Максимальное количество выходных изображений | --- | 10 изображений | --- | --- | 10 изображений | --- | 4 изображения | 4 изображения |
Максимальный размер на каждое входное изображение в кодировке Base64 | 7 МБ | 7 МБ | 7 МБ | 7 МБ | 7 МБ | --- | --- | --- |
Видео (по запросу) | ||||||||
Максимальное количество входных видеофайлов | 10 файлов | --- | 10 файлов | 10 файлов | --- | --- | --- | --- |
Максимальная длина всего входного видео (только рамки) | ~60 минут | --- | ~60 минут | ~60 минут | --- | --- | --- | --- |
Максимальная длина всего входного видео (кадры+звук) | ~45 минут | --- | ~45 минут | ~45 минут | --- | --- | --- | --- |
Аудио (по запросу) | ||||||||
Максимальное количество входных аудиофайлов | 1 файл | --- | 1 файл | 1 файл | --- | --- | --- | --- |
Максимальное количество выходных аудиофайлов | --- | --- | --- | --- | --- | --- | --- | --- |
Максимальная длина всего входного аудио | ~8,4 часа | ~8,4 часа | ~8,4 часа | ~8,4 часа | --- | --- | --- | --- |
Максимальная длина всего выходного аудио | --- | --- | --- | --- | --- | --- | --- | --- |
* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов — это примерно 60–80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens
.
** PDF-файлы рассматриваются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.
Найти дополнительную подробную информацию
Квоты и цены различны для каждой модели. Цена также зависит от ввода и вывода.
Узнайте о поддерживаемых типах входных файлов, о том, как указать тип MIME и как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям, и следуйте рекомендациям в разделе Поддерживаемые входные файлы и требования .
Модели управления версиями и шаблоны именования
Модели предлагаются в стабильной , предварительной и экспериментальной версиях. Для удобства поддерживаются псевдонимы без явных значений версии.
Чтобы найти конкретные имена моделей для использования в вашем коде, см. раздел «Доступные имена моделей» ниже на этой странице.
Тип версии / Стадия релиза | Описание | Образец названия модели | |
---|---|---|---|
Стабильный | Стабильные версии доступны и поддерживаются для промышленного использования, начиная с даты выпуска. Стабильная версия модели обычно выпускается с датой выхода из эксплуатации, которая указывает на последний день доступности модели. После этой даты модель больше не будет доступна и не будет поддерживаться Google. |
| |
Автоматически обновляемый стабильный псевдоним (Только модели Gemini 2.0 ) | Автоматически обновляемые псевдонимы стабильных версий всегда указывают на последнюю стабильную версию этой модели. Если выпускается новая стабильная версия, автоматически обновляемый псевдоним автоматически начинает указывать на эту новую стабильную версию. | Только модели Gemini 2.0 Пример: | |
Предварительный просмотр | Предварительные версии имеют новые возможности и считаются нестабильными . Эти модели не рекомендуются для промышленного использования, имеют более строгие ограничения по тарифам и могут предъявлять требования к выставлению счетов. Для Vertex AI Gemini API модели предварительной версии, выпущенные после июня 2025 года, обычно требуют установки | Названия моделей предварительных версий добавляются с помощью Пример: | |
Экспериментальный | Экспериментальные версии имеют новые возможности и считаются не стабильными . Эти модели не рекомендуются для промышленного использования и имеют более строгие ограничения по скорости. Экспериментальные модели предназначены для сбора отзывов и возможности экспериментировать с нашими новейшими функциями. Для API Vertex AI Gemini экспериментальные модели, выпущенные после июня 2025 года, требуют установки | Названия моделей экспериментальных версий добавляются через Пример: | |
Ушедший на пенсию | Срок годности устаревших версий истек, и они были окончательно деактивированы. Устаревшие модели больше не доступны и не поддерживаются Google, а запросы, ссылающиеся на идентификатор устаревшей модели, обычно возвращают ошибку 404. | --- |
Доступные названия моделей
Имена моделей — это явные значения, которые вы включаете в свой код во время инициализации модели.
Gemini Перейти к названиям моделей Imagen Перейти к названиям моделей
Программно перечислить все доступные модели
Вы можете перечислить все доступные имена моделей, используя REST API:
API разработчика Gemini : вызов конечной точки
models.list
API Vertex AI Gemini : вызов конечной
publishers.models.list
.
Обратите внимание, что этот возвращаемый список будет включать все модели, поддерживаемые поставщиками API, но Firebase AI Logic поддерживает только модели Gemini и Imagen , описанные на этой странице. Также обратите внимание, что автоматически обновляемые псевдонимы (например, gemini-2.0-flash
) не указаны, поскольку они являются удобным псевдонимом для базовой модели.
Названия моделей Gemini
Примеры инициализации для вашей платформы см. в руководстве по началу работы .
Подробные сведения об этапах выпуска (особенно о вариантах использования и выставлении счетов) см. в разделе шаблоны управления версиями и именованиями моделей .
Названия моделей Gemini 2.5 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-pro | Стабильная версия Gemini 2.5 Pro | Стабильный | 2025-06-17 | Не ранее, чем 17.06.2026 |
Названия моделей Gemini 2.5 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash | Стабильная версия Gemini 2.5 Flash | Стабильный | 2025-06-17 | Не ранее, чем 17.06.2026 |
Названия моделей Gemini 2.5 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-lite | Стабильная версия Gemini 2.5 Flash‑Lite | Стабильный | 2025-07-22 | Не ранее, чем 2026-07-22 |
Названия моделей флэш-изображений Gemini 2.5 (также известные как «нано-банан»)
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-image | Стабильная версия для флэш-образа Gemini 2.5 (также известного как «нано-банан») | Стабильный | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | Предварительная версия флэш-изображения Gemini 2.5 (также известного как «нано-банан») | Предварительный просмотр | 2025-08-26 | 31 октября 2025 г. |
Названия моделей Gemini 2.5 Flash Live
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-live-2.5-flash | Стабильная версия для Gemini 2.5 Flash Live | Стабильный (частный GA) 1 | 2025-06-01 | Не ранее, чем 01.06.2026 |
gemini-live-2.5-flash-preview 2 | Предварительная версия для Gemini 2.5 Flash Live | Предварительный просмотр | 2025-06-01 | Будет определено |
Обратите внимание, что в названиях моделей 2.5 для Live API сегмент live
следует сразу за сегментом gemini
.
Firebase AI Logic пока не поддерживает собственные модели звука (например gemini-2.5-flash-native-audio-preview-09-2025
).
1. Обратитесь к представителю вашей группы по работе с аккаунтами Google Cloud и запросите доступ.
2 Не поддерживается API Vertex AI Gemini, независимо от способа доступа к нему.
Названия моделей Gemini 2.0 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-001 | Последняя стабильная версия Gemini 2.0 Flash | Стабильный | 2025-02-05 | Не ранее, чем 2026-02-05 |
gemini-2.0-flash | Автоматически обновляемый псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash. (в настоящее время gemini-2.0-flash-001 ) | Стабильный | 2025-02-10 | --- |
Названия моделей Gemini 2.0 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Последняя стабильная версия Gemini 2.0 Flash‑Lite | Стабильный | 2025-02-25 | Не ранее, чем 2026-02-25 |
gemini-2.0-flash-lite | Автоматически обновляемый псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash‑Lite. (в настоящее время gemini-2.0-flash-lite-001 ) | Стабильный | 2025-02-25 | --- |
Названия моделей Gemini 2.0 Flash Image Generation
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | Предварительная версия для создания флэш-изображений Gemini 2.0 | Предварительный просмотр | 2025-05-06 | 31 октября 2025 г. |
Названия моделей Gemini 2.0 Flash Live
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | Стабильная версия для Gemini 2.0 Flash Live | Стабильный | 2025-04-01 | Не ранее, чем 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | Предварительная версия для Gemini 2.0 Flash Live | Предварительный просмотр | 2025-04-09 | Будет определено |
2 Не поддерживается API Vertex AI Gemini, независимо от способа доступа к нему.
Названия моделей изображений
Примеры инициализации для вашей платформы см. в руководстве по созданию изображений с помощью Imagen .
Подробные сведения об этапах выпуска (особенно о вариантах использования и выставлении счетов) см. в разделе шаблоны управления версиями и именованиями моделей .
Изображение 4 названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-generate-001 | Стабильная версия Imagen 4 | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-generate-preview-06-06 | Предварительная версия Imagen 4 | Предварительный просмотр | 2025-06-06 | Уже как 2025-08-14 |
Изображение 4 Быстрые названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | Стабильная версия Imagen 4 Fast | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-fast-generate-preview-06-06 3 | Предварительная версия Imagen 4 Fast (скоро будет удален - не используйте) | Предварительный просмотр | 2025-06-06 | Уже как 2025-08-14 |
Названия моделей Imagen 4 Ultra
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Стабильная версия Imagen 4 Ultra | Стабильный | 2025-08-14 | Не ранее 14 августа 2026 г. |
imagen-4.0-ultra-generate-preview-06-06 | Предварительная версия Imagen 4 Ultra (скоро будет удален - не используйте) | Предварительный просмотр | 2025-06-06 | Уже как 2025-08-14 |
Изображение 3 названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-generate-002 | Последняя стабильная версия Imagen 3 | Стабильный | 2025-01-23 | Не ранее 23 января 2026 г. |
imagen-3.0-generate-001 3 | Первоначальная стабильная версия Imagen 3 | Стабильный | 2024-07-31 | Не ранее 31 июля 2025 г. |
Изображение 3 Быстрые названия моделей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Начальная стабильная версия Imagen 3 Fast | Стабильный | 2024-07-31 | Не ранее 31 июля 2025 г. |
3 Не поддерживается API разработчика Gemini, независимо от способа доступа к нему.
Изображение 3. Названия моделей возможностей
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-capability-001 3 | Первоначальная стабильная версия Imagen 3 Capability | Стабильный | 2024-12-10 | Не ранее 10 декабря 2025 г. |
3 Не поддерживается API разработчика Gemini, независимо от способа доступа к нему.
Поддерживаемые языки
Близнецы
Все модели Gemini понимают и отвечают на следующих языках:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Имиджен
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about older models
Модель | Вход | Выход | Optimized for |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
These are the input and output types when using each model with Firebase AI Logic :
Джемини 1.5 Про | Gemini 1.5 Flash | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
Input types | |||||||
Текст | |||||||
Код | |||||||
Документы (PDFs or plain-text) | |||||||
Изображения | |||||||
Видео | |||||||
Аудио | |||||||
Audio (streaming) | |||||||
Output types | |||||||
Текст | |||||||
Код | |||||||
Структурированный вывод (like JSON) | |||||||
Images, Video, and Audio |
These are the capabilities and features when using each model with Firebase AI Logic :
Джемини 1.5 Про | Gemini 1.5 Flash | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
Generate text from text-only input | ||||
Generate text from multimodal input | ||||
Генерировать изображения | ||||
Генерировать аудио | ||||
Generate structured output (like JSON) | ||||
Анализировать документы (PDFs or plain-text) | ||||
Analyze images (vision) | ||||
Analyze video (vision) | ||||
Analyze audio | ||||
Multi-turn chat | ||||
Function calling (tools) | ||||
Count tokens and billable characters | ||||
Системные инструкции | ||||
Bidirectional multimodal streaming |
These are the specifications and limitations when using each model with Firebase AI Logic :
Джемини 1.5 Про | Gemini 1.5 Flash | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 2,097,152 tokens | 1,048,576 tokens | 16,384 tokens | 32,760 tokens | |||
Output token limit * | 8,192 tokens | 8,192 tokens | 2,048 tokens | 8,192 tokens | |||
Knowledge cutoff date | Май 2024 г. | Май 2024 г. | Февраль 2023 г. | Февраль 2023 г. | |||
PDFs (per request) | |||||||
Max number of input PDF files ** | 3,000 files | 3,000 files | 16 files | --- | |||
Max number of pages per input PDF file ** | 1,000 pages | 1,000 pages | 16 страниц | --- | |||
Max size per input PDF file | 50 МБ | 50 МБ | 50 МБ | --- | |||
Images (per request) | |||||||
Max number of input images | 3,000 images | 3,000 images | 16 изображений | --- | |||
Max number of output images | --- | --- | --- | --- | |||
Max size per input base64-encoded image | 7 МБ | 7 МБ | 7 МБ | --- | |||
Video (per request) | |||||||
Max number of input video files | 10 файлов | 10 файлов | 1 файл | --- | |||
Max length of all input video (frames only) | ~60 minutes | ~60 minutes | 2 минуты | --- | |||
Max length of all input video (frames+audio) | ~45 minutes | ~45 minutes | --- | --- | |||
Audio (per request) | |||||||
Max number of input audio files | 1 файл | 1 файл | --- | --- | |||
Max number of output audio files | --- | --- | --- | --- | |||
Max length of all input audio | ~8.4 hours | ~8.4 hours | --- | --- | |||
Max length of all output audio | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
Gemini 1.5 Pro model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-pro-002 | Latest stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Initial stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-pro | Points to the latest stable version of 1.5 Pro (в настоящее время gemini-1.5-pro-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-flash-002 | Latest stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Initial stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-flash | Points to the latest stable version of 1.5 Flash (в настоящее время gemini-1.5-flash-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-vision-001 | Latest stable version of Gemini 1.0 Pro Vision | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro-vision | Points to the latest stable version of 1.5 Pro Vision (в настоящее время gemini-1.5-pro-vision-001 ) | Ушедший на пенсию | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-002 | Latest stable version of Gemini 1.0 Pro | Ушедший на пенсию | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Stable version of Gemini 1.0 Pro | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro | Points to the latest stable version of 1.0 Pro (в настоящее время gemini-1.0-pro-002 ) | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Следующие шаги
Try out the capabilities of the Gemini API
- Build multi-turn conversations (chat) .
- Generate text from text-only prompts .
- Generate text by prompting with various file types, like images , PDFs , video , and audio .
- Generate structured output (like JSON) from both text and multimodal prompts.
- Generate images from text prompts ( Gemini or Imagen ).
- Stream input and output (including audio) using the Gemini Live API .
- Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.
For mobile and web apps, the Firebase AI Logic SDKs let you interact with the supported Gemini models and Imagen models directly from your app.
Gemini models are considered multimodal because they're capable of processing and even generating multiple modalities, including text, code, PDFs, images, video, and audio. Imagen models can be prompted with text to generate images.
The following table is a brief overview of supported models for Firebase AI Logic and their latest stable model names. This table also lists preview and experimental models that are available for prototyping use cases.
Also, review our FAQ about all the models that Firebase AI Logic supports and does not support.
Gemini models
Модель | Вход | Выход | Описание |
---|---|---|---|
Gemini models with stable versions | |||
Джемини 2.5 Проgemini-2.5-pro | text, code, PDFs, images, video, audio | text, code, JSON | Our most advanced reasoning model, capable of solving complex problems. |
Близнецы 2.5 Флэшgemini-2.5-flash | text, code, PDFs, images, video, audio | text, code, JSON | Our thinking model that offers great, well-rounded capabilities. It's designed to offer a balance between price and performance. |
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite | text, code, PDFs, images, video, audio | text, code, JSON | Our most balanced Gemini model, optimized for low-latency use cases and cost-conscious apps. |
Флэш-изображение Gemini 2.5gemini-2.5-flash-image | text, code, PDFs, images | images, text & images | Our standard Flash model upgraded for rapid creative workflows with image generation and conversational, multi-turn editing capabilities. (aka "nano banana") |
Gemini 2.0 Flashgemini-2.0-flash-001 | text, code, PDFs, images, video, audio | text, code, JSON | Our multimodal model with next-gen features and improved capabilities, including superior speed, built-in tool use, and a 1M token context window |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001 | text, code, PDFs, images, video, audio | text, code, JSON | Our fastest and most cost efficient Flash model. It's an upgrade path for 1.5 Flash users who want better quality for the same price and speed. |
Gemini models with only preview and experimental versions (recommended for prototyping use cases only) | |||
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation | text, code, PDFs, images | images, text & images | Our multimodal model that supports multimodal input and image output. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | text (streaming), audio (streaming) | text (streaming), audio (streaming) | Our multimodal model that supports low-latency realtime streaming of multimodal inputs and outputs. |
1 Additional model names support the Live API depending on your chosen Gemini API provider and access (see the Live API page ).
Imagen models
Модель | Вход | Выход | Описание |
---|---|---|---|
Imagen models with stable versions | |||
Имидж 4imagen-4.0-generate-001 | текст | изображения | Generates realistic, high-quality images from natural language text prompts |
Imagen 4 Fastimagen-4.0-fast-generate-001 | текст | изображения | Generates images for prototyping or low-latency use cases |
Imagen 4 Ultraimagen-4.0-ultra-generate-001 | текст | изображения | Generates realistic, high-quality images from natural language text prompts |
Имидж 3imagen-3.0-generate-002 | текст | изображения | Generates realistic, high-quality images from natural language text prompts |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | текст | изображения | Generates images for prototyping or low-latency use cases |
Imagen 3 Capability 2imagen-3.0-capability-001 | text, images | изображения | Edits and generates images; supports both mask-based editing and customization using reference images |
Imagen models with only preview and experimental versions (recommended for prototyping use cases only) | |||
--- | --- | --- | --- |
2 Not supported by the Gemini Developer API no matter how you access it.
The remainder of this page provides detailed information about the models supported by Firebase AI Logic .
- Supported input and output
- High-level comparison of the supported capabilities
- Specifications and limitations, for example max input tokens or max length of input video
Description of how models are versioned , specifically their stable , auto-updated , preview , and experimental versions
Lists of available model names to include in your code during initialization
Lists of supported languages for the models
At the bottom of this page, you can view detailed information about older models .
Сравнить модели
Each model has different capabilities to support various use cases. Note that each of tables in this section describe each model when used with Firebase AI Logic . Each model might have additional capabilities that aren't available when using our SDKs.
If you can't find the information you're looking for in the following sub-sections, you can find even more information in your chosen API provider documentation:
Gemini Developer API : Gemini models and Imagen models
Vertex AI Gemini API : Gemini models and Imagen models
Supported input and output
These are the supported input and output types when using each model with Firebase AI Logic :
Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (generate) | Imagen (capability) | |
---|---|---|---|---|---|---|---|---|
Input types | ||||||||
Текст | ||||||||
Text (streaming) | ||||||||
Код | ||||||||
Документы (PDFs or plain-text) | ||||||||
Изображения | ||||||||
Видео | ||||||||
Аудио | ||||||||
Audio (streaming) | ||||||||
Output types | ||||||||
Текст | ||||||||
Text (streaming) | ||||||||
Код | ||||||||
Структурированный вывод (like JSON) | ||||||||
Изображения | ||||||||
Аудио | ||||||||
Audio (streaming) |
To learn about supported file types, see Supported input files and requirements .
Supported capabilities and features
These are the supported capabilities and features when using each model with Firebase AI Logic :
Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (generate) | Imagen (capability) | |
---|---|---|---|---|---|---|---|---|
Мышление | ||||||||
Generate text from text-only or multimodal inputs | interleaved or as part of image | interleaved or as part of image | только потоковая передача | |||||
Генерировать изображения ( Gemini or Imagen ) | ||||||||
Редактировать изображения ( Gemini or Imagen ) | ||||||||
Генерировать аудио | только потоковая передача | |||||||
Generate structured output (like JSON) | ||||||||
Анализировать документы (PDFs or plain-text) | ||||||||
Analyze images (vision) | ||||||||
Analyze video (vision) | ||||||||
Analyze audio | только потоковая передача | |||||||
Multi-turn chat | ||||||||
Bidirectional multimodal streaming | ||||||||
Вызов функции | ||||||||
Выполнение кода | ||||||||
Заземление с помощью поиска Google | ||||||||
Системные инструкции | ||||||||
Count tokens |
Specifications and limitations
These are the specifications and limitations when using each model with Firebase AI Logic :
Свойство | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Imagen (generate) | Imagen (capability) |
---|---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 1,048,576 tokens | 32,768 tokens | 1,048,576 tokens | 1,048,576 tokens | 32,768 tokens | 32,768 tokens | 480 tokens | 480 tokens |
Output token limit * | 65,536 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | --- | --- |
Knowledge cutoff date | Январь 2025 г. | Июнь 2025 г. | Июнь 2024 г. | Июнь 2024 г. | Август 2024 г. | Август 2024 г. | --- | --- |
PDFs (per request) | ||||||||
Max number of input PDF files ** | 3,000 files | 3 файла | 3,000 files | 3,000 files | 3,000 files | --- | --- | --- |
Max number of pages per input PDF file ** | 1,000 pages | 3 страницы | 1,000 pages | 1,000 pages | 1,000 pages | --- | --- | --- |
Max size per input PDF file | 50 МБ | 50 МБ | 50 МБ | 50 МБ | 50 МБ | --- | --- | --- |
Images (per request) | ||||||||
Max number of input images | 3,000 images | 3 изображения | 3,000 images | 3,000 images | 3,000 images | --- | --- | 4 изображения |
Max number of output images | --- | 10 изображений | --- | --- | 10 изображений | --- | 4 изображения | 4 изображения |
Max size per input base64-encoded image | 7 МБ | 7 МБ | 7 МБ | 7 МБ | 7 МБ | --- | --- | --- |
Video (per request) | ||||||||
Max number of input video files | 10 файлов | --- | 10 файлов | 10 файлов | --- | --- | --- | --- |
Max length of all input video (frames only) | ~60 minutes | --- | ~60 minutes | ~60 minutes | --- | --- | --- | --- |
Max length of all input video (frames+audio) | ~45 minutes | --- | ~45 minutes | ~45 minutes | --- | --- | --- | --- |
Audio (per request) | ||||||||
Max number of input audio files | 1 файл | --- | 1 файл | 1 файл | --- | --- | --- | --- |
Max number of output audio files | --- | --- | --- | --- | --- | --- | --- | --- |
Max length of all input audio | ~8.4 hours | ~8.4 hours | ~8.4 hours | ~8.4 hours | --- | --- | --- | --- |
Max length of all output audio | --- | --- | --- | --- | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Find additional detailed information
Quotas and pricing are different for each model. Pricing also depends on input and output.
Learn about supported input file types, how to specify MIME type, and how to make sure that your input files and multimodal requests meet the requirements and follow best practices in Supported input files and requirements .
Model versioning and naming patterns
Models are offered in stable , preview , and experimental versions. For convenience, aliases without explicit version values are supported.
To find specific model names to use in your code, see the "available model names" section later on this page.
Version type / Release stage | Описание | Model name pattern | |
---|---|---|---|
Стабильный | Stable versions are available and supported for production use starting on the release date. A stable model version is typically released with a retirement date, which indicates the last day that the model is available. After this date, the model is no longer accessible or supported by Google. |
| |
Auto-updated stable alias ( Gemini 2.0 models only) | Auto-updated stable aliases always point to the latest stable version of that model. If a new stable version is released, the auto-updated alias automatically starts pointing to that new stable version. | Gemini 2.0 models only Пример: | |
Предварительный просмотр | Preview versions have new capabilities and are considered not stable . These models are not recommended for production use, come with more restrictive rate limits, and may have billing requirements. For the Vertex AI Gemini API , preview models released after June 2025 usually require you to set the model's location to | Model names of preview versions are appended with Пример: | |
Экспериментальный | Experimental versions have new capabilities and are considered not stable . These models are not recommended for production use and come with more restrictive rate limits. Experimental models are intended for gathering feedback and to enable experimentation with our latest features. For the Vertex AI Gemini API , experimental models released after June 2025 require you to set the model's location to | Model names of experimental versions are appended with Пример: | |
Ушедший на пенсию | Retired versions are past their retirement date and have been permanently deactivated. Retired models are no longer accessible or supported by Google, and requests referencing a retired model ID typically returns a 404 error. | --- |
Available model names
Model names are the explicit values that you include in your code during initialization of the model.
Gemini model names Jump to Imagen model names Jump to
Programmatically list all available models
You can list all available models names using the REST API:
Gemini Developer API : Call the
models.list
endpointVertex AI Gemini API : Call the
publishers.models.list
endpoint
Note that this returned list will include all models supported by the API providers, but Firebase AI Logic only supports the Gemini and Imagen models described on this page. Also note that auto-updated aliases (for example, gemini-2.0-flash
) aren't listed because they're a convenience alias for the base model.
Gemini model names
For initialization examples for your platform, see the getting started guide .
For details about the release stages (especially for use cases and billing), see model versioning and naming patterns .
Gemini 2.5 Pro model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-pro | Stable version of Gemini 2.5 Pro | Стабильный | 2025-06-17 | No earlier than 2026-06-17 |
Gemini 2.5 Flash model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash | Stable version of Gemini 2.5 Flash | Стабильный | 2025-06-17 | No earlier than 2026-06-17 |
Gemini 2.5 Flash‑Lite model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-lite | Stable version of Gemini 2.5 Flash‑Lite | Стабильный | 2025-07-22 | No earlier than 2026-07-22 |
Gemini 2.5 Flash Image model names (aka "nano banana")
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-image | Stable version for Gemini 2.5 Flash Image (aka "nano banana") | Стабильный | 2025-10-02 | 2026-10-02 |
gemini-2.5-flash-image-preview | Preview version for Gemini 2.5 Flash Image (aka "nano banana") | Предварительный просмотр | 2025-08-26 | 31 октября 2025 г. |
Gemini 2.5 Flash Live model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-live-2.5-flash | Stable version for Gemini 2.5 Flash Live | Стабильный (private GA) 1 | 2025-06-01 | No earlier than 2026-06-01 |
gemini-live-2.5-flash-preview 2 | Preview version for Gemini 2.5 Flash Live | Предварительный просмотр | 2025-06-01 | Будет определено |
Take note that in the 2.5 model names for the Live API , the live
segment immediately follows the gemini
segment.
Firebase AI Logic does not yet support the native audio models (like gemini-2.5-flash-native-audio-preview-09-2025
).
1 Reach out to your Google Cloud account team representative to request access.
2 Not supported by the Vertex AI Gemini API no matter how you access it.
Gemini 2.0 Flash model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-001 | Latest stable version of Gemini 2.0 Flash | Стабильный | 2025-02-05 | No earlier than 2026-02-05 |
gemini-2.0-flash | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash (в настоящее время gemini-2.0-flash-001 ) | Стабильный | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Latest stable version of Gemini 2.0 Flash‑Lite | Стабильный | 2025-02-25 | No earlier than 2026-02-25 |
gemini-2.0-flash-lite | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash‑Lite (в настоящее время gemini-2.0-flash-lite-001 ) | Стабильный | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation | Preview version for Gemini 2.0 Flash Image Generation | Предварительный просмотр | 2025-05-06 | 31 октября 2025 г. |
Gemini 2.0 Flash Live model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-live-001 2 | Stable version for Gemini 2.0 Flash Live | Стабильный | 2025-04-01 | No earlier than 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 | Preview version for Gemini 2.0 Flash Live | Предварительный просмотр | 2025-04-09 | Будет определено |
2 Not supported by the Vertex AI Gemini API no matter how you access it.
Imagen model names
For initialization examples for your platform, see the generate images with Imagen guide .
For details about the release stages (especially for use cases and billing), see model versioning and naming patterns .
Imagen 4 model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-generate-001 | Stable version of Imagen 4 | Стабильный | 2025-08-14 | No earlier than 2026-08-14 |
imagen-4.0-generate-preview-06-06 | Preview version of Imagen 4 | Предварительный просмотр | 2025-06-06 | As early as 2025-08-14 |
Imagen 4 Fast model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-fast-generate-001 | Stable version of Imagen 4 Fast | Стабильный | 2025-08-14 | No earlier than 2026-08-14 |
imagen-4.0-fast-generate-preview-06-06 3 | Preview version of Imagen 4 Fast (will be retired soon - do not use) | Предварительный просмотр | 2025-06-06 | As early as 2025-08-14 |
Imagen 4 Ultra model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Stable version of Imagen 4 Ultra | Стабильный | 2025-08-14 | No earlier than 2026-08-14 |
imagen-4.0-ultra-generate-preview-06-06 | Preview version of Imagen 4 Ultra (will be retired soon - do not use) | Предварительный просмотр | 2025-06-06 | As early as 2025-08-14 |
Imagen 3 model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-generate-002 | Latest stable version of Imagen 3 | Стабильный | 2025-01-23 | No earlier than 2026-01-23 |
imagen-3.0-generate-001 3 | Initial stable version of Imagen 3 | Стабильный | 2024-07-31 | No earlier than 2025-07-31 |
Imagen 3 Fast model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Initial stable version of Imagen 3 Fast | Стабильный | 2024-07-31 | No earlier than 2025-07-31 |
3 Not supported by the Gemini Developer API no matter how you access it.
Imagen 3 Capability model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-capability-001 3 | Initial stable version of Imagen 3 Capability | Стабильный | 2024-12-10 | No earlier than 2025-12-10 |
3 Not supported by the Gemini Developer API no matter how you access it.
Поддерживаемые языки
Близнецы
All the Gemini models can understand and respond in the following languages:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Имиджен
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about older models
Модель | Вход | Выход | Optimized for |
---|---|---|---|
gemini-1.5-pro-002 | | | |
gemini-1.5-flash-002 | | | |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
These are the input and output types when using each model with Firebase AI Logic :
Джемини 1.5 Про | Gemini 1.5 Flash | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
Input types | |||||||
Текст | |||||||
Код | |||||||
Документы (PDFs or plain-text) | |||||||
Изображения | |||||||
Видео | |||||||
Аудио | |||||||
Audio (streaming) | |||||||
Output types | |||||||
Текст | |||||||
Код | |||||||
Структурированный вывод (like JSON) | |||||||
Images, Video, and Audio |
These are the capabilities and features when using each model with Firebase AI Logic :
Джемини 1.5 Про | Gemini 1.5 Flash | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
Generate text from text-only input | ||||
Generate text from multimodal input | ||||
Генерировать изображения | ||||
Генерировать аудио | ||||
Generate structured output (like JSON) | ||||
Анализировать документы (PDFs or plain-text) | ||||
Analyze images (vision) | ||||
Analyze video (vision) | ||||
Analyze audio | ||||
Multi-turn chat | ||||
Function calling (tools) | ||||
Count tokens and billable characters | ||||
Системные инструкции | ||||
Bidirectional multimodal streaming |
These are the specifications and limitations when using each model with Firebase AI Logic :
Джемини 1.5 Про | Gemini 1.5 Flash | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||||
---|---|---|---|---|---|---|---|
Context window * Total token limit (combined input+output) | 2,097,152 tokens | 1,048,576 tokens | 16,384 tokens | 32,760 tokens | |||
Output token limit * | 8,192 tokens | 8,192 tokens | 2,048 tokens | 8,192 tokens | |||
Knowledge cutoff date | Май 2024 г. | Май 2024 г. | Февраль 2023 г. | Февраль 2023 г. | |||
PDFs (per request) | |||||||
Max number of input PDF files ** | 3,000 files | 3,000 files | 16 files | --- | |||
Max number of pages per input PDF file ** | 1,000 pages | 1,000 pages | 16 страниц | --- | |||
Max size per input PDF file | 50 МБ | 50 МБ | 50 МБ | --- | |||
Images (per request) | |||||||
Max number of input images | 3,000 images | 3,000 images | 16 изображений | --- | |||
Max number of output images | --- | --- | --- | --- | |||
Max size per input base64-encoded image | 7 МБ | 7 МБ | 7 МБ | --- | |||
Video (per request) | |||||||
Max number of input video files | 10 файлов | 10 файлов | 1 файл | --- | |||
Max length of all input video (frames only) | ~60 minutes | ~60 minutes | 2 минуты | --- | |||
Max length of all input video (frames+audio) | ~45 minutes | ~45 minutes | --- | --- | |||
Audio (per request) | |||||||
Max number of input audio files | 1 файл | 1 файл | --- | --- | |||
Max number of output audio files | --- | --- | --- | --- | |||
Max length of all input audio | ~8.4 hours | ~8.4 hours | --- | --- | |||
Max length of all output audio | --- | --- | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens
.
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
Gemini 1.5 Pro model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-pro-002 | Latest stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Initial stable version of Gemini 1.5 Pro | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-pro | Points to the latest stable version of 1.5 Pro (в настоящее время gemini-1.5-pro-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.5-flash-002 | Latest stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Initial stable version of Gemini 1.5 Flash | Upcoming Retirement | 2024-05-24 | 2025-05-24 |
Auto-updated stable alias | ||||
gemini-1.5-flash | Points to the latest stable version of 1.5 Flash (в настоящее время gemini-1.5-flash-002 ) | Upcoming Retirement | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-vision-001 | Latest stable version of Gemini 1.0 Pro Vision | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro-vision | Points to the latest stable version of 1.5 Pro Vision (в настоящее время gemini-1.5-pro-vision-001 ) | Ушедший на пенсию | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro model names
Название модели | Описание | Release stage | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Stable versions | ||||
gemini-1.0-pro-002 | Latest stable version of Gemini 1.0 Pro | Ушедший на пенсию | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Stable version of Gemini 1.0 Pro | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Auto-updated stable alias | ||||
gemini-1.0-pro | Points to the latest stable version of 1.0 Pro (в настоящее время gemini-1.0-pro-002 ) | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Следующие шаги
Try out the capabilities of the Gemini API
- Build multi-turn conversations (chat) .
- Generate text from text-only prompts .
- Generate text by prompting with various file types, like images , PDFs , video , and audio .
- Generate structured output (like JSON) from both text and multimodal prompts.
- Generate images from text prompts ( Gemini or Imagen ).
- Stream input and output (including audio) using the Gemini Live API .
- Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.