Для мобильных и веб-приложений SDK Firebase AI Logic позволяют взаимодействовать с поддерживаемыми моделями Gemini и Imagen непосредственно из вашего приложения.
Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF-файлы, изображения, видео и аудио. Модели Imagen могут генерировать изображения, используя текстовые подсказки.
Также ознакомьтесь с разделом часто задаваемых вопросов (FAQ) , где представлена информация о моделях, которые поддерживает и не поддерживает Firebase AI Logic .
Модели общего использования
Gemini 3 Pro
gemini-3-pro-preview
Наша лучшая модель для мультимодального понимания и самая мощная модель для кодирования агентных паттернов и атмосферы, обеспечивающая более насыщенную визуализацию и более глубокую интерактивность, — все это построено на основе самых современных методов анализа. (требуется оплата)
Gemini 2.5 Pro
gemini-2.5-pro
Наша передовая модель мышления способна рассуждать над сложными задачами в области программирования, математики и STEM-дисциплин, а также анализировать большие наборы данных, кодовые базы и документы, используя подробный контекст.
Вспышка Gemini 2.5
gemini-2.5-flash
Наша лучшая модель по соотношению цены и производительности, предлагающая широкий спектр возможностей. 2,5-дюймовый флэш-накопитель лучше всего подходит для крупномасштабной обработки, задач с низкой задержкой и большим объемом данных, требующих аналитического мышления, а также для агентских сценариев использования.
Фонарь Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Наша самая быстрая модель флэш-памяти, оптимизированная для экономичности и высокой пропускной способности.
модели генерации изображений
Вы можете создавать изображения, используя модели Gemini или Imagen .
Близнецы
Изображение Gemini 3 Pro (также известное как nano banana pro )
gemini-3-pro-image-preview
Разработан для профессионального создания графических ресурсов и сложных инструкций. Он основан на реальных примерах использования поиска Google, включает в себя стандартный процесс «размышления», который уточняет композицию перед созданием изображения, и может генерировать изображения с разрешением до 4K. (требуется оплата)
Изображение Gemini 2.5 Flash (также известное как nano banana )
gemini-2.5-flash-image
Разработан для скорости и эффективности. Оптимизирован для обработки больших объемов данных с низкой задержкой и генерирует изображения с разрешением 1024 пикселя. (требуется оплата)
Изображение
Изображение 4
imagen-4.0-generate-001
Создает реалистичные, высококачественные изображения на основе текстовых подсказок, содержащих естественную речь. (Требуется оплата)
Imagen 4 Fast
imagen-4.0-fast-generate-001
Создает изображения для прототипирования или сценариев использования с низкой задержкой. (Требуется оплата)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Создает реалистичные, высококачественные изображения на основе текстовых подсказок, содержащих естественную речь. (Требуется оплата)
Модели генерации звука
Вы можете создавать потоковое аудио с помощью моделей, поддерживающих Gemini Live API .
Gemini 2.5 Flash с встроенным аудио API Gemini Live
API для разработчиков Gemini: gemini-2.5-flash-native-audio-preview-12-2025
API Vertex AI Gemini: gemini-live-2.5-flash-native-audio
Обеспечивает голосовое и видеовзаимодействие в реальном времени с низкой задержкой благодаря двунаправленной модели Gemini.
Модели предыдущего поколения
Ниже представлены активные модели предыдущего поколения. По возможности мы рекомендуем использовать более новые модели.
модели Близнецов
Gemini 2.0 Flash
gemini-2.0-flash-001
Наша рабочая модель второго поколения с контекстным окном в 1 миллион токенов. Предоставляет функции нового поколения и улучшенные возможности, включая превосходную скорость и использование встроенных инструментов.
Фонарик Gemini 2.0
gemini-2.0-flash-lite-001
Наша модель второго поколения, рассчитанная на небольшой объем данных, с контекстным окном в 1 миллион токенов. Оптимизирована для повышения экономической эффективности и снижения задержки.
Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Firebase AI Logic .
- Поддерживаемые входные и выходные данные
- Сравнительный анализ поддерживаемых возможностей на высоком уровне
- Технические характеристики и ограничения, например, максимальное количество входных токенов или максимальная длина входного видео.
Описание системы версионирования моделей , в частности, их стабильных , автоматически обновляемых , предварительных и экспериментальных версий.
Списки доступных названий моделей для включения в ваш код во время инициализации.
Списки поддерживаемых языков для моделей
Внизу этой страницы вы можете ознакомиться с подробной информацией о моделях предыдущего поколения .
Сравните модели
Каждая модель обладает различными возможностями для поддержки различных сценариев использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Firebase AI Logic . Каждая модель может иметь дополнительные возможности, недоступные при использовании наших SDK.
Если вы не нашли нужную информацию в следующих подразделах, вы можете найти еще больше сведений в документации выбранного вами поставщика API:
API для разработчиков Gemini : модели Gemini и модели Imagen
API Vertex AI Gemini : модели Gemini и модели Imagen
Поддерживаемые входные и выходные данные
Ниже перечислены поддерживаемые типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
| Близнецы 3 Про | Близнецы 3 Про Изображение | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.5 Вспышка- Жить *** | Изображение (сгенерировать) | Изображение (возможности) | |
|---|---|---|---|---|---|---|---|
| Типы ввода | |||||||
| Текст | (стриминг) | ||||||
| Код | |||||||
| Документы (PDF-файлы или обычный текст) | |||||||
| Изображения | |||||||
| Видео | (стриминг) | ||||||
| Аудио | (стриминг) | ||||||
| Типы выходных данных | |||||||
| Текст | |||||||
| Текст (потоковая передача) | (транскрипция) | ||||||
| Код | |||||||
| Структурированный вывод (как JSON) | |||||||
| Изображения | |||||||
| Аудио | (стриминг) | ||||||
Чтобы узнать о поддерживаемых типах файлов, см. раздел «Поддерживаемые входные файлы и требования» .
Поддерживаемые возможности и функции
Ниже перечислены поддерживаемые возможности и функции при использовании каждой модели с Firebase AI Logic :
| Близнецы 3 Про | Близнецы 3 Про Изображение | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.5 Вспышка- Жить *** | Изображение (сгенерировать) | Изображение (возможности) | |
|---|---|---|---|---|---|---|---|
| Мышление | |||||||
| Генерация текста из текстовых или мультимодальных входных данных. | чередующийся или как часть изображения | чередующийся или как часть изображения | только транскрипция | ||||
| Сгенерировать изображения ( Близнецы или Образ ) | |||||||
| Редактировать изображения ( Близнецы или Образ ) | |||||||
| Сгенерировать аудио | только потоковое вещание | ||||||
| Сгенерировать структурированный вывод (как JSON) | |||||||
| Анализ документов (PDF-файлы или обычный текст) | |||||||
| Анализ изображений (зрение) | |||||||
| Анализ видео (зрения) | только потоковое вещание | ||||||
| Анализ звука | только потоковое вещание | ||||||
| Многоходовой чат | только потоковое вещание | ||||||
| Двунаправленная многомодальная потоковая передача | |||||||
| Вызов функции | |||||||
| Выполнение кода | |||||||
| Освоение основ поиска Google | |||||||
| Системные инструкции | |||||||
| Подсчет токенов |
Технические характеристики и ограничения
Ниже приведены технические характеристики и ограничения, возникающие при использовании каждой модели с Firebase AI Logic :
| Свойство | Близнецы 3 Про | Близнецы 3 Про Изображение | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.5 Вспышка- Жить *** | Изображение (сгенерировать) | Изображение (возможности) |
|---|---|---|---|---|---|---|---|
| Ограничение на количество вводимых токенов * | 1 048 576 токенов | 65 536 токенов | 1 048 576 токенов | 32 768 токенов | 32 000 (по умолчанию; возможно увеличение до 128 000) токенов | 480 токенов | 480 токенов |
| Ограничение на количество выводимых токенов * | 65 536 токенов | 32 768 токенов | 65 536 токенов | 8192 токена | 64 тыс. токенов | --- | --- |
| Дата окончания срока действия знаний | Январь 2025 г. | Январь 2025 г. | Январь 2025 г. | Июнь 2025 г. | Январь 2025 г. | --- | --- |
| PDF-файлы (по запросу) | |||||||
| Максимальное число входных PDF-файлов ** | 900 файлов | 14 файлов | 3000 файлов | 3 файла | --- | --- | --- |
| Максимальное число страниц за каждый входной PDF-файл ** | 900 страниц | 14 страниц | 1000 страниц | 3 страницы | --- | --- | --- |
| Максимальный размер для каждого входного PDF-файла | 50 МБ | 50 МБ | 50 МБ | 50 МБ | --- | --- | --- |
| Изображения (по запросу) | |||||||
| Максимальное число входных изображений | 1000 изображений | 14 изображений | 3000 изображений | 3 изображения | --- | --- | 4 изображения |
| Максимальное число выходных изображений | --- | 10 изображений | --- | 10 изображений | --- | 4 изображения | 4 изображения |
| Максимальный размер для каждого входного изображения, закодированного в формате base64 | 7 МБ | 7 МБ | 7 МБ | 7 МБ | --- | --- | --- |
| Видео (по запросу) | |||||||
| Максимальное число входных видеофайлов | 10 файлов | --- | 10 файлов | --- | --- | --- | --- |
| Максимальная длина всего входного видео (только рамки) | ~60 минут | --- | ~60 минут | --- | --- | --- | --- |
| Максимальная длина всего входного видео (кадры + аудио) | ~45 минут | --- | ~45 минут | --- | --- | --- | --- |
| Аудиозапись (по запросу) | |||||||
| Максимальное число входных аудиофайлов | 1 файл | --- | 1 файл | --- | --- | --- | --- |
| Максимальное число выходных аудиофайлов | --- | --- | --- | --- | --- | --- | --- |
| Максимальная длина всех входных аудио | ~8,4 часа | --- | ~8,4 часа | --- | --- | --- | --- |
| Максимальная длина всего выходного аудио | --- | --- | --- | --- | --- | --- | --- |
* Для всех моделей Gemini один токен эквивалентен примерно 4 символам, поэтому 100 токенов — это примерно 60-80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens .
** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.
*** Модели Gemini 2.5 Flash-Live — это модели с встроенной поддержкой звука, использующие Gemini Live API .
Найдите дополнительную подробную информацию.
Квоты и цены различаются для каждой модели. Цена также зависит от входных и выходных данных.
Узнайте о поддерживаемых типах входных файлов, о том, как указывать MIME-тип, и о том, как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям и передовым практикам, изложенным в разделе «Поддерживаемые входные файлы и требования» .
Шаблоны версионирования и именования моделей
Модели предлагаются в стабильной , предварительной и экспериментальной версиях. Для удобства поддерживаются псевдонимы без явного указания версии.
Чтобы найти конкретные названия моделей для использования в вашем коде, см. раздел «Доступные названия моделей» далее на этой странице.
| Тип версии / Этап выпуска | Описание | Шаблон названия модели | |
|---|---|---|---|
| Стабильный | Стабильные версии доступны и поддерживаются для использования в производственной среде начиная с даты выпуска.
|
| |
| Автоматически обновляемый стабильный псевдоним (Только для моделей Gemini 2.0 ) | Автоматически обновляемые стабильные псевдонимы всегда указывают на последнюю стабильную версию данной модели.
| Только для моделей Gemini 2.0 Пример: | |
| Предварительный просмотр | Предварительные версии обладают новыми возможностями и считаются нестабильными .
| Названия моделей в предварительных версиях дополняются символом Примеры: | |
| Экспериментальный | Экспериментальные версии обладают новыми возможностями и считаются нестабильными .
| Названия моделей экспериментальных версий дополняются символом: Пример: | |
| Ушедший на пенсию | Устаревшие версии устарели и были навсегда деактивированы.
| --- | |
Доступные названия моделей
Названия моделей — это явные значения, которые вы указываете в своем коде во время инициализации модели.
Перейти к названиям моделей Gemini Перейти к названиям моделей Imagen
Программно вывести список всех доступных моделей
Вы можете получить список всех доступных названий моделей, используя REST API:
API разработчика Gemini : вызов конечной точки
models.listAPI Vertex AI Gemini : вызов конечной точки
publishers.models.list
Обратите внимание, что в возвращаемый список будут включены все модели, поддерживаемые поставщиками API, но Firebase AI Logic поддерживает только модели Gemini и Imagen, описанные на этой странице. Также обратите внимание, что автоматически обновляемые псевдонимы (например, gemini-2.0-flash ) не указаны, поскольку это вспомогательный псевдоним для базовой модели.
Названия моделей Gemini
Примеры инициализации для вашей платформы см. в руководстве по началу работы .
Подробную информацию об этапах выпуска (особенно о вариантах использования, выставлении счетов и выводе из эксплуатации) см. в разделе «Версионирование моделей и шаблоны именования» .
Названия моделей Gemini 3 Pro
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-3-pro-preview | Предварительная версия Gemini 3 Pro | Предварительный просмотр | 2025-11-18 | Будет определено позже |
Названия моделей Gemini 3 Pro Image (также известные как "nano banana pro")
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-3-pro-image-preview | Предварительная версия образа Gemini 3 Pro (также известный как "нано банановый профессионал") | Предварительный просмотр | 2025-11-20 | Будет определено позже |
Названия моделей Gemini 2.5 Pro
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-2.5-pro | Стабильная версия Gemini 2.5 Pro | Стабильный | 2025-06-17 | Не раньше 2026-06-17 |
Названия моделей вспышки Gemini 2.5
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-2.5-flash | Стабильная версия Gemini 2.5 Flash | Стабильный | 2025-06-17 | Не раньше 2026-06-17 |
Названия моделей фонарика Gemini 2.5 Flash‑Lite
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-2.5-flash-lite | Стабильная версия Gemini 2.5 Flash‑Lite | Стабильный | 2025-07-22 | Не раньше 2026-07-22 |
Названия моделей флэш-накопителей Gemini 2.5 (также известные как "нано-банан")
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-2.5-flash-image | Стабильная версия для образа Flash Gemini 2.5 (также известного как "нано-банан") | Стабильный | 2025-10-02 | Не раньше 2026-10-02 |
Названия моделей Gemini 2.5 Flash Live
Модели Gemini 2.5 Flash Live — это встроенные аудиомодели , поддерживающие Gemini Live API . Несмотря на то, что модели могут иметь разные названия в зависимости от поставщика API Gemini , их поведение и функции остаются одинаковыми.
| API разработчика Gemini Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 | Последняя предварительная версия Live API на платформе Gemini Developer API. | Предварительный просмотр | 2025-12-12 | Будет определено позже |
gemini-2.5-flash-native-audio-preview-09-2025 1 | Первая предварительная версия Live API на платформе Gemini Developer API | Предварительный просмотр | 2025-09-18 | Будет определено позже |
| Vertex AI Gemini API Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 | Стабильная версия Live API для Vertex AI Gemini API | Стабильный | 2025-12-12 | Не раньше 2026-12-12 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 | Предварительная версия Live API на Vertex AI Gemini API | Предварительный просмотр | 2025-09-18 | Будет определено позже |
1. Поддерживается только API для разработчиков Gemini . Кроме того, несмотря на то, что это предварительные модели, они доступны в рамках «бесплатного уровня» API для разработчиков Gemini .
2. Поддерживается только API Vertex AI Gemini . Кроме того, эти модели не поддерживаются в global масштабе.
Названия моделей изображений
Примеры инициализации для вашей платформы см. в руководстве по созданию изображений с помощью Imagen .
Подробную информацию об этапах выпуска (особенно о вариантах использования, выставлении счетов и выводе из эксплуатации) см. в разделе «Версионирование моделей и шаблоны именования» .
Названия моделей Imagen 4
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
imagen-4.0-generate-001 | Стабильная версия Imagen 4 | Стабильный | 2025-08-14 | Не ранее 14.08.2026 |
Названия моделей Imagen 4 Fast
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 | Стабильная версия Imagen 4 Fast | Стабильный | 2025-08-14 | Не ранее 14.08.2026 |
Названия моделей Imagen 4 Ultra
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Стабильная версия Imagen 4 Ultra | Стабильный | 2025-08-14 | Не ранее 14.08.2026 |
Названия моделей возможностей Imagen 3
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
imagen-3.0-capability-001 2 | Первая стабильная версия возможностей Imagen 3 | Стабильный | 2024-12-10 | Не ранее 10.12.2025 |
2. Не поддерживается API разработчика Gemini независимо от способа доступа.
Поддерживаемые языки
Близнецы
Все модели Gemini могут понимать следующие языки и отвечать на них:
Арабский (ar), бенгальский (bn), болгарский (bg), упрощенный и традиционный китайский (zh), хорватский (hr), чешский (cs), датский (da), нидерландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), иврит (iw), хинди (hi), венгерский (hu), индонезийский (id), итальянский (it), японский (ja), корейский (ko), латышский (lv), литовский (lt), норвежский (no), польский (pl), португальский (pt), румынский (ro), русский (ru), сербский (sr), словацкий (sk), словенский (sl), испанский (es), суахили (sw), шведский (sv), тайский (th), турецкий (tr), украинский (uk), вьетнамский (vi)
Модели Gemini 2.0 Flash , Gemini 1.5 Pro и Gemini 1.5 Flash поддерживают следующие дополнительные языки:
Африкаанс (af), амхарский (am), ассамский (as), азербайджанский (az), белорусский (be), боснийский (bs), каталанский (ca), кебуанский (ceb), корсиканский (co), валлийский (cy), дивехи (dv), эсперанто (eo), баскский (eu), персидский (fa), филиппинский (тагальский) (fil), фризский (fy), ирландский (ga), шотландский гэльский (gd), галисийский (gl), гуджарати (gu), хауса (ha), гавайский (haw), хмонг (hmn), гаитянский креольский (ht), армянский (hy), игбо (ig), исландский (is), яванский (jv), грузинский (ka), казахский (kk), кхмерский (km), каннада (kn), крио (kri), курдский (ku), кыргызский (ky), латынь (la), люксембургский (lb), лаосский (lo), Малагасийский (мг), маори (ми), македонский (mk), малаялам (ml), монгольский (mn), Meiteilon (Manipuri) (mni-Mtei), маратхи (mr), малайский (ms), мальтийский (mt), мьянманский (бирманский) (my), непальский (ne), ньянджа (чичева) (ny), одиа (ория) (или), пенджабский (pa), пушту (ps), синдхи (sd), сингальский (сингальский) (si), самоанский (sm), шона (sn), сомалийский (so), албанский (sq), сесото (st), суданский (su), тамильский (ta), телугу (te), таджикский (tg), уйгурский (ug), урду (ur), узбекский (uz), коса (xh), идиш (yi), йоруба (yo), зулу (zu)
Изображение
Доступно на английском языке.
Предварительный просмотр : китайский (упрощенный), китайский (традиционный), хинди, японский, корейский, португальский, испанский
Информация о предыдущих моделях
Ниже представлены активные модели предыдущего поколения. По возможности мы рекомендуем использовать более новые модели.
модели Близнецов
-
gemini-2.0-flash-001(и его автоматически обновляемый псевдонимgemini-2.0-flash) -
gemini-2.0-flash-lite-001(и его автоматически обновляемый псевдонимgemini-2.0-flash-lite)
Для получения информации о более старых моделях Gemini Live API см. документацию поставщика Gemini API :
Модели изображений
-
imagen-3.0-generate-002 -
imagen-3.0-fast-generate-001
Вот типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
| Близнецы 2.0 Flash | Близнецы 2.0 Flash- Лайт | |
|---|---|---|
| Типы ввода | ||
| Текст | ||
| Текст (потоковая передача) | ||
| Код | ||
| Документы (PDF-файлы или обычный текст) | ||
| Изображения | ||
| Видео | ||
| Аудио | ||
| Аудио (потоковая передача) | ||
| Типы выходных данных | ||
| Текст | ||
| Текст (потоковая передача) | ||
| Код | ||
| Структурированный вывод (как JSON) | ||
| Изображения | ||
| Аудио | ||
| Аудио (потоковая передача) | ||
Вот возможности и функции, которые открываются при использовании каждой модели с Firebase AI Logic :
| Близнецы 2.0 Flash | Близнецы 2.0 Flash- Лайт | |
|---|---|---|
| Мышление | ||
| Генерация текста из текстовых или мультимодальных входных данных. | ||
| Сгенерировать изображения ( Близнецы или Образ ) | ||
| Редактировать изображения ( Близнецы или Образ ) | ||
| Сгенерировать аудио | ||
| Сгенерировать структурированный вывод (как JSON) | ||
| Анализ документов (PDF-файлы или обычный текст) | ||
| Анализ изображений (зрение) | ||
| Анализ видео (зрения) | ||
| Анализ звука | ||
| Многоходовой чат | ||
| Двунаправленная многомодальная потоковая передача | ||
| Вызов функции | ||
| Выполнение кода | ||
| Освоение основ поиска Google | ||
| Системные инструкции | ||
| Подсчет токенов |
Ниже приведены технические характеристики и ограничения, возникающие при использовании каждой модели с Firebase AI Logic :
| Свойство | Близнецы 2.0 Flash | Близнецы 2.0 Flash- Лайт |
|---|---|---|
| Окно контекста * Общий лимит токенов (комбинированный ввод+вывод) | 1 048 576 токенов | 1 048 576 токенов |
| Ограничение на количество выводимых токенов * | 8192 токена | 8192 токена |
| Дата окончания срока действия знаний | Июнь 2024 г. | Июнь 2024 г. |
| PDF-файлы (по запросу) | ||
| Максимальное число входных PDF-файлов ** | 3000 файлов | 3000 файлов |
| Максимальное число страниц за каждый входной PDF-файл ** | 1000 страниц | 1000 страниц |
| Максимальный размер для каждого входного PDF-файла | 50 МБ | 50 МБ |
| Изображения (по запросу) | ||
| Максимальное число входных изображений | 3000 изображений | 3000 изображений |
| Максимальное число выходных изображений | --- | --- |
| Максимальный размер для каждого входного изображения, закодированного в формате base64 | 7 МБ | 7 МБ |
| Видео (по запросу) | ||
| Максимальное число входных видеофайлов | 10 файлов | 10 файлов |
| Максимальная длина всего входного видео (только рамки) | ~60 минут | ~60 минут |
| Максимальная длина всего входного видео (кадры + аудио) | ~45 минут | ~45 минут |
| Аудиозапись (по запросу) | ||
| Максимальное число входных аудиофайлов | 1 файл | 1 файл |
| Максимальное число выходных аудиофайлов | --- | --- |
| Максимальная длина всех входных аудио | ~8,4 часа | ~8,4 часа |
| Максимальная длина всего выходного аудио | --- | --- |
* Для всех моделей Gemini один токен эквивалентен примерно 4 символам, поэтому 100 токенов — это примерно 60-80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens .
** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.
Названия моделей — это явные значения, которые вы указываете в своем коде во время инициализации модели.
модели Близнецов
Названия моделей флэш-накопителей Gemini 2.0
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-2.0-flash-001 | Последняя стабильная версия Gemini 2.0 Flash | Стабильный | 2025-02-05 | Не раньше 2026-02-05 |
gemini-2.0-flash | Автоматически обновленный псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash. (в настоящее время gemini-2.0-flash-001 ) | Стабильный | 2025-02-10 | --- |
Названия моделей Gemini 2.0 Flash‑Lite
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
gemini-2.0-flash-lite-001 | Последняя стабильная версия Gemini 2.0 Flash‑Lite | Стабильный | 2025-02-25 | Не раньше 2026-02-25 |
gemini-2.0-flash-lite | Автоматически обновленный псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash‑Lite. (в настоящее время gemini-2.0-flash-lite-001 ) | Стабильный | 2025-02-25 | --- |
Модели изображений
Названия моделей Imagen 3
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
imagen-3.0-generate-002 | Последняя стабильная версия Imagen 3 | Стабильный | 2025-01-23 | Не ранее 23.01.2026 |
imagen-3.0-generate-001 3 | Первая стабильная версия Imagen 3 | Стабильный | 2024-07-31 | Не ранее 31.07.2025 |
Названия моделей Imagen 3 Fast
| Название модели | Описание | Этап выпуска | Дата выпуска | Дата выхода на пенсию |
|---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Первая стабильная версия Imagen 3 Fast | Стабильный | 2024-07-31 | Не ранее 31.07.2025 |
3. Не поддерживается API разработчика Gemini независимо от способа доступа.
Следующие шаги
Оцените возможности API Gemini.
- Создавайте многоэтапные диалоги (чат) .
- Генерация текста на основе текстовых подсказок .
- Генерируйте текст, запрашивая различные типы файлов, такие как изображения , PDF-файлы , видео и аудио .
- Генерируйте структурированный вывод (например, в формате JSON) как из текстовых, так и из мультимодальных запросов.
- Создавайте изображения на основе текстовых подсказок ( Gemini или Imagen ).
- Осуществляйте потоковую передачу входного и выходного сигнала (включая звук) с помощью Gemini Live API .
- Используйте инструменты (например, вызов функций и привязку к Google Search ), чтобы связать модель Gemini с другими частями вашего приложения, а также с внешними системами и информацией.
Для мобильных и веб-приложений SDK Firebase AI Logic позволяют взаимодействовать с поддерживаемыми моделями Gemini и Imagen непосредственно из вашего приложения.
Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF-файлы, изображения, видео и аудио. Модели Imagen могут генерировать изображения, используя текстовые подсказки.
Также ознакомьтесь с разделом часто задаваемых вопросов (FAQ) , где представлена информация о моделях, которые поддерживает и не поддерживает Firebase AI Logic .
Модели общего использования
Gemini 3 Pro
gemini-3-pro-preview
Наша лучшая модель для мультимодального понимания и самая мощная модель для кодирования агентных паттернов и атмосферы, обеспечивающая более насыщенную визуализацию и более глубокую интерактивность, — все это построено на основе самых современных методов анализа. (требуется оплата)
Gemini 2.5 Pro
gemini-2.5-pro
Наша передовая модель мышления способна рассуждать над сложными задачами в области программирования, математики и STEM-дисциплин, а также анализировать большие наборы данных, кодовые базы и документы, используя подробный контекст.
Вспышка Gemini 2.5
gemini-2.5-flash
Наша лучшая модель по соотношению цены и производительности, предлагающая широкий спектр возможностей. 2,5-дюймовый флэш-накопитель лучше всего подходит для крупномасштабной обработки, задач с низкой задержкой и большим объемом данных, требующих аналитического мышления, а также для агентских сценариев использования.
Фонарь Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Наша самая быстрая модель флэш-памяти, оптимизированная для экономичности и высокой пропускной способности.
модели генерации изображений
Вы можете создавать изображения, используя модели Gemini или Imagen .
Близнецы
Изображение Gemini 3 Pro (также известное как nano banana pro )
gemini-3-pro-image-preview
Разработан для профессионального создания графических ресурсов и сложных инструкций. Он основан на реальных примерах использования поиска Google, включает в себя стандартный процесс «размышления», который уточняет композицию перед созданием изображения, и может генерировать изображения с разрешением до 4K. (требуется оплата)
Изображение Gemini 2.5 Flash (также известное как nano banana )
gemini-2.5-flash-image
Разработан для скорости и эффективности. Оптимизирован для обработки больших объемов данных с низкой задержкой и генерирует изображения с разрешением 1024 пикселя. (требуется оплата)
Изображение
Изображение 4
imagen-4.0-generate-001
Создает реалистичные, высококачественные изображения на основе текстовых подсказок, содержащих естественную речь. (Требуется оплата)
Imagen 4 Fast
imagen-4.0-fast-generate-001
Создает изображения для прототипирования или сценариев использования с низкой задержкой. (Требуется оплата)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Создает реалистичные, высококачественные изображения на основе текстовых подсказок, содержащих естественную речь. (Требуется оплата)
Модели генерации звука
Вы можете создавать потоковое аудио с помощью моделей, поддерживающих Gemini Live API .
Gemini 2.5 Flash с встроенным аудио API Gemini Live
API для разработчиков Gemini: gemini-2.5-flash-native-audio-preview-12-2025
API Vertex AI Gemini: gemini-live-2.5-flash-native-audio
Обеспечивает голосовое и видеовзаимодействие в реальном времени с низкой задержкой благодаря двунаправленной модели Gemini.
Модели предыдущего поколения
Ниже представлены активные модели предыдущего поколения. По возможности мы рекомендуем использовать более новые модели.
модели Близнецов
Gemini 2.0 Flash
gemini-2.0-flash-001
Наша рабочая модель второго поколения с контекстным окном в 1 миллион токенов. Предоставляет функции нового поколения и улучшенные возможности, включая превосходную скорость и использование встроенных инструментов.
Фонарик Gemini 2.0
gemini-2.0-flash-lite-001
Наша модель второго поколения, рассчитанная на небольшой объем данных, с контекстным окном в 1 миллион токенов. Оптимизирована для повышения экономической эффективности и снижения задержки.
Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Firebase AI Logic .
- Поддерживаемые входные и выходные данные
- Сравнительный анализ поддерживаемых возможностей на высоком уровне
- Технические характеристики и ограничения, например, максимальное количество входных токенов или максимальная длина входного видео.
Описание системы версионирования моделей , в частности, их стабильных , автоматически обновляемых , предварительных и экспериментальных версий.
Списки доступных названий моделей для включения в ваш код во время инициализации.
Списки поддерживаемых языков для моделей
Внизу этой страницы вы можете ознакомиться с подробной информацией о моделях предыдущего поколения .
Сравните модели
Каждая модель обладает различными возможностями для поддержки различных сценариев использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Firebase AI Logic . Каждая модель может иметь дополнительные возможности, недоступные при использовании наших SDK.
Если вы не нашли нужную информацию в следующих подразделах, вы можете найти еще больше сведений в документации выбранного вами поставщика API:
API для разработчиков Gemini : модели Gemini и модели Imagen
API Vertex AI Gemini : модели Gemini и модели Imagen
Поддерживаемые входные и выходные данные
Ниже перечислены поддерживаемые типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
| Близнецы 3 Про | Близнецы 3 Про Изображение | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.5 Вспышка- Жить *** | Изображение (сгенерировать) | Изображение (возможности) | |
|---|---|---|---|---|---|---|---|
| Типы ввода | |||||||
| Текст | (стриминг) | ||||||
| Код | |||||||
| Документы (PDF-файлы или обычный текст) | |||||||
| Изображения | |||||||
| Видео | (стриминг) | ||||||
| Аудио | (стриминг) | ||||||
| Типы выходных данных | |||||||
| Текст | |||||||
| Текст (потоковая передача) | (транскрипция) | ||||||
| Код | |||||||
| Структурированный вывод (как JSON) | |||||||
| Изображения | |||||||
| Аудио | (стриминг) | ||||||
Чтобы узнать о поддерживаемых типах файлов, см. раздел «Поддерживаемые входные файлы и требования» .
Поддерживаемые возможности и функции
Ниже перечислены поддерживаемые возможности и функции при использовании каждой модели с Firebase AI Logic :
| Близнецы 3 Про | Близнецы 3 Про Изображение | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.5 Вспышка- Жить *** | Изображение (сгенерировать) | Изображение (возможности) | |
|---|---|---|---|---|---|---|---|
| Мышление | |||||||
| Генерация текста из текстовых или мультимодальных входных данных. | чередующийся или как часть изображения | чередующийся или как часть изображения | только транскрипция | ||||
| Сгенерировать изображения ( Близнецы или Образ ) | |||||||
| Редактировать изображения ( Близнецы или Образ ) | |||||||
| Сгенерировать аудио | только потоковое вещание | ||||||
| Сгенерировать структурированный вывод (как JSON) | |||||||
| Анализ документов (PDF-файлы или обычный текст) | |||||||
| Анализ изображений (зрение) | |||||||
| Анализ видео (зрения) | только потоковое вещание | ||||||
| Анализ звука | только потоковое вещание | ||||||
| Многоходовой чат | только потоковое вещание | ||||||
| Двунаправленная многомодальная потоковая передача | |||||||
| Вызов функции | |||||||
| Выполнение кода | |||||||
| Освоение основ поиска Google | |||||||
| Системные инструкции | |||||||
| Подсчет токенов |
Технические характеристики и ограничения
Ниже приведены технические характеристики и ограничения, возникающие при использовании каждой модели с Firebase AI Logic :
| Свойство | Близнецы 3 Про | Близнецы 3 Про Изображение | Близнецы 2.5 Pro, Flash, Flash-Lite | Близнецы 2.5 Вспышка Изображение | Близнецы 2.5 Вспышка- Жить *** | Изображение (сгенерировать) | Изображение (возможности) |
|---|---|---|---|---|---|---|---|
| Ограничение на количество вводимых токенов * | 1 048 576 токенов | 65 536 токенов | 1 048 576 токенов | 32 768 токенов | 32 000 (по умолчанию; возможно увеличение до 128 000) токенов | 480 токенов | 480 токенов |
| Ограничение на количество выводимых токенов * | 65 536 токенов | 32 768 токенов | 65 536 токенов | 8192 токена | 64 тыс. токенов | --- | --- |
| Дата окончания срока действия знаний | Январь 2025 г. | Январь 2025 г. | Январь 2025 г. | Июнь 2025 г. | Январь 2025 г. | --- | --- |
| PDF-файлы (по запросу) | |||||||
| Максимальное число входных PDF-файлов ** | 900 файлов | 14 файлов | 3000 файлов | 3 файла | --- | --- | --- |
| Максимальное число страниц за каждый входной PDF-файл ** | 900 страниц | 14 страниц | 1000 страниц | 3 страницы | --- | --- | --- |
| Максимальный размер для каждого входного PDF-файла | 50 МБ | 50 МБ | 50 МБ | 50 МБ | --- | --- | --- |
| Изображения (по запросу) | |||||||
| Максимальное число входных изображений | 1000 изображений | 14 изображений | 3000 изображений | 3 изображения | --- | --- | 4 изображения |
| Максимальное число выходных изображений | --- | 10 изображений | --- | 10 изображений | --- | 4 изображения | 4 изображения |
| Максимальный размер для каждого входного изображения, закодированного в формате base64 | 7 МБ | 7 МБ | 7 МБ | 7 МБ | --- | --- | --- |
| Видео (по запросу) | |||||||
| Максимальное число входных видеофайлов | 10 файлов | --- | 10 файлов | --- | --- | --- | --- |
| Максимальная длина всего входного видео (только рамки) | ~60 минут | --- | ~60 минут | --- | --- | --- | --- |
| Максимальная длина всего входного видео (кадры + аудио) | ~45 минут | --- | ~45 минут | --- | --- | --- | --- |
| Аудиозапись (по запросу) | |||||||
| Максимальное число входных аудиофайлов | 1 файл | --- | 1 файл | --- | --- | --- | --- |
| Максимальное число выходных аудиофайлов | --- | --- | --- | --- | --- | --- | --- |
| Максимальная длина всех входных аудио | ~8,4 часа | --- | ~8,4 часа | --- | --- | --- | --- |
| Максимальная длина всего выходного аудио | --- | --- | --- | --- | --- | --- | --- |
* Для всех моделей Gemini один токен эквивалентен примерно 4 символам, поэтому 100 токенов — это примерно 60-80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens .
** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.
*** Модели Gemini 2.5 Flash-Live — это модели с встроенной поддержкой звука, использующие Gemini Live API .
Найдите дополнительную подробную информацию.
Квоты и цены различаются для каждой модели. Цена также зависит от входных и выходных данных.
Узнайте о поддерживаемых типах входных файлов, о том, как указывать MIME-тип, и о том, как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям и передовым практикам, изложенным в разделе «Поддерживаемые входные файлы и требования» .
Шаблоны версионирования и именования моделей
Модели предлагаются в стабильной , предварительной и экспериментальной версиях. Для удобства поддерживаются псевдонимы без явного указания версии.
Чтобы найти конкретные названия моделей для использования в вашем коде, см. раздел «Доступные названия моделей» далее на этой странице.
| Тип версии / Этап выпуска | Описание | Шаблон названия модели | |
|---|---|---|---|
| Стабильный | Стабильные версии доступны и поддерживаются для использования в производственной среде начиная с даты выпуска.
|
| |
| Автоматически обновляемый стабильный псевдоним (Только для моделей Gemini 2.0 ) | Автоматически обновляемые стабильные псевдонимы всегда указывают на последнюю стабильную версию данной модели.
| Только для моделей Gemini 2.0 Пример: | |
| Предварительный просмотр | Предварительные версии обладают новыми возможностями и считаются нестабильными .
| Model names of preview versions are appended with Примеры: | |
| Экспериментальный | Experimental versions have new capabilities and are considered not stable .
| Model names of experimental versions are appended with Пример: | |
| Ушедший на пенсию | Retired versions are past their retirement date and have been permanently deactivated.
| --- | |
Available model names
Model names are the explicit values that you include in your code during initialization of the model.
Jump to Gemini model names Jump to Imagen model names
Programmatically list all available models
You can list all available models names using the REST API:
Gemini Developer API : Call the
models.listendpointVertex AI Gemini API : Call the
publishers.models.listendpoint
Note that this returned list will include all models supported by the API providers, but Firebase AI Logic only supports the Gemini and Imagen models described on this page. Also note that auto-updated aliases (for example, gemini-2.0-flash ) aren't listed because they're a convenience alias for the base model.
Gemini model names
For initialization examples for your platform, see the getting started guide .
For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .
Gemini 3 Pro model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-3-pro-preview | Preview version of Gemini 3 Pro | Предварительный просмотр | 2025-11-18 | Будет определено позже |
Gemini 3 Pro Image model names (aka "nano banana pro")
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-3-pro-image-preview | Preview version of Gemini 3 Pro Image (aka "nano banana pro") | Предварительный просмотр | 2025-11-20 | Будет определено позже |
Gemini 2.5 Pro model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-2.5-pro | Stable version of Gemini 2.5 Pro | Стабильный | 2025-06-17 | No earlier than 2026-06-17 |
Gemini 2.5 Flash model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash | Stable version of Gemini 2.5 Flash | Стабильный | 2025-06-17 | No earlier than 2026-06-17 |
Gemini 2.5 Flash‑Lite model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash-lite | Stable version of Gemini 2.5 Flash‑Lite | Стабильный | 2025-07-22 | No earlier than 2026-07-22 |
Gemini 2.5 Flash Image model names (aka "nano banana")
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash-image | Stable version for Gemini 2.5 Flash Image (aka "nano banana") | Стабильный | 2025-10-02 | No earlier than 2026-10-02 |
Gemini 2.5 Flash Live model names
Gemini 2.5 Flash Live models are the native audio models that support the Gemini Live API . Even though the model has different model names depending on the Gemini API provider, the behavior and features of the model are the same.
| API разработчика Gemini Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 | Latest preview version for the Live API on the Gemini Developer API | Предварительный просмотр | 2025-12-12 | Будет определено позже |
gemini-2.5-flash-native-audio-preview-09-2025 1 | Initial preview version for the Live API on the Gemini Developer API | Предварительный просмотр | 2025-09-18 | Будет определено позже |
| Vertex AI Gemini API Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 | Stable version for the Live API on the Vertex AI Gemini API | Стабильный | 2025-12-12 | No earlier than 2026-12-12 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 | Preview version for the Live API on the Vertex AI Gemini API | Предварительный просмотр | 2025-09-18 | Будет определено позже |
1 Only supported by the Gemini Developer API . Also, even though these are preview models, they're available on the "free tier" of the Gemini Developer API .
2 Only supported by the Vertex AI Gemini API . Also, these models are not supported in the global location.
Imagen model names
For initialization examples for your platform, see the generate images with Imagen guide .
For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .
Imagen 4 model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
imagen-4.0-generate-001 | Stable version of Imagen 4 | Стабильный | 2025-08-14 | No earlier than 2026-08-14 |
Imagen 4 Fast model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 | Stable version of Imagen 4 Fast | Стабильный | 2025-08-14 | No earlier than 2026-08-14 |
Imagen 4 Ultra model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Stable version of Imagen 4 Ultra | Стабильный | 2025-08-14 | No earlier than 2026-08-14 |
Imagen 3 Capability model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
imagen-3.0-capability-001 2 | Initial stable version of Imagen 3 Capability | Стабильный | 2024-12-10 | No earlier than 2025-12-10 |
2 Not supported by the Gemini Developer API no matter how you access it.
Поддерживаемые языки
Близнецы
All the Gemini models can understand and respond in the following languages:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Изображение
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about previous models
The following are active, but previous generation models. We recommend using one of the latest models instead when possible.
Gemini models
-
gemini-2.0-flash-001(и его автоматически обновляемый псевдонимgemini-2.0-flash) -
gemini-2.0-flash-lite-001(и его автоматически обновляемый псевдонимgemini-2.0-flash-lite)
For information about older Gemini Live API models, see the Gemini API provider documentation:
Модели изображений
-
imagen-3.0-generate-002 -
imagen-3.0-fast-generate-001
These are the input and output types when using each model with Firebase AI Logic :
| Близнецы 2.0 Flash | Близнецы 2.0 Flash- Лайт | |
|---|---|---|
| Типы ввода | ||
| Текст | ||
| Text (streaming) | ||
| Код | ||
| Документы (PDFs or plain-text) | ||
| Изображения | ||
| Видео | ||
| Аудио | ||
| Audio (streaming) | ||
| Типы выходных данных | ||
| Текст | ||
| Text (streaming) | ||
| Код | ||
| Структурированный вывод (like JSON) | ||
| Изображения | ||
| Аудио | ||
| Audio (streaming) | ||
These are the capabilities and features when using each model with Firebase AI Logic :
| Близнецы 2.0 Flash | Близнецы 2.0 Flash- Лайт | |
|---|---|---|
| Мышление | ||
| Generate text from text-only or multimodal inputs | ||
| Сгенерировать изображения ( Gemini or Imagen ) | ||
| Редактировать изображения ( Gemini or Imagen ) | ||
| Сгенерировать аудио | ||
| Generate structured output (like JSON) | ||
| Анализ документов (PDFs or plain-text) | ||
| Analyze images (vision) | ||
| Analyze video (vision) | ||
| Анализ звука | ||
| Многоходовой чат | ||
| Bidirectional multimodal streaming | ||
| Вызов функции | ||
| Выполнение кода | ||
| Освоение основ поиска Google | ||
| Системные инструкции | ||
| Подсчет токенов |
These are the specifications and limitations when using each model with Firebase AI Logic :
| Свойство | Близнецы 2.0 Flash | Близнецы 2.0 Flash- Лайт |
|---|---|---|
| Context window * Total token limit (combined input+output) | 1,048,576 tokens | 1,048,576 tokens |
| Output token limit * | 8,192 tokens | 8,192 tokens |
| Knowledge cutoff date | Июнь 2024 г. | Июнь 2024 г. |
| PDFs (per request) | ||
| Max number of input PDF files ** | 3,000 files | 3,000 files |
| Max number of pages per input PDF file ** | 1,000 pages | 1,000 pages |
| Максимальный размер per input PDF file | 50 МБ | 50 МБ |
| Images (per request) | ||
| Max number of input images | 3000 изображений | 3000 изображений |
| Max number of output images | --- | --- |
| Максимальный размер per input base64-encoded image | 7 МБ | 7 МБ |
| Video (per request) | ||
| Max number of input video files | 10 файлов | 10 файлов |
| Максимальная длина of all input video (frames only) | ~60 minutes | ~60 minutes |
| Максимальная длина of all input video (frames+audio) | ~45 minutes | ~45 minutes |
| Audio (per request) | ||
| Max number of input audio files | 1 файл | 1 файл |
| Max number of output audio files | --- | --- |
| Максимальная длина of all input audio | ~8.4 hours | ~8.4 hours |
| Максимальная длина of all output audio | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens .
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
Gemini models
Gemini 2.0 Flash model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-2.0-flash-001 | Latest stable version of Gemini 2.0 Flash | Стабильный | 2025-02-05 | No earlier than 2026-02-05 |
gemini-2.0-flash | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash (в настоящее время gemini-2.0-flash-001 ) | Стабильный | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
gemini-2.0-flash-lite-001 | Latest stable version of Gemini 2.0 Flash‑Lite | Стабильный | 2025-02-25 | No earlier than 2026-02-25 |
gemini-2.0-flash-lite | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash‑Lite (в настоящее время gemini-2.0-flash-lite-001 ) | Стабильный | 2025-02-25 | --- |
Модели изображений
Imagen 3 model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
imagen-3.0-generate-002 | Latest stable version of Imagen 3 | Стабильный | 2025-01-23 | No earlier than 2026-01-23 |
imagen-3.0-generate-001 3 | Initial stable version of Imagen 3 | Стабильный | 2024-07-31 | No earlier than 2025-07-31 |
Imagen 3 Fast model names
| Название модели | Описание | Release stage | Дата выпуска | Retirement date |
|---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Initial stable version of Imagen 3 Fast | Стабильный | 2024-07-31 | No earlier than 2025-07-31 |
3 Not supported by the Gemini Developer API no matter how you access it.
Следующие шаги
Try out the capabilities of the Gemini API
- Создавайте многоэтапные диалоги (чат) .
- Generate text from text-only prompts .
- Генерируйте текст, запрашивая различные типы файлов, такие как изображения , PDF-файлы , видео и аудио .
- Генерируйте структурированный вывод (например, в формате JSON) как из текстовых, так и из мультимодальных запросов.
- Создавайте изображения на основе текстовых подсказок ( Gemini или Imagen ).
- Осуществляйте потоковую передачу входного и выходного сигнала (включая звук) с помощью Gemini Live API .
- Используйте инструменты (например, вызов функций и привязку к Google Search ), чтобы связать модель Gemini с другими частями вашего приложения, а также с внешними системами и информацией.