En savoir plus sur les modèles compatibles

Pour les applications mobiles et Web, les SDK Firebase AI Logic vous permettent d'interagir avec les modèles Gemini et modèles Imagen compatibles directement depuis votre application.

Les modèles Gemini sont considérés comme multimodaux, car ils sont capables de traiter et même de générer plusieurs modalités, y compris du texte, du code, des PDF, des images, des vidéos et de l'audio. Les modèles Imagen peuvent être sollicités avec du texte pour générer des images.

Consultez également nos questions fréquentes pour connaître tous les modèles compatibles et non compatibles avec Firebase AI Logic.

 Accéder aux comparaisons de modèles

NOTRE MODÈLE LE PLUS INTELLIGENT

gemini-3-pro-preview

Notre meilleur modèle pour la compréhension multimodale, et notre modèle agentique et de codage des ambiances le plus puissant à ce jour, qui offre des visuels plus riches et une interactivité plus poussée, le tout basé sur un raisonnement de pointe. (facturation requise)


NOTRE MODÈLE DE PENSÉE AVANCÉ

gemini-2.5-pro

Notre modèle de réflexion de pointe, capable de raisonner sur des problèmes complexes en code, en mathématiques et dans les domaines scientifiques et techniques, ainsi que d'analyser de grands ensembles de données, codebases et documents à l'aide d'un contexte long.

RAPIDE ET INTELLIGENT

gemini-2.5-flash

Notre meilleur modèle en termes de rapport performances-prix, qui offre des capacités complètes. 2.5 Flash est idéal pour les tâches de traitement à grande échelle, à faible latence et à volume élevé qui nécessitent de la réflexion, ainsi que pour les cas d'utilisation agentiques.

ULTRA RAPIDE

gemini-2.5-flash-lite

Notre modèle Flash le plus rapide, optimisé pour la rentabilité et le débit élevé.

Modèles de génération d'images

Vous pouvez générer des images avec les modèles Gemini ou Imagen.

 Accéder aux comparaisons de modèles

Gemini

gemini-2.5-flash-image

Notre modèle Flash standard amélioré pour accélérer les workflows créatifs, doté de fonctionnalités de génération d'images et de modification conversationnelle multitour. (facturation requise)

Imagen

imagen-4.0-generate-001

Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel. (facturation requise)

imagen-4.0-fast-generate-001

Génère des images pour le prototypage ou les cas d'utilisation à faible latence. (facturation requise)

imagen-4.0-ultra-generate-001

Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel. (facturation requise)

Modèles de génération précédente

Les modèles suivants sont actifs, mais de l'ancienne génération. Dans la mesure du possible, nous vous recommandons d'utiliser l'un des derniers modèles.

 Accéder aux comparaisons de modèles

Modèles Gemini

NOTRE MODÈLE ROBUSTE DE DEUXIÈME GÉNÉRATION

gemini-2.0-flash-001

Notre modèle polyvalent de deuxième génération, avec une fenêtre de contexte d'un million de jetons. Offre des fonctionnalités de nouvelle génération et des capacités améliorées, y compris une vitesse supérieure et l'utilisation d'outils natifs.

NOTRE MODÈLE RAPIDE DE DEUXIÈME GÉNÉRATION

gemini-2.0-flash-lite-001

Notre modèle de deuxième génération, petit mais puissant, avec une fenêtre de contexte d'un million de jetons. Optimisé pour améliorer la rentabilité et réduire la latence.


Le reste de cette page fournit des informations détaillées sur les modèles compatibles avec Firebase AI Logic.

  • Comparer des modèles :

    • Entrées et sorties acceptées
    • Comparaison générale des fonctionnalités compatibles
    • Spécifications et limites, par exemple le nombre maximal de jetons d'entrée ou la longueur maximale de la vidéo d'entrée
  • Description de la gestion des versions des modèles, en particulier de leurs versions stable, mise à jour automatique, preview et expérimentale

  • Listes des noms de modèles disponibles à inclure dans votre code lors de l'initialisation

  • Listes des langues disponibles pour les modèles

En bas de cette page, vous pouvez consulter des informations détaillées sur les modèles de génération précédente.



Comparer des modèles

Chaque modèle possède des capacités différentes pour prendre en charge divers cas d'utilisation. Notez que chaque tableau de cette section décrit chaque modèle lorsqu'il est utilisé avec Firebase AI Logic. Chaque modèle peut disposer de fonctionnalités supplémentaires qui ne sont pas disponibles lorsque vous utilisez nos SDK.

Si vous ne trouvez pas les informations que vous recherchez dans les sous-sections suivantes, vous pouvez en trouver d'autres dans la documentation du fournisseur d'API de votre choix :

Entrées et sorties acceptées

Voici les types d'entrées et de sorties compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic :

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (générer) Imagen (fonctionnalité)
Types d'entrée
Texte
Texte (streaming)
Code
Documents
(PDF ou texte brut)
Images
Vidéo
Audio
Audio (streaming)
Types de sortie
Texte
Texte (streaming)
Code
Sortie structurée
(comme JSON)
Images
Audio
Audio (streaming)

Pour en savoir plus sur les types de fichiers acceptés, consultez Fichiers d'entrée et exigences acceptés.

Fonctionnalités et caractéristiques compatibles

Voici les fonctionnalités et les capacités compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic :

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (générer) Imagen (fonctionnalité)
Raisonnement
Générer du texte à partir d'entrées textuelles ou multimodales entrelacé ou faisant partie de l'image streaming uniquement
Générer des images
(Gemini ou Imagen)
Modifier des images
(Gemini ou Imagen)
Générer de l'audio streaming uniquement
Générer une sortie structurée
(comme JSON)
Analyser des documents
(PDF ou texte brut)
Analyser des images (vision)
Analyser une vidéo (vision)
Analyser l'audio streaming uniquement
Chat multitour
Streaming multimodal bidirectionnel
Appel de fonction
Exécution de code
Ancrage avec la recherche Google
Instructions système
Compter les jetons

Spécifications et limites

Voici les spécifications et les limites lors de l'utilisation de chaque modèle avec Firebase AI Logic :

Propriété <span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (générer) Imagen (fonctionnalité)
Fenêtre de contexte*
Limite totale de jetons
(entrée + sortie combinées)
1 million de jetons 1 048 576 jetons 32 768 jetons 32 768 jetons 480 jetons 480 jetons
Limite de jetons de sortie* 64 000 jetons 65 536 jetons 8 192 jetons 8 192 jetons --- ---
Date limite des connaissances Janvier 2025 Janvier 2025 Juin 2025 Août 2024 --- ---
PDF (sur demande)
Nombre maximal
de fichiers PDF d'entrée**
900 fichiers 3 000 fichiers 3 fichiers --- --- ---
Nombre maximal
de pages
par fichier PDF d'entrée**
900 pages 1 000 pages 3 pages --- --- ---
Taille maximale de chaque fichier PDF d'entrée :
50 Mo 50 Mo 50 Mo --- --- ---
Images (par demande)
Nombre maximal
d'images d'entrée
1 000 images 3 000 images 3 images --- --- 4 images
Nombre maximal
d'images générées
--- --- 10 images --- 4 images 4 images
Taille maximale
par image encodée en base64
7 Mo 7 Mo 7 Mo --- --- ---
Vidéo (par demande)
Nombre maximal
de fichiers vidéo d'entrée
10 fichiers 10 fichiers --- --- --- ---
Durée maximale
de toutes les vidéos
(images uniquement)
Environ 60 minutes Environ 60 minutes --- --- --- ---
Durée maximale
de toutes les vidéos saisies
(images et audio)
45 minutes environ 45 minutes environ --- --- --- ---
Audio (par demande)
Nombre maximal
de fichiers audio d'entrée
1 fichier 1 fichier --- --- --- ---
Nombre maximal
de fichiers audio de sortie
--- --- --- --- --- ---
Longueur maximale
de tous les éléments audio saisis
~8,4 heures ~8,4 heures ~8,4 heures --- --- ---
Longueur maximale
de tous les contenus audio de sortie
--- --- --- --- --- ---

* Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. 100 jetons correspondent donc à environ 60 à 80 mots en anglais. Pour les modèles Gemini, vous pouvez déterminer le nombre total de jetons dans vos requêtes à l'aide de countTokens.

** Les PDF sont traités comme des images. Ainsi, une seule page d'un PDF est traitée comme une seule image. Le nombre de pages autorisées dans une requête est limité au nombre d'images que le modèle peut accepter.

Obtenir des informations détaillées supplémentaires



Gestion des versions et schémas de dénomination des modèles

Les modèles sont proposés en versions stable, preview et expérimentale. Pour plus de commodité, les alias sans valeurs de version explicites sont acceptés.

Pour trouver des noms de modèles spécifiques à utiliser dans votre code, consultez la section Noms de modèles disponibles plus loin sur cette page.

Type de version /
Étape de lancement
Description Format du nom du modèle
Stable Les versions stables sont disponibles et compatibles pour une utilisation en production à partir de la date de sortie.
  • Une version stable d'un modèle est généralement publiée avec une date d'arrêt, qui indique le dernier jour où le modèle est disponible. Après cette date, le modèle ne sera plus accessible ni pris en charge par Google.
  • Modèles Gemini 2.5
    Les noms des versions stables ne comportent aucun suffixe.

    Exemple : gemini-2.5-pro

  • Modèles Gemini 2.0 et Imagen
    Les noms des versions stables sont suivis d'un numéro de version spécifique à trois chiffres.

    Exemple : gemini-2.0-flash-001
    Exemple : imagen-3.0-generate-002

Alias stable mis à jour automatiquement
(modèles Gemini 2.0 uniquement)
Les alias stables mis à jour automatiquement pointent toujours vers la dernière version stable de ce modèle.
  • Si une nouvelle version stable est publiée, l'alias mis à jour automatiquement commence automatiquement à pointer vers cette nouvelle version stable.

Modèles Gemini 2.0 uniquement
Les noms d'alias de modèle ne comportent aucun suffixe.

Exemple : gemini-2.0-flash

Aperçu Les versions Preview disposent de nouvelles fonctionnalités et sont considérées comme instables.
  • Ces modèles ne sont pas recommandés pour une utilisation en production. Ils sont soumis à des limites de débit plus restrictives et peuvent être soumis à des exigences de facturation.
  • Ces modèles sont mis hors service quelques semaines ou mois après la sortie de leur version stable associée.
  • Pour les modèles d'aperçu Vertex AI Gemini API publiés après juin 2025, vous devez généralement définir la région du modèle sur global.

Le nom des modèles des versions Preview est suivi de -preview et souvent de la date de sortie du modèle (-MM-DD pour les anciens modèles ou -MM-YYYY pour les plus récents).

Exemples :
gemini-2.5-flash-preview-04-17
(publié le 17 avril 2025)
ou
gemini-2.5-flash-preview-09-2025
(publié en septembre 2025)
ou
gemini-3-pro-preview
(publié en novembre 2025)

Expérimental Les versions expérimentales disposent de nouvelles fonctionnalités et sont considérées comme instables.
  • Ces modèles ne sont pas recommandés pour une utilisation en production et sont soumis à des limites de fréquence plus restrictives. Les modèles expérimentaux sont destinés à recueillir des commentaires et à permettre de tester nos dernières fonctionnalités.
  • Ces modèles sont mis hors service quelques semaines ou mois après la sortie de leur version stable associée.
  • Pour les modèles expérimentaux Vertex AI Gemini API publiés après juin 2025, vous devez définir la région du modèle sur global.

Le nom des versions expérimentales des modèles est suivi de -exp et de la date de sortie du modèle (-MM-DD).

Exemple : gemini-2.5-pro-exp-03-25
(sorti le 25 mars 2025)

Retraité(e) Les versions abandonnées ont dépassé leur date d'abandon et ont été définitivement désactivées.
  • Les modèles abandonnés ne sont plus accessibles ni pris en charge par Google. Une requête utilisant le nom d'un modèle abandonné renvoie une erreur 404.

---



Noms de modèles disponibles

Les noms de modèles sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle.

 Accéder aux noms des modèles Gemini  Accéder aux noms des modèles Imagen

Lister tous les modèles disponibles de manière programmatique

Vous pouvez lister tous les noms de modèles disponibles à l'aide de l'API REST :

Notez que la liste renvoyée inclura tous les modèles compatibles avec les fournisseurs d'API, mais que Firebase AI Logic n'est compatible qu'avec les modèles Gemini et Imagen décrits sur cette page. Notez également que les alias mis à jour automatiquement (par exemple, gemini-2.0-flash) ne sont pas listés, car il s'agit d'un alias pratique pour le modèle de base.

Noms des modèles Gemini

Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de démarrage.

Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation, la facturation et l'arrêt), consultez Schémas de nommage et de versionnage des modèles.

Noms des modèles Gemini 3 Pro

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
gemini-3-pro-preview Version Preview de Gemini 3 Pro Aperçu 2025-11-18 À déterminer

Noms des modèles Gemini 2.5 Pro

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
gemini-2.5-pro Version stable de Gemini 2.5 Pro Stable 2025-06-17 Au plus tôt le
17/06/2026

Noms des modèles Gemini 2.5 Flash

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
gemini-2.5-flash Version stable de Gemini 2.5 Flash Stable 2025-06-17 Au plus tôt le
17/06/2026

Noms des modèles Gemini 2.5 Flash‑Lite

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
gemini-2.5-flash-lite Version stable de Gemini 2.5 Flash‑Lite Stable 2025-07-22 Au plus tôt le
2026-07-22

Noms de modèles Gemini 2.5 Flash Image (alias "nano banana")

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
gemini-2.5-flash-image Version stable pour Gemini 2.5 Flash Image (alias "nano banana") Stable 2025-10-02 Au plus tôt le
2026-10-02

Noms des modèles Gemini 2.5 Flash Live

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
gemini-live-2.5-flash Version stable pour Gemini 2.5 Flash Live Stable
(DG privée) 1
2025-06-01 Au plus tôt le
1er juin 2026
gemini-live-2.5-flash-preview 2 Version bêta de Gemini 2.5 Flash Live Aperçu 2025-06-01 À déterminer

Firebase AI Logic ne prend pas encore en charge les modèles audio natifs (comme gemini-2.5-flash-native-audio-preview-09-2025).

1 Contactez le représentant de votre équipe de compte Google Cloud pour demander l'accès. 2 Non compatible avec Vertex AI Gemini API, quel que soit le mode d'accès.

Noms des modèles Gemini 2.0 Flash Live

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
gemini-2.0-flash-live-001 2 Version stable pour Gemini 2.0 Flash Live Stable 2025-04-01 Au plus tôt le
01/04/2026
gemini-2.0-flash-live-preview-04-09 Version bêta de Gemini 2.0 Flash Live Aperçu 2025-04-09 À déterminer

2 Non disponible sur Vertex AI Gemini API, quelle que soit la méthode d'accès.

Noms des modèles Imagen

Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de génération d'images avec Imagen.

Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation, la facturation et l'arrêt), consultez Schémas de nommage et de versionnage des modèles.

Noms des modèles Imagen 4

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
imagen-4.0-generate-001 Version stable de Imagen 4 Stable 2025-08-14 Au plus tôt le 14 août 2026

Noms des modèles Imagen 4 Fast

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
imagen-4.0-fast-generate-001 Version stable de Imagen 4 Fast Stable 2025-08-14 Au plus tôt le 14 août 2026

Noms des modèles Imagen 4 Ultra

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
imagen-4.0-ultra-generate-001 Version stable de Imagen 4 Ultra Stable 2025-08-14 Au plus tôt le 14 août 2026

Noms des modèles Imagen 3 Capability

Nom du modèle Description Étape de publication Date de disponibilité Date d'arrêt
imagen-3.0-capability-001 3 Première version stable de Imagen 3 Capability Stable 2024-12-10 Au plus tôt le 10 décembre 2025

3 Non compatible avec Gemini Developer API, quelle que soit la manière dont vous y accédez.



Langues disponibles

Gemini

  • Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

    Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)

  • Les modèles Gemini 2.0 Flash, Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes :

    Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)

Imagen

  • Disponibilité générale : anglais

  • Aperçu : chinois (simplifié), chinois (traditionnel), coréen, espagnol, hindi, japonais, portugais



Informations sur les modèles précédents

Les modèles suivants sont actifs, mais de l'ancienne génération. Dans la mesure du possible, nous vous recommandons d'utiliser l'un des derniers modèles.

Gemini modèles

Modèle Entrée Sortie Description
Gemini 2.0 Flash
gemini-2.0-flash-001
texte, code, PDF, images, vidéo, audio texte, code, JSON Notre modèle multimodal doté de fonctionnalités de nouvelle génération et de capacités améliorées, y compris une vitesse supérieure, l'utilisation d'outils intégrés et une fenêtre de contexte d'un million de jetons
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
texte, code, PDF, images, vidéo, audio texte, code, JSON Notre modèle Flash le plus rapide et le plus économique. Il s'agit d'une mise à niveau pour les utilisateurs de Flash 1.5 qui souhaitent bénéficier d'une meilleure qualité pour le même prix et la même vitesse.

Imagen modèles

Modèle Entrée Sortie Description
Imagen 3
imagen-3.0-generate-002
texte images Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
texte images Génère des images pour le prototypage ou les cas d'utilisation à faible latence

2 Non compatible avec Gemini Developer API, quelle que soit la méthode d'accès.



Étapes suivantes

Tester les fonctionnalités de Gemini API