Per le app web e mobile, gli SDK Firebase AI Logic ti consentono di interagire con i Geminimodelli supportati direttamente dalla tua app.
I modelli Gemini sono considerati multimodali perché sono in grado di elaborare e persino generare più modalità, tra cui testo, codice, PDF, immagini, video e audio.
Consulta anche le nostre domande frequenti su tutti i modelli supportati e non supportati da Firebase AI Logic.
Modelli per uso generico
Gemini 3.1 Pro
gemini-3.1-pro-preview
Intelligenza avanzata, capacità di risoluzione di problemi complessi e potenti
funzionalità di codifica di agenti e vibrazioni.
Gemini 3 Flash
gemini-3-flash-preview
Prestazioni di classe Frontier paragonabili a quelle di modelli più grandi a una frazione
del costo.
Gemini 3.1 Flash-Lite
gemini-3.1-flash-lite-preview
Modello di riferimento ad alto volume e sensibile ai costi con le prestazioni e la qualità della serie Gemini 3.
Gemini 2.5 Pro
gemini-2.5-pro
Il nostro modello più avanzato per attività complesse della serie Gemini 2.5,
con capacità di ragionamento e programmazione avanzate.
Gemini 2.5 Flash
gemini-2.5-flash
Il nostro miglior modello della serie Gemini 2.5 in termini di rapporto prezzo/prestazioni,
soprattutto per attività a basso volume e bassa latenza che richiedono
ragionamento.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Il modello multimodale più veloce ed economico della
serie Gemini 2.5.
Modelli di generazione di immagini
Puoi generare e modificare immagini con i modelli Gemini.
Vai ai confronti tra i modelli
Gemini
Immagine di Gemini 3 Pro (Nano Banana Pro)
gemini-3-pro-image-preview
progettato per la produzione di asset professionali, utilizzando il ragionamento avanzato ("pensiero") per seguire istruzioni complesse e generare testo ad alta fedeltà.
Gemini 3.1 Flash Image (Nano Banana 2)
gemini-3.1-flash-image-preview
Controparte ad alta efficienza di Gemini 3 Pro Image, ottimizzata per
velocità e casi d'uso per sviluppatori ad alto volume.
Gemini 2.5 Flash Image (Nano Banana)
gemini-2.5-flash-image
Progettato per velocità ed efficienza, ottimizzato per attività a basso volume e bassa latenza.
Imagen (deprecato)
Per informazioni dettagliate sui modelli Imagen, vedi Modelli Imagen precedenti più avanti in questa pagina.
Modelli di generazione audio
Puoi generare audio in streaming con modelli che supportano Gemini Live API.
Vai ai confronti tra i modelli
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
API Gemini Developer: gemini-2.5-flash-native-audio-preview-12-2025
API Vertex AI Gemini: gemini-live-2.5-flash-native-audio
Consente interazioni vocali e video in tempo reale a bassa latenza con un
modello Gemini bidirezionale.
Il resto di questa pagina fornisce informazioni dettagliate sui modelli supportati da Firebase AI Logic.
-
- Input e output supportati
- Confronto di alto livello delle funzionalità supportate
- Specifiche e limitazioni, ad esempio numero massimo di token di input o lunghezza massima del video di input
Descrizione di come vengono versionati i modelli, in particolare le versioni stabile, aggiornata automaticamente, anteprima e sperimentale
Elenchi di nomi di modelli disponibili da includere nel codice durante l'inizializzazione
Elenchi delle lingue supportate per i modelli
In fondo a questa pagina, puoi visualizzare informazioni dettagliate sui modelli di generazione precedente.
Confronta i modelli
Ogni modello ha funzionalità diverse per supportare vari casi d'uso. Tieni presente che ogni tabella in questa sezione descrive ciascun modello se utilizzato con Firebase AI Logic. Ogni modello potrebbe avere funzionalità aggiuntive che non sono disponibili quando si utilizzano i nostri SDK.
Se non riesci a trovare le informazioni che stai cercando nelle seguenti sottosezioni, puoi trovare ulteriori informazioni nella documentazione del fornitore di API che hai scelto: Gemini Developer API o Vertex AI Gemini API.
Input e output supportati
Di seguito sono riportati i tipi di input e output supportati quando utilizzi ciascun modello con Firebase AI Logic:
|
<span="notranslate">Gemini 3 e 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 e 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Tipi di input | |||||
| Testo | (streaming) | ||||
| Codice | |||||
| Documenti (PDF o testo normale) |
|||||
| Immagini | |||||
| Video | (streaming) | ||||
| Audio | (streaming) | ||||
| Tipi di output | |||||
| Testo | |||||
| Testo (streaming) | (trascrizione) | ||||
| Codice | |||||
| Output strutturato (come JSON) |
|||||
| Immagini | |||||
| Audio | (streaming) | ||||
Per informazioni sui tipi di file supportati, consulta File di input e requisiti supportati.
Funzionalità e capacità supportate
Di seguito sono riportate le funzionalità e le capacità supportate quando si utilizza ciascun modello con Firebase AI Logic:
|
<span="notranslate">Gemini 3 e 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 e 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Ragionamento | |||||
| Genera testo da input solo testuali o multimodali | interlacciato o come parte dell'immagine | interlacciato o come parte dell'immagine | Solo trascrizione | ||
| Generare immagini | |||||
| Modificare le immagini | |||||
| Genera audio | solo streaming | ||||
|
Genera
output strutturato
(come JSON) |
|||||
|
Analizza documenti
(PDF o testo normale) |
|||||
| Analizza le immagini (visione) | |||||
| Analizza video (visione) | solo streaming | ||||
| Analizzare l'audio | solo streaming | ||||
| Chat a più turni | solo streaming | ||||
| Streaming multimodale bidirezionale | |||||
| Istruzioni di sistema | |||||
| Contare i token |
Strumenti supportati
Di seguito sono riportati gli strumenti supportati quando utilizzi ciascun modello con Firebase AI Logic:|
<span="notranslate">Gemini 3 e 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 e 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Chiamata di funzione | |||||
| Esecuzione del codice | |||||
| Contesto URL | |||||
| Grounding con la Ricerca Google |
Specifiche e limitazioni
Di seguito sono riportate le specifiche e le limitazioni quando utilizzi ciascun modello con Firebase AI Logic:
| Proprietà |
<span="notranslate">Gemini 3 e 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 e 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|---|---|---|---|---|---|
| Limite di token di input * | 1.048.576 token | 65.536 token | 1.048.576 token | 32.768 token | 32.000 token (valore predefinito; aggiornabile a 128.000) |
| Limite di token di output * | 65.536 token | 32.768 token | 65.536 token | 8192 token | 64.000 token |
| Data del knowledge cutoff | Gennaio 2025 | Gennaio 2025 | Gennaio 2025 | Giugno 2025 | Gennaio 2025 |
| PDF (su richiesta) | |||||
| Numero massimo di file PDF di input ** |
900 file | 14 file | 3000 file | 3 file | --- |
| Numero massimo di pagine per file PDF di input ** |
900 pagine | 14 pagine | 1000 pagine | 3 pagine | --- |
| Dimensione massima per file PDF di input |
50 MB | 50 MB | 50 MB | 50 MB | --- |
| Google Immagini (per richiesta) | |||||
| Numero massimo di immagini di input |
1000 immagini | 14 immagini | 3000 immagini | 3 immagini | --- |
| Numero massimo di immagini di output |
--- | 10 immagini | --- | 10 immagini | --- |
| Dimensioni massime per immagine di input con codifica base64 |
7 MB | 7 MB | 7 MB | 7 MB | --- |
| Video (per richiesta) | |||||
| Numero massimo di file video di input |
10 file | --- | 10 file | --- | --- |
| Durata massima di tutti i video di input (solo fotogrammi) |
~60 minuti | --- | ~60 minuti | --- | --- |
| Lunghezza massima di tutti i video di input (frame + audio) |
45 minuti circa | --- | 45 minuti circa | --- | --- |
| Audio (per richiesta) | |||||
| Numero massimo di file audio di input |
1 file | --- | 1 file | --- | --- |
| Numero massimo di file audio di output |
--- | --- | --- | --- | --- |
| Lunghezza massima di tutto l'audio input |
~8,4 ore | --- | ~8,4 ore | --- | --- |
| Lunghezza massima di tutto l'audio output |
--- | --- | --- | --- | --- |
*
Per tutti i modelli Gemini, un token equivale a circa 4 caratteri,
quindi 100 token corrispondono a circa 60-80 parole in inglese. Per i modelli Gemini, puoi
determinare il numero totale di token nelle tue richieste utilizzando
countTokens.
** I PDF vengono trattati come immagini, quindi una singola pagina di un PDF viene trattata come un'immagine. Il numero di pagine consentite in una richiesta è limitato al numero di immagini supportate dal modello.
*** I modelli Gemini 2.5 Flash-Live sono i modelli audio nativi che supportano Gemini Live API.
Trovare informazioni dettagliate aggiuntive
Quote e prezzi sono diversi per ogni modello. I prezzi dipendono anche dall'input e dall'output.
Scopri di più sui tipi di file di input supportati, su come specificare il tipo MIME e su come assicurarti che i file di input e le richieste multimodali soddisfino i requisiti e seguano le best practice in File di input supportati e requisiti.
Modelli di controllo delle versioni e denominazione
I modelli sono disponibili nelle versioni stabile, anteprima e sperimentale. Per comodità, sono supportati gli alias senza valori di versione espliciti.
Per trovare nomi di modelli specifici da utilizzare nel codice, consulta la sezione "Nomi dei modelli disponibili" più avanti in questa pagina.
| Tipo di versione / Fase di rilascio |
Descrizione | Pattern del nome del modello | |
|---|---|---|---|
| Stabile |
Le versioni stabili sono disponibili e supportate
per l'uso in produzione a partire dalla data di rilascio.
|
|
|
| Alias stabile aggiornato automaticamente (solo modelli Gemini 2.0) |
Gli alias stabili aggiornati automaticamente puntano sempre
all'ultima versione stabile del modello.
|
Solo modelli Gemini 2.0
Esempio: |
|
| Anteprima |
Le versioni anteprima hanno nuove funzionalità e
sono considerate non stabili.
|
Ai nomi dei modelli delle versioni di anteprima vengono aggiunti
Esempi: |
|
| Sperimentale |
Le versioni sperimentali hanno nuove funzionalità
e sono considerate non stabili.
|
I nomi dei modelli delle versioni sperimentali sono seguiti da
Esempio: |
|
| In pensione |
Le versioni ritirate hanno superato la data di ritiro
e sono state disattivate definitivamente.
|
--- |
|
Nomi dei modelli disponibili
I nomi dei modelli sono i valori espliciti che includi nel codice durante l'inizializzazione del modello.
Vai ai nomi dei modelli Gemini Vai ai nomi dei modelli Imagen (obsoleto)
Elencare in modo programmatico tutti i modelli disponibili
Puoi elencare tutti i nomi dei modelli disponibili utilizzando l'API REST:
Gemini Developer API: chiama l'endpoint
models.listVertex AI Gemini API: chiama l'endpoint
publishers.models.list
Tieni presente che l'elenco restituito includerà tutti i modelli supportati dai
provider API, ma Firebase AI Logic supporta solo i modelli
Gemini e Imagen descritti in questa pagina.
Tieni presente inoltre che gli alias aggiornati automaticamente (ad esempio gemini-2.0-flash) non sono
elencati perché sono un alias di convenienza per il modello di base.
Gemini nomi dei modelli
Per esempi di inizializzazione per la tua piattaforma, consulta la guida introduttiva.
Per informazioni dettagliate sulle fasi di rilascio (in particolare per casi d'uso, fatturazione e arresto), vedi Controllo delle versioni e pattern di denominazione dei modelli.
Gemini 3.1 Pro nomi dei modelli
Richiede il piano tariffario Blaze con pagamento a consumo, indipendentemente dal tuo provider Gemini API.
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-3.1-pro-preview |
L'ultima versione di anteprima di Gemini 3 Pro | Anteprima | 2026-02-19 | Da stabilire |
Gemini 3 Flash nomi dei modelli
Non richiede il piano tariffario Blaze con pagamento a consumo se utilizzi Gemini Developer API (di solito i modelli di anteprima richiedono un piano a pagamento).
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-3-flash-preview |
Versione di anteprima di Gemini 3 Flash | Anteprima | 2025-12-17 | Da stabilire |
Gemini 3.1 Flash‑Lite nomi dei modelli
Non richiede il piano tariffario Blaze con pagamento a consumo se utilizzi Gemini Developer API (di solito i modelli di anteprima richiedono un piano a pagamento).
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-3.1-flash-lite-preview |
Versione di anteprima di Gemini 3.1 Flash‑Lite | Anteprima | 03/03/2026 | Da stabilire |
Nomi dei modelli Gemini 3 Pro Image (ovvero "Nano Banana Pro")
Richiede il piano tariffario Blaze con pagamento a consumo, indipendentemente dal tuo provider Gemini API.
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Versione di anteprima di Gemini 3 Pro Image (nota anche come "Nano Banana Pro") |
Anteprima | 2025-11-20 | Da stabilire |
Nomi dei modelli Gemini 3.1 Flash Image (noti anche come "Nano Banana 2")
Richiede il piano tariffario Blaze con pagamento a consumo, indipendentemente dal tuo provider Gemini API.
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-3.1-flash-image-preview |
Versione di anteprima di Gemini 3.1 Flash Image (nota anche come "Nano Banana 2") |
Anteprima | 2026-02-26 | Da stabilire |
Gemini 2.5 Pro nomi dei modelli
Non richiede il piano tariffario Blaze con pagamento a consumo se utilizzi Gemini Developer API.
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-2.5-pro |
Versione stabile di Gemini 2.5 Pro | Stabile | 2025-06-17 | Non prima del 17/06/2026 |
Gemini 2.5 Flash nomi dei modelli
Non richiede il piano tariffario Blaze con pagamento a consumo se utilizzi Gemini Developer API.
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-2.5-flash |
Versione stabile di Gemini 2.5 Flash | Stabile | 2025-06-17 | Non prima del 17/06/2026 |
Gemini 2.5 Flash‑Lite nomi dei modelli
Non richiede il piano tariffario Blaze con pagamento a consumo se utilizzi Gemini Developer API.
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Versione stabile di Gemini 2.5 Flash‑Lite | Stabile | 2025-07-22 | Non prima del 22/07/2026 |
Nomi dei modelli Gemini 2.5 Flash Image (ovvero "Nano Banana")
Richiede il piano tariffario Blaze con pagamento a consumo, indipendentemente dal tuo provider Gemini API.
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-2.5-flash-image |
Versione stabile per Gemini 2.5 Flash Image (nota anche come "Nano Banana") | Stabile | 2025-10-02 | Non prima del giorno 2026-10-02 |
Gemini 2.5 Flash Live nomi dei modelli
Non richiede il piano tariffario Blaze con pagamento a consumo se utilizzi Gemini Developer API (di solito i modelli di anteprima richiedono un piano a pagamento).
I modelli Gemini 2.5 Flash Live sono i modelli audio nativi che supportano la Gemini Live API. Anche se il modello ha nomi diversi a seconda del provider API Gemini, il comportamento e le funzionalità del modello sono gli stessi.
| Gemini Developer API Nome modello |
Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 |
Ultima versione di anteprima per Live API su Gemini Developer API | Anteprima | 2025-12-12 | Da stabilire |
gemini-2.5-flash-native-audio-preview-09-2025 1 |
Versione di anteprima iniziale per Live API su Gemini Developer API | Anteprima | 2025-09-18 | Da stabilire |
| Vertex AI Gemini API Nome modello |
Descrizione | Fase di rilascio | Data di uscita | Data di chiusura |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 |
Versione stabile per Live API su Vertex AI Gemini API | Stabile | 2025-12-12 | Non prima del giorno 2026-12-12 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 |
Versione di anteprima per Live API su Vertex AI Gemini API | Anteprima | 2025-09-18 | Da stabilire |
1 Solo supportato da Gemini Developer API.
Inoltre, anche se si tratta di modelli di anteprima, sono disponibili nel
"livello senza costi" di Gemini Developer API.
2 Solo supportato da Vertex AI Gemini API.
Inoltre, questi modelli non sono supportati nella località global.
Nomi dei modelli Imagen (deprecato)
Per i nomi dei modelli Imagen, vedi Modelli Imagen precedenti più avanti in questa pagina.
Lingue supportate
Tutti i modelli Gemini possono comprendere e rispondere nelle seguenti lingue:
Arabo (ar), bengalese (bn), bulgaro (bg), cinese semplificato e tradizionale (zh), croato (hr), ceco (cs), danese (da), olandese (nl), inglese (en), estone (et), finlandese (fi), francese (fr), tedesco (de), greco (el), ebraico (iw), hindi (hi), ungherese (hu), indonesiano (id), italiano (it), giapponese (ja), coreano (ko), lettone (lv), lituano (lt), norvegese (no), polacco (pl), portoghese (pt), rumeno (ro), russo (ru), serbo (sr), slovacco (sk), sloveno (sl), spagnolo (es), swahili (sw), svedese (sv), tailandese (th), turco (tr), ucraino (uk), vietnamita (vi)
I modelli Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash possono comprendere e rispondere nelle seguenti lingue aggiuntive:
Afrikaans (af), amarico (am), assamese (as), azero (az), bielorusso (be), bosniaco (bs), catalano (ca), cebuano (ceb), corso (co), gallese (cy), maldiviano (dv), esperanto (eo), basco (eu), persiano (fa), filippino (tagalog) (fil), frisone (fy), irlandese (ga), gaelico scozzese (gd), galiziano (gl), gujarati (gu), hausa (ha), hawaiano (haw), hmong (hmn), creolo haitiano (ht), armeno (hy), igbo (ig), islandese (is), giavanese (jv), georgiano (ka), kazako (kk), khmer (km), kannada (kn), krio (kri), curdo (ku), kirghiso (ky), latino (la), lussemburghese (lb), lao (lo), malgascio (mg), maori (mi), macedone (mk), malayalam (ml), mongolo (mn), meitei (manipuri) (mni-Mtei), marathi (mr), malese (ms), maltese (mt), birmano (my), nepalese (ne), nyanja (chichewa) (ny), odia (oriya) (or), punjabi (pa), pashto (ps), sindhi (sd), singalese (si), samoano (sm), shona (sn), somalo (so), albanese (sq), sesotho (st), sundanese (su), tamil (ta), telugu (te), tagiko (tg), uiguro (ug), urdu (ur), uzbeko (uz), xhosa (xh), yiddish (yi), yoruba (yo), zulu (zu)
Informazioni sui modelli precedenti
I seguenti sono attivi, ma sono modelli di generazione precedente. Ti consigliamo di utilizzare uno dei modelli più recenti, se possibile.
Se non riesci a trovare le informazioni che cerchi nelle seguenti sottosezioni, puoi trovare ancora più informazioni nella documentazione del fornitore di API che hai scelto:
Gemini Developer API: Modelli Gemini e modelli Imagen
Vertex AI Gemini API: Modelli Gemini e modelli Imagen
Modelli Gemini precedenti
gemini-2.0-flash-001(e il relativo alias aggiornato automaticamentegemini-2.0-flash)gemini-2.0-flash-lite-001(e il relativo alias aggiornato automaticamentegemini-2.0-flash-lite)
Per informazioni sui modelli Gemini Live API precedenti, consulta la documentazione del provider Gemini API:
Modelli Imagen precedenti
imagen-4.0-ultra-generate-001imagen-4.0-generate-001imagen-4.0-fast-generate-001imagen-3.0-capability-001imagen-3.0-generate-002imagen-3.0-generate-001imagen-3.0-fast-generate-001
Visualizzare i dettagli dei modelli precedenti
Passaggi successivi
Prova le funzionalità di Gemini API
- Crea conversazioni multi-turno (chat).
- Genera testo da prompt solo di testo.
- Genera testo utilizzando prompt con vari tipi di file, ad esempio immagini, PDF, video e audio.
- Generare output strutturato (come JSON) da prompt di testo e multimodali.
- Genera e modifica immagini da prompt di testo e multimodali.
- Input e output di stream (incluso l'audio) utilizzando Gemini Live API.
- Utilizza strumenti (come la chiamata di funzioni e l'ancoraggio con la Ricerca Google) per connettere un modello Gemini ad altre parti della tua app e a sistemi e informazioni esterni.