Limiti di frequenza e quote

Fai clic sul tuo fornitore Gemini API per visualizzare contenuti specifici del fornitore e codice in questa pagina.


I limiti di frequenza (comunemente chiamati quote) regolano il numero di richieste che puoi effettuare all'Gemini API in un determinato periodo di tempo. Questi limiti contribuiscono a garantire un utilizzo equo, a proteggere dagli abusi e a mantenere le prestazioni del sistema per tutti gli utenti.

Quando utilizzi Firebase AI Logic per inviare richieste ai modelli Gemini e Imagen, i limiti di frequenza del tuo progetto dipendono dal fornitore "Gemini API" che hai scelto. Firebase AI Logic fornisce anche un modo per impostare i limiti di frequenza "per utente".

Visualizza i limiti di frequenza per l'Gemini Developer API

Se superi la quota o se la capacità del modello a cui stai accedendo è esaurita, riceverai un messaggio di errore 429.

Come funzionano i limiti di frequenza (quote)

I limiti di frequenza (quote) vengono misurati in base a quattro dimensioni:

  • Richieste al minuto (RPM)
  • Richieste al giorno (RPD)
  • Token al minuto (TPM)
  • Token al giorno (TPD)

L'utilizzo viene valutato in base a ogni limite e il superamento di uno di questi attiverà un errore 429 di superamento della quota. Ad esempio, se il limite di RPM è 20, l'esecuzione di 21 richieste in un minuto genererà un errore, anche se non hai superato il limite di TPM o altri limiti.

I limiti di frequenza vengono applicati a livello di progetto e a tutte le applicazioni e gli indirizzi IP che utilizzano il progetto Firebase.

I limiti variano a seconda del modello specifico utilizzato e alcuni limiti si applicano solo a modelli specifici. Ad esempio, le immagini al minuto (IPM) vengono calcolate solo per i modelli in grado di generare immagini (Imagen), ma sono concettualmente simili a TPM.

I limiti di frequenza sono più restrittivi per i modelli sperimentali e di anteprima.

Richiedi un aumento del limite di frequenza

Se utilizzi un "livello a pagamento" per Gemini Developer API, puoi richiedere un aumento del limite di frequenza.

Imposta i limiti di frequenza "per utente"

Per utilizzare Firebase AI Logic, il tuo progetto deve avere abilitato il fornitore Gemini API che hai scelto, ma devi anche abilitare l'API Firebase AI Logic che funge da gateway tra i nostri SDK client e il tuo fornitore Gemini API. Questa API viene abilitata quando configuri inizialmente Firebase AI Logic nel tuo progetto Firebase.

Puoi utilizzare il limite di frequenza (quota) dell'API Firebase AI Logic come limite di frequenza "per utente" per la tua app, in particolare per le funzionalità di AI che si basano su Firebase AI Logic. Devi impostare questo limite in modo da soddisfare ragionevolmente un singolo utente che accede alle tue funzionalità di AI, assicurandoti al contempo che nessun singolo utente superi i limiti del tuo Gemini API fornitore (che deve essere condiviso da tutti gli utenti).

Dettagli sul limite di frequenza "per utente"

Di seguito sono riportati alcuni dettagli importanti sui limiti di frequenza (quote) dell'API Firebase AI Logic, in particolare sulle richieste al minuto (RPM):

  • Si basa sulle "richieste di generazione di contenuti" per utente, per regione e per minuto e non sul modello.

  • È il limite di frequenza applicato a tutti gli utenti. Al momento, non è possibile impostare il limite di frequenza per un utente specifico o un gruppo di utenti specifico*.

  • Viene applicato a livello di progetto e a tutte le applicazioni e gli indirizzi IP che utilizzano il progetto Firebase.

  • Si applica a qualsiasi chiamata proveniente specificamente da qualsiasi Firebase AI Logic SDK.

  • Il limite di frequenza predefinito è 100 RPM per utente.
    Tieni presente che devi comunque considerare i limiti del tuo Gemini API fornitore (vedi sopra), che hanno la precedenza sull'API Firebase AI Logic.

* Se utilizzi Vertex AI Gemini API e la tua app indirizza gli utenti a regioni diverse (ad esempio, utilizzando Firebase Remote Config), puoi impostare un limite di frequenza specifico per gli utenti in una regione specifica.

Modifica il limite di frequenza "per utente"

Per modificare un limite di frequenza (quota), devi disporre dell'autorizzazione serviceusage.quotas.update, inclusa per impostazione predefinita nel ruolo Proprietario ed Editor.

Ecco come modificare il limite di frequenza (quota) o richiedere un aumento:

  1. Nella console Google Cloud, vai alla pagina dell' Firebase AI Logic API.

  2. Fai clic su Gestisci.

  3. Più in basso nella pagina, fai clic sulla scheda Quote e limiti di sistema.

  4. Filtra la tabella per visualizzare le quote di interesse, ad esempio la funzionalità (richieste di generazione di contenuti) e la regione.

    Ad esempio, per visualizzare le quote per utente per la generazione di richieste di contenuti in una delle regioni asiatiche supportate, il filtro sarà simile al seguente: Generate content requests + Dimension:region:asia

  5. Seleziona la casella di controllo a sinistra di ogni quota di interesse.

  6. Alla fine della riga della quota, fai clic su , e seleziona Modifica quota.

  7. Nel modulo Modifiche alla quota, procedi nel seguente modo:

    1. Inserisci la quota aumentata nel campo Nuovo valore.

      Questa quota viene applicata a livello di progetto ed è condivisa tra tutte le applicazioni e gli indirizzi IP che utilizzano il progetto Firebase.

    2. Compila eventuali campi aggiuntivi nel modulo, poi fai clic su Fine.

    3. Fai clic su Invia richiesta.