Para apps para dispositivos móveis e Web, os SDKs Vertex AI in Firebase permitem interagir com os modelos Gemini e Imagen 3 diretamente no app.
Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. Os modelos Imagen 3 podem ser solicitados com texto para gerar imagens.
A tabela a seguir é uma breve visão geral dos modelos compatíveis com Vertex AI in Firebase e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos de visualização e experimentais disponíveis para casos de uso de prototipagem.
Modelo | Entrada | Saída | Descrição |
---|---|---|---|
Modelos Gemini com versões estáveis | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON (imagens e áudio em breve) |
Oferece recursos e velocidade de última geração para uma variedade de tarefas
(geração multimodal em breve) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho econômico e de baixa latência e oferece suporte a alta taxa de transferência |
Modelos Gemini com somente versões de pré-lançamento e experimentais (recomendado apenas para casos de uso de prototipagem) | |||
Gemini 2.5 Progemini-2.5-pro-preview-03-25
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece raciocínio avançado, especialmente para compreensão multimodal, programação e conhecimento do mundo |
Gemini 2.0 Flash‑Livegemini-2.0-flash-live-preview-04-09
|
texto (streaming), áudio (streaming) |
texto (streaming), áudio (streaming) |
Suporte a streaming em tempo real de baixa latência de entradas e saídas multimodais |
Gemini 2.0 Flash‑Thinkinggemini-2.0-flash-thinking-exp-01-21
|
texto, código, PDFs, imagens | texto, código, JSON | Oferece recursos de raciocínio mais fortes e inclui o processo de pensamento nas respostas |
Modelos Imagen 3 (ao usar com Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002 |
texto | imagens | Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
texto | imagens | Gera imagens para prototipagem ou casos de uso de baixa latência |
O Vertex AI in Firebase oferece suporte a modelos mais antigos, como Gemini 1.5 e Gemini 1.0?
Sim, o Vertex AI in Firebase oferece suporte a todos os modelos Gemini, incluindo modelos mais antigos.
Modelo | Entrada | Saída | Otimizado para |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Suporte a tarefas de raciocínio complexas que exigem mais inteligência; contexto longo de 2 milhões |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho rápido e versátil em diversas tarefas |
Gemini 1.0 Pro Visiongemini-1.0-pro-vision-001
|
texto, código, PDFs, imagens, vídeo (somente frames) | texto, código | Processa texto, imagens e vídeo para respostas de texto ou código. Não pode ser usado para chat. |
Gemini 1.0 Progemini-1.0-pro-002
|
texto, código | texto, código | Tarefas de linguagem natural, chat de código e texto com várias interações e geração de código |
Vertex AI in Firebase só oferece suporte a modelos Imagen 3. Ele não oferece suporte aos modelos Imagen mais antigos (como Imagen 2).
Na parte de baixo da página, você pode acessar informações detalhadas sobre modelos mais antigos. Consulte nossas Perguntas frequentes sobre todos os modelos compatíveis e não compatíveis com Vertex AI in Firebase.
O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Vertex AI in Firebase:
-
- Entrada e saída com suporte
- Comparação de alto nível dos recursos compatíveis
- Especificações e limitações, por exemplo, tokens de entrada máximos ou comprimento máximo de vídeo de entrada
Descrição de como os modelos são versionados, especificamente as versões estáveis, atualizadas automaticamente e de pré-lançamento
Listas de nomes de modelos disponíveis para incluir no código durante a inicialização
Listas de idiomas com suporte para os modelos
Na parte de baixo da página, você pode acessar informações detalhadas sobre modelos mais antigos.
Comparar modelos
Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Observe que cada uma das tabelas nesta seção descreve cada modelo quando usado com Vertex AI in Firebase. Cada modelo pode ter recursos adicionais que não estão disponíveis ao usar nossos SDKs.
Se você não encontrar as informações que está procurando nas subseções a seguir, consulte mais informações sobre os modelos Gemini e Imagen 3 na documentação do Google Cloud.
Entrada e saída com suporte
Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Vertex AI in Firebase:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
||
---|---|---|---|---|---|---|---|
Tipos de entrada | |||||||
Texto | |||||||
Texto (streaming) | |||||||
Código | |||||||
Documentos (PDFs ou texto simples) |
|||||||
Imagens | |||||||
Vídeo | |||||||
Áudio | |||||||
Áudio (streaming) | |||||||
Tipos de saída | |||||||
Texto | |||||||
Texto (streaming) | |||||||
Código | |||||||
Saída estruturada (como JSON) |
|||||||
Imagens | Em breve | ||||||
Áudio | Em breve | ||||||
Áudio (streaming) |
Para saber mais sobre os tipos de arquivo aceitos, consulte Arquivos de entrada e requisitos compatíveis com o Vertex AI Gemini API.
Recursos e recursos compatíveis
Estes são os recursos e os recursos com suporte ao usar cada modelo com Vertex AI in Firebase:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
Gerar texto com base em entradas de texto ou multimodal | somente streaming | |||||
Gerar imagens (Imagen 3) |
Em breve | |||||
Gerar áudio | Em breve | somente streaming | ||||
Gerar saída estruturada
(como JSON) |
||||||
Analisar documentos
(PDFs ou texto simples) |
||||||
Analisar imagens (visão) | ||||||
Analisar vídeo (visão) | ||||||
Analisar áudio | somente streaming | |||||
Chat multiturno | ||||||
Chamadas de função (ferramentas) | ||||||
Contar tokens e caracteres faturáveis | ||||||
Instruções do sistema | ||||||
Streaming multimodal bidirecional |
Especificações e limitações
Estas são as especificações e limitações ao usar cada modelo com Vertex AI in Firebase:
Propriedade |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
---|---|---|---|---|---|---|
Janela de contexto * Limite total de tokens (entrada+saída combinadas) |
1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 32.768 tokens | 480 tokens |
Limite de token de saída * | 65.536 tokens | 8.192 tokens | 8.192 tokens | 8.192 tokens | --- | --- |
Data limite de conhecimento | Janeiro de 2025 | Junho de 2024 | Junho de 2024 | Junho de 2024 | Agosto de 2024 | --- |
PDFs (por solicitação) | ||||||
Número máximo de arquivos PDF de entrada ** |
3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos | --- | --- |
Número máximo de páginas por arquivo PDF de entrada ** |
1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas | --- | --- |
Tamanho máximo por arquivo PDF de entrada |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
Imagens (por solicitação) | ||||||
Número máximo de imagens de entrada |
3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens | --- | --- |
Número máximo de imagens de saída |
--- | Em breve | --- | --- | --- | 4 imagens |
Tamanho máximo por imagem codificada em base64 de entrada |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
Vídeo (por solicitação) | ||||||
Número máximo de arquivos de vídeo de entrada |
10 arquivos | 10 arquivos | 10 arquivos | --- | --- | --- |
Duração máxima de todo o vídeo de entrada (somente frames) |
~60 minutos | ~60 minutos | ~60 minutos | --- | --- | --- |
Comprimento máximo de todo o vídeo de entrada (frames + áudio) |
aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | --- | --- | --- |
Áudio (por solicitação) | ||||||
Número máximo de arquivos de áudio de entrada |
1 arquivo | 1 arquivo | 1 arquivo | --- | --- | --- |
Número máximo de arquivos de áudio de saída |
--- | Em breve | --- | --- | --- | --- |
Comprimento máximo de todo o áudio de entrada |
~8,4 horas | ~8,4 horas | ~8,4 horas | --- | --- | --- |
Comprimento máximo de todo o áudio de saída |
--- | Em breve | --- | --- | --- | --- |
*
Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres,
então 100 tokens são cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível
determinar a contagem total de tokens nas solicitações usando
countTokens
.
** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.
Encontre mais informações detalhadas
As cotas e os preços são diferentes para cada modelo. Os preços também dependem da entrada e da saída.
Saiba mais sobre os tipos de arquivos de entrada aceitos, como especificar o tipo MIME e como garantir que os arquivos de entrada e as solicitações multimodais atendam aos requisitos e sigam as práticas recomendadas em Arquivos de entrada e requisitos compatíveis com o Vertex AI Gemini API.
Controle de versões de modelos e padrões de nomenclatura
Os modelos são oferecidos nas versões estável, pré-lançamento e experimental. Para conveniência, há suporte para aliases sem valores de versão explícitos.
Para encontrar nomes de modelos específicos para usar no código, consulte a seção "Nomes de modelos disponíveis" mais adiante nesta página.
Tipo de versão | Descrição | Padrão de nome do modelo | |
---|---|---|---|
Estável | As versões estáveis são consideradas de disponibilidade geral. |
Os nomes de modelos de versões estáveis são anexados a um número de versão de três dígitos específico.
Exemplo: |
|
Alias estável atualizado automaticamente | Os aliases estáveis atualizados automaticamente sempre apontam para a versão estável mais recente desse modelo. Se uma nova versão estável for lançada, o alias auto-atualizado vai começar a apontar para essa nova versão estável. |
Os nomes de modelos de aliases não têm apêndices
Exemplo: |
|
Visualizar |
As versões Pré-lançamento têm novos recursos e
são consideradas não estáveis.
As versões de pré-lançamento sempre apontam para a versão de pré-lançamento mais recente desse modelo. Se uma nova versão de visualização for lançada, todas as versões de visualização atuais vão começar a apontar para essa nova versão. |
Os nomes de modelos das versões de pré-lançamento são anexados com
Exemplo: |
|
Experimental |
As versões experimentais têm novos recursos
e são consideradas não estáveis e não seguem o
plano de ciclo de vida do modelo e o esquema de controle de versão padrão do Google.
Saiba mais sobre os modelos experimentais. |
Os nomes de modelos de versões experimentais são anexados com
Exemplo: |
Saiba mais sobre as versões de modelo disponíveis e o ciclo de vida delas (Gemini) ou Imagen na documentação do Google Cloud.
Nomes de modelos disponíveis
Os nomes de modelo são os valores explícitos que você inclui no código durante a inicialização do modelo.
É possível usar o
endpoint publishers.models.list
para listar todos os nomes de modelos disponíveis. Essa lista retornada vai incluir
todos os modelos compatíveis com Vertex AI, mas Vertex AI in Firebase só aceita
os modelos Gemini e Imagen descritos nesta página.
Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash
) não são
listados porque são um alias de conveniência para o modelo básico.
Gemini nomes de modelos
Para conferir exemplos de inicialização para seu idioma, consulte o guia de início.
Gemini 2.5 Pro nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
Nenhuma versão estável disponível | --- | --- | --- | --- |
Alias estável atualizado automaticamente | ||||
Nenhum alias estável atualizado automaticamente disponível | --- | --- | --- | --- |
Versões de pré-lançamento | ||||
gemini-2.5-pro-preview-03-25 |
Versão de pré-lançamento de Gemini 2.5 Pro | Visualizar | 25/03/2025 | A ser determinado |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Gemini 2.0 Flash nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-2.0-flash-001 |
Versão estável mais recente do Gemini 2.0 Flash | Disponibilidade geral | 2025-02-05 | A partir de 2026-02-05 |
Alias estável atualizado automaticamente | ||||
gemini-2.0-flash |
Indica a versão estável mais recente do Flash 2.0 (atualmente gemini-2.0-flash-001 |
Disponibilidade geral | 2025-02-10 | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Gemini 2.0 Flash‑Lite nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-2.0-flash-lite-001 |
Versão estável mais recente do Gemini 2.0 Flash‑Lite | Disponibilidade geral | 2025-02-25 | A partir de 2026-02-25 |
Alias estável atualizado automaticamente | ||||
gemini-2.0-flash-lite |
Aponta para a versão mais recente do Flash-Lite 2.0 (atualmente gemini-2.0-flash-lite-001 |
Disponibilidade geral | 2025-02-25 | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Gemini 2.0 Flash‑Live nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
Nenhuma versão estável disponível | --- | --- | --- | --- |
Alias estável atualizado automaticamente | ||||
Nenhum alias estável atualizado automaticamente disponível | --- | --- | --- | --- |
Versões de pré-lançamento | ||||
gemini-2.0-flash-live-preview-04-09 |
Versão de pré-lançamento para Gemini 2.0 Flash‑Live | Visualizar | 2025-04-09 | A ser determinado |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Gemini 2.0 Flash‑Thinking nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
Nenhuma versão estável disponível | --- | --- | --- | --- |
Alias estável atualizado automaticamente | ||||
Nenhum alias estável atualizado automaticamente disponível | --- | --- | --- | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
gemini-2.0-flash-thinking-exp-01-21 |
Versão experimental de Gemini 2.0 Flash‑Thinking | Experimental | 2025-01-21 | A ser determinado |
Imagen nomes de modelos
Para conferir exemplos de inicialização para seu idioma, consulte o guia de geração de imagens com Imagen.
No momento, nenhum dos modelos Imagen 3 tem versões de visualização ou experimentais disponíveis.
Imagen 3 nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
imagen-3.0-generate-002 |
Versão estável mais recente do Imagen 3 | Disponibilidade geral | 2025-01-23 | A partir de 23/01/2026 |
imagen-3.0-generate-001 |
Versão estável inicial de Imagen 3 | Disponibilidade geral | 2024-07-31 | A partir de 31-07-2025 |
Imagen 3 Fast nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
imagen-3.0-fast-generate-001 |
Versão estável inicial de Imagen 3 Fast | Disponibilidade geral | 2024-07-31 | A partir de 31-07-2025 |
Idiomas com suporte
Gemini
Todos os modelos Gemini podem entender e responder nos seguintes idiomas:
Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)
Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes idiomas adicionais:
Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)
Imagen
Disponibilidade geral: inglês
Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol
Informações sobre modelos mais antigos
O Vertex AI in Firebase oferece suporte a todos os modelos Gemini, incluindo modelos mais antigos, como Gemini 1.5 e Gemini 1.0.
Vertex AI in Firebase só oferece suporte a modelos Imagen 3. Ele não oferece suporte aos modelos Imagen mais antigos (como Imagen 2).
Conferir a entrada e a saída compatíveis de modelos mais antigos
Estes são os tipos de entrada e saída ao usar cada modelo com Vertex AI in Firebase:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | ||||
---|---|---|---|---|---|---|---|
Tipos de entrada | |||||||
Texto | |||||||
Código | |||||||
Documentos (PDFs ou texto simples) |
|||||||
Imagens | |||||||
Vídeo | |||||||
Áudio | |||||||
Áudio (streaming) | |||||||
Tipos de saída | |||||||
Texto | |||||||
Código | |||||||
Saída estruturada (como JSON) |
|||||||
Imagens, vídeos e áudio |
Recursos e recursos com suporte de modelos mais antigos
Estes são os recursos e as capacidades ao usar cada modelo com Vertex AI in Firebase:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | |
---|---|---|---|---|
Gerar texto com base na entrada somente de texto | ||||
Gerar texto a partir de uma entrada multimodal | ||||
Gerar imagens | ||||
Gerar áudio | ||||
Gerar saída estruturada
(como JSON) |
||||
Analisar documentos
(PDFs ou texto simples) |
||||
Analisar imagens (visão) | ||||
Analisar vídeo (visão) | ||||
Analisar áudio | ||||
Chat multiturno | ||||
Chamadas de função (ferramentas) | ||||
Contar tokens e caracteres faturáveis | ||||
Instruções do sistema | ||||
API Multimodal Live (streaming bidirecional) |
Especificações e limitações de modelos mais antigos
Estas são as especificações e limitações ao usar cada modelo com Vertex AI in Firebase:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | ||||
---|---|---|---|---|---|---|---|
Janela de contexto * Limite total de tokens (entrada+saída combinadas) |
2.097.152 tokens | 1.048.576 tokens | 16.384 tokens | 32.760 tokens | |||
Limite de token de saída * | 8.192 tokens | 8.192 tokens | 2.048 tokens | 8.192 tokens | |||
Data limite de conhecimento | Maio de 2024 | Maio de 2024 | Fevereiro de 2023 | Fevereiro de 2023 | |||
PDFs (por solicitação) | |||||||
Número máximo de arquivos PDF de entrada ** |
3.000 arquivos | 3.000 arquivos | 16 arquivos | --- | |||
Número máximo de páginas por arquivo PDF de entrada ** |
1.000 páginas | 1.000 páginas | 16 páginas | --- | |||
Tamanho máximo por arquivo PDF de entrada |
50 MB | 50 MB | 50 MB | --- | |||
Imagens (por solicitação) | |||||||
Número máximo de imagens de entrada |
3.000 imagens | 3.000 imagens | 16 imagens | --- | |||
Número máximo de imagens de saída |
--- | --- | --- | --- | |||
Tamanho máximo por imagem codificada em base64 de entrada |
7 MB | 7 MB | 7 MB | --- | |||
Vídeo (por solicitação) | |||||||
Número máximo de arquivos de vídeo de entrada |
10 arquivos | 10 arquivos | 1 arquivo | --- | |||
Duração máxima de todo o vídeo de entrada (somente frames) |
~60 minutos | ~60 minutos | 2 minutos | --- | |||
Comprimento máximo de todo o vídeo de entrada (frames + áudio) |
aproximadamente 45 minutos | aproximadamente 45 minutos | --- | --- | |||
Áudio (por solicitação) | |||||||
Número máximo de arquivos de áudio de entrada |
1 arquivo | 1 arquivo | --- | --- | |||
Número máximo de arquivos de áudio de saída |
--- | --- | --- | --- | |||
Comprimento máximo de todo o áudio de entrada |
~8,4 horas | ~8,4 horas | --- | --- | |||
Comprimento máximo de todo o áudio de saída |
--- | --- | --- | --- |
*
Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres,
então 100 tokens são cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível
determinar a contagem total de tokens nas solicitações usando
countTokens
.
** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.
Nomes de modelos disponíveis de modelos mais antigos (incluindo datas de desativação)
Os nomes de modelo são os valores explícitos que você inclui no código durante a inicialização do modelo.
Nomes dos modelos Gemini 1.5 Pro
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-1.5-pro-002 |
Versão estável mais recente do Gemini 1.5 Pro | Descontinuado | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 |
Versão estável inicial de Gemini 1.5 Pro | Descontinuado | 2024-05-24 | 2025-05-24 |
Alias estável atualizado automaticamente | ||||
gemini-1.5-pro |
Aponta para a versão estável mais recente do 1.5 Pro (atualmente gemini-1.5-pro-002 |
Descontinuado | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-1.5-flash-002 |
Versão estável mais recente do Gemini 1.5 Flash | Descontinuado | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 |
Versão estável inicial de Gemini 1.5 Flash | Descontinuado | 2024-05-24 | 2025-05-24 |
Alias estável atualizado automaticamente | ||||
gemini-1.5-flash |
Aponta para a versão estável mais recente do Flash 1.5 (atualmente gemini-1.5-flash-002 |
Descontinuado | 2024-09-24 | 2025-09-24 |
Gemini 1.0 Pro Vision nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-1.0-pro-vision-001 |
Versão estável mais recente do Gemini 1.0 Pro Vision | Descontinuado | 2024-02-15 | 2025-04-21 |
Alias estável atualizado automaticamente | ||||
gemini-1.0-pro-vision |
Aponta para a versão estável mais recente do 1.5 Pro Vision (atualmente gemini-1.5-pro-vision-001 |
Descontinuado | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-1.0-pro-002 |
Versão estável mais recente do Gemini 1.0 Pro | Descontinuado | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 |
Versão estável de Gemini 1.0 Pro | Descontinuado | 2024-02-15 | 2025-04-21 |
Alias estável atualizado automaticamente | ||||
gemini-1.0-pro |
Indica a versão mais recente da 1.0 Pro (atualmente gemini-1.0-pro-002 |
Descontinuado | 2024-02-15 | 2025-04-21 |
Próximas etapas
Teste os recursos do Gemini API
- Crie conversas com vários turnos (chat).
- Gerar texto com base em comandos somente de texto.
- Gerar texto a partir de comandos multimodais (incluindo texto, imagens, PDFs, vídeo e áudio).
- Gere saída estruturada (como JSON) com comandos de texto e multimodais.
- Gerar imagens com base em comandos de texto.
- Transmita entrada e saída de stream (incluindo áudio) usando o Gemini Live API.
- Use a chamada de função para conectar modelos generativos a sistemas e informações externas.