サポートされているモデルの詳細

モバイルアプリとウェブアプリの場合、Vertex AI in Firebase SDK を使用すると、サポートされている Gemini モデルImagen 3 モデルをアプリから直接操作できます。

Gemini モデルは、テキスト、コード、PDF、画像、動画、音声など、複数のモダリティを処理し、生成できるため、マルチモーダルと見なされます。Imagen 3 モデルにはテキストを指定して画像を生成できます。

次の表に、Vertex AI in Firebase でサポートされているモデルと、最新の安定版モデル名の概要を示します。この表には、ユースケースのプロトタイピングに使用できるプレビュー版モデルと試験運用版モデルも示されています。

モデル 入力 出力 説明
安定版の Gemini モデル
Gemini 2.0 Flash
gemini-2.0-flash-001
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON
(画像と音声は近日提供予定)
さまざまなタスクに対応する次世代の機能と速度を提供します。
(マルチモーダル生成は近日提供予定です)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 費用対効果に優れた低レイテンシのパフォーマンスを提供し、高スループットをサポートします。
プレビュー バージョンと試験運用版のみの Gemini モデル(プロトタイピングのユースケースにのみ推奨)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 非常に品質の高いモデルで、特にコードと世界中の知識に優れています。200 万個のトークンの長いコンテキストに対応しています。
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
テキスト、コード、PDF、画像 テキスト、コード、JSON 推論機能が強化されており、回答に思考プロセスが含まれます。
Imagen 3 モデル Vertex AI in Firebase で使用する場合)
Imagen 3
imagen-3.0-generate-002
テキスト 画像 自然言語テキスト プロンプトからリアルで高品質な画像を生成します。
Imagen 3 Fast
imagen-3.0-fast-generate-001
テキスト 画像 プロトタイピングや低レイテンシのユースケース用の画像を生成します。

はい。Vertex AI in Firebase は、古いモデルを含むすべての Gemini モデルをサポートしています。

モデル 入力 出力 最適な用途
Gemini 1.5 Pro
gemini-1.5-pro-002
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON より高度なインテリジェンスを必要とする複雑な推論タスクをサポート。200 万文字の長いコンテキスト
Gemini 1.5 Flash
gemini-1.5-flash-002
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON さまざまなタスクで高速で汎用性の高いパフォーマンスを提供します。
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
テキスト、コード、PDF、画像、動画(フレームのみ) テキスト、コード テキストまたはコードのレスポンスのテキスト、画像、動画を処理します。チャットには使用できません。
Gemini 1.0 Pro
gemini-1.0-pro-002
テキスト、コード テキスト、コード 自然言語タスク、マルチターン テキストとコードチャット、コード生成

Vertex AI in FirebaseImagen 3 モデルのみをサポートします。古い Imagen モデル(Imagen 2 など)はサポートされていません。

このページの下部にある以前のモデルの詳細情報をご覧ください。Vertex AI in Firebase がサポートするモデルとサポートしないモデルについては、よくある質問をご覧ください。


このページの残りの部分では、Vertex AI in Firebase でサポートされているモデルについて詳しく説明します。

このページの下部にある以前のモデルの詳細情報をご覧ください。



モデルを比較する

各モデルには、さまざまなユースケースをサポートするためのさまざまな機能があります。このセクションの各表は、Vertex AI in Firebase で使用する場合の各モデルについて説明しています。各モデルには、Google の SDK では利用できない追加機能が含まれている場合があります。

次のサブセクションで目的の情報が見つからない場合は、Google Cloud のドキュメントで Gemini モデルImagen 3 モデルの詳細をご覧ください。

サポートされている入力と出力

Vertex AI in Firebase で各モデルを使用する場合、サポートされている入力と出力のタイプは次のとおりです。

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
Imagen 3 /
Imagen 3 Fast
入力値の型
テキスト
コード
ドキュメント
(PDF またはテキスト)
画像
動画
音声
オーディオ(ストリーミング) 近日提供予定
出力タイプ
テキスト
コード
構造化出力
(JSON など)
画像 近日提供予定
音声 近日提供予定
オーディオ(ストリーミング) 近日提供予定

サポートされているファイル形式については、サポートされている入力ファイルと Vertex AI Gemini API の要件をご覧ください。

サポートされている機能

Vertex AI in Firebase で各モデルを使用する場合にサポートされる機能は次のとおりです。

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
Imagen 3 /
Imagen 3 Fast
テキストまたはマルチモーダル入力からテキストを生成する
画像を生成
Imagen 3
近日提供予定
音声を生成する 近日提供予定
構造化出力を生成する
(JSON など)
ドキュメントを分析する
(PDF またはテキスト)
画像を分析する(ビジョン)
動画を分析する(ビジョン)
音声を分析する
マルチターン チャット
関数呼び出し(ツール)
トークンと課金対象文字数をカウントする
システム指示
Multimodal Live API
(双方向ストリーミング)
近日提供予定

仕様と制限事項

Vertex AI in Firebase で各モデルを使用する場合の仕様と制限事項は次のとおりです。

プロパティ <span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
Imagen 3 /
Imagen 3 Fast
コンテキスト ウィンドウ *
トークンの合計上限
(入力と出力の合計)
2,097,152 個のトークン 1,048,576 個のトークン 1,048,576 個のトークン 1,048,576 個のトークン 480 トークン
出力トークンの上限 * 8,192 トークン 8,192 トークン 8,192 トークン 8,192 トークン ---
知識の締め切り日 2024 年 6 月 2024 年 6 月 2024 年 6 月 2024 年 6 月 ---
PDF(リクエストに応じて)
入力 PDF ファイルの最大数
**
3,000 ファイル 3,000 ファイル 3,000 ファイル 3,000 ファイル ---
入力 PDF ファイルあたりの最大ページ数
**
1,000 ページ 1,000 ページ 1,000 ページ 1,000 ページ ---
入力 PDF ファイルあたりの最大サイズ
50 MB 50 MB 50 MB 50 MB ---
画像(リクエストあたり)
入力画像の最大数
3,000 個の画像 3,000 個の画像 3,000 個の画像 3,000 個の画像 ---
出力画像の最大数
--- 近日提供予定 --- --- 4 枚
入力 base64 エンコード画像あたりの最大サイズ
7 MB 7 MB 7 MB 7 MB ---
動画(リクエストに応じて)
入力動画ファイルの最大数
10 ファイル 10 ファイル 10 ファイル --- ---
すべての入力動画の最大長

(フレームのみ)
60 分程度 60 分程度 60 分程度 --- ---
入力動画
の最大長
(フレーム数 + 音声)
45 分程度 45 分程度 45 分程度 --- ---
音声(リクエストに応じて)
入力音声ファイルの最大数
1 個のファイル 1 個のファイル 1 個のファイル --- ---
出力音声ファイルの最大数
--- 近日提供予定 --- --- ---
すべての入力音声の最大長
~ 8.4 時間 ~ 8.4 時間 ~ 8.4 時間 --- ---
すべての出力音声の最大長
--- 近日提供予定 --- --- ---

* すべての Gemini モデルで、1 トークンは約 4 文字に相当するため、100 トークンは約 60 ~ 80 ワード(英語)に相当します。Gemini モデルの場合、countTokens を使用してリクエスト内のトークンの合計数を特定できます。

** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。

詳細情報を確認する

  • 割り当て料金はモデルごとに異なります。料金は入力と出力によっても異なります。

  • サポートされている入力ファイルの種類、MIME タイプの指定方法、入力ファイルとマルチモーダル リクエストが要件を満たしていることを確認する方法、ベスト プラクティスに沿って作成する方法については、Vertex AI Gemini API でサポートされている入力ファイルと要件をご覧ください。



モデルのバージョニングと命名パターン

モデルには、安定版プレビュー版試験運用版があります。便宜上、明示的なバージョン値のないエイリアスがサポートされています。

コードで使用する特定のモデル名については、このページの「使用可能なモデル名」をご覧ください。

バージョンの種類 説明 モデル名のパターン
安定版 安定版は一般提供と見なされます。

安定版のモデル名には、特定の 3 桁のバージョン番号が追加されます。

例: gemini-2.0-flash-001
例: imagen-3.0-generate-002

自動更新の安定版エイリアス 自動更新の安定版エイリアスは、常にそのモデルの最新の安定版を参照します。新しい安定版がリリースされると、自動更新エイリアスが自動的にその新しい安定版を参照するようになります。

エイリアスのモデル名に接尾辞がない

例: gemini-2.0-flash

プレビュー プレビュー版には新しい機能が含まれており、安定版ではないと見なされます。

プレビュー バージョンは、常にそのモデルの最新の プレビュー バージョンを参照します。新しいプレビュー バージョンがリリースされると、既存のプレビュー バージョンは自動的にその新しいプレビュー バージョンを参照するようになります。

プレビュー バージョンのモデル名には、モデルの最初のリリース日(-MMDD)とともに -preview が追加されます。

例: gemini-2.0-flash-lite-preview-02-05
(2025 年 2 月 5 日にリリース)

試験運用版 試験運用版には新しい機能が含まれており、安定版ではないと見なされ、Google の標準モデル ライフサイクル計画とバージョニング スキームに準拠していません。

詳しくは、試験運用版モデルをご覧ください。

試験運用版のモデル名には、モデルの最初のリリース日(-MMDD)とともに -exp が追加されます。

例: gemini-2.0-pro-exp-02-05
(2025 年 2 月 5 日にリリース)

使用可能なモデル バージョンとそのライフサイクル(Gemini)の詳細については、Google Cloud のドキュメントで Imagen をご覧ください。



使用可能なモデル名

モデル名は、モデルの初期化時にコードに含める明示的な値です。

publishers.models.list エンドポイントを使用して、使用可能なモデル名をすべて一覧表示できます。返されるリストには、Vertex AI がサポートするすべてのモデルが含まれますが、Vertex AI in Firebase は、このページで説明する Gemini モデルと Imagen モデルのみをサポートします。また、自動更新エイリアス(gemini-2.0-flash など)は、ベースモデルの便利なエイリアスであるため、リストに表示されません。

Gemini モデル名

使用言語の初期化例については、スタートガイドをご覧ください。

Gemini 2.0 Pro モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
利用可能な安定版はありません --- --- --- ---
自動更新の安定版エイリアス
自動更新の安定版エイリアスが利用できない --- --- --- ---
プレビュー版
利用可能なプレビュー バージョンはありません --- --- --- ---
試験運用版
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro の試験運用版 試験運用版 2025-02-05 未定

Gemini 2.0 Flash モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-2.0-flash-001 Gemini 2.0 Flash の最新の安定版 一般提供 2025-02-05
2026-02-05 以降
自動更新の安定版エイリアス
gemini-2.0-flash 2.0 Flash の最新の安定版を指します
(現在は gemini-2.0-flash-001)。
一般提供 2025-02-10 ---
プレビュー版
利用可能なプレビュー バージョンはありません --- --- --- ---
試験運用版
利用可能な試験運用版はありません --- --- --- ---

Gemini 2.0 Flash‑Lite モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-2.0-flash-lite-001 Gemini 2.0 Flash‑Lite の最新の安定版 一般提供 2025-02-25
2026-02-25 以降
自動更新の安定版エイリアス
gemini-2.0-flash-lite 2.0 Flash-Lite の最新の安定版を指します
(現在は gemini-2.0-flash-lite-001
一般提供 2025-02-25 ---
プレビュー版
gemini-2.0-flash-lite-preview-02-05 Gemini 2.0 Flash‑Lite のプレビュー版 プレビュー 2025-02-05 未定
試験運用版
利用可能な試験運用版はありません --- --- --- ---

Gemini 2.0 Flash‑Thinking モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
利用可能な安定版はありません --- --- --- ---
自動更新の安定版エイリアス
自動更新の安定版エイリアスが利用できない --- --- --- ---
プレビュー版
利用可能なプレビュー バージョンはありません --- --- --- ---
試験運用版
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.0 Flash‑Thinking の試験運用版 試験運用版 2025-01-21 未定

Imagen モデル名

言語の初期化例については、Imagen を使用して画像を生成するガイドをご覧ください。

現在、Imagen 3 モデルのプレビュー版または試験運用版はいずれも利用できません。

Imagen 3 モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
imagen-3.0-generate-002 Imagen 3 の最新の安定版 一般提供 2025-01-23 2026 年 1 月 23 日以降
imagen-3.0-generate-001 Imagen 3 の最初の安定版 一般提供 2024-07-31 2025-07-31 以降

Imagen 3 Fast モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
imagen-3.0-fast-generate-001 Imagen 3 Fast の最初の安定版 一般提供 2024-07-31 2025-07-31 以降



サポートされている言語

Gemini

  • すべての Gemini モデルは、次の言語を理解して回答できます。

    アラビア語(ar)、ベンガル語(bn)、ブルガリア語(bg)、中国語(簡体字、繁体字)(zh)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(iw)、ヒンディー語(hi)、ハンガリー語(hu)、インドネシア語(id)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(lv)、リトアニア語(lt)、ノルウェー語(no)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、セルビア語(sr)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スワヒリ語(sw)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr)、ウクライナ語(uk)、ベトナム語(vi)

  • Gemini 2.0 FlashGemini 1.5 ProGemini 1.5 Flash モデルは、次の追加言語を理解して回答できます。

    アフリカーンス語(af)、アムハラ語(am)、アッサム語(as)、アゼルバイジャン語(az)、ベラルーシ語(be)、ボスニア語(bs)、カタルーニャ語(ca)、セブアノ語(ceb)、コルシカ語(co)、ウェールズ語(cy)、ディベヒ語(dv)、エスペラント語(eo)、バスク語(eu)、ペルシア語(fa)、フィリピン語(タガログ語)(fil)、フリジア語(fy)、アイルランド語(ga)、スコットランド ゲール語(gd)、ガリシア語(gl)、グジャラート語(gu)、ハウサ語(ha)、ハワイ語(haw)、モン語(hmn)、クレオール語(ハイチ)(ht)、アルメニア語(hy)、イボ語(ig)、アイスランド語(is)、ジャワ語(jv)、ジョージア語(ka)、カザフ語(kk)、クメール語(km)、カンナダ語(kn)、クリオ語(kri)、クルド語(ku)、キルギス語(ky)、ラテン語(la)、ルクセンブルク語(lb)、ラオ語(lo)、マダガスカル語(mg)、マオリ語(mi)、マケドニア語(mk)、マラヤーラム語(ml)、モンゴル語(mn)、メイテイ語(マニプル語)(mni-Mtei)、マラーティー語(mr)、マレー語(ms)、マルタ語(mt)、ミャンマー語(ビルマ語)(my)、ネパール語(ne)、ニャンジャ語(チェワ語)(ny)、オディア語(オリヤー語)(or)、パンジャブ語(pa)、パシュトゥ語(ps)、シンド語(sd)、シンハラ語(si)、サモア語(sm)、ショナ語(sn)、ソマリ語(so)、アルバニア語(sq)、ソト語(st)、スンダ語(su)、タミル語(ta)、テルグ語(te)、タジク語(tg)、ウイグル語(ug)、ウルドゥー語(ur)、ウズベク語(uz)、コーサ語(xh)、イディッシュ語(yi)、ヨルバ語(yo)、ズールー語(zu)

Imagen

  • 一般提供: 英語

  • プレビュー: 中国語(簡体)、中国語(繁体)、ヒンディー語、日本語、韓国語、ポルトガル語、スペイン語



以前のモデルに関する情報

Vertex AI in Firebase は、Gemini 1.5 モデルや Gemini 1.0 モデルなどの古いモデルを含む、すべての Gemini モデルをサポートしています。

Vertex AI in FirebaseImagen 3 モデルのみをサポートします。古い Imagen モデル(Imagen 2 など)はサポートされていません。

Vertex AI in Firebase で各モデルを使用する場合の入力と出力の型は次のとおりです。

<span="notranslate">Gemini 1.5 Pro </span="notranslate"> <span="notranslate">Gemini 1.5 Flash </span="notranslate"> <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> <span="notranslate">Gemini 1.0 Pro </span="notranslate">
入力値の型
テキスト
コード
ドキュメント
(PDF またはテキスト)
画像
動画
音声
オーディオ(ストリーミング)
出力タイプ
テキスト
コード
構造化出力
(JSON など)
画像、動画、音声

Vertex AI in Firebase で各モデルを使用する場合の機能は次のとおりです。

<span="notranslate">Gemini 1.5 Pro </span="notranslate"> <span="notranslate">Gemini 1.5 Flash </span="notranslate"> <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> <span="notranslate">Gemini 1.0 Pro </span="notranslate">
テキストのみの入力からテキストを生成する
マルチモーダル入力からテキストを生成する
画像を生成する
音声を生成する
構造化出力を生成する
(JSON など)
ドキュメントを分析する
(PDF またはテキスト)
画像を分析する(ビジョン)
動画を分析する(ビジョン)
音声を分析する
マルチターン チャット
関数呼び出し(ツール)
トークンと課金対象文字数をカウントする
システム指示
Multimodal Live API
(双方向ストリーミング)

Vertex AI in Firebase で各モデルを使用する場合の仕様と制限事項は次のとおりです。

<span="notranslate">Gemini 1.5 Pro </span="notranslate"> <span="notranslate">Gemini 1.5 Flash </span="notranslate"> <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> <span="notranslate">Gemini 1.0 Pro </span="notranslate">
コンテキスト ウィンドウ *
トークンの合計上限
(入力と出力の合計)
2,097,152 個のトークン 1,048,576 個のトークン 16,384 トークン 32,760 トークン
出力トークンの上限 * 8,192 トークン 8,192 トークン 2,048 トークン 8,192 トークン
知識の締め切り日 2024 年 5 月 2024 年 5 月 2023 年 2 月 2023 年 2 月
PDF(リクエストに応じて)
入力 PDF ファイルの最大数
**
3,000 ファイル 3,000 ファイル 16 個のファイル ---
入力 PDF ファイルあたりの最大ページ数
**
1,000 ページ 1,000 ページ 16 ページ ---
入力 PDF ファイルあたりの最大サイズ
50 MB 50 MB 50 MB ---
画像(リクエストあたり)
入力画像の最大数
3,000 個の画像 3,000 個の画像 16 枚 ---
出力画像の最大数
--- --- --- ---
入力 base64 エンコード画像あたりの最大サイズ
7 MB 7 MB 7 MB ---
動画(リクエストに応じて)
入力動画ファイルの最大数
10 ファイル 10 ファイル 1 個のファイル ---
すべての入力動画の最大長

(フレームのみ)
60 分程度 60 分程度 2 分 ---
入力動画
の最大長
(フレーム数 + 音声)
45 分程度 45 分程度 --- ---
音声(リクエストに応じて)
入力音声ファイルの最大数
1 個のファイル 1 個のファイル --- ---
出力音声ファイルの最大数
--- --- --- ---
すべての入力音声の最大長
~ 8.4 時間 ~ 8.4 時間 --- ---
すべての出力音声の最大長
--- --- --- ---

* すべての Gemini モデルで、1 トークンは約 4 文字に相当するため、100 トークンは約 60 ~ 80 ワード(英語)に相当します。Gemini モデルの場合、countTokens を使用してリクエスト内のトークンの合計数を特定できます。

** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。

以前のモデルで使用可能なモデル名(廃止日を含む)

モデル名は、モデルの初期化時にコードに含める明示的な値です。

Gemini 1.5 Pro のモデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.5-pro-002 Gemini 1.5 Pro の最新の安定版 非推奨 2024-09-24 2025-09-24
gemini-1.5-pro-001 Gemini 1.5 Pro の最初の安定版 非推奨 2024-05-24 2025-05-24
自動更新の安定版エイリアス
gemini-1.5-pro 1.5 Pro の最新の安定版を指します
(現在は gemini-1.5-pro-002)。
非推奨 2024-09-24 2025-09-24

Gemini 1.5 Flash モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.5-flash-002 Gemini 1.5 Flash の最新の安定版 非推奨 2024-09-24 2025-09-24
gemini-1.5-flash-001 Gemini 1.5 Flash の最初の安定版 非推奨 2024-05-24 2025-05-24
自動更新の安定版エイリアス
gemini-1.5-flash 1.5 Flash の最新の安定版を指します
(現在は gemini-1.5-flash-002)。
非推奨 2024-09-24 2025-09-24

Gemini 1.0 Pro Vision モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision の最新の安定版 非推奨 2024-02-15 2025-04-09
自動更新の安定版エイリアス
gemini-1.0-pro-vision 1.5 Pro Vision の最新の安定版を指します(現在は gemini-1.5-pro-vision-001)。
非推奨 2024-01-04 2025-04-09

Gemini 1.0 Pro モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.0-pro-002 Gemini 1.0 Pro の最新の安定版 非推奨 2024-04-09 2025-04-09
gemini-1.0-pro-001 Gemini 1.0 Pro の安定版 非推奨 2024-02-15 2025-04-09
自動更新の安定版エイリアス
gemini-1.0-pro 1.0 Pro の最新の安定版を指します
(現在は gemini-1.0-pro-002)。
非推奨 2024-02-15 2025-04-09



次のステップ

Gemini API の機能を試す