サポートされているモデルの詳細

モバイルアプリとウェブアプリの場合、Firebase AI Logic SDK を使用すると、アプリからサポートされている Gemini モデルImagen モデルを直接操作できます。

Gemini モデルは、テキスト、コード、PDF、画像、動画、音声など、複数のモダリティを処理し、生成することもできるため、マルチモーダルと見なされます。Imagen モデルは、テキストでプロンプトを指定して画像を生成できます。

また、Firebase AI Logic がサポートしているモデルとサポートしていないモデルに関するよくある質問もご覧ください。

汎用モデル

モデルの比較に移動

最もインテリジェントなモデル

gemini-3-pro-preview

マルチモーダル理解に最適なモデルであり、これまでで最も強力なエージェント モデルとバイブ コーディング モデルです。最先端の推論を基盤として、より豊かなビジュアルとより深いインタラクティビティを実現します。(課金が必要)


Google の高度な思考モデル

gemini-2.5-pro

コード、数学、STEM の複雑な問題を推論し、長いコンテキストを使用して大規模なデータセット、コードベース、ドキュメントを分析できる最先端の思考モデル。

高速かつインテリジェント

gemini-2.5-flash

バランスの取れた機能を提供する、価格とパフォーマンスの面で最適なモデル。2.5 Flash は、大規模な処理、低レイテンシ、思考を必要とする大容量のタスク、エージェントのユースケースに最適です。

超高速

gemini-2.5-flash-lite

費用対効果と高スループット向けに最適化された、最も高速な Flash モデル。

画像生成モデル

画像は Gemini モデルまたは Imagen モデルで生成できます。

モデルの比較に移動

Gemini

gemini-3-pro-image-preview

プロフェッショナルなアセット制作や複雑な指示向けに設計されています。Google 検索を使用した現実世界のグラウンディング、生成前に構成を調整するデフォルトの「思考」プロセス、最大 4K 解像度の画像を生成できる機能が搭載されています。(課金が必要)

gemini-2.5-flash-image

スピードと効率性を重視した設計。大容量で低レイテンシのタスク向けに最適化されており、1024 ピクセルの解像度で画像を生成します。(課金が必要)

Imagen

imagen-4.0-generate-001

自然言語テキスト プロンプトからリアルで高品質な画像を生成します。(課金が必要)

imagen-4.0-fast-generate-001

プロトタイピングや低レイテンシのユースケース用の画像を生成します。(課金が必要)

imagen-4.0-ultra-generate-001

自然言語テキスト プロンプトからリアルで高品質な画像を生成します。(課金が必要)

以前の世代のモデル

以下は現行モデルですが、旧世代のモデルです。可能であれば、代わりに最新のモデルのいずれかを使用することをおすすめします。

モデルの比較に移動

Gemini モデル

第 2 世代の主力モデル

gemini-2.0-flash-001

100 万トークンのコンテキスト ウィンドウを備えた、第 2 世代の主力モデル。優れたスピードやネイティブ ツールの使用など、次世代の機能と強化された機能を提供します。

Google の第 2 世代高速モデル

gemini-2.0-flash-lite-001

100 万トークンのコンテキスト ウィンドウを備えた第 2 世代の小型主力モデル。費用対効果と低レイテンシを重視して最適化されています。


このページの残りの部分では、Firebase AI Logic でサポートされているモデルについて詳しく説明します。

このページの下部で、以前の世代のモデルの詳細情報を確認できます。



モデルの比較

各モデルには、さまざまなユースケースに対応するための異なる機能が備わっています。このセクションの各表では、各モデルを Firebase AI Logic と組み合わせて使用する場合について説明します。各モデルには、SDK を使用する際には利用できない追加機能がある場合があります。

次のサブセクションでお探しの情報が見つからない場合は、選択した API プロバイダのドキュメントで詳細を確認してください。

サポートされている入出力

Firebase AI Logic で各モデルを使用する場合、サポートされている入出力の型は次のとおりです。

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
3 Pro
Image </span="notranslate">
<span="notranslate">Gemini
2.5 Pro、Flash、Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen(生成) Imagen(機能)
入力値の型
テキスト
テキスト(ストリーミング)
コード
ドキュメント
(PDF またはプレーン テキスト)
画像
動画
音声
音声(ストリーミング)
出力タイプ
テキスト
テキスト(ストリーミング)
コード
構造化された出力
(JSON など)
画像
音声
音声(ストリーミング)

サポートされているファイル形式については、サポートされている入力ファイルと要件をご覧ください。

サポートされている機能

Firebase AI Logic で各モデルを使用する場合にサポートされる機能は次のとおりです。

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
3 Pro
Image </span="notranslate">
<span="notranslate">Gemini
2.5 Pro、Flash、Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen(生成) Imagen(機能)
思考
テキストのみの入力またはマルチモーダル入力からテキストを生成する インターリーブまたは画像の一部として インターリーブまたは画像の一部として ストリーミングのみ
画像を生成する
Gemini または Imagen
画像を編集する
Gemini または Imagen
音声を生成する ストリーミングのみ
構造化された出力
(JSON など)を生成する
ドキュメントを分析する
(PDF またはプレーン テキスト)
画像を分析する(vision)
動画を分析する(ビジョン)
音声を分析する ストリーミングのみ
マルチターン チャット
双方向マルチモーダル ストリーミング
関数呼び出し
コードの実行
Google 検索によるグラウンディング
システム指示
トークンをカウントする

仕様と制限事項

Firebase AI Logic で各モデルを使用する場合の仕様と制限事項は次のとおりです。

プロパティ <span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
3 Pro
Image </span="notranslate">
<span="notranslate">Gemini
2.5 Pro、Flash、Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen(生成) Imagen(機能)
入力トークンの上限* 1,048,576 個のトークン 65,536 個のトークン 1,048,576 個のトークン 32,768 トークン 32,768 トークン 480 トークン 480 トークン
出力トークンの上限 * 65,536 個のトークン 32,768 トークン 65,536 個のトークン 8,192 個のトークン 8,192 個のトークン --- ---
ナレッジ カットオフ日 2025 年 1 月 2025 年 1 月 2025 年 1 月 June 2025 2024 年 8 月 --- ---
PDF(リクエストごと)
入力 PDF ファイルの最大数
**
900 ファイル 14 ファイル 3,000 ファイル 3 ファイル --- --- ---
入力 PDF ファイルあたりの最大ページ数

**
900 ページ 14 ページ 1,000 ページ 3 ページ --- --- ---
入力 PDF ファイルあたりの最大サイズ
50 MB 50 MB 50 MB 50 MB --- --- ---
画像(リクエストあたり)
入力画像の最大数
1,000 個の画像 画像 14 枚 3,000 個の画像 画像 3 枚 --- --- 4 枚
出力画像の最大数
--- 10 枚の画像 --- 10 枚の画像 --- 4 枚 4 枚
入力された base64 エンコード画像の最大サイズ
7 MB 7 MB 7 MB 7 MB --- --- ---
動画(リクエストごと)
入力動画ファイルの最大数
10 ファイル --- 10 ファイル --- --- --- ---
すべての入力動画の最大長
(フレームのみ)
~ 60 分 --- ~ 60 分 --- --- --- ---
すべての入力動画
(フレーム + 音声)の最大長
45 分程度 --- 45 分程度 --- --- --- ---
音声(リクエストごと)
入力音声ファイルの最大数
1 個のファイル --- 1 個のファイル --- --- --- ---
出力音声ファイルの最大数
--- --- --- --- --- --- ---
すべての入力音声の最大長
約 8.4 時間 --- 約 8.4 時間 --- --- --- ---
すべての出力音声の最大長
--- --- --- --- --- --- ---

* すべての Gemini モデルでは、1 つのトークンは約 4 文字に相当するため、100 個のトークンは約 60 ~ 80 語(英語)に相当します。Gemini モデルの場合、countTokens を使用して、リクエスト内のトークンの合計数を特定できます。

** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。

詳細情報を確認する



モデルのバージョニングと命名パターン

モデルは、安定版プレビュー版試験運用版で提供されます。便宜上、明示的なバージョン値のないエイリアスがサポートされています。

コードで使用する特定のモデル名については、このページの後半の「使用可能なモデル名」セクションをご覧ください。

バージョンの種類 /
リリース ステージ
説明 モデル名のパターン
Stable 安定版は、リリース日から本番環境で使用でき、サポートされます。
  • 安定版モデル バージョンは通常、モデルが利用できる最終日を示す廃止日とともにリリースされます。この日以降、このモデルにはアクセスできなくなり、Google のサポートも受けられなくなります。
  • Gemini 2.5 モデル
    安定版のモデル名には接尾辞がありません。

    例: gemini-2.5-pro

  • Gemini 2.0 モデルと Imagen モデル
    安定版のモデル名には、特定の 3 桁のバージョン番号が付加されます。

    例: gemini-2.0-flash-001
    例: imagen-3.0-generate-002

自動更新される安定版エイリアス
Gemini 2.0 モデルのみ)
自動更新安定版エイリアスは、常にそのモデルの最新の安定版バージョンを参照します。
  • 新しい安定版がリリースされると、自動更新エイリアスは自動的にその新しい安定版を参照するようになります。

Gemini 2.0 モデルのみ
エイリアスのモデル名に接尾辞がない

例: gemini-2.0-flash

プレビュー プレビュー版には新しい機能が搭載されていますが、安定版ではありません
  • これらのモデルは本番環境での使用には推奨されません。レート上限が厳しく、課金要件が適用される場合があります。
  • これらのモデルは、関連する安定版のリリース後数週間または数か月以内に廃止されます。
  • Vertex AI Gemini API の場合、2025 年 6 月以降にリリースされたプレビュー モデルでは、通常、モデルのロケーションを global に設定する必要があります。

プレビュー バージョンのモデル名には -preview が付加され、多くの場合、モデルのリリース日(古いモデルの場合は -MM-DD、新しいモデルの場合は -MM-YYYY)も付加されます。

例:
gemini-2.5-flash-preview-04-17
(2025 年 4 月 17 日リリース)
または
gemini-2.5-flash-preview-09-2025
(2025 年 9 月リリース)
または
gemini-3-pro-preview
(2025 年 11 月リリース)

試験運用版 試験運用バージョンには新しい機能が搭載されていますが、安定していないと見なされます。
  • これらのモデルは本番環境での使用には推奨されず、より厳しいレート制限が適用されます。試験運用版モデルは、フィードバックを収集し、最新機能のテストを可能にすることを目的としています。
  • これらのモデルは、関連する安定版のリリース後数週間または数か月以内に廃止されます。
  • Vertex AI Gemini API の場合、2025 年 6 月以降にリリースされた試験運用モデルでは、モデルのロケーションを global に設定する必要があります。

試験運用版のモデル名には、モデルのリリース日(-MM-DD)とともに -exp が付加されます。

例: gemini-2.5-pro-exp-03-25
(2025 年 3 月 25 日リリース)

退職 廃止されたバージョンは廃止日を過ぎており、完全に無効になっています。
  • 廃止されたモデルにはアクセスできなくなり、Google のサポートも終了します。廃止されたモデル名を使用するリクエストは 404 エラーを返します。

---



使用可能なモデル名

モデル名は、モデルの初期化時にコードに含める明示的な値です。

Gemini モデル名にジャンプ Imagen モデル名にジャンプ

使用可能なすべてのモデルをプログラムで一覧表示する

REST API を使用して、使用可能なすべてのモデル名を一覧表示できます。

返されるリストには、API プロバイダがサポートするすべてのモデルが含まれますが、Firebase AI Logic はこのページで説明する Gemini モデルと Imagen モデルのみをサポートします。また、自動更新エイリアス(gemini-2.0-flash など)は基本モデルの便利なエイリアスであるため、一覧表示されません。

Gemini モデル名

プラットフォームの初期化の例については、スタートガイドをご覧ください。

リリース ステージ(特にユースケース、課金、廃止)の詳細については、モデルのバージョン管理と命名パターンをご覧ください。

Gemini 3 Pro モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-3-pro-preview Gemini 3 Pro のプレビュー版 プレビュー 2025-11-18 未定

Gemini 3 Pro Image モデル名(「nano banana pro」)

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-3-pro-image-preview Gemini 3 Pro Image のプレビュー版 プレビュー 2025-11-20 未定

Gemini 2.5 Pro モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.5-pro Gemini 2.5 Pro の安定版 Stable 2025-06-17
2026 年 6 月 17 日以降

Gemini 2.5 Flash モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.5-flash Gemini 2.5 Flash の安定版 Stable 2025-06-17
2026 年 6 月 17 日以降

Gemini 2.5 Flash‑Lite モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.5-flash-lite Gemini 2.5 Flash‑Lite の安定版 Stable 2025-07-22
2026 年 7 月 22 日以降

Gemini 2.5 Flash Image モデル名(「nano banana」とも呼ばれます)

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.5-flash-image Gemini 2.5 Flash Image(「nano banana」とも呼ばれます)の安定版 Stable 2025-10-02
2026 年 10 月 2 日以降

Gemini 2.5 Flash Live モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-live-2.5-flash Gemini 2.5 Flash Live の安定版 Stable
(限定公開一般提供)1
2025-06-01
2026 年 6 月 1 日以降
gemini-live-2.5-flash-preview 2 Gemini 2.5 Flash Live のプレビュー バージョン プレビュー 2025-06-01 未定

Firebase AI Logic は、ネイティブ音声モデル(gemini-2.5-flash-native-audio-preview-09-2025 など)をまだサポートしていません。

1 アクセス権をリクエストするには、Google Cloud アカウント チームの担当者にお問い合わせください。 2 アクセス方法に関係なく、Vertex AI Gemini API ではサポートされていません。

Gemini 2.0 Flash Live モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.0-flash-live-001 2 Gemini 2.0 Flash Live の安定版 Stable 2025-04-01
2026 年 4 月 1 日以降
gemini-2.0-flash-live-preview-04-09 Gemini 2.0 Flash Live のプレビュー バージョン プレビュー 2025-04-09 未定

2 アクセス方法に関係なく、Vertex AI Gemini API ではサポートされていません。

Imagen モデル名

プラットフォームの初期化の例については、Imagen を使用して画像を生成するガイドをご覧ください。

リリース ステージ(特にユースケース、課金、廃止)の詳細については、モデルのバージョン管理と命名パターンをご覧ください。

Imagen 4 モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-4.0-generate-001 Imagen 4 の安定版 Stable 2025-08-14 2026 年 8 月 14 日以降

Imagen 4 Fast モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-4.0-fast-generate-001 Imagen 4 Fast の安定版 Stable 2025-08-14 2026 年 8 月 14 日以降

Imagen 4 Ultra モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-4.0-ultra-generate-001 Imagen 4 Ultra の安定版 Stable 2025-08-14 2026 年 8 月 14 日以降

Imagen 3 Capability モデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-3.0-capability-001 3 Imagen 3 Capability の最初の安定版 Stable 2024-12-10 2025 年 12 月 10 日以降

3 アクセス方法に関係なく、Gemini Developer API ではサポートされていません。



サポートされている言語

Gemini

  • すべての Gemini モデルは、次の言語を理解して回答できます。

    アラビア語(ar)、ベンガル語(bn)、ブルガリア語(bg)、中国語(簡体字、繁体字)(zh)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(iw)、ヒンディー語(hi)、ハンガリー語(hu)、インドネシア語(id)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(lv)、リトアニア語(lt)、ノルウェー語(no)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、セルビア語(sr)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スワヒリ語(sw)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr)、ウクライナ語(uk)、ベトナム語(vi)

  • Gemini 2.0 FlashGemini 1.5 ProGemini 1.5 Flash モデルは、次の追加言語を理解して応答できます。

    アフリカーンス語(af)、アムハラ語(am)、アッサム語(as)、アゼルバイジャン語(az)、ベラルーシ語(be)、ボスニア語(bs)、カタルーニャ語(ca)、セブアノ語(ceb)、コルシカ語(co)、ウェールズ語(cy)、ディベヒ語(dv)、エスペラント語(eo)、バスク語(eu)、ペルシア語(fa)、フィリピン語(タガログ語)(fil)、フリジア語(fy)、アイルランド語(ga)、スコットランド ゲール語(gd)、ガリシア語(gl)、グジャラート語(gu)、ハウサ語(ha)、ハワイ語(haw)、モン語(hmn)、クレオール語(ハイチ)(ht)、アルメニア語(hy)、イボ語(ig)、アイスランド語(is)、ジャワ語(jv)、ジョージア語(ka)、カザフ語(kk)、クメール語(km)、カンナダ語(kn)、クリオ語(kri)、クルド語(ku)、キルギス語(ky)、ラテン語(la)、ルクセンブルク語(lb)、ラオ語(lo)、マダガスカル語(mg)、マオリ語(mi)、マケドニア語(mk)、マラヤーラム語(ml)、モンゴル語(mn)、メイテイ語(マニプル語)(mni-Mtei)、マラーティー語(mr)、マレー語(ms)、マルタ語(mt)、ミャンマー語(ビルマ語)(my)、ネパール語(ne)、ニャンジャ語(チェワ語)(ny)、オディア語(オリヤー語)(or)、パンジャブ語(pa)、パシュトゥ語(ps)、シンド語(sd)、シンハラ語(si)、サモア語(sm)、ショナ語(sn)、ソマリ語(so)、アルバニア語(sq)、ソト語(st)、スンダ語(su)、タミル語(ta)、テルグ語(te)、タジク語(tg)、ウイグル語(ug)、ウルドゥー語(ur)、ウズベク語(uz)、コーサ語(xh)、イディッシュ語(yi)、ヨルバ語(yo)、ズールー語(zu)

Imagen

  • 一般提供: 英語

  • プレビュー: 中国語(簡体)、中国語(繁体)、ヒンディー語、日本語、韓国語、ポルトガル語、スペイン語



以前のモデルに関する情報

以下は現行モデルですが、旧世代のモデルです。可能であれば、代わりに最新のモデルのいずれかを使用することをおすすめします。

Gemini 個のモデル

モデル 入力 出力 説明
Gemini 2.0 Flash
gemini-2.0-flash-001
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 優れたスピード、組み込みツールの使用、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と強化された機能を備えたマルチモーダル モデル
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 最も高速で費用対効果の高い Flash モデル。価格と速度はそのままに品質の向上を求めている 1.5 Flash ユーザー向けのアップグレード パスです。

Imagen 個のモデル

モデル 入力 出力 説明
Imagen 3
imagen-3.0-generate-002
テキスト 画像 自然言語テキスト プロンプトからリアルで高品質な画像を生成します。
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
テキスト 画像 プロトタイピングや低レイテンシのユースケース用の画像を生成します

2 アクセス方法に関係なく、Gemini Developer API ではサポートされていません。



次のステップ

Gemini API の機能を試す