モバイルアプリとウェブアプリの場合、Firebase AI Logic SDK を使用すると、アプリからサポートされている Gemini モデルと Imagen モデルを直接操作できます。
Gemini モデルは、テキスト、コード、PDF、画像、動画、音声など、複数のモダリティを処理し、生成することもできるため、マルチモーダルと見なされます。Imagen モデルは、テキストでプロンプトを指定して画像を生成できます。
また、Firebase AI Logic がサポートしているモデルとサポートしていないモデルに関するよくある質問もご覧ください。
汎用モデル
Gemini 3 Pro
gemini-3-pro-preview
マルチモーダル理解に最適なモデルであり、これまでで最も強力なエージェント モデルとバイブ コーディング モデルです。最先端の推論を基盤として、より豊かなビジュアルとより深いインタラクティビティを実現します。(課金が必要)
Gemini 2.5 Pro
gemini-2.5-pro
コード、数学、STEM の複雑な問題を推論し、長いコンテキストを使用して大規模なデータセット、コードベース、ドキュメントを分析できる最先端の思考モデル。
Gemini 2.5 Flash
gemini-2.5-flash
バランスの取れた機能を提供する、価格とパフォーマンスの面で最適なモデル。2.5 Flash は、大規模な処理、低レイテンシ、思考を必要とする大容量のタスク、エージェントのユースケースに最適です。
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
費用対効果と高スループット向けに最適化された、最も高速な Flash モデル。
画像生成モデル
画像は Gemini モデルまたは Imagen モデルで生成できます。
Gemini
Gemini 3 Pro Image(別名 nano banana pro)
gemini-3-pro-image-preview
プロフェッショナルなアセット制作や複雑な指示向けに設計されています。Google 検索を使用した現実世界のグラウンディング、生成前に構成を調整するデフォルトの「思考」プロセス、最大 4K 解像度の画像を生成できる機能が搭載されています。(課金が必要)
Gemini 2.5 Flash Image(別名 nano banana)
gemini-2.5-flash-image
スピードと効率性を重視した設計。大容量で低レイテンシのタスク向けに最適化されており、1024 ピクセルの解像度で画像を生成します。(課金が必要)
Imagen
Imagen 4
imagen-4.0-generate-001
自然言語テキスト プロンプトからリアルで高品質な画像を生成します。(課金が必要)
Imagen 4 Fast
imagen-4.0-fast-generate-001
プロトタイピングや低レイテンシのユースケース用の画像を生成します。(課金が必要)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
自然言語テキスト プロンプトからリアルで高品質な画像を生成します。(課金が必要)
以前の世代のモデル
以下は現行モデルですが、旧世代のモデルです。可能であれば、代わりに最新のモデルのいずれかを使用することをおすすめします。
Gemini モデル
Gemini 2.0 Flash
gemini-2.0-flash-001
100 万トークンのコンテキスト ウィンドウを備えた、第 2 世代の主力モデル。優れたスピードやネイティブ ツールの使用など、次世代の機能と強化された機能を提供します。
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
100 万トークンのコンテキスト ウィンドウを備えた第 2 世代の小型主力モデル。費用対効果と低レイテンシを重視して最適化されています。
このページの残りの部分では、Firebase AI Logic でサポートされているモデルについて詳しく説明します。
-
- サポートされている入出力
- サポートされている機能の概要の比較
- 仕様と制限事項(最大入力トークン数や入力動画の最大長など)
モデルのバージョン管理方法(特に、安定版、自動更新版、プレビュー版、試験運用版)の説明
初期化時にコードに含める使用可能なモデル名のリスト
モデルのサポートされている言語のリスト
このページの下部で、以前の世代のモデルの詳細情報を確認できます。
モデルの比較
各モデルには、さまざまなユースケースに対応するための異なる機能が備わっています。このセクションの各表では、各モデルを Firebase AI Logic と組み合わせて使用する場合について説明します。各モデルには、SDK を使用する際には利用できない追加機能がある場合があります。
次のサブセクションでお探しの情報が見つからない場合は、選択した API プロバイダのドキュメントで詳細を確認してください。
Gemini Developer API: Gemini モデルと Imagen モデル
Vertex AI Gemini API: Gemini モデルと Imagen モデル
サポートされている入出力
Firebase AI Logic で各モデルを使用する場合、サポートされている入出力の型は次のとおりです。
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro、Flash、Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen(生成) | Imagen(機能) | |
|---|---|---|---|---|---|---|---|
| 入力値の型 | |||||||
| テキスト | |||||||
| テキスト(ストリーミング) | |||||||
| コード | |||||||
| ドキュメント (PDF またはプレーン テキスト) |
|||||||
| 画像 | |||||||
| 動画 | |||||||
| 音声 | |||||||
| 音声(ストリーミング) | |||||||
| 出力タイプ | |||||||
| テキスト | |||||||
| テキスト(ストリーミング) | |||||||
| コード | |||||||
| 構造化された出力 (JSON など) |
|||||||
| 画像 | |||||||
| 音声 | |||||||
| 音声(ストリーミング) | |||||||
サポートされているファイル形式については、サポートされている入力ファイルと要件をご覧ください。
サポートされている機能
Firebase AI Logic で各モデルを使用する場合にサポートされる機能は次のとおりです。
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro、Flash、Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen(生成) | Imagen(機能) | |
|---|---|---|---|---|---|---|---|
| 思考 | |||||||
| テキストのみの入力またはマルチモーダル入力からテキストを生成する | インターリーブまたは画像の一部として | インターリーブまたは画像の一部として | ストリーミングのみ | ||||
|
画像を生成する (Gemini または Imagen) |
|||||||
|
画像を編集する (Gemini または Imagen) |
|||||||
| 音声を生成する | ストリーミングのみ | ||||||
|
構造化された出力
(JSON など)を生成する |
|||||||
|
ドキュメントを分析する
(PDF またはプレーン テキスト) |
|||||||
| 画像を分析する(vision) | |||||||
| 動画を分析する(ビジョン) | |||||||
| 音声を分析する | ストリーミングのみ | ||||||
| マルチターン チャット | |||||||
| 双方向マルチモーダル ストリーミング | |||||||
| 関数呼び出し | |||||||
| コードの実行 | |||||||
| Google 検索によるグラウンディング | |||||||
| システム指示 | |||||||
| トークンをカウントする |
仕様と制限事項
Firebase AI Logic で各モデルを使用する場合の仕様と制限事項は次のとおりです。
| プロパティ |
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro、Flash、Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen(生成) | Imagen(機能) |
|---|---|---|---|---|---|---|---|
| 入力トークンの上限* | 1,048,576 個のトークン | 65,536 個のトークン | 1,048,576 個のトークン | 32,768 トークン | 32,768 トークン | 480 トークン | 480 トークン |
| 出力トークンの上限 * | 65,536 個のトークン | 32,768 トークン | 65,536 個のトークン | 8,192 個のトークン | 8,192 個のトークン | --- | --- |
| ナレッジ カットオフ日 | 2025 年 1 月 | 2025 年 1 月 | 2025 年 1 月 | June 2025 | 2024 年 8 月 | --- | --- |
| PDF(リクエストごと) | |||||||
| 入力 PDF ファイルの最大数 ** |
900 ファイル | 14 ファイル | 3,000 ファイル | 3 ファイル | --- | --- | --- |
| 入力 PDF ファイルあたりの最大ページ数 ** |
900 ページ | 14 ページ | 1,000 ページ | 3 ページ | --- | --- | --- |
| 入力 PDF ファイルあたりの最大サイズ |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | --- |
| 画像(リクエストあたり) | |||||||
| 入力画像の最大数 |
1,000 個の画像 | 画像 14 枚 | 3,000 個の画像 | 画像 3 枚 | --- | --- | 4 枚 |
| 出力画像の最大数 |
--- | 10 枚の画像 | --- | 10 枚の画像 | --- | 4 枚 | 4 枚 |
| 入力された base64 エンコード画像の最大サイズ |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | --- |
| 動画(リクエストごと) | |||||||
| 入力動画ファイルの最大数 |
10 ファイル | --- | 10 ファイル | --- | --- | --- | --- |
| すべての入力動画の最大長 (フレームのみ) |
~ 60 分 | --- | ~ 60 分 | --- | --- | --- | --- |
| すべての入力動画 (フレーム + 音声)の最大長 |
45 分程度 | --- | 45 分程度 | --- | --- | --- | --- |
| 音声(リクエストごと) | |||||||
| 入力音声ファイルの最大数 |
1 個のファイル | --- | 1 個のファイル | --- | --- | --- | --- |
| 出力音声ファイルの最大数 |
--- | --- | --- | --- | --- | --- | --- |
| すべての入力音声の最大長 |
約 8.4 時間 | --- | 約 8.4 時間 | --- | --- | --- | --- |
| すべての出力音声の最大長 |
--- | --- | --- | --- | --- | --- | --- |
*
すべての Gemini モデルでは、1 つのトークンは約 4 文字に相当するため、100 個のトークンは約 60 ~ 80 語(英語)に相当します。Gemini モデルの場合、countTokens を使用して、リクエスト内のトークンの合計数を特定できます。
** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。
詳細情報を確認する
サポートされている入力ファイル形式、MIME タイプの指定方法、入力ファイルとマルチモーダル リクエストが サポートされている入力ファイルと要件の要件を満たし、ベスト プラクティスに沿っていることを確認する方法について学習する。
モデルのバージョニングと命名パターン
モデルは、安定版、プレビュー版、試験運用版で提供されます。便宜上、明示的なバージョン値のないエイリアスがサポートされています。
コードで使用する特定のモデル名については、このページの後半の「使用可能なモデル名」セクションをご覧ください。
| バージョンの種類 / リリース ステージ |
説明 | モデル名のパターン | |
|---|---|---|---|
| Stable |
安定版は、リリース日から本番環境で使用でき、サポートされます。
|
|
|
| 自動更新される安定版エイリアス (Gemini 2.0 モデルのみ) |
自動更新安定版エイリアスは、常にそのモデルの最新の安定版バージョンを参照します。
|
Gemini 2.0 モデルのみ
例: |
|
| プレビュー |
プレビュー版には新しい機能が搭載されていますが、安定版ではありません。
|
プレビュー バージョンのモデル名には
例: |
|
| 試験運用版 |
試験運用バージョンには新しい機能が搭載されていますが、安定していないと見なされます。
|
試験運用版のモデル名には、モデルのリリース日(
例: |
|
| 退職 |
廃止されたバージョンは廃止日を過ぎており、完全に無効になっています。
|
--- |
|
使用可能なモデル名
モデル名は、モデルの初期化時にコードに含める明示的な値です。
Gemini モデル名にジャンプ Imagen モデル名にジャンプ
使用可能なすべてのモデルをプログラムで一覧表示する
REST API を使用して、使用可能なすべてのモデル名を一覧表示できます。
Gemini Developer API:
models.listエンドポイントを呼び出します。Vertex AI Gemini API:
publishers.models.listエンドポイントを呼び出します。
返されるリストには、API プロバイダがサポートするすべてのモデルが含まれますが、Firebase AI Logic はこのページで説明する Gemini モデルと Imagen モデルのみをサポートします。また、自動更新エイリアス(gemini-2.0-flash など)は基本モデルの便利なエイリアスであるため、一覧表示されません。
Gemini モデル名
プラットフォームの初期化の例については、スタートガイドをご覧ください。
リリース ステージ(特にユースケース、課金、廃止)の詳細については、モデルのバージョン管理と命名パターンをご覧ください。
Gemini 3 Pro モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-3-pro-preview |
Gemini 3 Pro のプレビュー版 | プレビュー | 2025-11-18 | 未定 |
Gemini 3 Pro Image モデル名(「nano banana pro」)
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Gemini 3 Pro Image のプレビュー版 | プレビュー | 2025-11-20 | 未定 |
Gemini 2.5 Pro モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro の安定版 | Stable | 2025-06-17 | 2026 年 6 月 17 日以降 |
Gemini 2.5 Flash モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash の安定版 | Stable | 2025-06-17 | 2026 年 6 月 17 日以降 |
Gemini 2.5 Flash‑Lite モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Gemini 2.5 Flash‑Lite の安定版 | Stable | 2025-07-22 | 2026 年 7 月 22 日以降 |
Gemini 2.5 Flash Image モデル名(「nano banana」とも呼ばれます)
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.5-flash-image |
Gemini 2.5 Flash Image(「nano banana」とも呼ばれます)の安定版 | Stable | 2025-10-02 | 2026 年 10 月 2 日以降 |
Gemini 2.5 Flash Live モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-live-2.5-flash |
Gemini 2.5 Flash Live の安定版 | Stable (限定公開一般提供)1 |
2025-06-01 | 2026 年 6 月 1 日以降 |
gemini-live-2.5-flash-preview 2 |
Gemini 2.5 Flash Live のプレビュー バージョン | プレビュー | 2025-06-01 | 未定 |
Firebase AI Logic は、ネイティブ音声モデル(gemini-2.5-flash-native-audio-preview-09-2025 など)をまだサポートしていません。
1 アクセス権をリクエストするには、Google Cloud アカウント チームの担当者にお問い合わせください。 2 アクセス方法に関係なく、Vertex AI Gemini API ではサポートされていません。
Gemini 2.0 Flash Live モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
Gemini 2.0 Flash Live の安定版 | Stable | 2025-04-01 | 2026 年 4 月 1 日以降 |
gemini-2.0-flash-live-preview-04-09 |
Gemini 2.0 Flash Live のプレビュー バージョン | プレビュー | 2025-04-09 | 未定 |
2 アクセス方法に関係なく、Vertex AI Gemini API ではサポートされていません。
Imagen モデル名
プラットフォームの初期化の例については、Imagen を使用して画像を生成するガイドをご覧ください。
リリース ステージ(特にユースケース、課金、廃止)の詳細については、モデルのバージョン管理と命名パターンをご覧ください。
Imagen 4 モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Imagen 4 の安定版 | Stable | 2025-08-14 | 2026 年 8 月 14 日以降 |
Imagen 4 Fast モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Imagen 4 Fast の安定版 | Stable | 2025-08-14 | 2026 年 8 月 14 日以降 |
Imagen 4 Ultra モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Imagen 4 Ultra の安定版 | Stable | 2025-08-14 | 2026 年 8 月 14 日以降 |
Imagen 3 Capability モデル名
| モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Imagen 3 Capability の最初の安定版 | Stable | 2024-12-10 | 2025 年 12 月 10 日以降 |
3 アクセス方法に関係なく、Gemini Developer API ではサポートされていません。
サポートされている言語
Gemini
すべての Gemini モデルは、次の言語を理解して回答できます。
アラビア語(ar)、ベンガル語(bn)、ブルガリア語(bg)、中国語(簡体字、繁体字)(zh)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(iw)、ヒンディー語(hi)、ハンガリー語(hu)、インドネシア語(id)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(lv)、リトアニア語(lt)、ノルウェー語(no)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、セルビア語(sr)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スワヒリ語(sw)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr)、ウクライナ語(uk)、ベトナム語(vi)
Gemini 2.0 Flash、Gemini 1.5 Pro、Gemini 1.5 Flash モデルは、次の追加言語を理解して応答できます。
アフリカーンス語(af)、アムハラ語(am)、アッサム語(as)、アゼルバイジャン語(az)、ベラルーシ語(be)、ボスニア語(bs)、カタルーニャ語(ca)、セブアノ語(ceb)、コルシカ語(co)、ウェールズ語(cy)、ディベヒ語(dv)、エスペラント語(eo)、バスク語(eu)、ペルシア語(fa)、フィリピン語(タガログ語)(fil)、フリジア語(fy)、アイルランド語(ga)、スコットランド ゲール語(gd)、ガリシア語(gl)、グジャラート語(gu)、ハウサ語(ha)、ハワイ語(haw)、モン語(hmn)、クレオール語(ハイチ)(ht)、アルメニア語(hy)、イボ語(ig)、アイスランド語(is)、ジャワ語(jv)、ジョージア語(ka)、カザフ語(kk)、クメール語(km)、カンナダ語(kn)、クリオ語(kri)、クルド語(ku)、キルギス語(ky)、ラテン語(la)、ルクセンブルク語(lb)、ラオ語(lo)、マダガスカル語(mg)、マオリ語(mi)、マケドニア語(mk)、マラヤーラム語(ml)、モンゴル語(mn)、メイテイ語(マニプル語)(mni-Mtei)、マラーティー語(mr)、マレー語(ms)、マルタ語(mt)、ミャンマー語(ビルマ語)(my)、ネパール語(ne)、ニャンジャ語(チェワ語)(ny)、オディア語(オリヤー語)(or)、パンジャブ語(pa)、パシュトゥ語(ps)、シンド語(sd)、シンハラ語(si)、サモア語(sm)、ショナ語(sn)、ソマリ語(so)、アルバニア語(sq)、ソト語(st)、スンダ語(su)、タミル語(ta)、テルグ語(te)、タジク語(tg)、ウイグル語(ug)、ウルドゥー語(ur)、ウズベク語(uz)、コーサ語(xh)、イディッシュ語(yi)、ヨルバ語(yo)、ズールー語(zu)
Imagen
一般提供: 英語
プレビュー: 中国語(簡体)、中国語(繁体)、ヒンディー語、日本語、韓国語、ポルトガル語、スペイン語
以前のモデルに関する情報
以下は現行モデルですが、旧世代のモデルです。可能であれば、代わりに最新のモデルのいずれかを使用することをおすすめします。
Gemini 個のモデル
| モデル | 入力 | 出力 | 説明 |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 優れたスピード、組み込みツールの使用、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と強化された機能を備えたマルチモーダル モデル |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 最も高速で費用対効果の高い Flash モデル。価格と速度はそのままに品質の向上を求めている 1.5 Flash ユーザー向けのアップグレード パスです。 |
Imagen 個のモデル
| モデル | 入力 | 出力 | 説明 |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
テキスト | 画像 | 自然言語テキスト プロンプトからリアルで高品質な画像を生成します。 |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
テキスト | 画像 | プロトタイピングや低レイテンシのユースケース用の画像を生成します |
2 アクセス方法に関係なく、Gemini Developer API ではサポートされていません。
次のステップ
Gemini API の機能を試す
- マルチターン会話(チャット)を構築します。
- テキストのみのプロンプトからテキストを生成します。
- 画像、PDF、動画、音声など、さまざまなファイル形式でプロンプトを入力してテキストを生成します。
- テキスト プロンプトとマルチモーダル プロンプトの両方から構造化出力(JSON など)を生成します。
- テキスト プロンプトから画像を生成します(Gemini または Imagen)。
- Gemini Live API を使用したストリームの入出力(音声を含む)。
- ツール(関数呼び出しや Google 検索によるグラウンディングなど)を使用して、Gemini モデルをアプリの他の部分や外部システム、情報に接続します。