Gemini モデルの詳細

Gemini ファミリーのモデルは、画像、動画、テキストなどの複数のモダリティからの情報を処理できるため、マルチモーダルとみなされます。たとえば、一皿のクッキーの写真を Gemini モデルに送信し、そのクッキーのレシピを提供するようそのモデルに要求できます。

プロンプト レスポンス

このクッキーのレシピを教えてください。

いくつかのチョコレート チップ クッキーの写真
**材料**
- 1 c. (2 本のスティック)柔らかい無塩バター
- 3/4 c. グラニュー糖
- 3/4 c. パック詰めされたブラウン シュガー
- 1 tsp . バニラ抽出物
- 大さじ 2 個
- 小麦粉 2 1/4 c. 重曹
- 重曹
- 小さじ 1 br class="ph-2-0"> - 塩 1 小さじ

Google Cloud で Vertex AI が提供する Gemini API を使用して、Gemini ファミリーのモデルを操作できます。モバイルアプリとウェブアプリの場合、Vertex AI for Firebase SDK を使用して Gemini API を呼び出し、アプリから直接 Gemini モデルを操作できます。

このページでは、Gemini モデルに関する次の情報を提供します。

使用可能なモデル

Vertex AI for Firebase では、次の Gemini モデルのいずれかを使用できます。

  • Gemini 1.5 Flash: 1.5 Pro と同じ入出力タイプ(およびトークン総数)をサポートするマルチモーダル モデルですが、1.5 Flash は大容量で費用対効果の高いアプリケーション用に特別に設計されています。

  • Gemini 1.5 Pro: テキストまたはコードのレスポンス用に、テキストまたはチャット プロンプトに画像、音声、動画、PDF ファイルを追加することをサポートするマルチモーダル モデル。また、最大 100 万個のトークンを使用して、長いコンテキストの理解をサポートします。

  • Gemini 1.0 Pro Vision: テキストまたはコード レスポンスのテキスト、画像、動画を処理するように設計されたマルチモーダル モデル。チャットには使用できません。

  • Gemini 1.0 Pro: 自然言語タスク、テキストとコードによるマルチターン チャット、コード生成を処理するように設計されたモデル。

コードに含めるモデル名に移動

各モデルのユースケース

Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
入力値の型
テキスト
コード
画像
PDF
動画(フレームのみ)
動画(フレームと音声)
音声
出力タイプ
テキスト
コード
一般的なユースケース
マルチモーダル リクエスト
マルチターン チャット

Gemini モデルのユースケースの詳細については、Google Cloud ドキュメントをご覧ください。

各モデルの詳細情報

すべての Gemini モデルで、1 トークンは約 4 文字に相当します。100 トークンは約 60 ~ 80 英単語です。リクエスト内のトークンの合計数は、countTokens で確認できます。

プロパティ Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
合計トークン上限(入力と出力の組み合わせ) 100 万トークン 16,384 トークン 32,760 トークン
出力トークンの上限 8,192 トークン 2,048 トークン 8,192 トークン
リクエストごとの画像の最大数 3,000 枚 16 枚 なし
base64 エンコード画像の最大サイズ 7 MB 7 MB なし
PDF の最大サイズ 30 MB 30 MB なし
リクエストごとの動画ファイルの最大数 10 個の動画ファイル 1 個の動画ファイル なし
動画の最大長(フレームのみ) 60 分間の動画 2 分 なし
動画の最大長(フレームと音声) 約 45 分間の動画 なし なし
リクエストごとの音声ファイルの最大数 1 件の音声ファイル なし なし
音声の最大長 最長 8.4 時間の音声 なし なし

ここでは、モデルと入力ファイルに関するさらに詳しい情報を確認できます。

モデルのバージョニング

Gemini モデルには、安定版、自動更新版、プレビュー版があります。

  • 安定版バージョンは一般提供とみなされます。

    • 安定版では、モデル名に特定の 3 桁のバージョン番号が付加されています(例: gemini-1.0-pro-001)。
  • 自動更新バージョンは常に、そのモデルの最新の安定版を指します。新しい安定版がリリースされると、自動更新バージョンは自動的にその新しい安定版を指すようになります。

    • 自動更新バージョンには、モデル名が追加されていません(例: gemini-1.0-pro)。
  • プレビュー バージョンは新しい機能を備えており、不安定であるとみなされます。プレビュー版は常にそのモデルの最新のプレビュー バージョンを指します。新しいプレビュー版がリリースされると、既存のプレビュー版は自動的にその新しいプレビュー版を指すようになります。

    • プレビュー版では、モデル名-preview とモデルの初期リリース日(-MMDD)が追加されています。たとえば、gemini-1.5-pro-preview-0409(2024 年 4 月 9 日リリース)です。

Google Cloud ドキュメントで 利用可能な Gemini モデル バージョンとそのライフサイクルを確認する。

使用可能なモデル名

モデル名は、生成モデルの初期化(Gemini API を呼び出すために必要な手順)でコードに含める明示的な値です。ご使用の言語の初期化例については、スタートガイドをご覧ください。

Gemini 1.5 Flash モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.5-flash-001 Gemini 1.5 Flash の最新の安定版 一般提供 2024-05-24 2025-05-24 以前
自動更新バージョン
gemini-1.5-flash 1.5 Flash の最新の安定版を指します
(現在は gemini-1.5-flash-001
一般提供 2024-05-24 ---
プレビュー版
gemini-1.5-flash-preview-0514 Gemini 1.5 Flash の最新プレビュー版 公開プレビュー版 2024-05-14 2024-06-24

Gemini 1.5 Pro のモデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.5-pro-001 Gemini 1.5 Pro の最新の安定版 一般提供 2024-05-24 2025-05-24 以前
自動更新バージョン
gemini-1.5-pro 1.5 Pro の最新の安定版を参照
(現在は gemini-1.5-pro-001
一般提供 2024-05-24 ---
プレビュー版
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro 最新プレビュー版 公開プレビュー版 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 gemini-1.5-pro-preview-0514
最新のプレビュー版)を指します。
公開プレビュー版 2024-04-09 2024-06-14

Gemini 1.0 Pro Vision モデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision の最新の安定版 一般提供 2024-02-15 2025-02-15 以前
自動更新バージョン
gemini-1.0-pro-vision 1.5 Pro Vision の最新の安定版を参照
(現在は gemini-1.5-pro-vision-001
一般提供 2024-01-04 ---

Gemini 1.0 Pro のモデル名

モデル名 説明 リリース ステージ 初回リリース日 廃止日
安定版
gemini-1.0-pro-002 Gemini 1.0 Pro の最新の安定版 一般提供 2024-04-09 2025-04-09 以前
gemini-1.0-pro-001 Gemini 1.0 Pro 安定版 一般提供 2024-02-15 2025-02-15 以前
自動更新バージョン
gemini-1.0-pro 1.0 Pro の最新の安定版を参照
(現在は gemini-1.0-pro-002
一般提供 2024-02-15 ---

対応している言語

Gemini モデルは、次の言語をサポートしています。

アラビア語(ar)、ベンガル語(スロバキア語(スロバキア語)、イタリア語(スロウ語、スワライン語、スワライン語、スワライン語、スワライン語、スワライン語、スワライン語、スロバ語、タイ語、ロシア語、スワップ語(スラビア語)、タイ語(スラビア語)、タイ語(スラビア語)、中国語(簡体、繁体)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(el)、ヘブライ語(iw)、ヒンディー語(hi)

次のステップ

Gemini API の機能を試す