The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic on all platforms!

Gemini 2.0 Flash and Flash-Lite models will be retired on June 1, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Also, Gemini 3 Pro Preview (gemini-3-pro-preview) will be retired on March 9, 2026 (update to Gemini 3.1 Pro Preview: gemini-3.1-pro-preview). Learn more.

Gemini API を使用してドキュメント（PDF など）を分析する

Gemini モデルに、インライン（Base64 エンコード）または URL 経由で指定したドキュメントファイル（PDF やプレーンテキストファイルなど）の分析をリクエストできます。Firebase AI Logic を使用する場合は、アプリから直接このリクエストを行うことができます。

この機能を使用すると、次のようなことができます。

ドキュメント内の図、グラフ、表を分析する
構造化された出力形式で情報を抽出する
ドキュメント内の画像やテキストコンテンツに関する質問に回答する
ドキュメントを要約する
ドキュメントのコンテンツを（HTML などに）文字起こしし、レイアウトと書式設定を保持して、下流のアプリケーション（RAG パイプラインなど）で使用する

コードサンプルに移動ストリーミングレスポンスのコードに移動

ドキュメント（PDF など）を操作するためのその他のオプションについては、他のガイドをご覧ください
構造化された出力を生成する複数ターンのチャット

始める前に

Gemini API プロバイダをクリックして、このページでプロバイダ固有のコンテンツとコードを表示します。

まだ完了していない場合は、スタートガイドに沿って、記載されている手順（Firebase プロジェクトの設定、アプリと Firebase の連携、SDK の追加、選択した Gemini API プロバイダのバックエンドサービスの初期化、GenerativeModel インスタンスの作成）を完了します。

プロンプトのテストと反復処理には、Google AI Studio の使用をおすすめします。

PDF ファイルのサンプルが必要ですか？

この一般公開されているファイルは、MIME タイプ application/pdf で使用できます（ファイルの表示またはダウンロード）。 https://storage.googleapis.com/cloud-samples-data/generative-ai/pdf/2403.05530.pdf

PDF ファイル（base64 エンコード）からテキストを生成する

このサンプルを試す前に、このガイドの始める前にのセクションを完了して、プロジェクトとアプリを設定してください。
このセクションでは、選択した Gemini API プロバイダのボタンをクリックして、このページにプロバイダ固有のコンテンツを表示します。

Gemini モデルにテキストの生成をリクエストするには、テキストと PDF でプロンプトを指定します。各入力ファイルの mimeType とファイル自体を指定します。このページの後半で、入力ファイルの要件と推奨事項をご確認ください。