Watch demos on how to build & run AI-powered apps with Firebase at Demo Day '24. Watch now.

このページは Cloud Translation API によって翻訳されました。

Gemini API を使用してマルチターンの会話（チャット）を作成する

Gemini API を使用すると、複数のターンにわたる自由形式の会話を作成できます。Vertex AI in Firebase SDK は会話の状態を管理することでプロセスを簡素化するため、generateContentStream() や generateContent() とは異なり、会話履歴を自分で保存する必要はありません。

Gemini API を操作するためのその他のオプション

必要に応じて、Gemini API
の代替の「Google AI」バージョンをテストします。Google AI Studio と Google AI クライアント SDK を使用して、制限内で（利用可能な場合）無料アクセスを取得します。これらの SDK は、モバイルアプリとウェブアプリのプロトタイピングのみに使用してください。

Gemini API の仕組みを理解したら、Vertex AI in Firebase SDK に移行します（このドキュメント）。Vertex AI in Firebase SDK には、Firebase App Check を使用した API の不正使用からの保護や、リクエスト内の大規模なメディアファイルのサポートなど、モバイルアプリとウェブアプリに重要な多くの追加機能が含まれています。

必要に応じて、Vertex AI Gemini API サーバーサイドを呼び出す（Python、Node.js、Go など）
Gemini API には、サーバーサイド Vertex AI SDK、Firebase Genkit、または Firebase Extensions を使用します。

始める前に

まだ行っていない場合は、Vertex AI in Firebase SDK のスタートガイドを完了してください。以下の手順をすべて完了していることを確認します。

Blaze お支払いプランの使用や必要な API の有効化など、新規または既存の Firebase プロジェクトを設定します。
アプリを Firebase に接続します。アプリの登録や Firebase 構成のアプリへの追加などを行います。
SDK を追加し、アプリで Vertex AI サービスと生成モデルを初期化します。

アプリを Firebase に接続し、SDK を追加して、Vertex AI サービスと生成モデルを初期化したら、Gemini API を呼び出す準備が整います。

チャットプロンプトリクエストを送信する

マルチターンの会話（チャットなど）を構築するには、まず startChat() を呼び出してチャットを初期化します。次に、sendMessageStream()（または sendMessage()）を使用して新しいユーザーメッセージを送信します。これにより、メッセージとレスポンスがチャット履歴に追加されます。

会話内のコンテンツに関連付けられた role には、次の 2 つのオプションがあります。

user: プロンプトを提供するロール。この値は sendMessageStream()（または sendMessage()）の呼び出しのデフォルト値です。別のロールが渡された場合、関数は例外をスローします。
model: レスポンスを提供するロール。このロールは、既存の history で startChat() を呼び出す場合に使用できます。

レスポンスをストリーミングするか（sendMessageStream）、結果全体が生成されるまでレスポンスを待つか（sendMessage）を選択します。

ストリーミング

モデル生成の結果全体を待たずに、ストリーミングを使用して部分的な結果を処理することで、インタラクションを高速化できます。

ストリーミングなし

ストリーミングではなく、結果全体を待つこともできます。結果は、モデルが生成プロセス全体を完了した後にのみ返されます。

ユースケースとアプリに適した Gemini モデルと、必要に応じてロケーションを選択する方法を学びます。

Google アシスタントの機能

長いプロンプトをモデルに送信する前にトークンをカウントする方法を学習する。
Cloud Storage for Firebase を設定して、Cloud Storage URL を使用してマルチモーダルリクエストに大きなファイルを含めることができるようにします。ファイルには、画像、PDF、動画、音声を含めることができます。
不正なクライアントによる Gemini API の不正使用から保護するために Firebase App Check を設定するなど、本番環境の準備を検討します。

Gemini API のその他の機能を試す

テキストのみのプロンプトからテキストを生成する。
マルチモーダルプロンプトからテキストを生成します（テキスト、画像、PDF、動画、音声など）。
テキストとマルチモーダルプロンプトの両方から構造化された出力（JSON など）を生成します。
関数呼び出しを使用して、生成モデルを外部システムと情報に接続します。

コンテンツ生成を制御する方法

プロンプトの設計を理解する。ベストプラクティス、戦略、プロンプトの例などをご覧ください。
温度や最大出力トークンなどのモデルパラメータを構成します。
安全性設定を使用すると、有害と見なされる可能性のある回答が生成される可能性を調整できます。

Vertex AI Studio を使用して、プロンプトとモデル構成をテストすることもできます。

Gemini モデルの詳細

さまざまなユースケースで使用可能なモデルと、その割り当てと料金について学びます。

Vertex AI in Firebase の使用感に関するフィードバックを送信する