モデルを呼び出すたびに、モデル構成を送信して、モデルがレスポンスを生成する方法を制御できます。モデルごとに構成オプションが異なります。
プロンプトとモデル構成をテストし、Vertex AI Studio を使用して迅速に反復処理できます。
Gemini 構成オプションに移動 Imagen 構成オプションに移動
Gemini モデルを構成する
このセクションでは、Gemini モデルで使用する構成を設定する方法と、各パラメータの説明について説明します。
モデル構成を設定する(Gemini)
一般的なユースケースの構成
GenerativeModel
インスタンスの作成と generateContent
、generateContentStream
、startChat
の呼び出しの一部として、GenerationConfig
でパラメータの値を設定します。
この構成は、インスタンスの存続期間中維持されます。別の構成を使用する場合は、その構成を使用して新しい GenerativeModel
インスタンスを作成します。
// ...
// Set parameter values in a `GenerationConfig` (example values shown here)
val config = generationConfig {
maxOutputTokens = 200
stopSequences = listOf("red")
temperature = 0.9f
topK = 16
topP = 0.1f
}
// Specify the config as part of creating the `GenerativeModel` instance
val generativeModel = Firebase.vertexAI.generativeModel(
modelName = "GEMINI_MODEL_NAME ",
generationConfig = config
)
// ...
// ...
// Set parameter values in a `GenerationConfig` (example values shown here)
GenerationConfig.Builder configBuilder = new GenerationConfig.Builder();
configBuilder.maxOutputTokens = 200;
configBuilder.stopSequences = List.of("red");
configBuilder.temperature = 0.9f;
configBuilder.topK = 16;
configBuilder.topP = 0.1f;
GenerationConfig generationConfig = configBuilder.build();
// Specify the config as part of creating the `GenerativeModel` instance
GenerativeModel gm = FirebaseVertexAI.getInstance().generativeModel(
"GEMINI_MODEL_NAME ",
generationConfig
);
GenerativeModelFutures model = GenerativeModelFutures.from(gm);
// ...
各パラメータの説明については、このページの次のセクションをご覧ください。
Gemini Live API の構成
LiveModel
インスタンスの作成の一環として、LiveGenerationConfig
でパラメータの値を設定します。
この構成は、インスタンスの存続期間中維持されます。別の構成を使用する場合は、その構成を使用して新しい LiveModel
インスタンスを作成します。
// ...
// Set parameter values in a `LiveGenerationConfig` (example values shown here)
val config = liveGenerationConfig {
maxOutputTokens = 200
responseModality = ResponseModality.AUDIO
speechConfig = SpeechConfig(voice = Voices.FENRIR)
temperature = 0.9f
topK = 16
topP = 0.1f
}
// Specify the config as part of creating the `LiveModel` instance
val generativeModel = Firebase.vertexAI.liveModel(
modelName = "gemini-2.0-flash-live-preview-04-09",
generationConfig = config
)
// ...
// ...
// Set parameter values in a `LiveGenerationConfig` (example values shown here)
LiveGenerationConfig.Builder configBuilder = new LiveGenerationConfig.Builder();
configBuilder.setMaxOutputTokens(200);
configBuilder.setResponseModalities(ResponseModality.AUDIO);
configBuilder.setSpeechConfig(new SpeechConfig(Voices.FENRIR));
configBuilder.setTemperature(0.9f);
configBuilder.setTopK(16);
configBuilder.setTopP(0.1f);
LiveGenerationConfig generationConfig = configBuilder.build();
// Specify the config as part of creating the `LiveModel` instance
LiveGenerativeModel gm = FirebaseVertexAI.getInstance().liveModel(
"gemini-2.0-flash-live-preview-04-09",
generationConfig
);
LiveModelFutures model = LiveModelFutures.from(gm);
// ...
各パラメータの説明については、このページの次のセクションをご覧ください。
パラメータの説明(Gemini)
使用可能なパラメータの概要は次のとおりです。パラメータとその値の包括的なリストは、Google Cloud のドキュメントで確認できます。
パラメータ | 説明 | デフォルト値 |
---|---|---|
音声のタイムスタンプ
audioTimestamp
|
音声のみの入力ファイルでタイムスタンプの認識を有効にするブール値。
|
false |
頻度のペナルティ
frequencyPenalty
|
生成されたレスポンスに繰り返し出現するトークンを含める確率を制御します。 値が正の場合は、生成されたコンテンツに繰り返し出現するトークンにペナルティが課されるため、コンテンツが繰り返される確率は低下します。 |
--- |
最大出力トークン
maxOutputTokens
|
レスポンスで生成できるトークンの最大数を指定します。 | --- |
プレゼンス ペナルティ
presencePenalty
|
生成されたレスポンスにすでに存在するトークンが含まれる確率を制御します。 値が正の場合は、生成されたコンテンツ内の既存のトークンにペナルティが課されるため、より多様なコンテンツが生成される確率は高くなります。 |
--- |
停止シーケンス
stopSequences
|
レスポンスでいずれかの文字列が検出された場合に、コンテンツの生成を停止するようモデルに指示する文字列のリストを指定します。
|
--- |
温度
temperature
|
回答のランダム性の度合いを制御します。 温度が低いほど、確定的なレスポンスが得られ、温度が高いほど、多様性や創造性のあるレスポンスが得られます。 |
モデルによって異なる |
Top-K
topK
|
生成されたコンテンツで使用される最も高い確率の単語の数を制限します。 Top-K 値が 1 の場合、次に選択されるトークンは、モデルの語彙内のすべてのトークンで最も確率の高いものである必要があります。Top-K 値が n の場合、次に選択されるトークンは、最も確率の高い n 個のトークンから選択されます(すべて設定された温度に基づきます)。 |
モデルによって異なる |
Top-P
topP
|
生成されるコンテンツの多様性を制御します。 トークンは、確率の合計がトップ P 値に等しくなるまで、確率の高いもの(上記のトップ K を参照)から低いものへと選択されます。 |
モデルによって異なる |
レスポンス モダリティ
responseModality
|
Live API を使用するときにストリーミング出力のタイプ(テキストや音声など)を指定します。 Live API と |
--- |
音声(ボイス)
speechConfig
|
Live API を使用するときに、ストリーミングされた音声出力に使用する音声を指定します。 Live API と |
Puck |
Imagen モデルを構成する
このセクションでは、Imagen モデルで使用する構成を設定する方法と、各パラメータの説明について説明します。
モデル構成を設定する(Imagen)
ImagenModel
インスタンスの作成と generateImages
の呼び出しの一環として、ImagenGenerationConfig
でパラメータの値を設定します。
この構成は、インスタンスの存続期間中維持されます。別の構成を使用する場合は、その構成を使用して新しい ImagenModel
インスタンスを作成します。
// ...
// Set parameter values in a `ImagenGenerationConfig` (example values shown here)
val config = ImagenGenerationConfig(
negativePrompt = "frogs",
numberOfImages = 2,
aspectRatio = ImagenAspectRatio.LANDSCAPE_16x9,
imageFormat = ImagenImageFormat.jpeg(compressionQuality = 100),
addWatermark = false
)
// Specify the config as part of creating the `ImagenModel` instance
val imagenModel = Firebase.vertexAI.imagenModel(
modelName = "IMAGEN_MODEL_NAME ",
generationConfig = config
)
// ...
// ...
// Set parameter values in a `ImagenGenerationConfig` (example values shown here)
ImagenGenerationConfig config = new ImagenGenerationConfig.Builder()
.setNegativePrompt("frogs")
.setNumberOfImages(2)
.setAspectRatio(ImagenAspectRatio.LANDSCAPE_16x9)
.setImageFormat(ImagenImageFormat.jpeg(100))
.setAddWatermark(false)
.build();
// Specify the config as part of creating the `ImagenModel` instance
ImagenModel m = FirebaseVertexAI.getInstance().imagenModel(
"IMAGEN_MODEL_NAME ",
config
);
ImagenModelFutures model = ImagenModelFutures.from(m);
// ...
各パラメータの説明については、このページの次のセクションをご覧ください。
パラメータの説明(Imagen)
使用可能なパラメータの概要は次のとおりです。パラメータとその値の包括的なリストは、Google Cloud のドキュメントで確認できます。
パラメータ | 説明 | デフォルト値 |
---|---|---|
否定的なプロンプト
negativePrompt
|
生成される画像から除外する内容の説明 このパラメータは |
--- |
結果の数
numberOfImages
|
リクエストごとに返される生成画像の数 | デフォルトは、Imagen 3 モデルの場合は 1 つの画像 |
アスペクト比
aspectRatio
|
生成された画像の幅と高さの比率 | デフォルトは正方形(1:1)です |
画像形式
imageFormat
|
出力オプション(画像形式(MIME タイプ)や生成された画像の圧縮レベルなど) | デフォルトの MIME タイプは PNG デフォルトの圧縮は 75(MIME タイプが JPEG に設定されている場合) |
ウォーターマーク
addWatermark
|
生成された画像に目に見えないデジタル透かし(SynthID)を追加するかどうか | デフォルトは、Imagen 3 モデルの場合は true です。 |
人物の生成
personGeneration
|
モデルによる人物の画像生成を許可するかどうか | デフォルトはモデルによって異なります |
コンテンツ生成を制御するその他の方法
- プロンプトの設計について学び、ニーズに固有の出力を生成するようにモデルに影響を与えましょう。
- 安全性設定を使用して、ヘイトスピーチや露骨な性的描写を含むコンテンツなど、有害と見なされる可能性のあるレスポンスを受け取る確率を調整します。
- システム指示を設定して、モデルの動作を制御します。この機能は、エンドユーザーからの詳細な手順を示すためにモデルが公開される前に追加する「プリアンブル」のようなものです。
- プロンプトとともにレスポンス スキーマを渡して、特定の出力スキーマを指定します。この機能は、JSON 出力の生成に最もよく使用されますが、分類タスクにも使用できます(モデルで特定のラベルやタグを使用する場合など)。