The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ウェブアプリのハイブリッドエクスペリエンスの構成オプション

このページでは、次の構成オプションについて説明します。

推論モードを設定する
デフォルトのクラウドホストフォールバックモデルをオーバーライドする
モデル構成を使用してレスポンスを制御する、例えば温度

JSON や列挙型などの構造化出力を生成することもできます。

始める前に

ハイブリッドエクスペリエンスを構築するためのスタートガイドを完了していることを確認してください。

推論モードを設定する

スタートガイドの例では PREFER_ON_DEVICE モードを使用していますが、これは使用可能な 4 つの推論モードの 1 つにすぎません。

PREFER_ON_DEVICE: オンデバイスモデルが使用可能な場合はオンデバイスモデルを使用します。使用できない場合は、 クラウドホストモデルにフォールバックします。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });
```
ONLY_ON_DEVICE: オンデバイスモデルが使用可能な場合はオンデバイスモデルを使用します。使用できない場合は、 例外をスローします。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_ON_DEVICE });
```
PREFER_IN_CLOUD: クラウドホストモデルが使用可能な場合はクラウドホストモデルを使用します。使用できない場合は、 オンデバイスモデルにフォールバックします。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_IN_CLOUD });
```
ONLY_IN_CLOUD: クラウドホストモデルが使用可能な場合はクラウドホストモデルを使用します。使用できない場合は、 例外をスローします。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_IN_CLOUD });
```

オンデバイス推論とクラウド推論のどちらが使用されたかを判断する

PREFER_ON_DEVICE 推論モードまたは PREFER_IN_CLOUD 推論モードを使用する場合は、特定のリクエストにどちらのモードが使用されたかを知ることが役立ちます。この情報は、各レスポンスの inferenceSource プロパティによって提供されます（JS SDK v12.5.0 以降で使用可能）。

このプロパティにアクセスすると、返される値は ON_DEVICE または IN_CLOUD になります。

// ...

console.log('You used: ' + result.response.inferenceSource);

console.log(result.response.text());

デフォルトのフォールバックモデルをオーバーライドする

デフォルトのクラウドホストモデルは gemini-2.5-flash-lite です（JS SDK v12.8.0 以降）。

このモデルは、PREFER_ON_DEVICE モードを使用する場合のフォールバッククラウドホストモデルです。また、ONLY_IN_CLOUD モードまたは PREFER_IN_CLOUD モードを使用する場合のデフォルトモデルでもあります。

inCloudParams 構成オプションを使用して、別のデフォルトのクラウドホストモデルを指定できます。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
  }
});

サポートされているすべての Gemini モデルのモデル名を確認する。

モデル構成を使用してレスポンスを制御する

モデルへのリクエストごとに、モデル構成を送信して、モデルがレスポンスを生成する方法を制御できます。クラウドホストモデルとオンデバイスモデルでは、異なる構成オプションが用意されています。

構成はインスタンスの有効期間中維持されます。別の構成を使用する場合は、その構成で新しい GenerativeModel インスタンスを作成します。

クラウドホストモデルを構成する

inCloudParams オプションを使用して、クラウドホスト Gemini モデルを構成します。使用可能なパラメータについて学習する。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
    temperature: 0.8,
    topK: 10
  }
});

オンデバイスモデルを構成する

オンデバイスモデルを使用した推論では、 Chrome の Prompt API が使用されます。

onDeviceParams オプションを使用して、オンデバイスモデルを構成します。使用可能なパラメータについて学習する。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  onDeviceParams: {
    createOptions: {
      temperature: 0.8,
      topK: 8
    }
  }
});