The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

オンデバイスモデルとクラウドホストモデルを使用して Android アプリでハイブリッドエクスペリエンスを構築する

ハイブリッド推論を使用して AI を活用した Android アプリや機能を作成できます Firebase AI Logic。ハイブリッド推論では、オンデバイスモデルが利用可能な場合はオンデバイスモデルを使用して推論を実行し、それ以外の場合はクラウドホスト型モデルにシームレスにフォールバックします（逆も同様です）。

このページでは、クライアント SDK の使用を開始する方法と、Temperature などの追加の構成オプションと機能について説明します。

Firebase AI Logic を介したオンデバイス推論は、 Firebase AI Logic SDK v17.10.0 以降（BoM v34.10.0 以降）を使用し、特定のデバイスで実行される Android アプリでサポートされています。これは、 ML Kit の利用規約と、 ML Kit の Gen AI 固有の利用規約に準拠しています。

サポートされている API:
- クラウド推論では、選択した Gemini API プロバイダ（ Gemini Developer API または Vertex AI Gemini API）を使用します。
- オンデバイス推論では、ML Kit の Prompt APIを使用します。これはベータ版であり、特定のデバイスでのみ使用できます。
  
  オンデバイスモデルの使用は、 ML Kit の利用規約と、 ML Kit の生成 AI 固有の利用規約に則っています。
このページでは、使用を開始する方法 について説明します。

この標準設定が完了したら、追加の構成オプションと機能（温度の設定など）をご確認ください。

サポートされている Android デバイスとそのオンデバイスモデル

オンデバイス推論（ML Kit の Prompt API を使用）の場合、サポートされているデバイスとそのオンデバイスモデルの一覧は、ML Kit のドキュメントで確認できます。

始める

以下の手順では、送信するサポート対象のプロンプトリクエストに必要な一般的な設定について説明します。

ステップ 1: Firebase プロジェクトを設定し、アプリを Firebase に接続する

Firebase コンソールにログインし Firebase プロジェクトを選択します。
Firebase プロジェクトをお持ちでない場合

Firebase プロジェクトをお持ちでない場合は、ボタンをクリックして新しい Firebase プロジェクトを作成し、次のいずれかのオプションを使用します。
- オプション 1: ワークフローの最初のステップで新しいプロジェクト名を入力して、完全に新しい Firebase プロジェクト（およびその基盤となる Google Cloud プロジェクト）を自動的に作成します。
- オプション 2: [**Add Firebase to Google Cloud project**]（ページ下部）をクリックして、既存の Google Cloud クラウドプロジェクトに「Firebase を追加」します。ワークフローの最初のステップで、既存のプロジェクトのプロジェクト名 の入力を開始し、表示されたリストからプロジェクトを選択します。
画面上のワークフローの残りの手順を完了して、Firebase プロジェクトを作成します。なお、プロンプトが表示されたら、設定する必要は Google Analyticsありません。Firebase AI Logic SDK を使用するために
Firebase コンソールで、[AI Services] > [AI Logic] に移動します。
[使ってみる] をクリックして、プロジェクトに必要な API とリソースを設定するガイド付きワークフローを起動します。
「Gemini API」プロバイダを使用するようにプロジェクトを設定します。

から始めることをおすすめします。 Gemini Developer APIVertex AI Gemini API はいつでも設定できますVertex AI Gemini API （とその請求要件）。

Gemini Developer API の場合、コンソールで必要な API が有効になり、プロジェクトに Gemini API キーが作成されます。
この Gemini API キーをアプリのコードベースに追加しないでください 。 詳細
コンソールのワークフローでプロンプトが表示されたら、画面上の手順に沿ってアプリを登録し、Firebase に接続します。
このガイドの次のステップに進み、アプリに SDK を追加します。

ステップ 2: 必要な SDK を追加する

Android 用 Firebase AI Logic SDK（firebase-ai）と SDK（firebase-ai-ondevice）を使用すると、生成モデルとやり取りするための API にアクセスできます。Firebase AI Logic On-Device

firebase-ai-ondevicefirebase-ai

モジュール（アプリレベル）の Gradle ファイル （<project>/<app-module>/build.gradle.kts など）に、Android 用の Firebase AI Logic ライブラリの依存関係を追加します。

Kotlin

dependencies {
  // ... other androidx dependencies

  // Add the dependencies for the Firebase AI Logic libraries
  // Note that the on-device SDK is not yet included in the Firebase Android BoM
  implementation("com.google.firebase:firebase-ai:17.12.1")
  implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta02")
}

Java

Java の場合は、2 つのライブラリを追加する必要があります。

dependencies {
  // ... other androidx dependencies

  // Add the dependencies for the Firebase AI Logic libraries
  // Note that the on-device SDK is not yet included in the Firebase Android BoM
  implementation("com.google.firebase:firebase-ai:17.12.1")
  implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta02")

  // Required for one-shot operations (to use `ListenableFuture` from Guava Android)
  implementation("com.google.guava:guava:31.0.1-android")

  // Required for streaming operations (to use `Publisher` from Reactive Streams)
  implementation("org.reactivestreams:reactive-streams:1.0.4")
}

ステップ 3: オンデバイスモデルが利用可能かどうかを確認する

FirebaseAIOnDevice を使用して、オンデバイスモデルが利用可能かどうかを確認し、利用できない場合はモデルをダウンロードします。

ダウンロードすると、AICore によってモデルが自動的に最新の状態に保たれます。AICore とオンデバイスモデルのダウンロードの管理について詳しくは、スニペットの後のメモをご覧ください。

Kotlin

val status = FirebaseAIOnDevice.checkStatus()
when (status) {
  OnDeviceModelStatus.UNAVAILABLE -> {
    Log.w(TAG, "On-device model is unavailable")
  }

  OnDeviceModelStatus.DOWNLOADABLE -> {
    FirebaseAIOnDevice.download().collect { status ->
      when (status) {
        is DownloadStatus.DownloadStarted ->
          Log.w(TAG, "Starting download - ${status.bytesToDownload}")

        is DownloadStatus.DownloadInProgress ->
          Log.w(TAG, "Download in progress ${status.totalBytesDownloaded} bytes downloaded")

        is DownloadStatus.DownloadCompleted ->
          Log.w(TAG, "On-device model download complete")

        is DownloadStatus.DownloadFailed ->
          Log.e(TAG, "Download failed ${status}")
      }
    }
  }
  OnDeviceModelStatus.DOWNLOADING -> {
    Log.w(TAG, "On-device model is being downloaded")
  }

  OnDeviceModelStatus.AVAILABLE -> {
    Log.w(TAG, "On-device model is available")
  }
}

Java

Checking for and downloading the model is not yet available for Java.

However, all other APIs and interactions in this guide are available for Java.

オンデバイスモデルのダウンロードに関する注意事項は次のとおりです。

オンデバイスモデルのダウンロードにかかる時間は、ネットワークなど、さまざまな要因によって異なります。
コードでプライマリ推論またはフォールバック推論にオンデバイスモデルを使用する場合は、アプリのライフサイクルの早い段階でモデルをダウンロードして、エンドユーザーがアプリでコードを使用する前にオンデバイスモデルが利用できるようにしてください。
オンデバイス推論リクエストが作成されたときにオンデバイスモデルが利用できない場合、SDK はオンデバイスモデルのダウンロードを自動的にトリガーしません。SDK は、クラウドホスト型モデルにフォールバックするか、例外をスローします（推論モードの動作の詳細をご覧ください）。
AICore （Android システムサービス）は、ダウンロードするモデルとバージョンを管理し、モデルを最新の状態に保ちます。デバイスにダウンロードされるモデルは 1 つだけです。デバイス上の別のアプリがオンデバイスモデルを以前に正常にダウンロードしている場合、このチェックではモデルが利用可能であることが返されます。

レイテンシの最適化

最初の推論呼び出しを最適化するには、アプリで warmup()を呼び出すことができます。これにより、オンデバイスモデルがメモリに読み込まれ、ランタイムコンポーネントが初期化されます。

ステップ 4: サービスを初期化してモデルインスタンスを作成する

Gemini API プロバイダをクリックして、このページでプロバイダ固有のコンテンツとコードを表示します。

モデルにプロンプトリクエストを送信する前に、次の設定を行います。

選択した API プロバイダのサービスを初期化します。
GenerativeModel インスタンスを作成し、mode を次のいずれかに設定します。ここでは概要のみを説明しますが、これらのモードの動作の詳細については、推論モードを設定するをご覧ください。
- PREFER_ON_DEVICE: オンデバイスモデルを使用しようとします。使用できない場合は、クラウドホスト型モデルにフォールバックします。
- ONLY_ON_DEVICE: オンデバイスモデルを使用しようとします。使用できない場合は、例外をスローします。
- PREFER_IN_CLOUD: クラウドホスト型モデルを使用しようとします。使用できない場合は、オンデバイスモデルにフォールバックします。
- ONLY_IN_CLOUD: クラウドホスト型モデルを使用しようとします。使用できない場合は、例外をスローします。
注 : 次の点にご注意ください。
- オンデバイスモデルを使用するには、このページの下部にある、まだ利用できない機能の一覧をご確認ください。
- クラウドホスト型モデルを使用するには、デバイスがオンラインである必要があります。また、使用するクラウドホスト型モデルを明示的に指定する必要があります。
- レスポンスの一部として、オンデバイス推論とクラウド推論のどちらが使用されたかが SDK によって通知されます。

Kotlin

// Using this SDK to access on-device inference is an Experimental release and requires opt-in
@OptIn(PublicPreviewAPI::class)

// ...

// Initialize the Gemini Developer API backend service
// Create a GenerativeModel instance with a model that supports your use case
// Set the inference mode (like PREFER_ON_DEVICE to use the on-device model if available)
val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        modelName = "MODEL_NAME",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
    )

Java

// Initialize the Gemini Developer API backend service
// Create a GenerativeModel instance with a model that supports your use case
// Set the inference mode (like PREFER_ON_DEVICE to use the on-device model if available)
GenerativeModel ai = FirebaseAI.getInstance(GenerativeBackend.googleAI())
    .generativeModel(
        "MODEL_NAME",
        new OnDeviceConfig(InferenceMode.PREFER_ON_DEVICE)
    );

// Use the GenerativeModelFutures Java compatibility layer which offers
// support for ListenableFuture and Publisher APIs
GenerativeModelFutures model = GenerativeModelFutures.from(ai);

ステップ 5: モデルにプロンプトリクエストを送信する

このセクションでは、さまざまな種類の入力を送信して、次のようなさまざまな種類の出力を生成する方法について説明します。

テキストのみの入力からテキストを生成する
テキストと画像（マルチモーダル）の入力からテキストを生成する

テキストのみの入力からテキストを生成する

このサンプルを試す前に、このガイドの「始める」セクションを完了していることを確認してください。

generateContent() を使用すると、テキストを含むプロンプトからテキストを生成できます。

Kotlin

// Imports + initialization of Gemini API backend service + creation of model instance

// Provide a prompt that contains text
val prompt = "Write a story about a magic backpack."

// To generate text output, call generateContent with the text input
val response = model.generateContent(prompt)
print(response.text)

Java

// Imports + initialization of Gemini API backend service + creation of model instance

// Provide a prompt that contains text
Content prompt = new Content.Builder()
    .addText("Write a story about a magic backpack.")
    .build();

// To generate text output, call generateContent with the text input
ListenableFuture<GenerateContentResponse> response = model.generateContent(prompt);
Futures.addCallback(response, new FutureCallback<GenerateContentResponse>() {
    @Override
    public void onSuccess(GenerateContentResponse result) {
        String resultText = result.getText();
        System.out.println(resultText);
    }

    @Override
    public void onFailure(Throwable t) {
        t.printStackTrace();
    }
}, executor);

Firebase AI Logic では、 generateContentStream の代わりに、テキストレスポンスのストリーミングもサポートしています。generateContent

テキストと画像（マルチモーダル）の入力からテキストを生成する

このサンプルを試す前に、このガイドの「始める」セクションを完了していることを確認してください。

generateContent() を使用すると、テキストと1 つの画像ファイル （Bitmap のみ）を含むプロンプトからテキストを生成できます。各入力ファイルのmimeTypeとファイル自体を指定します。

Kotlin

// Imports + initialization of Gemini API backend service + creation of model instance

// Loads an image from the app/res/drawable/ directory
val bitmap: Bitmap = BitmapFactory.decodeResource(resources, R.drawable.sparky)

// Provide a prompt that includes the image specified above and text
val prompt = content {
  image(bitmap)
  text("What developer tool is this mascot from?")
}

// To generate text output, call generateContent with the prompt
val response = model.generateContent(prompt)
print(response.text)

Java

// Imports + initialization of Gemini API backend service + creation of model instance

Bitmap bitmap = BitmapFactory.decodeResource(getResources(), R.drawable.sparky);

// Provide a prompt that includes the image specified above and text
Content content = new Content.Builder()
        .addImage(bitmap)
        .addText("What developer tool is this mascot from?")
        .build();

// To generate text output, call generateContent with the prompt
ListenableFuture<GenerateContentResponse> response = model.generateContent(content);
Futures.addCallback(response, new FutureCallback<GenerateContentResponse>() {
    @Override
    public void onSuccess(GenerateContentResponse result) {
        String resultText = result.getText();
        System.out.println(resultText);
    }

    @Override
    public void onFailure(Throwable t) {
        t.printStackTrace();
    }
}, executor);

Firebase AI Logic では、 generateContentStream の代わりに、テキストレスポンスのストリーミングもサポートしています。generateContent

その他の機能

ハイブリッドエクスペリエンスでは、さまざまな追加の構成オプションと機能を使用できます。

オンデバイス推論でまだ利用できない機能

試験運用版リリースでは、クラウドモデルのすべての機能がオンデバイス推論で使用できるわけではありません。

このセクションに記載されている機能は、オンデバイス推論ではまだ利用できません。 これらの機能を使用する場合は、ONLY_IN_CLOUD 推論モードを使用することをおすすめします。

構造化出力（JSON や enum など）の生成
Bitmap 以外の画像ファイル入力タイプ（メモリに読み込まれた画像）からテキストを生成する
複数の画像ファイルからテキストを生成する
音声、動画、ドキュメント（PDF など）の入力からテキストを生成する
Gemini または Imagen モデルを使用して画像を生成する
マルチモーダルリクエストで URL を使用してファイルを提供する。オンデバイスモデルには、インラインデータとしてファイルを提供する必要があります。
4,000 トークン（約 3,000 語）を超えるリクエストを送信する。
マルチターンチャット
モデルがレスポンスを生成するのに役立つツール（関数呼び出し、コード実行、URL コンテキスト、 Google Searchによるグラウンディング、Google Mapsによるグラウンディングなど）を提供する。

Firebase コンソールの AI モニタリングには、オンデバイス推論（オンデバイスログを含む）のデータは表示されません。ただし、クラウドホスト型モデルを使用する推論は、 Firebase AI Logic を介した他の推論と同様にモニタリングできます。 Firebase AI Logic

その他の制限

上記に加えて、オンデバイス推論には次の制限があります （詳しくは、 ML Kit のドキュメントをご覧ください）。

アプリのエンドユーザーは、オンデバイス推論でサポートされているデバイスを使用する必要があります。
アプリは、フォアグラウンドにある場合にのみオンデバイス推論を実行できます。
オンデバイス推論で検証されているのは英語と韓国語のみです。
オンデバイス推論リクエスト全体の最大トークン数は 4,000 トークンです。リクエストがこの上限を超える可能性がある場合は、クラウドホスト型モデルを使用できる推論モードを構成してください。
長い出力（256 トークン以上）が必要なオンデバイス推論のユースケースは避けることをおすすめします。
AICore （オンデバイスモデルを管理する Android システムサービス）は、推論割り当てをアプリごとに適用します。短期間に API リクエストを送信しすぎると、 ErrorCode.BUSY レスポンスが返されます。このエラーが表示された場合は、指数バックオフを使用してリクエストを再試行することを検討してください。また、アプリが長期間の割り当て（1 日の割り当てなど）を超過した場合、ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED が返されることがあります。

フィードバックを送信する Firebase AI Logicの使用に関する

オンデバイスモデルとクラウドホストモデルを使用して Android アプリでハイブリッドエクスペリエンスを構築する

おすすめのユースケースとサポートされている機能

おすすめのユースケース

オンデバイス推論でサポートされている機能

始める前に

サポートされている Android デバイスとそのオンデバイスモデル

始める

ステップ 1: Firebase プロジェクトを設定し、アプリを Firebase に接続する

ステップ 2: 必要な SDK を追加する

Kotlin

Java

ステップ 3: オンデバイスモデルが利用可能かどうかを確認する

Kotlin

Java

レイテンシの最適化

ステップ 4: サービスを初期化してモデルインスタンスを作成する

Kotlin

Java

ステップ 5: モデルにプロンプトリクエストを送信する

テキストのみの入力からテキストを生成する

Kotlin

Java

テキストと画像（マルチモーダル）の入力からテキストを生成する

Kotlin

Java

その他の機能

オンデバイス推論でまだ利用できない機能

その他の制限

オンデバイス モデルとクラウドホスト モデルを使用して Android アプリでハイブリッド エクスペリエンスを構築する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

おすすめのユースケースとサポートされている機能

おすすめのユースケース

オンデバイス推論でサポートされている機能

始める前に

サポートされている Android デバイスとそのオンデバイス モデル

始める

ステップ 1: Firebase プロジェクトを設定し、アプリを Firebase に接続する

ステップ 2: 必要な SDK を追加する

Kotlin

Java

ステップ 3: オンデバイス モデルが利用可能かどうかを確認する

Kotlin

Java

レイテンシの最適化

ステップ 4: サービスを初期化してモデル インスタンスを作成する

Kotlin

Java

ステップ 5: モデルにプロンプト リクエストを送信する

テキストのみの入力からテキストを生成する

Kotlin

Java

テキストと画像（マルチモーダル）の入力からテキストを生成する

Kotlin

Java

その他の機能

オンデバイス推論でまだ利用できない機能

その他の制限

オンデバイスモデルとクラウドホストモデルを使用して Android アプリでハイブリッドエクスペリエンスを構築する

サポートされている Android デバイスとそのオンデバイスモデル

ステップ 3: オンデバイスモデルが利用可能かどうかを確認する

ステップ 4: サービスを初期化してモデルインスタンスを作成する

ステップ 5: モデルにプロンプトリクエストを送信する