The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

オンデバイスモデルとクラウドホストモデルを使用して Android アプリでハイブリッドエクスペリエンスを構築する

Firebase AI Logic を使用して、ハイブリッド推論による AI を活用した Android アプリや機能を構築できます。ハイブリッド推論では、オンデバイスモデルが利用可能な場合はそれを使用して推論を実行し、それ以外の場合はクラウドホストモデルにシームレスにフォールバックできます（逆も同様）。

このページでは、クライアント SDK の使用を開始する方法について説明します。また、Temperature などの追加の設定オプションと機能についても説明します。

Firebase AI Logic を介したオンデバイス推論は、特定のデバイスで実行される Android アプリでサポートされており、ML Kit の利用規約と ML Kit の生成 AI 関連の利用規約に則って適用されます。

推奨されるユースケースとサポートされている機能

オンデバイス推論でサポートされている機能

オンデバイス推論は、ストリーミングまたは非ストリーミング出力による単一ターンのテキスト生成（チャットではない）のみをサポートします。次のテキスト生成機能がサポートされています。

テキストのみの入力からテキストを生成する
テキストと画像の入力からテキストを生成する。特に、入力として単一の Bitmap 画像を使用する

このページの下部にあるオンデバイス推論でまだ利用できない機能のリストを必ずご確認ください。

始める前に

次の点に注目してください。

サポートされている API:
- クラウド内推論では、選択した Gemini API プロバイダ（Gemini Developer API または Vertex AI Gemini API）を使用します。
- オンデバイス推論では、ML Kit のプロンプト API を使用します。この API はベータ版であり、特定のデバイスでのみ使用できます。
  
  オンデバイスモデルの使用には、ML Kit の利用規約と、ML Kit の生成 AI 関連の利用規約が適用されます。
このページでは、スタートガイドについて説明します。

この標準設定が完了したら、追加の設定オプションと機能（温度設定など）を確認してください。

サポートされている Android デバイスとそのオンデバイスモデル

オンデバイス推論（ML Kit の Prompt API を使用）については、ML Kit のドキュメントでサポートされているデバイスとそのオンデバイスモデルのリストを確認できます。

始める

このスタートガイドの手順では、送信するサポート対象のプロンプトリクエストに必要な一般的な設定について説明します。

ステップ 1: Firebase プロジェクトを設定し、アプリを Firebase に接続する

Firebase コンソールにログインし、Firebase プロジェクトを選択します。
Firebase プロジェクトをまだ作成していない場合

Firebase プロジェクトをまだ作成していない場合は、ボタンをクリックして新しい Firebase プロジェクトを作成し、次のいずれかのオプションを使用します。
- オプション 1: ワークフローの最初のステップで新しいプロジェクト名を入力して、完全に新しい Firebase プロジェクト（およびその基盤となる Google Cloud プロジェクトを自動的に）を作成します。
- オプション 2: ページの下部にある [Google Cloud プロジェクトに Firebase を追加] をクリックして、既存の Google Cloud プロジェクトに「Firebase を追加」します。ワークフローの最初のステップで、既存のプロジェクトのプロジェクト名を入力し、表示されたリストからプロジェクトを選択します。
画面上のワークフローの残りの手順を完了して、Firebase プロジェクトを作成します。プロンプトが表示されたら、Firebase AI Logic SDK を使用するように Google Analytics を設定する必要はありません。
Firebase コンソールで、[AI サービス] > [AI ロジック] に移動します。
[使ってみる] をクリックして、プロジェクトに必要な API とリソースの設定に役立つガイド付きワークフローを起動します。
「Gemini API」プロバイダを使用するようにプロジェクトを設定します。

Gemini Developer API を使用して始めることをおすすめします。いつでも Vertex AI Gemini API を設定できます（お支払いに関する要件も同様です）。

Gemini Developer API の場合、コンソールは必要な API を有効にし、プロジェクトに Gemini API キーを作成します。
この Gemini API キーをアプリのコードベースに追加しないでください。詳細
コンソールのワークフローでプロンプトが表示されたら、画面上の指示に沿ってアプリを登録し、Firebase に接続します。
このガイドの次のステップに進み、SDK をアプリに追加します。

ステップ 2: 必要な SDK を追加する

Firebase AI Logic SDK for Android（firebase-ai）と Firebase AI Logic On-Device SDK（firebase-ai-ondevice）を使用すると、生成モデルを操作するための API にアクセスできます。

モジュール（アプリレベル）の Gradle ファイル（<project>/<app-module>/build.gradle.kts など）に、Android 用 Firebase AI Logic ライブラリの依存関係を追加します。

Kotlin

dependencies {
  // ... other androidx dependencies

  // Add the dependencies for the Firebase AI Logic libraries
  // Note that the on-device SDK is not yet included in the Firebase Android BoM
  implementation("com.google.firebase:firebase-ai:17.11.0")
  implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta01")
}

Java

Java の場合は、2 つのライブラリを追加する必要があります。

dependencies {
  // ... other androidx dependencies

  // Add the dependencies for the Firebase AI Logic libraries
  // Note that the on-device SDK is not yet included in the Firebase Android BoM
  implementation("com.google.firebase:firebase-ai:17.11.0")
  implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta01")

  // Required for one-shot operations (to use `ListenableFuture` from Guava Android)
  implementation("com.google.guava:guava:31.0.1-android")

  // Required for streaming operations (to use `Publisher` from Reactive Streams)
  implementation("org.reactivestreams:reactive-streams:1.0.4")
}

ステップ 3: オンデバイスモデルが利用可能かどうかを確認する

FirebaseAIOnDevice を使用して、オンデバイスモデルが利用可能かどうかを確認し、利用可能でない場合はモデルをダウンロードします。

ダウンロードが完了すると、AICore はモデルを自動的に最新の状態に保ちます。AICore とオンデバイスモデルのダウンロードの管理について詳しくは、スニペットの後のメモをご覧ください。

Kotlin

val status = FirebaseAIOnDevice.checkStatus()
when (status) {
  OnDeviceModelStatus.UNAVAILABLE -> {
    Log.w(TAG, "On-device model is unavailable")
  }

  OnDeviceModelStatus.DOWNLOADABLE -> {
    FirebaseAIOnDevice.download().collect { status ->
      when (status) {
        is DownloadStatus.DownloadStarted ->
          Log.w(TAG, "Starting download - ${status.bytesToDownload}")

        is DownloadStatus.DownloadInProgress ->
          Log.w(TAG, "Download in progress ${status.totalBytesDownloaded} bytes downloaded")

        is DownloadStatus.DownloadCompleted ->
          Log.w(TAG, "On-device model download complete")

        is DownloadStatus.DownloadFailed ->
          Log.e(TAG, "Download failed ${status}")
      }
    }
  }
  OnDeviceModelStatus.DOWNLOADING -> {
    Log.w(TAG, "On-device model is being downloaded")
  }

  OnDeviceModelStatus.AVAILABLE -> {
    Log.w(TAG, "On-device model is available")
  }
}

Java

Checking for and downloading the model is not yet available for Java.

However, all other APIs and interactions in this guide are available for Java.

オンデバイスモデルのダウンロードについては、次の点にご注意ください。

デバイス上のモデルのダウンロードにかかる時間は、ネットワークなど、さまざまな要因によって異なります。
コードでオンデバイスモデルをプライマリ推論またはフォールバック推論に使用している場合は、アプリのライフサイクルの早い段階でモデルがダウンロードされるようにしてください。これにより、エンドユーザーがアプリのコードに遭遇する前にオンデバイスモデルを利用できるようになります。
オンデバイス推論リクエストが行われたときにオンデバイスモデルが利用できない場合、SDK はオンデバイスモデルのダウンロードを自動的にトリガーしません。SDK は、クラウドホスト型モデルにフォールバックするか、例外をスローします（推論モードの動作の詳細を参照）。
AICore（Android システムサービス）は、ダウンロードされるモデルとバージョンを管理し、モデルを最新の状態に保ちます。デバイスにダウンロードされるモデルは 1 つだけです。デバイス上の別のアプリが以前にオンデバイスモデルを正常にダウンロードしている場合、このチェックではモデルが利用可能であると返されます。

レイテンシの最適化

最初の推論呼び出しを最適化するには、アプリで warmup() を呼び出すことができます。これにより、オンデバイスモデルがメモリに読み込まれ、ランタイムコンポーネントが初期化されます。

ステップ 4: サービスを初期化してモデルインスタンスを作成する

Gemini API プロバイダをクリックして、このページでプロバイダ固有のコンテンツとコードを表示します。

モデルにプロンプトリクエストを送信する前に、次の設定を行います。

選択した API プロバイダのサービスを初期化します。
GenerativeModel インスタンスを作成し、mode を次のいずれかに設定します。ここでは概要のみを説明しますが、これらのモードの動作の詳細については、推論モードを設定するをご覧ください。
- PREFER_ON_DEVICE: オンデバイスモデルの使用を試みます。使用できない場合は、クラウドでホストされるモデルにフォールバックします。
- ONLY_ON_DEVICE: オンデバイスモデルの使用を試みます。それ以外の場合は、例外をスローします。
- PREFER_IN_CLOUD: クラウドでホストされるモデルを使用しようとします。使用できない場合は、オンデバイスモデルにフォールバックします。
- ONLY_IN_CLOUD: クラウドでホストされるモデルを使用しようとします。それ以外の場合は、例外をスローします。
注: 次の点にご注意ください。
- デバイスモデルを使用するには、このページの下部にあるまだ利用できない機能の一覧を確認してください。
- クラウドでホストされるモデルを使用するには、デバイスがオンラインである必要があり、使用するクラウドでホストされるモデルを明示的に指定する必要があります。
- レスポンスの一部として、オンデバイス推論とクラウド推論のどちらが使用されたかが SDK から返されます。

Kotlin

// Using this SDK to access on-device inference is an Experimental release and requires opt-in
@OptIn(PublicPreviewAPI::class)

// ...

// Initialize the Gemini Developer API backend service
// Create a GenerativeModel instance with a model that supports your use case
// Set the inference mode (like PREFER_ON_DEVICE to use the on-device model if available)
val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        modelName = "MODEL_NAME",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
    )

Java

// Initialize the Gemini Developer API backend service
// Create a GenerativeModel instance with a model that supports your use case
// Set the inference mode (like PREFER_ON_DEVICE to use the on-device model if available)
GenerativeModel ai = FirebaseAI.getInstance(GenerativeBackend.googleAI())
    .generativeModel(
        "MODEL_NAME",
        new OnDeviceConfig(InferenceMode.PREFER_ON_DEVICE)
    );

// Use the GenerativeModelFutures Java compatibility layer which offers
// support for ListenableFuture and Publisher APIs
GenerativeModelFutures model = GenerativeModelFutures.from(ai);

ステップ 5: モデルにプロンプトリクエストを送信する

このセクションでは、さまざまな種類の入力を送信して、次のようなさまざまな種類の出力を生成する方法について説明します。

テキストのみの入力からテキストを生成する
テキストと画像（マルチモーダル）の入力からテキストを生成する

テキストのみの入力からテキストを生成する

このサンプルを試す前に、このガイドのスタートガイドセクションを完了していることを確認してください。

generateContent() を使用すると、テキストを含むプロンプトからテキストを生成できます。

Kotlin

// Imports + initialization of Gemini API backend service + creation of model instance

// Provide a prompt that contains text
val prompt = "Write a story about a magic backpack."

// To generate text output, call generateContent with the text input
val response = model.generateContent(prompt)
print(response.text)

Java

// Imports + initialization of Gemini API backend service + creation of model instance

// Provide a prompt that contains text
Content prompt = new Content.Builder()
    .addText("Write a story about a magic backpack.")
    .build();

// To generate text output, call generateContent with the text input
ListenableFuture<GenerateContentResponse> response = model.generateContent(prompt);
Futures.addCallback(response, new FutureCallback<GenerateContentResponse>() {
    @Override
    public void onSuccess(GenerateContentResponse result) {
        String resultText = result.getText();
        System.out.println(resultText);
    }

    @Override
    public void onFailure(Throwable t) {
        t.printStackTrace();
    }
}, executor);

なお、Firebase AI Logic は generateContentStream（generateContent ではなく）を使用したテキストレスポンスのストリーミングもサポートしています。

テキストと画像（マルチモーダル）入力からテキストを生成する

このサンプルを試す前に、このガイドのスタートガイドセクションを完了していることを確認してください。

generateContent() を使用して、テキストと最大 1 つの画像ファイル（ビットマップのみ）を含むプロンプトからテキストを生成できます。各入力ファイルの mimeType とファイル自体を指定します。

Kotlin

// Imports + initialization of Gemini API backend service + creation of model instance

// Loads an image from the app/res/drawable/ directory
val bitmap: Bitmap = BitmapFactory.decodeResource(resources, R.drawable.sparky)

// Provide a prompt that includes the image specified above and text
val prompt = content {
  image(bitmap)
  text("What developer tool is this mascot from?")
}

// To generate text output, call generateContent with the prompt
val response = model.generateContent(prompt)
print(response.text)

Java

// Imports + initialization of Gemini API backend service + creation of model instance

Bitmap bitmap = BitmapFactory.decodeResource(getResources(), R.drawable.sparky);

// Provide a prompt that includes the image specified above and text
Content content = new Content.Builder()
        .addImage(bitmap)
        .addText("What developer tool is this mascot from?")
        .build();

// To generate text output, call generateContent with the prompt
ListenableFuture<GenerateContentResponse> response = model.generateContent(content);
Futures.addCallback(response, new FutureCallback<GenerateContentResponse>() {
    @Override
    public void onSuccess(GenerateContentResponse result) {
        String resultText = result.getText();
        System.out.println(resultText);
    }

    @Override
    public void onFailure(Throwable t) {
        t.printStackTrace();
    }
}, executor);

なお、Firebase AI Logic は generateContentStream（generateContent ではなく）を使用したテキストレスポンスのストリーミングもサポートしています。

Google アシスタントの機能

ハイブリッドエクスペリエンスには、さまざまな追加の構成オプションと機能を使用できます。

オンデバイス推論でまだ利用できない機能

試験運用版として、クラウドモデルのすべての機能をオンデバイス推論で使用できるわけではありません。

このセクションに記載されている機能は、オンデバイス推論ではまだ利用できません。これらの機能を使用する場合は、より一貫したエクスペリエンスを実現するために ONLY_IN_CLOUD 推論モードを使用することをおすすめします。

構造化出力（JSON や列挙型など）の生成
Bitmap（メモリに読み込まれた画像）以外の画像ファイル入力タイプからテキストを生成する
複数の画像ファイルからテキストを生成する
音声、動画、ドキュメント（PDF など）の入力からテキストを生成する
Gemini モデルまたは Imagen モデルを使用して画像を生成する
マルチモーダルリクエストで URL を使用してファイルを提供する。ファイルはオンデバイスモデルへのインラインデータとして提供する必要があります
4,000 トークン（約 3,000 ワード（英語））を超えるリクエストを送信する。
マルチターンチャット
モデルがレスポンスを生成するのに役立つツール（関数呼び出し、コード実行、URL コンテキスト、Google 検索によるグラウンディングなど）をモデルに提供する

Firebase コンソールの AI モニタリングには、オンデバイス推論（オンデバイスログを含む）のデータは表示されません。ただし、クラウドホスト型モデルを使用する推論は、Firebase AI Logic を介して他の推論と同様にモニタリングできます。

その他の制限

上記に加えて、オンデバイス推論には次の制限事項があります（詳しくは、ML Kit のドキュメントをご覧ください）。

アプリのエンドユーザーは、オンデバイス推論にサポートされているデバイスを使用する必要があります。
アプリがオンデバイス推論を実行できるのは、フォアグラウンドにあるときのみです。
オンデバイス推論で検証されているのは英語と韓国語のみです。
デバイス上の推論リクエスト全体の最大トークン数は 4,000 トークンです。リクエストがこの上限を超える可能性がある場合は、クラウドホスト型モデルを使用できる推論モードを構成してください。
長い出力（256 個を超えるトークン）を必要とするオンデバイス推論のユースケースは避けることをおすすめします。
AICore（オンデバイスモデルを管理する Android システムサービス）は、アプリごとに推論割り当てを適用します。短期間に API リクエストを過剰に送信すると、ErrorCode.BUSY レスポンスが返されます。このエラーが発生した場合は、指数バックオフを使用してリクエストを再試行することを検討してください。また、アプリが長期間の割り当て（1 日の割り当てなど）を超過した場合にも、ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED が返されることがあります。

Firebase AI Logic の使用感についてフィードバックを送信する

オンデバイス モデルとクラウドホスト モデルを使用して Android アプリでハイブリッド エクスペリエンスを構築する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

推奨されるユースケースとサポートされている機能

おすすめのユースケース

オンデバイス推論でサポートされている機能

始める前に

サポートされている Android デバイスとそのオンデバイス モデル

始める

ステップ 1: Firebase プロジェクトを設定し、アプリを Firebase に接続する

ステップ 2: 必要な SDK を追加する

Kotlin

Java

ステップ 3: オンデバイス モデルが利用可能かどうかを確認する

Kotlin

Java

レイテンシの最適化

ステップ 4: サービスを初期化してモデル インスタンスを作成する

Kotlin

Java

ステップ 5: モデルにプロンプト リクエストを送信する

テキストのみの入力からテキストを生成する

Kotlin

Java

テキストと画像（マルチモーダル）入力からテキストを生成する

Kotlin

Java

Google アシスタントの機能

オンデバイス推論でまだ利用できない機能

その他の制限

オンデバイスモデルとクラウドホストモデルを使用して Android アプリでハイブリッドエクスペリエンスを構築する

サポートされている Android デバイスとそのオンデバイスモデル

ステップ 3: オンデバイスモデルが利用可能かどうかを確認する

ステップ 4: サービスを初期化してモデルインスタンスを作成する

ステップ 5: モデルにプロンプトリクエストを送信する