The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models were shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Konfigurationsoptionen für hybride Funktionen in Android-Apps

Auf dieser Seite werden die folgenden Konfigurationsoptionen für Hybrid-Erlebnisse beschrieben:

Inferenzmodus festlegen
Ermitteln, ob die Inferenz auf dem Gerät oder in der Cloud verwendet wurde.
Geben Sie ein zu verwendendes Modell an.
Mit der Modellkonfiguration Antworten steuern (z. B. Temperatur)

Startleitfaden für die Entwicklung hybrider Apps

Inferenzmodus festlegen

In den Beispielen im Leitfaden für den Einstieg wird der PREFER_ON_DEVICE-Modus verwendet. Dies ist jedoch nur einer der vier verfügbaren Inferenzmodi.

Folgende Inferenzmodi sind verfügbar:

PREFER_ON_DEVICE: Versuchen Sie, das On-Device-Modell zu verwenden, wenn es verfügbar ist und die Art der Anfrage unterstützt. Andernfalls wird ein Fehler auf dem Gerät protokolliert und dann automatisch auf das in der Cloud gehostete Modell zurückgegriffen.
Kotlin
val config = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
Java
InferenceMode mode = InferenceMode.PREFER_ON_DEVICE; OnDeviceConfig config = new OnDeviceConfig(mode);

ONLY_ON_DEVICE: Versuchen Sie, das On-Device-Modell zu verwenden, wenn es verfügbar ist und die Art der Anfrage unterstützt. Andernfalls wird eine Ausnahme ausgelöst.

Kotlin

val config = OnDeviceConfig(mode = InferenceMode.ONLY_ON_DEVICE)

Java

InferenceMode mode = InferenceMode.ONLY_ON_DEVICE;
OnDeviceConfig config = new OnDeviceConfig(mode);

PREFER_IN_CLOUD: Versuchen Sie, das in der Cloud gehostete Modell zu verwenden, wenn das Gerät online und das Modell verfügbar ist. Wenn das Gerät offline ist, wird auf das On-Device-Modell zurückgegriffen. In allen anderen Fehlerfällen wird eine Ausnahme ausgelöst.
Kotlin
val config = OnDeviceConfig(mode = InferenceMode.PREFER_IN_CLOUD)
Java
InferenceMode mode = InferenceMode.PREFER_IN_CLOUD; OnDeviceConfig config = new OnDeviceConfig(mode);
ONLY_IN_CLOUD: Versuchen Sie, das in der Cloud gehostete Modell zu verwenden, wenn das Gerät online und das Modell verfügbar ist. Andernfalls wird eine Ausnahme ausgelöst.
Kotlin
val config = OnDeviceConfig(mode = InferenceMode.ONLY_IN_CLOUD)
Java
InferenceMode mode = InferenceMode.ONLY_IN_CLOUD; OnDeviceConfig config = new OnDeviceConfig(mode);

Ermitteln, ob die Inferenz auf dem Gerät oder in der Cloud verwendet wurde

Wenn Ihr Inferenzmodus PREFER_ON_DEVICE oder PREFER_IN_CLOUD ist, kann es hilfreich sein, zu wissen, welcher Modus für bestimmte Anfragen verwendet wurde. Diese Informationen werden durch das Attribut inferenceSource jeder Antwort bereitgestellt.

Wenn Sie auf diese Eigenschaft zugreifen, ist der zurückgegebene Wert entweder ON_DEVICE oder IN_CLOUD.

Kotlin

// ...

print("You used: ${result.response.inferenceSource}")

print(result.response.text)

Java

// ...

System.out.println("You used: " + result.getResponse().getInferenceSource());

System.out.println(result.getResponse().getText());

Modell angeben, das verwendet werden soll

Klicken Sie auf Ihren Gemini API-Anbieter, um anbieterspezifische Inhalte und Code auf dieser Seite aufzurufen.

Sie können ein Modell angeben, das beim Erstellen der generativeModel-Instanz verwendet werden soll (Kotlin | Java).

In der Cloud gehostetes Modell angeben:
- Wenn Ihr Inferenzmodus PREFER_ON_DEVICE, PREFER_IN_CLOUD oder ONLY_IN_CLOUD ist, müssen Sie explizit ein in der Cloud gehostetes Modell angeben. Das SDK hat kein standardmäßiges cloudbasiertes Modell.
- Modellnamen für alle unterstützten cloudgehosteten Gemini-Modelle
On-Device-Modell angeben:
- Wenn Ihr Inferenzmodus PREFER_ON_DEVICE, PREFER_IN_CLOUD oder ONLY_ON_DEVICE ist, können Sie optional in der onDeviceConfig eine „category“ (Kategorie) des zu verwendenden On-Device-Modells angeben. Kategorien sind eine Kombination aus Release-Phase und Leistungsmerkmalen.
- Unterstützte Kategoriewerte sind unten aufgeführt.
  AICore wählt automatisch das On-Device-Modell aus, das die Bedingungen der angegebenen Kategorie erfüllt und vom Gerät unterstützt wird. Wenn Sie beispielsweise PREVIEW angeben und das Gerät ein Pixel 9 ist, wird wahrscheinlich automatisch Gemini Nano 4 Full [Preview] (nano-v4-full) ausgewählt.
  - STABLE: Das neueste stabile On-Device-Modell.
    - Vollständig getestet und auf Verbrauchergeräten verfügbar.
    - Beispiele: Gemini Nano 3 (nano-v3) oder Gemini Nano 2 (nano-v2).
    - Standardeinstellung für das On-Device-Modell, wenn kein OnDeviceModelOption angegeben ist.
  - PREVIEW: Das neueste Vorschaumodell auf dem Gerät mit voller Leistung.
    - Für höhere Schlussfolgerungsfähigkeit und komplexe Aufgaben konzipiert.
    - Ein Beispiel ist Gemini Nano 4 Full [Preview] (nano-v4-full, das auf Gemma 4 E4B basiert).
  - PREVIEW_FAST: Das aktuelle schnelle On-Device-Modell in der Vorschau.
    - Für maximale Geschwindigkeit und geringere Latenz optimiert.
    - Ein Beispiel ist Gemini Nano 4 Fast [Preview] (nano-v4-fast, das auf Gemma 4 E2B basiert).
  Wichtig: Wenn Sie ein Vorschaumodell auf dem Gerät verwenden möchten, lesen Sie die Voraussetzungen und Registrierungsanleitung für die Entwicklervorschau im AICore-Entwicklervorschauleitfaden.

Kotlin

val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        // Specify a cloud-hosted model.
        // Required for `PREFER_ON_DEVICE`, `PREFER_IN_CLOUD`, and `ONLY_IN_CLOUD` inference modes.
        modelName = "CLOUD_HOSTED_MODEL_NAME",
        onDeviceConfig = OnDeviceConfig(
            mode = InferenceMode.INFERENCE_MODE,
            // (Optional) Specify an on-device model category.
            // AICore will auto-select an on-device model based on this category.
            // If not specified, AICore will auto-select the default stable on-device model.
            modelOption = OnDeviceModelOption.ON-DEVICE_MODEL_CATEGORY)
    )

Java

GenerativeModel ai = FirebaseAI.getInstance(GenerativeBackend.googleAI())
    .generativeModel(
        // Specify a cloud-hosted model.
        // Required for `PREFER_ON_DEVICE`, `PREFER_IN_CLOUD`, and `ONLY_IN_CLOUD` inference modes.
        "CLOUD_HOSTED_MODEL_NAME",
        /* config = */ null,
        /* safetySettings = */ null,
        /* tools = */ null,
        /* toolConfig = */ null,
        /* systemInstruction = */ null,
        /* requestOptions = */ new RequestOptions(),
        new OnDeviceConfig(
                /* mode = */ InferenceMode.INFERENCE_MODE,
                /* maxOutputTokens = */ null,
                /* temperature = */ null,
                /* topK = */ null,
                /* seed = */ null,
                /* candidateCount = */ 1,
                // (Optional) Specify an on-device model category.
                // AICore will auto-select an on-device model based on this category.
                // If not specified, AICore will auto-select the default stable on-device model.
                /* modelOption = */ OnDeviceModelOption.ON-DEVICE_MODEL_CATEGORY)
    );

GenerativeModelFutures model = GenerativeModelFutures.from(ai);

Antworten mit der Modellkonfiguration steuern

Klicken Sie auf Ihren Gemini API-Anbieter, um anbieterspezifische Inhalte und Code auf dieser Seite aufzurufen.

In jeder Anfrage an ein Modell können Sie eine Modellkonfiguration senden, um zu steuern, wie das Modell eine Antwort generiert. Cloudbasierte und geräteinterne Modelle bieten unterschiedliche Konfigurationsoptionen (cloud- im Vergleich zu on-device-Parametern).

Bei in der Cloud gehosteten Modellen legen Sie die Konfiguration direkt in der Konfiguration des Modells fest. Bei On-Device-Modellen legen Sie die Konfiguration jedoch in einem onDeviceConfig fest.

Die Konfiguration bleibt für die gesamte Lebensdauer der Instanz erhalten. Wenn Sie eine andere Konfiguration verwenden möchten, erstellen Sie eine neue GenerativeModel-Instanz mit dieser Konfiguration.

Hier ist ein Beispiel, in dem die Konfigurationen für die cloudbasierten und geräteinternen Modelle festgelegt werden, die verwendet werden könnten, wenn der PREFER_ON_DEVICE-Inferenzmodus festgelegt ist:

Kotlin

val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel("MODEL_NAME",
        // Config for cloud-hosted model
        generationConfig = generationConfig {
          temperature = 0.8f,
          topK = 10
        },
        // Config for on-device model
        onDeviceConfig = onDeviceConfig {
          mode = InferenceMode.PREFER_ON_DEVICE,
          temperature = 0.8f,
          topK = 5
        })

Java

// Config for cloud-hosted model
GenerationConfig generationConfig = new GenerationConfig.Builder()
    .setTemperature(0.8f)
    .setTopK(10)
    .build();

// Config for on-device model
OnDeviceConfig onDeviceConfig = new OnDeviceConfig.Builder()
    .setMode(InferenceMode.PREFER_ON_DEVICE)
    .setTemperature(0.8f)
    .setTopK(5)
    .build();

GenerativeModel ai = FirebaseAI.getInstance(GenerativeBackend.googleAI())
    .generativeModel(
        "MODEL_NAME",
        generationConfig,
        onDeviceConfig
    );

GenerativeModelFutures model = GenerativeModelFutures.from(ai);

Konfigurationsoptionen für hybride Funktionen in Android-Apps Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Inferenzmodus festlegen

Kotlin

Java

Kotlin

Java

Kotlin

Java

Kotlin

Java

Ermitteln, ob die Inferenz auf dem Gerät oder in der Cloud verwendet wurde

Kotlin

Java

Modell angeben, das verwendet werden soll

Kotlin

Java

Antworten mit der Modellkonfiguration steuern

Kotlin

Java

Konfigurationsoptionen für hybride Funktionen in Android-Apps