The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models were shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ตัวเลือกการกำหนดค่าสำหรับประสบการณ์การใช้งานแบบไฮบริดในแอป Android

หน้านี้จะอธิบายตัวเลือกการกำหนดค่าต่อไปนี้สำหรับประสบการณ์แบบไฮบริด

ตั้งค่าโหมดการอนุมาน
พิจารณาว่าใช้การอนุมานในอุปกรณ์หรือในระบบคลาวด์
ระบุโมเดลที่จะใช้
ใช้การกำหนดค่าโมเดลเพื่อควบคุมคำตอบ (เช่น อุณหภูมิ)

ตรวจสอบว่าคุณได้ทำตามคู่มือเริ่มต้นใช้งานสำหรับการสร้างประสบการณ์แบบไฮบริดเรียบร้อยแล้ว

ตั้งค่าโหมดการอนุมาน

ตัวอย่างในคู่มือการเริ่มต้นใช้งานใช้โหมด PREFER_ON_DEVICE แต่ นี่เป็นเพียง 1 ใน 4 ของโหมดการอนุมานที่มี

หมายเหตุ: โปรดทราบข้อต่อไปนี้

หากต้องการใช้โมเดลในอุปกรณ์ โปรดตรวจสอบรายการฟีเจอร์ ที่ยังไม่พร้อมใช้งาน สำหรับการอนุมานในอุปกรณ์ ในหน้าเริ่มต้นใช้งาน
หากต้องการใช้โมเดลที่โฮสต์บนระบบคลาวด์ อุปกรณ์ต้องออนไลน์และคุณต้องระบุ โมเดลที่โฮสต์บนระบบคลาวด์ที่จะใช้อย่างชัดเจน
SDK จะแจ้งให้คุณทราบ ว่า ใช้การอนุมานในอุปกรณ์หรือในระบบคลาวด์เป็นส่วนหนึ่งของการตอบกลับ

โหมดการอนุมานที่ใช้ได้มีดังนี้

PREFER_ON_DEVICE: พยายามใช้โมเดลในอุปกรณ์หากมีและรองรับคำขอประเภทนั้น มิเช่นนั้น ให้บันทึกข้อผิดพลาดในอุปกรณ์ แล้วกลับไปใช้โมเดลที่โฮสต์ในระบบคลาวด์โดยอัตโนมัติ
Kotlin
val config = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
Java
InferenceMode mode = InferenceMode.PREFER_ON_DEVICE; OnDeviceConfig config = new OnDeviceConfig(mode);
ONLY_ON_DEVICE: พยายามใช้โมเดลในอุปกรณ์หากมีและรองรับคำขอประเภทนั้น มิเช่นนั้นให้แสดงข้อยกเว้น
Kotlin
val config = OnDeviceConfig(mode = InferenceMode.ONLY_ON_DEVICE)
Java
InferenceMode mode = InferenceMode.ONLY_ON_DEVICE; OnDeviceConfig config = new OnDeviceConfig(mode);
PREFER_IN_CLOUD: พยายามใช้โมเดลที่โฮสต์ในระบบคลาวด์หากอุปกรณ์ออนไลน์และหากโมเดลพร้อมใช้งาน หากอุปกรณ์ออฟไลน์ ให้ใช้โมเดลในอุปกรณ์แทน ในกรณีอื่นๆ ทั้งหมดที่การดำเนินการไม่สำเร็จ ให้ส่งข้อยกเว้น
Kotlin
val config = OnDeviceConfig(mode = InferenceMode.PREFER_IN_CLOUD)
Java
InferenceMode mode = InferenceMode.PREFER_IN_CLOUD; OnDeviceConfig config = new OnDeviceConfig(mode);
ONLY_IN_CLOUD: พยายามใช้โมเดลที่โฮสต์ในระบบคลาวด์หากอุปกรณ์ออนไลน์และหากโมเดลพร้อมใช้งาน มิเช่นนั้นให้แสดงข้อยกเว้น
Kotlin
val config = OnDeviceConfig(mode = InferenceMode.ONLY_IN_CLOUD)
Java
InferenceMode mode = InferenceMode.ONLY_IN_CLOUD; OnDeviceConfig config = new OnDeviceConfig(mode);

พิจารณาว่าใช้การอนุมานในอุปกรณ์หรือในระบบคลาวด์

หากโหมดการอนุมานเป็น PREFER_ON_DEVICE หรือ PREFER_IN_CLOUD การทราบว่าใช้โหมดใดสำหรับคำขอที่กำหนดอาจมีประโยชน์ ข้อมูลนี้มาจากพร็อพเพอร์ตี้ inferenceSource ของการตอบกลับแต่ละรายการ

เมื่อเข้าถึงพร็อพเพอร์ตี้นี้ ค่าที่แสดงผลจะเป็น ON_DEVICE หรือ IN_CLOUD

Kotlin

// ...

print("You used: ${result.response.inferenceSource}")

print(result.response.text)

Java

// ...

System.out.println("You used: " + result.getResponse().getInferenceSource());

System.out.println(result.getResponse().getText());

ระบุโมเดลที่จะใช้

คลิกผู้ให้บริการ Gemini API เพื่อดูเนื้อหาและโค้ดเฉพาะของผู้ให้บริการ ในหน้านี้

คุณระบุโมเดลที่จะใช้เมื่อสร้างอินสแตนซ์ generativeModel ได้ (Kotlin | Java)

ระบุโมเดลที่โฮสต์บนระบบคลาวด์:
- หากโหมดการอนุมานเป็น PREFER_ON_DEVICE, PREFER_IN_CLOUD หรือ ONLY_IN_CLOUD คุณต้องระบุโมเดลที่โฮสต์ในระบบคลาวด์อย่างชัดเจน เพื่อใช้งาน SDK ไม่มีโมเดลที่โฮสต์บนระบบคลาวด์เริ่มต้น
- ค้นหาชื่อโมเดลสำหรับโมเดลที่โฮสต์บนระบบคลาวด์ที่รองรับGeminiทั้งหมด
ระบุโมเดลในอุปกรณ์
- หากโหมดการอนุมานเป็น PREFER_ON_DEVICE, PREFER_IN_CLOUD หรือ ONLY_ON_DEVICE คุณจะระบุ "หมวดหมู่" ของโมเดลในอุปกรณ์ที่จะใช้ได้โดยไม่บังคับใน onDeviceConfig หมวดหมู่คือ การผสมผสานระหว่างระยะการเปิดตัวและลักษณะประสิทธิภาพ
- ค่าหมวดหมู่ที่รองรับแสดงอยู่ด้านล่าง
  AICore จะเลือกโมเดลในอุปกรณ์โดยอัตโนมัติซึ่งตรงตามเงื่อนไขของ หมวดหมู่ที่ระบุและอุปกรณ์รองรับ เช่น หากคุณ ระบุ PREVIEW และอุปกรณ์เป็น Pixel 9 ระบบก็น่าจะ เลือกGemini Nano 4 Full [ตัวอย่าง] (nano-v4-full) โดยอัตโนมัติ
  - STABLE: โมเดล Stable ล่าสุดในอุปกรณ์
    - ผ่านการทดสอบอย่างเต็มรูปแบบและพร้อมใช้งานในอุปกรณ์ของผู้บริโภค
    - เช่น Gemini Nano 3 (nano-v3) หรือ Gemini Nano 2 (nano-v2)
    - การตั้งค่าเริ่มต้นสำหรับโมเดลในอุปกรณ์หากไม่ได้ระบุ OnDeviceModelOption
  - PREVIEW: รุ่นตัวอย่างล่าสุดของโมเดลในอุปกรณ์ที่มีความสามารถด้านประสิทธิภาพเต็มรูปแบบ
    - ออกแบบมาเพื่อเพิ่มความสามารถในการให้เหตุผลและงานที่ซับซ้อน
    - เช่น Gemini Nano 4 Full [ตัวอย่าง] (nano-v4-full ซึ่ง อิงตาม Gemma 4 E4B)
  - PREVIEW_FAST: โมเดลเวอร์ชันตัวอย่างล่าสุดในอุปกรณ์ที่รวดเร็ว
    - เพิ่มประสิทธิภาพเพื่อความเร็วสูงสุดและเวลาในการตอบสนองที่ต่ำลง
    - เช่น Gemini Nano 4 Fast [ตัวอย่าง] (nano-v4-fast ซึ่ง อิงตาม Gemma 4 E2B)
  สำคัญ: หากต้องการใช้โมเดลเวอร์ชันตัวอย่างในอุปกรณ์ โปรดอ่านข้อกำหนดเบื้องต้น และวิธีการลงทะเบียนสำหรับเวอร์ชันตัวอย่างสำหรับนักพัฒนาซอฟต์แวร์ใน คู่มือเวอร์ชันตัวอย่างสำหรับนักพัฒนาซอฟต์แวร์ของ AICore

Kotlin

val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        // Specify a cloud-hosted model.
        // Required for `PREFER_ON_DEVICE`, `PREFER_IN_CLOUD`, and `ONLY_IN_CLOUD` inference modes.
        modelName = "CLOUD_HOSTED_MODEL_NAME",
        onDeviceConfig = OnDeviceConfig(
            mode = InferenceMode.INFERENCE_MODE,
            // (Optional) Specify an on-device model category.
            // AICore will auto-select an on-device model based on this category.
            // If not specified, AICore will auto-select the default stable on-device model.
            modelOption = OnDeviceModelOption.ON-DEVICE_MODEL_CATEGORY)
    )

Java

GenerativeModel ai = FirebaseAI.getInstance(GenerativeBackend.googleAI())
    .generativeModel(
        // Specify a cloud-hosted model.
        // Required for `PREFER_ON_DEVICE`, `PREFER_IN_CLOUD`, and `ONLY_IN_CLOUD` inference modes.
        "CLOUD_HOSTED_MODEL_NAME",
        /* config = */ null,
        /* safetySettings = */ null,
        /* tools = */ null,
        /* toolConfig = */ null,
        /* systemInstruction = */ null,
        /* requestOptions = */ new RequestOptions(),
        new OnDeviceConfig(
                /* mode = */ InferenceMode.INFERENCE_MODE,
                /* maxOutputTokens = */ null,
                /* temperature = */ null,
                /* topK = */ null,
                /* seed = */ null,
                /* candidateCount = */ 1,
                // (Optional) Specify an on-device model category.
                // AICore will auto-select an on-device model based on this category.
                // If not specified, AICore will auto-select the default stable on-device model.
                /* modelOption = */ OnDeviceModelOption.ON-DEVICE_MODEL_CATEGORY)
    );

GenerativeModelFutures model = GenerativeModelFutures.from(ai);

ใช้การกำหนดค่าโมเดลเพื่อควบคุมคำตอบ

ในแต่ละคำขอที่ส่งไปยังโมเดล คุณสามารถส่งการกำหนดค่าโมเดลเพื่อควบคุม วิธีที่โมเดลสร้างคำตอบ โมเดลที่โฮสต์ในระบบคลาวด์และโมเดลในอุปกรณ์ มีตัวเลือกการกำหนดค่าที่แตกต่างกัน (พารามิเตอร์คลาวด์ เทียบกับในอุปกรณ์ )

สำหรับโมเดลที่โฮสต์บนระบบคลาวด์ ให้ตั้งค่าการกำหนดค่าโดยตรงในการกำหนดค่าของโมเดล อย่างไรก็ตาม สำหรับโมเดลในอุปกรณ์ ให้ตั้งค่าภายใน onDeviceConfig

ระบบจะรักษาการกำหนดค่าไว้ตลอดอายุการใช้งานของอินสแตนซ์ หากต้องการใช้การกำหนดค่าอื่น ให้สร้างอินสแตนซ์ GenerativeModel ใหม่ด้วยการกำหนดค่านั้น

ตัวอย่างต่อไปนี้จะตั้งค่าสำหรับโมเดลที่โฮสต์บนระบบคลาวด์และโมเดลในอุปกรณ์ที่อาจใช้ได้หากตั้งค่าPREFER_ON_DEVICEโหมดการอนุมาน ไว้

Kotlin

val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel("MODEL_NAME",
        // Config for cloud-hosted model
        generationConfig = generationConfig {
          temperature = 0.8f,
          topK = 10
        },
        // Config for on-device model
        onDeviceConfig = onDeviceConfig {
          mode = InferenceMode.PREFER_ON_DEVICE,
          temperature = 0.8f,
          topK = 5
        })

Java

// Config for cloud-hosted model
GenerationConfig generationConfig = new GenerationConfig.Builder()
    .setTemperature(0.8f)
    .setTopK(10)
    .build();

// Config for on-device model
OnDeviceConfig onDeviceConfig = new OnDeviceConfig.Builder()
    .setMode(InferenceMode.PREFER_ON_DEVICE)
    .setTemperature(0.8f)
    .setTopK(5)
    .build();

GenerativeModel ai = FirebaseAI.getInstance(GenerativeBackend.googleAI())
    .generativeModel(
        "MODEL_NAME",
        generationConfig,
        onDeviceConfig
    );

GenerativeModelFutures model = GenerativeModelFutures.from(ai);