The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

สร้างประสบการณ์แบบไฮบริดในเว็บแอปด้วยโมเดลที่โฮสต์ในอุปกรณ์และระบบคลาวด์

เวอร์ชันตัวอย่าง: การใช้ Firebase AI Logic SDK เพื่อสร้างประสบการณ์ใช้งานแบบไฮบริดในเว็บแอปเป็นฟีเจอร์ เวอร์ชันตัวอย่าง ซึ่งหมายความว่าฟีเจอร์นี้ไม่อยู่ภายใต้นโยบาย SLA หรือ นโยบายการเลิกใช้งาน และอาจมีการเปลี่ยนแปลงบางอย่างที่ใช้กับรุ่นก่อนหน้าไม่ได้

การเปิดตัวครั้งแรกนี้รองรับการอนุมานในอุปกรณ์สำหรับ เว็บแอปที่ทำงานบน Chrome ในเดสก์ท็อปเท่านั้น

สร้างเว็บแอปและฟีเจอร์ที่ขับเคลื่อนด้วย AI พร้อมการอนุมานแบบไฮบริดโดยใช้ Firebase AI Logic การอนุมานแบบไฮบริดช่วยให้สามารถเรียกใช้การอนุมานโดยใช้โมเดลในอุปกรณ์เมื่อพร้อมใช้งาน และเปลี่ยนไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้อย่างราบรื่นในกรณีอื่นๆ (และในทางกลับกัน)

หน้านี้อธิบายวิธี เริ่มต้นใช้งาน Client SDK หลังจากตั้งค่ามาตรฐานนี้เสร็จแล้ว ให้ดูตัวเลือกการกำหนดค่าและความสามารถเพิ่มเติม (เช่น เอาต์พุตที่มีโครงสร้าง)

โปรดทราบว่าระบบรองรับการอนุมานในอุปกรณ์สำหรับ เว็บแอปที่ทำงานบน Chrome ในเดสก์ท็อป

ข้ามไปยังตัวอย่างโค้ด

กรณีการใช้งานที่แนะนำและความสามารถที่รองรับ

กรณีการใช้งานที่แนะนำ:

การใช้โมเดลในอุปกรณ์สำหรับการอนุมานมีข้อดีดังนี้
- ความเป็นส่วนตัวที่ดียิ่งขึ้น
- บริบทเฉพาะรายการ
- การอนุมานโดยไม่มีค่าใช้จ่าย
- ฟังก์ชันการทำงานแบบออฟไลน์
การใช้ฟังก์ชันการทำงานแบบไฮบริดมีข้อดีดังนี้
- เข้าถึงกลุ่มเป้าหมายได้ 100% ไม่ว่าโมเดลในอุปกรณ์จะพร้อมใช้งานหรือไม่ หรือการเชื่อมต่ออินเทอร์เน็ตจะเป็นอย่างไร

ความสามารถและฟีเจอร์ที่รองรับสำหรับการอนุมานในอุปกรณ์:

การอนุมานในอุปกรณ์รองรับเฉพาะการสร้างข้อความแบบครั้งเดียว (ไม่ใช่ แชท) โดยมีเอาต์พุตแบบสตรีมมิงหรือไม่สตรีมมิง และรองรับความสามารถในการสร้างข้อความต่อไปนี้

การสร้าง ข้อความจากอินพุตที่เป็นข้อความเท่านั้น
การสร้างข้อความจากอินพุตที่เป็นข้อความและรูปภาพ โดยเฉพาะ รูปภาพอินพุตประเภท JPEG และ PNG

นอกจากนี้ คุณยัง สร้างเอาต์พุตที่มีโครงสร้าง, ซึ่งรวมถึง JSON และ Enum ได้ด้วย

ก่อนเริ่มต้น

โปรดทราบสิ่งต่อไปนี้

การอนุมานโดยใช้โมเดลในอุปกรณ์จะใช้ Prompt API จาก Chrome ส่วน การอนุมานโดยใช้โมเดลที่โฮสต์ในระบบคลาวด์จะใช้Gemini API ผู้ให้บริการที่คุณเลือก (ไม่ว่าจะเป็นGemini Developer API หรือ Vertex AI Gemini API)
หน้านี้อธิบายวิธีเริ่มต้นพัฒนาโดยใช้ localhost (ดูข้อมูล เพิ่มเติมเกี่ยวกับการ ใช้ API ใน localhost ในเอกสารประกอบของ Chrome)

หลังจากตั้งค่ามาตรฐานนี้เสร็จแล้ว ให้ดูตัวเลือกการกำหนดค่าและความสามารถเพิ่มเติม (เช่น เอาต์พุตที่มีโครงสร้าง)
หลังจากติดตั้งใช้งานฟีเจอร์แล้ว คุณสามารถ เปิดใช้ฟีเจอร์ให้ผู้ใช้ปลายทางได้ทดลองใช้ ในแอปจริง

เริ่มต้นใช้งานใน localhost

ขั้นตอนการเริ่มต้นใช้งานเหล่านี้อธิบายการตั้งค่าทั่วไปที่จำเป็นสำหรับคำขอพรอมต์ที่รองรับซึ่งคุณต้องการส่ง

ขั้นตอนที่ 1: ตั้งค่า Chrome และ Prompt API สำหรับการอนุมานในอุปกรณ์

ตรวจสอบว่าคุณใช้ Chrome เวอร์ชันล่าสุด อัปเดตใน chrome://settings/help
การอนุมานในอุปกรณ์พร้อมใช้งานตั้งแต่ Chrome v139 ขึ้นไป
เปิดใช้โมเดลมัลติโมดัลในอุปกรณ์โดยตั้งค่าแฟล็กต่อไปนี้เป็น เปิดใช้:
- chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
รีสตาร์ท Chrome
(ไม่บังคับ) ดาวน์โหลดโมเดลในอุปกรณ์ก่อนส่งคำขอแรก

Prompt API ติดตั้งมากับ Chrome แต่โมเดลในอุปกรณ์จะไม่พร้อมใช้งานโดยค่าเริ่มต้น หากคุณยังไม่ได้ดาวน์โหลดโมเดลก่อนส่งคำขอแรกสำหรับการอนุมานในอุปกรณ์ ระบบจะเริ่มดาวน์โหลดโมเดลในเบื้องหลังโดยอัตโนมัติ

หมายเหตุ: การดาวน์โหลดโมเดลอาจใช้เวลาหลายนาที ดังนั้นการรอให้ ดาวน์โหลดอัตโนมัติพร้อมกับคำขอแรกอาจทำให้การตอบกลับ คำขอนั้นล่าช้าอย่างมาก
ดูวิธีการดาวน์โหลดโมเดลในอุปกรณ์
1. เปิดเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ > คอนโซล
2. เรียกใช้คำสั่งต่อไปนี้
```
await LanguageModel.availability();
```
3. ตรวจสอบว่าเอาต์พุตเป็น available, downloading หรือ downloadable
4. หากเอาต์พุตเป็น downloadable ให้เริ่มดาวน์โหลดโมเดลโดยเรียกใช้คำสั่งต่อไปนี้
```
await LanguageModel.create();
```
5. คุณสามารถใช้ Callback monitor ต่อไปนี้เพื่อฟังความคืบหน้าในการดาวน์โหลดและตรวจสอบว่าโมเดล available ก่อนส่งคำขอ
```
const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});
```

ขั้นตอนที่ 2: ตั้งค่าโปรเจ็กต์ Firebase และเชื่อมต่อแอปกับ Firebase

ลงชื่อเข้าใช้คอนโซล Firebase แล้วเลือกโปรเจ็กต์ Firebase
ยังไม่มีโปรเจ็กต์ Firebase ใช่ไหม

หากยังไม่มีโปรเจ็กต์ Firebase ให้คลิกปุ่มเพื่อสร้างโปรเจ็กต์ Firebase ใหม่ แล้วใช้ตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้
- ตัวเลือกที่ 1: สร้างโปรเจ็กต์ Firebase ใหม่ทั้งหมด (และโปรเจ็กต์ที่เกี่ยวข้อง Google Cloudโดยอัตโนมัติ) โดยป้อนชื่อโปรเจ็กต์ใหม่ใน ขั้นตอนแรกของเวิร์กโฟลว์
- ตัวเลือกที่ 2: "เพิ่ม Firebase" ลงในโปรเจ็กต์ Google Cloud ที่มีอยู่โดยคลิก เพิ่ม Firebase ลงในโปรเจ็กต์ที่อยู่ในระบบคลาวด์ของ Google (ที่ด้านล่างของหน้า) ในขั้นตอนแรกของเวิร์กโฟลว์ ให้เริ่มป้อนชื่อโปรเจ็กต์ ของโปรเจ็กต์ที่มีอยู่ แล้วเลือกโปรเจ็กต์จากรายการที่แสดง
ทำตามขั้นตอนที่เหลือของเวิร์กโฟลว์บนหน้าจอเพื่อสร้างโปรเจ็กต์ Firebase โปรดทราบว่าเมื่อระบบแจ้ง คุณไม่ จำเป็นต้องตั้งค่า Google Analytics เพื่อใช้ Firebase AI Logic SDK
ในคอนโซล Firebase ให้ไปที่บริการ AI > AI Logic
คลิกเริ่มต้นใช้งาน เพื่อเปิดเวิร์กโฟลว์แบบมีคำแนะนำที่จะช่วยคุณตั้งค่า API ที่จำเป็น และทรัพยากรสำหรับโปรเจ็กต์
ตั้งค่าโปรเจ็กต์ให้ใช้ผู้ให้บริการ "Gemini API"

เราขอแนะนำให้เริ่มต้นใช้งาน Gemini Developer API. คุณสามารถตั้งค่า Vertex AI Gemini API (และข้อกำหนดในการเรียกเก็บเงิน) ได้ทุกเมื่อ

สำหรับ Gemini Developer API คอนโซลจะเปิดใช้ API ที่จำเป็น และสร้างคีย์ Gemini API ในโปรเจ็กต์
อย่า เพิ่ม คีย์ Gemini API นี้ลงในโค้ดเบสของแอป ดูข้อมูลเพิ่มเติม
หากระบบแจ้งในเวิร์กโฟลว์ของคอนโซล ให้ทำตามวิธีการบนหน้าจอเพื่อลงทะเบียนแอปและเชื่อมต่อแอปกับ Firebase
ทำตามขั้นตอนถัดไปในคู่มือนี้เพื่อเพิ่ม SDK ลงในแอป

หมายเหตุ: เราขอแนะนำอย่างยิ่งให้คุณ ตั้งค่า Firebase App Checkในคอนโซล Firebase
หากคุณเพียงต้องการทดลองใช้ Gemini API คุณก็ไม่จำเป็นต้องตั้งค่า App Check ในทันที อย่างไรก็ตาม เพื่อช่วยรักษาความปลอดภัยของแอปจากการละเมิด API คุณควรตั้งค่า App Check โดยเร็วที่สุด (โดยเฉพาะอย่างยิ่งก่อนที่จะแชร์แอปหรือเผยแพร่แอปต่อสาธารณะ)

ขั้นตอนที่ 3: เพิ่ม SDK

ไลบรารี Firebase ให้สิทธิ์เข้าถึง API สำหรับโต้ตอบกับโมเดล Generative โดยไลบรารีนี้รวมอยู่ใน Firebase JavaScript SDK สำหรับเว็บ

ติดตั้ง Firebase JS SDK สำหรับเว็บโดยใช้ npm ดังนี้
```
npm install firebase
```

เริ่มต้น Firebase ในแอปโดยใช้โค้ดต่อไปนี้

import { initializeApp } from "firebase/app";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

ขั้นตอนที่ 4: เริ่มต้นบริการและสร้างอินสแตนซ์โมเดล

คลิกผู้ให้บริการ Gemini API เพื่อดูเนื้อหาเฉพาะของผู้ให้บริการ และโค้ดในหน้านี้

ตั้งค่าสิ่งต่อไปนี้ก่อนส่งคำขอพรอมต์ไปยังโมเดล

เริ่มต้นบริการสำหรับผู้ให้บริการ API ที่คุณเลือก
สร้างอินสแตนซ์ GenerativeModel และตรวจสอบว่าได้ทำสิ่งต่อไปนี้
1. เรียกใช้ getGenerativeModel หลังหรือเมื่อผู้ใช้ปลายทางโต้ตอบ (เช่น การคลิกปุ่ม) ซึ่งเป็นข้อกำหนดเบื้องต้นสำหรับ inferenceMode
2. ตั้งค่า mode เป็นค่าใดค่าหนึ่งต่อไปนี้
  - PREFER_ON_DEVICE: ใช้โมเดลในอุปกรณ์หากพร้อมใช้งาน ไม่เช่นนั้น เปลี่ยนไปใช้โมเดลที่โฮสต์ในระบบคลาวด์
  - ONLY_ON_DEVICE: ใช้โมเดลในอุปกรณ์หากพร้อมใช้งาน ไม่เช่นนั้น แสดงข้อยกเว้น
  - PREFER_IN_CLOUD: ใช้โมเดลที่โฮสต์ในระบบคลาวด์หากพร้อมใช้งาน ไม่เช่นนั้น เปลี่ยนไปใช้โมเดลในอุปกรณ์
  - ONLY_IN_CLOUD: ใช้โมเดลที่โฮสต์ในระบบคลาวด์หากพร้อมใช้งาน ไม่เช่นนั้น แสดงข้อยกเว้น
  หมายเหตุ: สำหรับคำขอที่ส่งไปยังโมเดลในอุปกรณ์ โปรดตรวจสอบว่า การอนุมานในอุปกรณ์รองรับคำขอนั้น
  สำหรับคำขอที่ส่งจากอุปกรณ์ อุปกรณ์ต้องออนไลน์ นอกจากนี้ โมเดลที่โฮสต์ในระบบคลาวด์เริ่มต้นคือ gemini-2.5-flash-lite แต่คุณสามารถ ลบล้างค่าเริ่มต้นได้

import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend, InferenceMode } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create a `GenerativeModel` instance
// Call `getGenerativeModel` after or on an end-user interaction
// Set the mode (for example, use the on-device model if it's available)
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });

ขั้นตอนที่ 5: ส่งคำขอพรอมต์ไปยังโมเดล

ส่วนนี้แสดงวิธีส่งอินพุตประเภทต่างๆ เพื่อสร้างเอาต์พุตประเภทต่างๆ ซึ่งรวมถึง

สร้างข้อความจากอินพุตที่เป็นข้อความเท่านั้น
สร้างข้อความจากอินพุตที่เป็นข้อความและรูปภาพ (มัลติโมดัล)

หากต้องการสร้างเอาต์พุตที่มีโครงสร้าง (เช่น JSON หรือ Enum) ให้ ใช้ตัวอย่าง "สร้างข้อความ" ตัวอย่างใดตัวอย่างหนึ่งต่อไปนี้ และกำหนดค่าโมเดลเพิ่มเติมให้ตอบสนองตามสคีมาที่ระบุ

สร้างข้อความจากอินพุตที่เป็นข้อความเท่านั้น

ก่อนลองใช้ตัวอย่างนี้ โปรดตรวจสอบว่าคุณได้ทำตาม ส่วนเริ่มต้นใช้งานในคู่มือนี้แล้ว

คุณสามารถใช้ generateContent() เพื่อสร้างข้อความจากพรอมต์ที่มีข้อความได้

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Wrap in an async function so you can use await
async function run() {
  // Provide a prompt that contains text
  const prompt = "Write a story about a magic backpack."

  // To generate text output, call `generateContent` with the text input
  const result = await model.generateContent(prompt);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

โปรดทราบว่า Firebase AI Logic ยังรองรับการสตรีมมิงการตอบกลับที่เป็นข้อความโดยใช้ generateContentStream (แทน generateContent)

สร้างข้อความจากอินพุตที่เป็นข้อความและรูปภาพ (มัลติโมดัล)

คุณสามารถใช้ generateContent() เพื่อสร้างข้อความจากพรอมต์ที่มีข้อความและไฟล์รูปภาพ โดยระบุ ไฟล์อินพุตแต่ละไฟล์'s mimeType และไฟล์นั้น

ประเภทรูปภาพอินพุตที่รองรับสำหรับการอนุมานในอุปกรณ์คือ PNG และ JPEG

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Converts a File object to a Part object.
async function fileToGenerativePart(file) {
  const base64EncodedDataPromise = new Promise((resolve) => {
    const reader = new FileReader();
    reader.onloadend = () => resolve(reader.result.split(',')[1]);
    reader.readAsDataURL(file);
  });
  return {
    inlineData: { data: await base64EncodedDataPromise, mimeType: file.type },
  };
}

async function run() {
  // Provide a text prompt to include with the image
  const prompt = "Write a poem about this picture:";

  const fileInputEl = document.querySelector("input[type=file]");
  const imagePart = await fileToGenerativePart(fileInputEl.files[0]);

  // To generate text output, call `generateContent` with the text and image
  const result = await model.generateContent([prompt, imagePart]);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

เปิดใช้ฟีเจอร์ให้ผู้ใช้ปลายทางได้ทดลองใช้

หากต้องการให้ผู้ใช้ปลายทางได้ทดลองใช้ฟีเจอร์ในแอป คุณต้อง ลงทะเบียนเข้าร่วมการทดลองใช้ Origin ของ Chrome โปรดทราบว่าการทดลองใช้เหล่านี้มีระยะเวลาและการใช้งานที่จำกัด

ลงทะเบียนเข้าร่วมการทดลองใช้ Origin ของ Chrome สำหรับ Prompt API แล้วคุณจะได้รับโทเค็น
ระบุโทเค็นในทุกหน้าเว็บที่คุณต้องการเปิดใช้ฟีเจอร์ช่วงทดลองใช้ โดยใช้ตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้
- ระบุโทเค็นเป็นเมตาแท็กในแท็ก <head>: <meta http-equiv="origin-trial" content="TOKEN">
- ระบุโทเค็นเป็นส่วนหัว HTTP: Origin-Trial: TOKEN
- ระบุโทเค็น แบบเป็นโปรแกรม

คุณทำอะไรได้อีกบ้าง

คุณสามารถใช้ตัวเลือกการกำหนดค่าและความสามารถเพิ่มเติมต่างๆ สำหรับประสบการณ์ใช้งานแบบไฮบริดได้ดังนี้

ฟีเจอร์ที่ยังไม่พร้อมใช้งานสำหรับการอนุมานในอุปกรณ์

เนื่องจากเป็นเวอร์ชันทดลองใช้ ความสามารถบางอย่างของ Web SDK จึงยังไม่พร้อมใช้งานสำหรับการอนุมาน ในอุปกรณ์ ฟีเจอร์ต่อไปนี้ ยังไม่รองรับการอนุมานในอุปกรณ์ (แต่โดยปกติจะพร้อมใช้งานสำหรับการอนุมานที่อิงตามระบบคลาวด์)

การสร้างข้อความจากอินพุตไฟล์รูปภาพประเภทอื่นที่ไม่ใช่ JPEG และ PNG
- สามารถเปลี่ยนไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้ แต่โหมด ONLY_ON_DEVICE จะแสดงข้อผิดพลาด
การสร้างข้อความจากอินพุตเสียง วิดีโอ และเอกสาร (เช่น PDF)
- สามารถเปลี่ยนไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้ แต่โหมด ONLY_ON_DEVICE จะแสดงข้อผิดพลาด
การสร้างรูปภาพโดยใช้โมเดล Gemini หรือ Imagen
- สามารถเปลี่ยนไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้ แต่โหมด ONLY_ON_DEVICE จะแสดงข้อผิดพลาด
การระบุไฟล์โดยใช้ URL ในคำขอมัลติโมดัล คุณต้องระบุไฟล์เป็นข้อมูลแบบอินไลน์ให้กับโมเดลในอุปกรณ์
แชทแบบหลายรอบ
- สามารถเปลี่ยนไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้ แต่โหมด ONLY_ON_DEVICE จะแสดงข้อผิดพลาด
การสตรีมมิงแบบ 2 ทางด้วย Gemini Live API
การระบุ เครื่องมือ ให้กับโมเดลเพื่อช่วยสร้างการตอบกลับ (เช่น การเรียกใช้ฟังก์ชัน การดำเนินการโค้ด บริบท URL และ การเชื่อมต่อแหล่งข้อมูลกับ Google Search)
นับโทเค็น
- แสดงข้อผิดพลาดเสมอ จำนวนโทเค็นจะแตกต่างกันระหว่างโมเดลที่โฮสต์ในระบบคลาวด์กับโมเดลในอุปกรณ์ จึงไม่มีการเปลี่ยนไปใช้โมเดลอื่นที่เข้าใจง่าย
การตรวจสอบ AI ในคอนโซล Firebase สำหรับการอนุมานในอุปกรณ์
- โปรดทราบว่าคุณสามารถตรวจสอบการอนุมานใดๆ ที่ใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้เช่นเดียวกับการอนุมานอื่นๆ ที่ใช้ Firebase AI Logic client SDK สำหรับเว็บ

แสดงความคิดเห็น เกี่ยวกับประสบการณ์ใช้งานFirebase AI Logic