Gemini API กำลังใช้ Firebase AI Logic

สร้างแอปและฟีเจอร์บนอุปกรณ์เคลื่อนที่และเว็บที่ทำงานด้วยระบบ AI ด้วยโมเดล Gemini และ Imagen โดยใช้ Firebase AI Logic

Firebase AI Logic ช่วยให้คุณเข้าถึงโมเดล Generative AI ล่าสุดจาก Google ได้แก่ โมเดล Gemini และโมเดล Imagen

หากต้องการเรียกใช้ Gemini API หรือ Imagen API โดยตรง จากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปแทนที่จะใช้ฝั่งเซิร์ฟเวอร์ คุณสามารถใช้ Firebase AI Logic SDK ของไคลเอ็นต์ SDK ไคลเอ็นต์เหล่านี้สร้างขึ้น สําหรับใช้กับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอปโดยเฉพาะ โดยมีตัวเลือกความปลอดภัยเพื่อป้องกัน ไคลเอ็นต์ที่ไม่ได้รับอนุญาต รวมถึงการผสานรวมกับบริการอื่นๆ ของ Firebase

SDK ไคลเอ็นต์เหล่านี้พร้อมใช้งานใน Swift สำหรับแพลตฟอร์ม Apple, Kotlin และ Java สำหรับ Android, JavaScript สำหรับเว็บ, Dart สำหรับ Flutter และ Unity

SDK ฝั่งไคลเอ็นต์เหล่านี้ช่วยให้คุณเพิ่มการปรับเปลี่ยน AI ในแบบของคุณลงในแอป สร้างประสบการณ์แชทด้วย AI สร้างการเพิ่มประสิทธิภาพและการทำงานอัตโนมัติที่ทำงานด้วยระบบ AI และอื่นๆ อีกมากมายได้

เริ่มต้นใช้งาน


หากต้องการความยืดหยุ่นเพิ่มเติมหรือการผสานรวมฝั่งเซิร์ฟเวอร์
Genkit เป็นเฟรมเวิร์กโอเพนซอร์สของ Firebase สำหรับการพัฒนา AI ฝั่งเซิร์ฟเวอร์ที่ซับซ้อนพร้อมสิทธิ์เข้าถึงโมเดลจาก Google, OpenAI, Anthropic และอื่นๆ อย่างกว้างขวาง ซึ่งรวมถึงฟีเจอร์ AI ขั้นสูงเพิ่มเติม และเครื่องมือเฉพาะในพื้นที่

ความสามารถหลัก

อินพุตหลายรูปแบบและภาษาธรรมชาติ Gemini โมเดลเป็นแบบ มัลติโมดัล ดังนั้นพรอมต์ที่ส่งไปยัง Gemini API จึงมีข้อความ รูปภาพ PDF วิดีโอ และเสียงได้ Gemini บางรุ่นยังสร้างเอาต์พุตแบบมัลติโมดัลได้ด้วย

ทั้งโมเดล Gemini และ Imagen สามารถรับพรอมต์ด้วย อินพุตภาษาธรรมชาติ

ชุดความสามารถที่เพิ่มขึ้น SDK ช่วยให้คุณเรียกใช้ Gemini API หรือ Imagen API ได้โดยตรงจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปเพื่อ สร้างประสบการณ์แชท AI สร้างรูปภาพ ใช้เครื่องมือ (เช่น การเรียกใช้ฟังก์ชัน และการอ้างอิงจาก Google Search) สตรีมอินพุตและเอาต์พุตแบบมัลติโมดัล (รวมถึงเสียง) และอื่นๆ
การรักษาความปลอดภัยและการป้องกันการละเมิดสำหรับแอปเวอร์ชันที่ใช้งานจริง ใช้ Firebase App Check เพื่อช่วย ปกป้อง API ที่เข้าถึงโมเดล Gemini และ Imagen จากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต

Firebase AI Logic ยังมี ขีดจำกัดอัตราต่อผู้ใช้ โดยค่าเริ่มต้น และขีดจำกัดอัตราต่อผู้ใช้เหล่านี้สามารถกำหนดค่าได้อย่างเต็มที่

โครงสร้างพื้นฐานที่แข็งแกร่ง ใช้ประโยชน์จากโครงสร้างพื้นฐานที่ปรับขนาดได้ซึ่งสร้างขึ้นเพื่อใช้กับแอปบนอุปกรณ์เคลื่อนที่ และเว็บแอป เช่น การจัดการไฟล์ด้วย Cloud Storage for Firebase การจัดการ Structured Data ด้วยข้อเสนอฐานข้อมูล Firebase (เช่น Cloud Firestore) และ การตั้งค่าการกำหนดค่ารันไทม์แบบไดนามิกด้วย Firebase Remote Config

วิธีการทำงาน

Firebase AI Logic มี SDK ของไคลเอ็นต์ บริการพร็อกซี และฟีเจอร์อื่นๆ ซึ่งช่วยให้คุณเข้าถึงโมเดล Generative AI ของ Google เพื่อสร้างฟีเจอร์ AI ใน แอปบนอุปกรณ์เคลื่อนที่และเว็บแอปได้

การสนับสนุนสำหรับโมเดลของ Google และผู้ให้บริการ "Gemini API"

เรารองรับโมเดล Gemini และโมเดล Imagen รุ่นล่าสุดทั้งหมด และคุณสามารถเลือกผู้ให้บริการ "Gemini API" ที่ต้องการเพื่อเข้าถึงโมเดลเหล่านี้ เราสนับสนุนทั้ง Gemini Developer API และ Vertex AI Gemini API ดูข้อมูลเกี่ยวกับความแตกต่างระหว่างการใช้ผู้ให้บริการ API ทั้ง 2 ราย

และหากเลือกใช้ Gemini Developer API คุณจะใช้ประโยชน์จาก "ระดับฟรี" เพื่อให้พร้อมใช้งานได้อย่างรวดเร็ว

SDK ของไคลเอ็นต์บนอุปกรณ์เคลื่อนที่และเว็บ

คุณส่งคำขอไปยังโมเดลได้โดยตรงจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปโดยใช้ Firebase AI Logic SDK ของไคลเอ็นต์ ซึ่งมีให้ใช้งานใน Swift สำหรับแพลตฟอร์มของ Apple, Kotlin และ Java สำหรับ Android, JavaScript สำหรับเว็บ Dart สำหรับ Flutter และ Unity

หากคุณตั้งค่าผู้ให้บริการทั้ง 2 รายในโปรเจ็กต์ Firebase คุณจะสลับระหว่างผู้ให้บริการ API ได้เพียงแค่เปิดใช้ API อื่น และเปลี่ยนโค้ดการเริ่มต้นเพียงไม่กี่บรรทัดGemini API

นอกจากนี้ SDK ไคลเอ็นต์ของเราหลายรายการยังให้สิทธิ์เข้าถึงการอนุมานแบบไฮบริดและในอุปกรณ์ด้วย การกำหนดค่านี้ ช่วยให้แอปใช้โมเดลในอุปกรณ์ได้เมื่อพร้อมใช้งาน แต่จะเปลี่ยนไปใช้ โมเดลที่โฮสต์ในระบบคลาวด์ได้อย่างราบรื่นเมื่อจำเป็น (และในทางกลับกัน)

บริการพร็อกซี

บริการพร็อกซีของเราทำหน้าที่เป็นเกตเวย์ระหว่างไคลเอ็นต์กับGemini APIผู้ให้บริการที่คุณเลือก (และโมเดลของ Google) โดยมีบริการและการผสานรวมที่สำคัญสำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ เช่น คุณสามารถตั้งค่า Firebase App Check เพื่อช่วยปกป้อง ผู้ให้บริการ API ที่เลือกและทรัพยากรแบ็กเอนด์จากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต

ซึ่งมีความสำคัญอย่างยิ่งหากคุณเลือกใช้ Gemini Developer API เนื่องจากบริการพร็อกซีและการผสานรวม App Check นี้จะช่วยให้มั่นใจได้ว่าคีย์ API ของ Gemini จะยังคงอยู่ในเซิร์ฟเวอร์และไม่ได้ฝังอยู่ในโค้ดเบสของแอป

เส้นทางการติดตั้งใช้งาน

ตั้งค่าโปรเจ็กต์ Firebase และเชื่อมต่อแอปกับ Firebase ใช้เวิร์กโฟลว์แบบมีคำแนะนำในหน้าFirebase AI Logic ของ Firebase คอนโซลเพื่อตั้งค่าโปรเจ็กต์ (รวมถึงการเปิดใช้ API ที่จำเป็นสำหรับผู้ให้บริการ Gemini API ที่คุณเลือก) ลงทะเบียนแอปกับ โปรเจ็กต์ Firebase แล้วเพิ่มการกำหนดค่า Firebase ลงใน แอป
ติดตั้ง SDK และเริ่มต้น ติดตั้ง Firebase AI Logic SDK ที่เฉพาะเจาะจงสำหรับแพลตฟอร์มของแอป จากนั้นเริ่มต้นบริการและสร้างอินสแตนซ์โมเดลในแอป
ส่งคำขอพรอมต์ไปยังโมเดล Gemini และ Imagen ใช้ SDK เพื่อส่งพรอมต์ที่เป็นข้อความเท่านั้นหรือพรอมต์หลายรูปแบบไปยังGemini โมเดลเพื่อสร้าง ข้อความและโค้ด เอาต์พุตที่มีโครงสร้าง (เช่น JSON) และ รูปภาพ หรือคุณจะพรอมต์Imagenโมเดลให้ สร้างรูปภาพก็ได้

สร้างประสบการณ์การใช้งานที่สมบูรณ์ยิ่งขึ้นด้วย การแชทหลายรอบ การสตรีมแบบ 2 ทาง (รวมถึงเสียง) และ การเรียกใช้ฟังก์ชัน

เตรียมพร้อมสำหรับเวอร์ชันที่ใช้งานจริง ติดตั้งใช้งานการผสานรวมที่สำคัญสำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ เช่น การปกป้อง API จากการละเมิดด้วย Firebase App Check และการใช้ Firebase Remote Config เพื่ออัปเดตพารามิเตอร์ในโค้ดจากระยะไกล (ที่สำคัญที่สุดคือชื่อโมเดล)

ขั้นตอนถัดไป

เริ่มต้นใช้งานด้วยการเข้าถึงโมเดลจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอป

ไปที่คู่มือเริ่มต้นใช้งาน

ดูข้อมูลเพิ่มเติมเกี่ยวกับโมเดลที่รองรับ

ดูข้อมูลเกี่ยวกับ โมเดลที่พร้อมใช้งานสำหรับกรณีการใช้งานต่างๆ รวมถึง โควต้าและ ราคา