Gemini API โดยใช้ Firebase AI Logic
สร้างแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป รวมถึงฟีเจอร์ที่ขับเคลื่อนด้วย AI ด้วยโมเดล Gemini โดยใช้ Firebase AI Logic
Firebase AI Logic ช่วยให้คุณเข้าถึงโมเดล Generative AI ล่าสุดจาก Google ซึ่งก็คือโมเดล Gemini
หากต้องการเรียก Gemini API จากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปโดยตรง (แทนที่จะเรียกจากฝั่งเซิร์ฟเวอร์) คุณสามารถใช้ Firebase AI Logic Client SDK ได้ Client SDK เหล่านี้สร้างขึ้นมาเพื่อใช้กับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอปโดยเฉพาะ โดยมีตัวเลือกด้านความปลอดภัยเพื่อป้องกันไคลเอ็นต์ที่ไม่ได้รับอนุญาต รวมถึงการผสานรวมกับบริการอื่นๆ ของ Firebase
Client SDK เหล่านี้พร้อมใช้งานใน Swift สำหรับแพลตฟอร์ม Apple, Kotlin และ Java สำหรับ Android, JavaScript สำหรับเว็บ, Dart สำหรับ Flutter และ Unity
Client SDK เหล่านี้ช่วยให้คุณเพิ่มการปรับเปลี่ยนในแบบของคุณด้วย AI ลงในแอป สร้างประสบการณ์การแชทด้วย AI สร้างการเพิ่มประสิทธิภาพและการทำงานอัตโนมัติที่ขับเคลื่อนด้วย AI และอื่นๆ อีกมากมายได้
ความสามารถหลัก
| อินพุตหลายรูปแบบและภาษาธรรมชาติ |
โมเดล Gemini ทำงานได้หลายรูปแบบ ดังนั้นพรอมต์ที่ส่งไปยัง Gemini API จึงสามารถมีข้อความ รูปภาพ PDF วิดีโอ และเสียง นอกจากนี้ โมเดล Gemini บางโมเดลยังสร้าง
เอาต์พุตหลายรูปแบบได้ด้วย
คุณสามารถป้อนข้อมูลภาษาธรรมชาติเป็นพรอมต์ให้กับโมเดล Gemini ได้ |
| ชุดความสามารถที่เพิ่มขึ้น | SDK ช่วยให้คุณเรียก Gemini API จากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปได้โดยตรงเพื่อสร้างประสบการณ์การแชทด้วย AI, สร้างรูปภาพ, ใช้เครื่องมือ (เช่น การเรียกใช้ฟังก์ชัน และ การเชื่อมต่อแหล่งข้อมูลกับ Google Search), สตรีมอินพุตและเอาต์พุตหลายรูปแบบ (รวมถึงเสียง) และอื่นๆ |
| การรักษาความปลอดภัยและการป้องกันการละเมิดสำหรับแอปที่ใช้งานจริง |
ใช้
Firebase App Check เพื่อช่วย
ปกป้อง API ที่เข้าถึงโมเดล Gemini จากการละเมิดโดย
ไคลเอ็นต์ที่ไม่ได้รับอนุญาต
Firebase AI Logic ยังมี ขีดจำกัดอัตราต่อผู้ใช้ โดยค่าเริ่มต้น และคุณสามารถกำหนดค่าขีดจำกัดอัตราต่อผู้ใช้เหล่านี้ได้อย่างเต็มที่ |
| โครงสร้างพื้นฐานที่มีประสิทธิภาพ | ใช้ประโยชน์จากโครงสร้างพื้นฐานที่รองรับการปรับขนาดซึ่งสร้างขึ้นเพื่อใช้กับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป เช่น การจัดการไฟล์ด้วย Cloud Storage for Firebase, การจัดการ Structured Data ด้วยข้อเสนอฐานข้อมูล Firebase (เช่น Cloud Firestore) และการตั้งค่าการกำหนดค่ารันไทม์แบบไดนามิกด้วย Firebase Remote Config |
วิธีการทำงาน
Firebase AI Logic มี Client SDK, บริการพร็อกซี และฟีเจอร์อื่นๆ ที่ช่วยให้คุณเข้าถึงโมเดล Generative AI ของ Google เพื่อสร้างฟีเจอร์ AI ใน แอปบนอุปกรณ์เคลื่อนที่และเว็บแอปได้
การรองรับโมเดลของ Google และผู้ให้บริการ "Gemini API"
เรารองรับโมเดล Gemini ล่าสุดทั้งหมด และคุณสามารถเลือกผู้ให้บริการ "Gemini API" ที่ต้องการเพื่อเข้าถึงโมเดลเหล่านี้ได้ เรารองรับทั้ง Gemini Developer API และ Vertex AI Gemini API ดูข้อมูลเกี่ยวกับความแตกต่างระหว่างการใช้ผู้ให้บริการ API ทั้ง 2 ราย
และหากเลือกใช้ Gemini Developer API คุณจะใช้ ประโยชน์จาก "แพ็กเกจฟรี" เพื่อเริ่มต้นใช้งานได้อย่างรวดเร็ว
Client SDK สำหรับอุปกรณ์เคลื่อนที่และเว็บ
คุณส่งคำขอไปยังโมเดลได้โดยตรงจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปโดยใช้ Firebase AI Logic Client SDK ซึ่งพร้อมใช้งานใน Swift สำหรับแพลตฟอร์ม Apple, Kotlin และ Java สำหรับ Android, JavaScript สำหรับเว็บ, Dart สำหรับ Flutter และ Unity
หากคุณตั้งค่าผู้ให้บริการ Gemini API ทั้ง 2 รายไว้ในโปรเจ็กต์ Firebase คุณจะสลับไปใช้ผู้ให้บริการ API อีกรายได้เพียงแค่เปิดใช้ API อีกรายและเปลี่ยนโค้ดเริ่มต้น 2-3 บรรทัด
นอกจากนี้ Client SDK หลายรายการยังให้สิทธิ์เข้าถึง การอนุมานแบบไฮบริดและในอุปกรณ์ด้วย การกำหนดค่านี้ช่วยให้แอปใช้โมเดลในอุปกรณ์ได้เมื่อพร้อมใช้งาน แต่จะเปลี่ยนไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้อย่างราบรื่นเมื่อจำเป็น (และในทางกลับกัน)
บริการพร็อกซี
บริการพร็อกซีของเราทำหน้าที่เป็นเกตเวย์ระหว่างไคลเอ็นต์กับผู้ให้บริการ Gemini API (และโมเดลของ Google) ที่คุณเลือก โดยมีบริการและการผสานรวมที่สำคัญสำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป ตัวอย่างเช่น คุณสามารถ ตั้งค่า Firebase App Check เพื่อช่วยปกป้องผู้ให้บริการ API ที่คุณ เลือกและทรัพยากรแบ็กเอนด์จากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต
การดำเนินการนี้มีความสำคัญอย่างยิ่งหากคุณเลือกใช้ Gemini Developer API เนื่องจากบริการพร็อกซีและการผสานรวม App Check นี้จะช่วยให้มั่นใจได้ว่าคีย์ Gemini API จะอยู่ในเซิร์ฟเวอร์และ ไม่ได้ ฝังอยู่ในฐานของโค้ดของแอป
เส้นทางการติดตั้งใช้งาน
| ตั้งค่าโปรเจ็กต์ Firebase และเชื่อมต่อแอปกับ Firebase | ใช้เวิร์กโฟลว์แบบแนะนำในหน้า Firebase AI Logic ของ Firebase คอนโซลเพื่อตั้งค่าโปรเจ็กต์ (รวมถึงการเปิดใช้ API ที่จำเป็นสำหรับผู้ให้บริการ Gemini API ที่คุณเลือก) ลงทะเบียนแอป กับโปรเจ็กต์ Firebase แล้วเพิ่มการกำหนดค่า Firebase ลงใน แอป | |
| ติดตั้ง SDK และเริ่มต้น | ติดตั้ง Firebase AI Logic SDK ที่เฉพาะเจาะจงสำหรับแพลตฟอร์มของแอป จากนั้นเริ่มต้นบริการและสร้างอินสแตนซ์โมเดลในแอป | |
| ส่งคำขอพรอมต์ไปยังโมเดล Gemini | ใช้ SDK เพื่อส่งพรอมต์ที่เป็นข้อความเท่านั้นหรือพรอมต์หลายรูปแบบไปยังGemini
โมเดลเพื่อสร้าง
ข้อความและโค้ด,
เอาต์พุตที่มีโครงสร้าง (เช่น JSON)
และ
รูปภาพ
สร้างประสบการณ์ที่สมบูรณ์ยิ่งขึ้นด้วย การแชทหลายรอบ, การสตรีมแบบ 2 ทิศทาง (รวมถึงเสียง), และ การเรียกฟังก์ชัน |
|
| เตรียมพร้อมสำหรับเวอร์ชันที่ใช้งานจริง | ติดตั้งใช้งานการผสานรวมที่สำคัญสำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป เช่น การปกป้อง API จากการละเมิดด้วย Firebase App Check และการใช้ Firebase Remote Config เพื่ออัปเดตพารามิเตอร์ในโค้ดจากระยะไกล (ที่สำคัญที่สุดคือชื่อโมเดล) |
ขั้นตอนถัดไป
เริ่มต้นใช้งานการเข้าถึงโมเดลจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอป