คลิกผู้ให้บริการ Gemini API เพื่อดูเนื้อหาและโค้ดเฉพาะของผู้ให้บริการ ในหน้านี้ |
การจำกัดอัตรา (โดยทั่วไปเรียกว่าโควต้า) จะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยให้มั่นใจได้ถึง การใช้งานอย่างเป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
เมื่อใช้ Firebase AI Logic เพื่อส่งคำขอไปยังโมเดล Gemini และ Imagen ขีดจำกัดอัตราของโปรเจ็กต์จะขึ้นอยู่กับผู้ให้บริการ "Gemini API" ที่คุณเลือก Firebase AI Logic ยังมีวิธีตั้งค่าขีดจำกัดอัตรา "ต่อผู้ใช้" ด้วย
ดูขีดจำกัดอัตราการใช้งานสำหรับ Gemini Developer API
วิธีการทำงานของขีดจำกัดอัตรา (โควต้า)
ระบบจะวัดอัตราการจำกัด (โควต้า) ใน 4 มิติข้อมูลต่อไปนี้
- คำขอต่อนาที (RPM)
- คำขอต่อวัน (RPD)
- โทเค็นต่อนาที (TPM)
- โทเค็นต่อวัน (TPD)
การใช้งานของคุณจะได้รับการประเมินเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาด 429 ที่ระบุว่าโควต้าเกิน เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้ขีดจํากัดอัตราที่ระดับโปรเจ็กต์ และจะมีผลกับแอปพลิเคชันและ ที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างใช้ได้กับบางโมเดลเท่านั้น เช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM
โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า
ขอเพิ่มขีดจำกัดอัตรา
หากใช้ Gemini Developer API ใน "ระดับแบบชำระเงิน" คุณจะขอเพิ่มขีดจำกัดอัตราได้
ตั้งค่าขีดจำกัดของอัตรา "ต่อผู้ใช้"
หากต้องการใช้ Firebase AI Logic โปรเจ็กต์ของคุณต้องเปิดใช้ผู้ให้บริการ Gemini API ที่คุณเลือก แต่คุณต้องเปิดใช้ Firebase AI Logic API ด้วย ซึ่งทำหน้าที่เป็นเกตเวย์ระหว่าง SDK ของไคลเอ็นต์กับผู้ให้บริการ Gemini API ระบบจะเปิดใช้ API นี้ให้คุณเมื่อตั้งค่า Firebase AI Logic ในโปรเจ็กต์ Firebase เป็นครั้งแรก
คุณสามารถใช้Firebase AI Logicขีดจำกัดอัตรา API (โควต้า) เป็นขีดจำกัดอัตรา "ต่อผู้ใช้" สำหรับแอป โดยเฉพาะสำหรับฟีเจอร์ AI ที่ต้องใช้ Firebase AI Logic คุณควรกำหนดขีดจำกัดนี้ให้เหมาะสม เพื่อรองรับผู้ใช้รายเดียวที่เข้าถึงฟีเจอร์ AI ของคุณ ในขณะเดียวกันก็ต้องมั่นใจว่า ไม่มีผู้ใช้รายใดรายหนึ่งใช้เกินขีดจำกัดของผู้ให้บริการ Gemini API (ซึ่งมีไว้สำหรับผู้ใช้ทั้งหมดของคุณ)
รายละเอียดเกี่ยวกับขีดจำกัดของอัตรา "ต่อผู้ใช้"
รายละเอียดสำคัญเกี่ยวกับFirebase AI Logicขีดจำกัดอัตราการใช้งาน API (โควต้า) โดยเฉพาะคำขอต่อนาที (RPM) มีดังนี้
โดยจะอิงตาม "คำขอสร้างเนื้อหา" ต่อผู้ใช้ 1 คนต่อภูมิภาค 1 แห่งต่อนาที และไม่ได้อิงตามโมเดล
ซึ่งเป็นขีดจำกัดอัตราที่ใช้กับผู้ใช้ทั้งหมด ปัจจุบันยังไม่มีวิธี ตั้งค่าขีดจำกัดอัตราสำหรับผู้ใช้รายใดรายหนึ่งหรือ กลุ่มผู้ใช้ที่เฉพาะเจาะจง*
โดยจะมีผลในระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
โดยจะใช้กับการเรียกใช้ที่มาจาก Firebase AI Logic SDK โดยเฉพาะ
ขีดจำกัดของอัตราเริ่มต้นคือ 100 RPM ต่อผู้ใช้
โปรดทราบว่าคุณยังคงต้องพิจารณา ขีดจำกัดสำหรับผู้ให้บริการ Gemini API (ดูด้านบน) ซึ่งมีความสำคัญเหนือกว่า Firebase AI Logic API
* หากคุณใช้ Vertex AI Gemini API และแอปของคุณนำผู้ใช้ไปยังภูมิภาคต่างๆ (เช่น ใช้ Firebase Remote Config) คุณจะตั้งค่าขีดจำกัดอัตราที่เฉพาะเจาะจงสำหรับผู้ใช้ในภูมิภาคที่เฉพาะเจาะจงได้
ปรับขีดจำกัดอัตรา "ต่อผู้ใช้"
หากต้องการปรับขีดจํากัดอัตรา (โควต้า) คุณต้องมีserviceusage.quotas.update
สิทธิ์ ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น
วิธีแก้ไขขีดจํากัดอัตรา (โควต้า) หรือขอเพิ่มมีดังนี้
ในGoogle Cloudคอนโซล ให้ไปที่หน้าสำหรับ Firebase AI Logic API
คลิกจัดการ
คลิกแท็บโควต้าและขีดจำกัดของระบบที่ด้านล่างของหน้า
กรองตารางเพื่อแสดงโควต้าที่สนใจ เช่น ความสามารถ (คำขอสำหรับสร้างเนื้อหา) และภูมิภาค
เช่น หากต้องการดูโควต้าต่อผู้ใช้สำหรับการสร้างคำขอเนื้อหา ในภูมิภาคเอเชียที่รองรับ คุณจะต้องใช้ตัวกรองที่คล้ายกับ ตัวกรองนี้
Generate content requests
+Dimension:region:asia
เลือกช่องทำเครื่องหมายทางด้านซ้ายของโควต้าแต่ละรายการที่สนใจ
ที่ท้ายแถวของโควต้า ให้คลิก
แล้วเลือกแก้ไขโควต้าในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทำดังนี้
ป้อนโควต้าที่เพิ่มขึ้นในช่องค่าใหม่
โควต้านี้มีผลในระดับโปรเจ็กต์และใช้ร่วมกันใน แอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
กรอกช่องเพิ่มเติมในแบบฟอร์ม แล้วคลิกเสร็จสิ้น
คลิกส่งคำขอ