|
คลิกผู้ให้บริการ Gemini API เพื่อดูเนื้อหาเฉพาะของผู้ให้บริการ และโค้ดในหน้านี้ |
การจำกัดอัตรา (เรียกกันทั่วไปว่าโควต้า) จะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด การจำกัดเหล่านี้ช่วยให้มั่นใจได้ถึงการใช้งานอย่างยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
เมื่อใช้ Firebase AI Logic เพื่อส่งคำขอไปยัง Gemini และ Imagen โมเดล การจำกัดอัตราของโปรเจ็กต์จะขึ้นอยู่กับผู้ให้บริการ "Gemini API" ที่คุณเลือก Firebase AI Logic นอกจากนี้ยังมีวิธี ตั้งค่าการจำกัดอัตรา "ต่อผู้ใช้" ด้วย
ดูการจำกัดอัตราสำหรับ Gemini Developer API
หากคุณใช้โควต้าเกินหรือความจุของโมเดลที่คุณเข้าถึงหมดลง คุณจะได้รับข้อความแสดงข้อผิดพลาด 429
วิธีการทำงานของการจำกัดอัตรา (โควต้า)
การจำกัดอัตรา (โควต้า) จะวัดตามมิติข้อมูล 4 รายการ ได้แก่
- คำขอต่อนาที (RPM)
- คำขอต่อวัน (RPD)
- โทเค็นต่อนาที (TPM)
- โทเค็นต่อวัน (TPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับการจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดรายการหนึ่งจะทำให้เกิดข้อผิดพลาด 429 โควต้าเกิน ตัวอย่างเช่น หากการจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่ได้ใช้ TPM หรือการจำกัดอื่นๆ เกินก็ตาม
การจำกัดอัตราจะมีผลที่ระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
การจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และการจำกัดบางรายการจะมีผลกับโมเดลบางรายการเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen) เท่านั้น แต่ในเชิงแนวคิดแล้ว IPM จะคล้ายกับ TPM
การจำกัดอัตราจะเข้มงวดมากขึ้นสำหรับโมเดลทดลองและโมเดลเวอร์ชันตัวอย่าง
ขอเพิ่มการจำกัดอัตรา
หากคุณใช้ "แพ็กเกจแบบชำระเงิน" สำหรับ Gemini Developer API คุณจะ ขอเพิ่มการจำกัดอัตราได้
ตั้งค่าการจำกัดอัตรา "ต่อผู้ใช้"
หากต้องการใช้ Firebase AI Logic โปรเจ็กต์ของคุณต้องเปิดใช้ผู้ให้บริการ Gemini API ที่คุณเลือกไว้ แต่คุณต้องเปิดใช้ Firebase AI Logic API ด้วย ซึ่งทำหน้าที่เป็นเกตเวย์ระหว่าง SDK ของไคลเอ็นต์กับผู้ให้บริการGemini API ของคุณ ระบบจะเปิดใช้ API นี้ให้คุณเมื่อคุณตั้งค่า Firebase AI Logic ในโปรเจ็กต์ Firebase เป็นครั้งแรก
คุณสามารถใช้การจำกัดอัตรา (โควต้า) ของ Firebase AI Logic API เป็นการจำกัดอัตรา "ต่อผู้ใช้" สำหรับแอป โดยเฉพาะอย่างยิ่งสำหรับฟีเจอร์ AI ที่ใช้ Firebase AI Logic คุณควร ตั้งค่าการจำกัดนี้ให้เหมาะสมกับการเข้าถึงฟีเจอร์ AI ของผู้ใช้รายเดียว ในขณะเดียวกันก็ต้องมั่นใจว่า ไม่มีผู้ใช้รายใดรายหนึ่งใช้งานเกินขีดจำกัดของผู้ให้บริการ Gemini API (ซึ่ง มีไว้ให้ผู้ใช้ทุกคนใช้ร่วมกัน)
รายละเอียดเกี่ยวกับการจำกัดอัตรา "ต่อผู้ใช้"
รายละเอียดสำคัญเกี่ยวกับการจำกัดอัตรา (โควต้า) ของ Firebase AI Logic API มีดังนี้ โดยเฉพาะอย่างยิ่งคำขอต่อนาที (RPM)
การจำกัดอัตรานี้อิงตาม "คำขอสร้างเนื้อหา" ต่อผู้ใช้ ต่อภูมิภาค ต่อนาที และ ไม่ได้อิงตามโมเดล
เป็นการจำกัดอัตราที่ใช้กับผู้ใช้ ทั้งหมด ปัจจุบันยังไม่มีวิธี ตั้งค่าการจำกัดอัตราสำหรับผู้ใช้รายใดรายหนึ่งหรือ กลุ่มผู้ใช้ที่เฉพาะเจาะจง*
การจำกัดอัตรานี้มีผลที่ระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
การจำกัดอัตรานี้มีผลกับการเรียกใช้ใดก็ตามที่มาจาก Firebase AI Logic SDK โดยเฉพาะ
การจำกัดอัตราเริ่มต้นคือ 100 RPM ต่อผู้ใช้
โปรดทราบว่าคุณยังต้องพิจารณา การจำกัดสำหรับผู้ให้บริการ Gemini API (ดูด้านบน) ซึ่งมีความสำคัญมากกว่า Firebase AI Logic API
* หากคุณใช้ Vertex AI Gemini API และแอปของคุณนำผู้ใช้ไปยังภูมิภาคต่างๆ (เช่น ใช้ Firebase Remote Config) คุณสามารถตั้งค่าการจำกัดอัตราที่เฉพาะเจาะจงสำหรับผู้ใช้ในภูมิภาคที่เฉพาะเจาะจงได้
ปรับการจำกัดอัตรา "ต่อผู้ใช้"
หากต้องการปรับการจำกัดอัตรา (โควต้า) คุณต้องมีสิทธิ์ serviceusage.quotas.update ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น
วิธีแก้ไขการจำกัดอัตรา (โควต้า) หรือขอเพิ่มการจำกัดอัตรา
ในคอนโซล Google Cloud ให้ไปที่หน้าสำหรับ Firebase AI Logic API
คลิกจัดการ
คลิกแท็บโควต้าและการจำกัดของระบบ ที่ด้านล่างของหน้า
กรองตารางเพื่อแสดงโควต้าที่ต้องการ เช่น ความสามารถ (คำขอสร้างเนื้อหา) และภูมิภาค
ตัวอย่างเช่น หากต้องการดูโควต้าต่อผู้ใช้สำหรับคำขอสร้างเนื้อหา ในภูมิภาคเอเชียที่รองรับรายการใดรายการหนึ่ง ตัวกรองของคุณจะมีลักษณะคล้ายกับ ตัวกรองนี้:
Generate content requests+Dimension:region:asiaเลือกช่องทำเครื่องหมายทางด้านซ้ายของโควต้าแต่ละรายการที่ต้องการ
คลิก ที่ส่วนท้ายของแถวโควต้า แล้วเลือกแก้ไขโควต้า
ในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทำดังนี้
ป้อนโควต้าที่เพิ่มขึ้นในช่อง ค่าใหม่
โควต้านี้มีผลที่ระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
กรอกข้อมูลในช่องเพิ่มเติมในแบบฟอร์ม แล้วคลิกเสร็จสิ้น
คลิกส่งคำขอ