Vertex AI in Firebase ต้องใช้ API 2 รายการที่แตกต่างกัน (แต่ละรายการมีโควต้าของตัวเอง) ดังนี้ Vertex AI API และ Vertex AI in Firebase API
API แต่ละรายการมีโควต้าที่วัดเป็นคําขอต่อนาที (RPM) โดยเฉพาะอย่างยิ่งคําขอ "สร้างเนื้อหา" (ทั้งแบบสตรีมมิงและแบบไม่สตรีม) นอกจากนี้ Vertex AI API ยังมีโควต้าสำหรับโทเค็นอินพุตต่อนาทีด้วย
หน้านี้จะอธิบายข้อมูลต่อไปนี้
ทำความเข้าใจโควต้าสำหรับ Vertex AI API และ Vertex AI in Firebase API
การดูโควต้าในคอนโซล Google Cloud
คุณสามารถดูข้อมูลทั่วไปเกี่ยวกับโควต้าได้ในเอกสารประกอบของ Google Cloud
ทำความเข้าใจโควต้าของ API แต่ละรายการ
โควต้าของ API แต่ละรายการจะวัดผลแตกต่างกันเล็กน้อย ซึ่งหมายความว่า API แต่ละรายการอาจใช้เพื่อวัตถุประสงค์ที่แตกต่างกัน
ทําความเข้าใจVertex AI โควต้า API
โควต้า Vertex AI API จะอิงตาม "สร้างคำขอเนื้อหา" ต่อโมเดลต่อภูมิภาคต่อนาที
รายละเอียดสำคัญเกี่ยวกับโควต้าเหล่านี้ (โดยเฉพาะคำขอต่อนาทีและโทเค็นอินพุตต่อนาที) มีดังนี้
โดยจะมีผลในระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
นโยบายนี้มีผลกับการเรียกใช้ Vertex AI Gemini API ไม่ว่าจะเป็นการเรียกใช้ SDK ของไคลเอ็นต์ Vertex AI in Firebase, SDK ของเซิร์ฟเวอร์ Vertex AI, Firebase Genkit, Gemini Firebase Extensions, การเรียก REST, Vertex AI Studio หรือไคลเอ็นต์ API อื่นๆ
ซึ่งจะมีผลกับโมเดลพื้นฐานและเวอร์ชัน ตัวระบุ และเวอร์ชันที่ปรับแต่งทั้งหมดของโมเดลนั้น โดยตัวอย่างมีดังนี้
คำขอไปยัง
gemini-1.0-pro
และคำขอไปยังgemini-1.0-pro-001
จะนับเป็น 2 คำขอต่อโควต้า RPM ของรุ่นพื้นฐานgemini-1.0 pro
คำขอ
gemini-1.0-pro-001
และคำขอโมเดลที่ปรับแต่งซึ่งอิงตามgemini-1.0-pro-001
จะนับเป็น 2 คำขอต่อโควต้า RPM ของโมเดลพื้นฐานgemini-1.0-pro
ดูโควต้าเริ่มต้นสำหรับแต่ละรุ่นและแต่ละภูมิภาคได้ในเอกสารประกอบของ Google Cloud
โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ทั้งหมด" สําหรับผู้ใช้ทุกคน (ที่ใช้ฟีเจอร์ AI ในแอปซึ่งอาศัยโมเดลที่เฉพาะเจาะจงและในภูมิภาคที่เฉพาะเจาะจง)
โควต้าเหล่านี้ต้องสูงพอที่จะรองรับจํานวนผู้ใช้ปลายทางทั้งหมดในภูมิภาคหนึ่งๆ ที่อาจเข้าถึงฟีเจอร์ AI ของคุณซึ่งใช้โมเดลหนึ่งๆ เนื่องจากเป็นโควต้าต่อนาที จึงเป็นไปได้น้อยมากที่ผู้ใช้ทุกคนในภูมิภาคจะใช้ชุดฟีเจอร์เดียวกันพร้อมกันและทำให้โควต้าเหล่านี้หมดลง แต่แอปแต่ละแอปจะแตกต่างกันไป ดังนั้นโปรดปรับโควต้าเหล่านี้ตามความเหมาะสม
Vertex AIทําความเข้าใจโควต้า Vertex AI in Firebase API
Vertex AI in Firebase โควต้า API จะอิงตาม "สร้างคำขอเนื้อหา" ต่อผู้ใช้ต่อภูมิภาคต่อนาที
รายละเอียดสำคัญเกี่ยวกับโควต้านี้ (โดยเฉพาะคำขอต่อนาที) มีดังนี้
โดยจะมีผลในระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
โดยจะมีผลกับการเรียกใช้ที่ผ่าน Vertex AI in FirebaseSDK ใดก็ตามโดยเฉพาะ
โควต้าเริ่มต้นคือ 100 RPM ต่อผู้ใช้ 1 คน
โปรดทราบว่าคุณยังคงต้องพิจารณาขีดจํากัดโควต้าสําหรับ Vertex AI API โดยเฉพาะหากต่ำกว่า 100 RPM นี้
โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ต่อผู้ใช้" สำหรับฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase
โดยโควต้านี้ต้องสูงพอที่จะรองรับผู้ใช้รายเดียวที่เข้าถึงฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase เนื่องจาก API นี้ทำหน้าที่เป็นเกตเวย์ไปยัง Vertex AI API คุณจึงใช้โควต้า Vertex AI API ได้เพื่อให้มั่นใจว่าไม่มีผู้ใช้รายใดใช้โควต้า Vertex AI API ของคุณจนหมด (ซึ่งผู้ใช้ทุกคนควรใช้ร่วมกันได้)Vertex AI in Firebase
ดูโควต้าของ API แต่ละรายการ
คุณดูโควต้าของ API แต่ละรายการได้ในคอนโซล Google Cloud
ในคอนโซล Google Cloud ให้ไปที่หน้าของ API ที่ต้องการ ซึ่งได้แก่ Vertex AI API หรือ Vertex AI in Firebase API
คลิกจัดการ
คลิกแท็บโควต้าและขีดจํากัดของระบบที่ด้านล่างของหน้า
กรองตารางเพื่อแสดงโควต้าความสนใจ
โปรดทราบว่าหากต้องการสร้างตัวกรอง
Dimension
คุณต้องใช้เครื่องมือตัวกรองแทนการคัดลอกและวางค่าในตัวอย่างต่อไปนี้สำหรับ Vertex AI API: ระบุความสามารถ (คำขอสร้างเนื้อหา), ชื่อรุ่น และภูมิภาค
ตัวอย่างเช่น หากต้องการดูโควต้าในการสร้างคำขอเนื้อหาด้วย Gemini 1.5 Flash ในภูมิภาคใดก็ได้ของสหภาพยุโรป ตัวกรองจะมีลักษณะดังนี้
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
สำหรับ Vertex AI in Firebase API: ระบุความสามารถ (คำขอสร้างเนื้อหา) และภูมิภาค
ตัวอย่างเช่น หากต้องการดูโควต้าต่อผู้ใช้ในการสร้างคำขอเนื้อหาในภูมิภาคเอเชียที่รองรับ ตัวกรองของคุณจะมีลักษณะดังนี้
Generate content requests
+Dimension:region:asia
โปรดทราบว่าVertex AI in Firebase โควต้า API ไม่ได้อิงตามรูปแบบใดรูปแบบหนึ่ง นอกจากนี้ แถวโควต้า
(default)
จะไม่มีผลกับ Vertex AI in Firebase
แก้ไขโควต้าหรือขอเพิ่มโควต้า
ก่อนใช้งานจริงหรือหากได้รับข้อผิดพลาด 429 โควต้าเกิน คุณอาจต้องแก้ไขโควต้าหรือขอเพิ่มโควต้า โปรดปรับโควต้าของ API แต่ละรายการตามความเหมาะสม (ดูข้อควรพิจารณาในหัวข้อทําความเข้าใจโควต้าของ API แต่ละรายการก่อนหน้านี้ในหน้านี้)
หากต้องการแก้ไขโควต้า คุณต้องมีสิทธิ์ serviceusage.quotas.update
ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น
วิธีแก้ไขโควต้าหรือขอเพิ่มโควต้ามีดังนี้
ทําตามวิธีการในส่วนย่อยก่อนหน้าเพื่อดูโควต้าของ API แต่ละรายการ
เลือกช่องทําเครื่องหมายทางด้านซ้ายของโควต้าความสนใจแต่ละรายการ
คลิกเมนู 3 จุดที่ท้ายแถวโควต้า แล้วเลือกแก้ไขโควต้า
ในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทําดังนี้
ป้อนโควต้าที่เพิ่มขึ้นในช่องค่าใหม่
โดยโควต้านี้จะมีผลในระดับโปรเจ็กต์และจะแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
กรอกข้อมูลในช่องเพิ่มเติมในแบบฟอร์ม แล้วคลิกเสร็จสิ้น
คลิกส่งคำขอ