فهم الحصص وإدارتها

تتطلّب Vertex AI in Firebase واجهتَي برمجة تطبيقات مختلفتَين (لكل منهما حصة خاصة بها): Vertex AI API وVertex AI in Firebase API.

لكلّ من واجهات برمجة التطبيقات هذه حصة يتم قياسها حسب عدد الطلبات في الدقيقة (RPM)، ويشمل ذلك على وجه التحديد طلبات "إنشاء المحتوى" (باستخدام ميزة البث المباشر أو بدونها). تفرض واجهة برمجة التطبيقات Vertex AI حدًا أقصى لعدد الرموز المميزة للإدخال في الدقيقة.

توضّح هذه الصفحة ما يلي:

الحصص لكل طراز ومنطقة
فهم الحصص المفروضة على واجهتَي برمجة التطبيقات Vertex AI API و Vertex AI in Firebase API
عرض الحصص في وحدة تحكّم Google Cloud
تعديل الحصة أو طلب زيادة الحصة

للحصول على معلومات عامة عن الحصص وGoogle Cloud، يُرجى الاطّلاع على مستندات "حصص السحابة الإلكترونية".

الحصص لكل طراز ومنطقة

يمكنك الاطّلاع على الحصص التفصيلية لكل طراز ومنطقة في مستندات Google Cloud.

فهم الحصص لكل واجهة برمجة تطبيقات

يتم قياس حصة كل واجهة برمجة تطبيقات بشكل مختلف قليلاً، ما يعني أنّه يمكن استخدامها لأغراض مختلفة.

فهم حصص Vertex AI واجهة برمجة التطبيقات

تستند حصص Vertex AI لواجهة برمجة التطبيقات إلى "إنشاء طلبات محتوى" لكل نموذج في كل منطقة في كل دقيقة.

في ما يلي بعض التفاصيل المهمة حول هذه الحصص (على وجه التحديد، الطلبات في الدقيقة ورموز الإدخال في الدقيقة):

وتنطبق هذه الإعدادات على مستوى المشروع وتتم مشاركتها على مستوى جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.
وتنطبق هذه الأحكام على أي طلب موجَّه إلى Vertex AI Gemini API، سواء كان باستخدام حِزم تطوير البرامج (SDK) لعملاء Vertex AI in Firebase أو حِزم تطوير البرامج (SDK) لخوادم Vertex AI أو Firebase Genkit أو Firebase Extensions Gemini أو طلبات REST أو Vertex AI Studio أو عملاء واجهة برمجة التطبيقات الآخرين.
وتنطبق هذه الإعدادات على النموذج الأساسي وجميع الإصدارات والمعرّفات والإصدارات المحسّنة من هذا النموذج. وإليك بعض الأمثلة:
- يتم احتساب طلب موجَّه إلى gemini-1.0-pro وطلب موجَّه إلى gemini-1.0-pro-001 كطلبَين ضمن حصة العائد لكل ألف ظهور للنموذج الأساسي، وهو gemini-1.0 pro.
- يتم احتساب طلب موجَّه إلى gemini-1.0-pro-001 وطلب موجَّه إلى نموذج معدَّل يستند إلى gemini-1.0-pro-001 كطلبَين ضمن حصة RPM للنموذج الأساسي، gemini-1.0-pro.
يمكن العثور على الإعدادات التلقائية الحصص لكل نموذج ولكل منطقة في مستندات Google Cloud.

يجب أن تكون هذه الحصص عالية بما يكفي لاستيعاب إجمالي عدد المستخدمين النهائيين في منطقة معيّنة الذين قد يستخدمون ميزات الذكاء الاصطناعي التي تعتمد على نموذج معيّن. وبما أنّ هذه الحصص تُحدَّد لكل دقيقة، من غير المرجّح نسبيًا أن يستخدم جميع المستخدمين في منطقة معيّنة المجموعة نفسها من الميزات في الوقت نفسه ويستنفذون هذه الحصص. ولكن يختلف كل تطبيق عن الآخر، لذا عليك تعديل هذه الحصص وفقًا لذلك.

فهم حصة Vertex AI in Firebase لواجهة برمجة التطبيقات

تستند حصة Vertex AI in Firebase لواجهة برمجة التطبيقات إلى "إنشاء طلبات المحتوى" لكل مستخدم في كل منطقة في كل دقيقة.

في ما يلي بعض التفاصيل المهمة عن هذه الحصة (على وجه التحديد، الطلبات في الدقيقة):

وينطبق ذلك على مستوى المشروع وعلى جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.
وينطبق ذلك على أي مكالمة تمرّ تحديدًا من خلال أي Vertex AI in Firebase حزمة تطوير برامج (SDK).
الحصة التلقائية هي 100 دورة في الدقيقة لكل مستخدم.
يُرجى العِلم أنّه لا يزال عليك مراعاة حدود الحصة Vertex AI لواجهة برمجة التطبيقات، خاصةً إذا كانت أقل من 100 مرة في الساعة.

يجب أن تكون هذه الحصة عالية بما يكفي لاستيعاب مستخدم واحد بشكل معقول يستخدم ميزات الذكاء الاصطناعي التي تعتمد على Vertex AI in Firebase. بما أنّ واجهة برمجة التطبيقات هذه تؤدي دور البوابة إلى واجهة برمجة التطبيقات Vertex AI، يمكنك استخدام حصة Vertex AI in Firebase واجهة برمجة التطبيقات لضمان عدم استنفاد أي مستخدم individual لحصة Vertex AI واجهة برمجة التطبيقات (التي من المفترض أن تتم مشاركتها من قِبل جميع المستخدمين).

عرض الحصص لكل واجهة برمجة تطبيقات

يمكنك الاطّلاع على الحصص لكل واجهة برمجة تطبيقات في وحدة تحكّم Google Cloud.

في وحدة تحكّم Google Cloud، انتقِل إلى صفحة واجهة برمجة التطبيقات التي تهمّك: Vertex AI API أو Vertex AI in Firebase API.
انقر على إدارة.
في أسفل الصفحة، انقر على علامة التبويب الحصص وحدود النظام.
فلتِر الجدول لعرض حصص الاهتمام.

يُرجى العِلم أنّه لإنشاء فلتر Dimension، عليك استخدام أدوات الفلترة ، بدلاً من نسخ القيم في الأمثلة التالية ولصقها فقط.
- بالنسبة إلى Vertex AI واجهة برمجة التطبيقات: حدِّد الإمكانات (طلبات إنشاء المحتوى) واسم النموذج والمنطقة.
  
  على سبيل المثال، للاطّلاع على الحصص المخصّصة لإنشاء طلبات المحتوى باستخدام Gemini 2.0 Flash في أيّ من مناطق الاتحاد الأوروبي المتوافقة، سيظهر فلترك على النحو التالي:
  Generate content requests + Dimension:base_model:gemini-2.0-flash + Dimension:region:eu
- بالنسبة إلى Vertex AI in Firebase واجهة برمجة التطبيقات: حدِّد الإمكانات (طلبات إنشاء المحتوى) والمنطقة.
  
  على سبيل المثال، لعرض الحصص لكل مستخدم لإنشاء طلبات المحتوى في أي من المناطق الآسيوية المتوافقة، سيظهر الفلتر على النحو التالي:
  Generate content requests + Dimension:region:asia
  
  يُرجى العلم أنّ Vertex AI in Firebase الحصص المخصّصة لواجهات برمجة التطبيقات لا تستند إلى نموذج معيّن. بالإضافة إلى ذلك، لا ينطبق صف الحصة (default) على Vertex AI in Firebase.

تعديل الحصة أو طلب زيادة الحصة

قبل الانتقال إلى مرحلة الإنتاج أو إذا كنت تتلقّى أخطاء 429 بسبب تجاوز الحصة، قد تحتاج إلى تعديل حصتك أو طلب زيادة الحصة. احرص على تعديل حصة كل واجهة برمجة تطبيقات وفقًا لذلك (اطّلِع على فهم الحصص لكل واجهة برمجة تطبيقات في وقت سابق من هذه الصفحة للحصول على اعتبارات).

لتعديل حصة، يجب أن يكون لديك إذن serviceusage.quotas.update، الذي يكون مضمّنًا تلقائيًا في دورَي "المالك" و"المحرِّر".

في ما يلي كيفية تعديل حصتك أو طلب زيادة الحصة:

اتّبِع التعليمات الواردة في القسم الفرعي السابق لعرض الحصص لكل واجهة برمجة تطبيقات.
ضَع علامة في مربّع الاختيار على يمين كل حصة من الحصص المعنيّة.
في نهاية صف الحصة، انقر على القائمة ذات النقاط الثلاث، ثم اختَر تعديل الحصة.
في نموذج تغييرات الحصة، اتّبِع الخطوات التالية:
1. أدخِل الحصة المتزايدة في حقل القيمة الجديدة.
  
  تنطبق هذه الحصة على مستوى المشروع وتتم مشاركتها على مستوى جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.
2. أكمِل أي حقول إضافية في النموذج، ثم انقر على تم.
3. انقر على إرسال الطلب.