تتطلّب Vertex AI in Firebase واجهتَي برمجة تطبيقات مختلفتَين (لكل منهما quotum) : Vertex AI API وVertex AI in Firebase API.
لكلّ من واجهات برمجة التطبيقات هذه حصة يتم قياسها حسب عدد الطلبات في الدقيقة (RPM)، ويشمل ذلك على وجه التحديد طلبات "إنشاء المحتوى" (سواءً من خلال البث أو بدونه). تتضمّن واجهة برمجة التطبيقات Vertex AI أيضًا حصة للرموز المميزة للإدخال في الدقيقة.
توضّح هذه الصفحة ما يلي:
فهم الحصص المفروضة على واجهتَي برمجة التطبيقات Vertex AI API و Vertex AI in Firebase API
عرض الحصص في وحدة تحكّم Google Cloud
يمكنك قراءة مستندات Google Cloud للحصول على معلومات عامة حول الحصص.
فهم الحصص لكل واجهة برمجة تطبيقات
يتم قياس حصة كل واجهة برمجة تطبيقات بشكل مختلف قليلاً، ما يعني أنّه يمكن استخدامها لأغراض مختلفة.
فهم حصص Vertex AI واجهة برمجة التطبيقات
تستند حصص Vertex AI لواجهة برمجة التطبيقات إلى "إنشاء طلبات المحتوى" لكل نموذج في كل منطقة في كل دقيقة.
في ما يلي بعض التفاصيل المهمة حول هذه الحصص (على وجه التحديد، الطلبات في الدقيقة ورموز الإدخال في الدقيقة):
تنطبق هذه الإعدادات على مستوى المشروع وتتم مشاركتها على مستوى جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.
تنطبق هذه الأحكام على أي طلب موجَّه إلى Vertex AI Gemini API، سواء كان باستخدام حِزم تطوير البرامج (SDK) لعملاء Vertex AI in Firebase أو حِزم تطوير البرامج (SDK) لخوادم Vertex AI أو Firebase Genkit أو Firebase Extensions Gemini أو طلبات REST أو Vertex AI Studio أو حِزم تطوير البرامج (SDK) لعملاء واجهة برمجة التطبيقات الأخرى.
وتنطبق هذه الإعدادات على نموذج أساسي وجميع الإصدارات والمعرّفات والإصدارات المحسّنة من هذا النموذج. وإليك بعض الأمثلة:
يتم احتساب طلب موجَّه إلى
gemini-1.0-pro
وطلب موجَّه إلىgemini-1.0-pro-001
كطلبَين ضمن حصة العائد لكل ألف ظهور للنموذج الأساسي، وهوgemini-1.0 pro
.يتم احتساب طلب موجَّه إلى
gemini-1.0-pro-001
وطلب موجَّه إلى نموذج معدَّل يستند إلىgemini-1.0-pro-001
كطلبَين ضمن حصة RPM للنموذج الأساسي،gemini-1.0-pro
.
يمكن العثور على الإعدادات التلقائية الحصص لكل نموذج ولكل منطقة في مستندات Google Cloud.
يمكنك اعتبار حصص واجهة برمجة التطبيقات هذه بشكل أساسي حصصك "الكلية" لجميع مستخدميك (الذين يستخدمون ميزات الذكاء الاصطناعي في تطبيقك التي تعتمد على نموذج معيّن وفي منطقة معيّنة).
يجب أن تكون هذه الحصص عالية بما يكفي لاستيعاب إجمالي عدد المستخدمين النهائيين في منطقة معيّنة الذين قد يستخدمون ميزات الذكاء الاصطناعي التي تعتمد على نموذج معيّن. وبما أنّ هذه الحصص تُحدَّد لكل دقيقة، من غير المرجّح نسبيًا أن يستخدم جميع المستخدمين في منطقة معيّنة المجموعة نفسها من الميزات في الوقت نفسه ويستنفذون هذه الحصص. ولكن يختلف كل تطبيق عن الآخر، لذا عليك تعديل هذه الحصص وفقًا لذلك.
فهم حصة Vertex AI in Firebase لواجهة برمجة التطبيقات
تستند حصة Vertex AI in Firebase لواجهة برمجة التطبيقات إلى "إنشاء طلبات المحتوى" لكل مستخدم في كل منطقة في كل دقيقة.
في ما يلي بعض التفاصيل المهمة عن هذه الحصة (على وجه التحديد، الطلبات في الدقيقة):
وينطبق ذلك على مستوى المشروع وعلى جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.
وينطبق ذلك على أي مكالمة تمرّ تحديدًا من خلال أي Vertex AI in Firebase حزمة تطوير برامج (SDK).
الحصة التلقائية هي 100 دورة في الدقيقة لكل مستخدم.
يُرجى العِلم أنّه لا يزال عليك مراعاة حدود الحصة Vertex AI لواجهة برمجة التطبيقات، خاصةً إذا كانت أقل من 100 مرة في الدقيقة.
يمكنك اعتبار حصة واجهة برمجة التطبيقات هذه هي حصتك "لكل مستخدم" ل ميزات الذكاء الاصطناعي التي تعتمد على Vertex AI in Firebase.
يجب أن تكون هذه الحصة عالية بما يكفي لاستيعاب مستخدم واحد بشكل معقول يستخدم ميزات الذكاء الاصطناعي التي تعتمد على Vertex AI in Firebase. بما أنّ واجهة برمجة التطبيقات هذه تؤدي دور البوابة إلى واجهة برمجة التطبيقات Vertex AI، يمكنك استخدام حصة Vertex AI in Firebase واجهة برمجة التطبيقات لضمان عدم استنفاد أي مستخدم واحد لحصة Vertex AI واجهة برمجة التطبيقات (التي من المفترض أن تتم مشاركتها من قِبل جميع المستخدمين).
عرض الحصص لكل واجهة برمجة تطبيقات
يمكنك الاطّلاع على الحصص لكل واجهة برمجة تطبيقات في وحدة تحكّم Google Cloud.
في وحدة تحكّم Google Cloud، انتقِل إلى صفحة واجهة برمجة التطبيقات التي تهمّك: Vertex AI API أو Vertex AI in Firebase API.
انقر على إدارة.
في أسفل الصفحة، انقر على علامة التبويب الحصص وحدود النظام.
فلتِر الجدول لعرض الحصص ذات الصلة.
يُرجى العِلم أنّه لإنشاء فلتر
Dimension
، عليك استخدام أدوات الفلترة بدلاً من نسخ القيم في الأمثلة التالية ولصقها فقط.بالنسبة إلى Vertex AI واجهة برمجة التطبيقات: حدِّد الإمكانات (طلبات إنشاء المحتوى) واسم النموذج والمنطقة.
على سبيل المثال، للاطّلاع على الحصص المخصّصة لإنشاء طلبات المحتوى باستخدام Gemini 1.5 Flash في أيّ من مناطق الاتحاد الأوروبي المتوافقة، سيظهر فلترك على النحو التالي:
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
بالنسبة إلى Vertex AI in Firebase واجهة برمجة التطبيقات: حدِّد الإمكانات (طلبات إنشاء المحتوى) والمنطقة.
على سبيل المثال، لعرض الحصص لكل مستخدم لإنشاء طلبات المحتوى في أي من المناطق الآسيوية المتوافقة، سيظهر الفلتر على النحو التالي:
Generate content requests
+Dimension:region:asia
يُرجى العلم أنّ Vertex AI in Firebase الحصص المخصّصة لواجهات برمجة التطبيقات لا تستند إلى نموذج معيّن. بالإضافة إلى ذلك، لا ينطبق صف الحصة
(default)
على Vertex AI in Firebase.
تعديل الحصة أو طلب زيادة الحصة
قبل الانتقال إلى مرحلة الإنتاج أو إذا كنت تتلقّى أخطاء 429 بسبب تجاوز الحصة، قد تحتاج إلى تعديل حصتك أو طلب زيادة الحصة. احرص على تعديل حصة كل واجهة برمجة تطبيقات وفقًا لذلك (اطّلِع على فهم الحصص لكل واجهة برمجة تطبيقات في وقت سابق من هذه الصفحة للحصول على اعتبارات).
لتعديل حصة، يجب أن يكون لديك إذن serviceusage.quotas.update
،
الذي يكون مضمّنًا تلقائيًا في دورَي "المالك" و"المحرِّر".
في ما يلي كيفية تعديل حصتك أو طلب زيادة الحصة:
اتّبِع التعليمات الواردة في القسم الفرعي السابق لعرض حصص كل واجهة برمجة تطبيقات.
ضَع علامة في مربّع الاختيار على يمين كل حصة من الحصص المخصّصة للإعلانات التي تهمّك.
في نهاية صف الحصة، انقر على القائمة ذات النقاط الثلاث، ثم اختَر تعديل الحصة.
في نموذج تغييرات الحصة، اتّبِع الخطوات التالية:
أدخِل الحصة المتزايدة في حقل القيمة الجديدة.
تنطبق هذه الحصة على مستوى المشروع وتتم مشاركتها على مستوى جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.
أكمِل أي حقول إضافية في النموذج، ثم انقر على تم.
انقر على إرسال الطلب.