نظارت بر هزینه‌ها، میزان استفاده و سایر معیارهای Gemini API، هزینه‌ها، استفاده و سایر معیارهای Gemini API

نظارت بر هزینه‌ها، استفاده و سایر معیارهای Gemini API بخش مهمی از اجرای یک برنامه تولیدی است. مهم است که بدانید الگوهای استفاده معمولی برای برنامه شما چگونه به نظر می رسند و مطمئن شوید که در آستانه های مهم برای شما باقی می مانند.

نظارت بر هزینه ها

در داشبورد Usage and Billing کنسول Firebase ، می‌توانید هزینه‌های پروژه خود را برای فراخوانی Vertex AI Gemini API مشاهده کنید.

هزینه های نمایش داده شده در داشبورد لزوماً مختص تماس های از طریق Vertex AI in Firebase نیست. هزینه های نمایش داده شده با هر تماس با Vertex AI Gemini API مرتبط است، خواه استفاده از Vertex AI in Firebase ، SDK های سرور Vertex AI ، Firebase Genkit ، Firebase Extensions برای Gemini API ، تماس های REST، Vertex AI Studio ، یا سایر سرویس گیرندگان API.

همچنین می توانید با استفاده از Count Tokens API تخمینی از اندازه توکن و کاراکترهای قابل پرداخت درخواست های خود دریافت کنید. درباره محدودیت های توکن در هر مدل و قیمت هر مدل بیشتر بیاموزید.

هشدار را تنظیم کنید

برای جلوگیری از صورت‌حساب‌های غافلگیرکننده، مطمئن شوید که هشدارهای بودجه را تنظیم کرده‌اید .

توجه داشته باشید که هشدارهای بودجه سقف بودجه نیستند. هنگامی که به آستانه پیکربندی شده خود نزدیک می شوید یا از آن فراتر می روید، یک هشدار برای شما ارتباطات ارسال می کند تا بتوانید در برنامه یا پروژه خود اقدام کنید.

نظارت بر استفاده و سایر معیارها

می‌توانید معیارهای پروژه خود را برای هر API، مانند استفاده از آن، در کنسول Google Cloud مشاهده کنید.

  1. در کنسول Google Cloud ، به هر صفحه API بروید: Vertex AI API و Vertex AI in Firebase API .

    • صفحه Vertex AI API : این کاربرد مربوط به هر تماسی با Vertex AI Gemini API است، خواه از Vertex AI in Firebase ، SDK های سرور Vertex AI ، Firebase Genkit ، Firebase Extensions برای Gemini API ، REST باشد. تماس ها، Vertex AI Studio و غیره

    • Vertex AI in Firebase : این مورد به‌طور خاص برای تماس‌هایی است که از Vertex AI in Firebase SDK استفاده می‌شود.

  2. روی Manage کلیک کنید.

  3. روی تب Metrics کلیک کنید.

  4. از منوهای کشویی برای مشاهده معیارهای مورد علاقه، مانند ترافیک بر اساس کد پاسخ، خطاها بر اساس روش API، تأخیر کلی و تأخیر با روش API استفاده کنید.