Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

Gemini 2.0 Flash and Flash-Lite models will be retired on March 3, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Learn more.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

فایل های ویدئویی را با استفاده از API جمینی تجزیه و تحلیل کنید

شما می‌توانید از یک مدل Gemini بخواهید فایل‌های ویدیویی که شما به صورت درون‌خطی (با کدگذاری base64) یا از طریق URL ارائه می‌دهید را تجزیه و تحلیل کند. وقتی از Firebase AI Logic استفاده می‌کنید، می‌توانید این درخواست را مستقیماً از برنامه خود انجام دهید.

با این قابلیت، می‌توانید کارهایی مانند موارد زیر را انجام دهید:

زیرنویس بگذارید و به سوالات مربوط به ویدیوها پاسخ دهید
بخش‌های خاصی از یک ویدیو را با استفاده از مهرهای زمانی تجزیه و تحلیل کنید
با پردازش همزمان آهنگ صوتی و فریم‌های تصویری، محتوای ویدیو را رونویسی کنید
توصیف، قطعه‌بندی و استخراج اطلاعات از ویدیوها، شامل آهنگ صوتی و فریم‌های بصری

پرش به نمونه‌های کد پرش به کد برای پاسخ‌های استریم‌شده

برای گزینه‌های بیشتر برای کار با ویدیو، به راهنماهای دیگر مراجعه کنید.
تولید خروجی ساختاریافته چت چند نوبتی

قبل از اینکه شروع کنی

برای مشاهده محتوا و کد مخصوص ارائه‌دهنده در این صفحه، روی ارائه‌دهنده API Gemini خود کلیک کنید.

اگر هنوز این کار را نکرده‌اید، راهنمای شروع به کار را تکمیل کنید، که نحوه راه‌اندازی پروژه Firebase، اتصال برنامه به Firebase، افزودن SDK، راه‌اندازی سرویس backend برای ارائه‌دهنده API انتخابی Gemini و ایجاد یک نمونه GenerativeModel شرح می‌دهد.

برای آزمایش و تکرار روی درخواست‌هایتان، توصیه می‌کنیم از Google AI Studio استفاده کنید.

به یک فایل ویدیویی نمونه نیاز دارید؟

شما می‌توانید از این فایل عمومی با نوع MIME از نوع video/mp4 ( مشاهده یا دانلود فایل ) استفاده کنید. https://storage.googleapis.com/cloud-samples-data/video/animals.mp4

تولید متن از فایل‌های ویدیویی (با کدگذاری base64)

قبل از امتحان کردن این نمونه، بخش «قبل از شروع» این راهنما را برای راه‌اندازی پروژه و برنامه خود تکمیل کنید.
در آن بخش، شما همچنین می‌توانید روی دکمه‌ای برای ارائه‌دهنده‌ی API Gemini انتخابی خود کلیک کنید تا محتوای خاص ارائه‌دهنده را در این صفحه مشاهده کنید .

شما می‌توانید از یک مدل Gemini بخواهید با ارائه متن و ویدیو، متن تولید کند - و mimeType هر فایل ورودی و خود فایل را ارائه دهد. الزامات و توصیه‌هایی برای فایل‌های ورودی را بعداً در این صفحه بیابید.

توجه داشته باشید که این مثال ارائه فایل به صورت درون‌خطی را نشان می‌دهد، اما SDKها از ارائه URL یوتیوب نیز پشتیبانی می‌کنند.