The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

تحليل الملفات الصوتية باستخدام Gemini API

يمكنك الطلب من نموذج Gemini تحليل ملفات صوتية تقدّمها إما بشكل مضمّن (ترميز base64) أو عبر عنوان URL. عند استخدام Firebase AI Logic، يمكنك تقديم هذا الطلب مباشرةً من تطبيقك.

باستخدام هذه الإمكانية، يمكنك تنفيذ إجراءات مثل:

وصف المحتوى الصوتي أو تلخيصه أو الإجابة عن أسئلة بشأنه
تحويل المحتوى الصوتي إلى نص
تحليل مقاطع صوتية محدّدة باستخدام الطوابع الزمنية

الانتقال إلى عيّنات التعليمات البرمجية الانتقال إلى التعليمات البرمجية للردود التي يتم بثها

الاطّلاع على أدلة أخرى تتضمّن خيارات إضافية للتعامل مع الصوت
إنشاء ناتج منظَّم محادثة متعدّدة الجولات البث الثنائي الاتجاه

قبل البدء

انقر على مقدّم خدمة Gemini API لعرض المحتوى والرمز الخاصين بمقدّم الخدمة على هذه الصفحة.

إذا لم يسبق لك إجراء ذلك، عليك إكمال دليل بدء الاستخدام الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase وإضافة حزمة تطوير البرامج (SDK) وتهيئة خدمة الخلفية لمزوّد Gemini API الذي اخترته وإنشاء مثيل GenerativeModel.

لاختبار طلباتك وتكرارها، ننصحك باستخدام Google AI Studio.

هل تحتاج إلى ملف صوتي نموذجي؟

يمكنك استخدام هذا الملف المتاح للجميع بنوع MIME‏ audio/mp3 (عرض الملف أو تنزيله). https://storage.googleapis.com/cloud-samples-data/generative-ai/audio/pixel.mp3

إنشاء نص من ملفات صوتية (مشفرة باستخدام Base64)

قبل تجربة هذا النموذج، أكمل القسم قبل البدء من هذا الدليل لإعداد مشروعك وتطبيقك.
في هذا القسم، ستنقر أيضًا على زر لمقدّم الخدمة الذي اخترته Gemini API حتى يظهر لك محتوى خاص بمقدّم الخدمة في هذه الصفحة.

يمكنك أن تطلب من نموذج Gemini إنشاء نص من خلال تقديم طلب يتضمّن نصًا وصوتًا، أي من خلال تقديم mimeType لملف الإدخال والملف نفسه. يمكنك الاطّلاع على متطلبات وملفات مقترَحة للملفات المدخلة لاحقًا في هذه الصفحة.