The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models were shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

تحليل المستندات (مثل ملفات PDF) باستخدام واجهة برمجة التطبيقات Gemini

يمكنك أن تطلب من نموذج Gemini تحليل ملفات المستندات (مثل ملفات PDF وملفات النصوص العادية) التي تقدّمها إما مضمّنة (مشفّرة باستخدام base64) أو عبر عنوان URL. عند استخدام Firebase AI Logic, يمكنك إجراء هذا الطلب مباشرةً من تطبيقك.

باستخدام هذه الإمكانية، يمكنك إجراء ما يلي:

تحليل المخططات والرسوم البيانية والجداول داخل المستندات
استخراج المعلومات إلى تنسيقات الإخراج المنظَّمة
الإجابة عن الأسئلة حول المحتويات المرئية والنصية في المستندات
تلخيص المستندات
تحويل محتوى المستند إلى نص (على سبيل المثال، إلى HTML)، مع الحفاظ على التنسيقات والتخطيطات، لاستخدامه في التطبيقات اللاحقة (مثل مسارات RAG)

يتناول هذا الدليل إنشاء نص من إدخال مستند (مثل ملفات PDF)، ولكن يمكنك أيضًا إنشاء صور من إدخال مستند.

الانتقال إلى نماذج الرموز البرمجية الانتقال إلى الرمز البرمجي للردود التي يتم عرضها تدريجيًا

الاطّلاع على أدلة أخرى تتضمّن خيارات إضافية للعمل مع المستندات (مثل ملفات PDF)
إنشاء إخراج منظَّم محادثة مترابطة

قبل البدء

انقر على موفّر Gemini API لعرض المحتوى والرمز البرمجي الخاصَّين بالموفّر على هذه الصفحة.

إذا لم تكن قد أكملت دليل البدء، الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase وإضافة حزمة تطوير البرامج (SDK) و تهيئة خدمة الخلفية لموفّر Gemini API الذي اخترته و إنشاء مثيل GenerativeModel، يُرجى إكماله الآن.

لاختبار طلباتك وتكرارها، ننصحك باستخدام Google AI Studio.

هل تحتاج إلى ملف PDF نموذجي؟

يمكنك استخدام هذا الملف المتاح للجميع بنوع MIME‏ application/pdf (عرض الملف أو تنزيله). https://storage.googleapis.com/cloud-samples-data/generative-ai/pdf/2403.05530.pdf

النماذج التي تتيح هذه الإمكانية

يتناول هذا الدليل إنشاء نص من إدخال مستند (مثل ملفات PDF)، وينطبق على النماذج التالية Gemini:

gemini-3.1-pro-preview
gemini-3.5-flash
gemini-3.1-flash-lite
gemini-2.5-pro
gemini-2.5-flash
gemini-2.5-flash-lite

ملاحظة: Firebase AI Logic لا تتيح بعد إمكانية ضبط دقة الوسائط المُدخَلة، ولكن ستتوفّر هذه الميزة قريبًا.

إنشاء نص من ملفات PDF (مشفّرة باستخدام base64)

قبل تجربة هذا النموذج، يُرجى إكمال قسم قبل البدء في هذا الدليل لإعداد مشروعك وتطبيقك.
في هذا القسم، ستنقر أيضًا على زر لموفّر Gemini API الذي اخترته حتى يظهر لك المحتوى الخاص بالموفّر على هذه الصفحة.

يمكنك أن تطلب من نموذج Gemini لـ إنشاء نص من خلال تقديم نص وملفات PDF، مع توفير mimeType لكل ملف إدخال والملف نفسه. يمكنك الاطّلاع على المتطلبات والاقتراحات الخاصة بملفات الإدخال لاحقًا في هذه الصفحة.