Gemini API usando Firebase AI Logic
Compila apps y funciones web y para dispositivos móviles potenciadas por IA con los modelos Gemini usando Firebase AI Logic
Firebase AI Logic te brinda acceso a los modelos de IA generativa más recientes de Google: los modelos Gemini.
Si necesitas llamar a Gemini API directamente desde tu app web o para dispositivos móviles (en lugar de hacerlo desde el servidor), puedes usar los SDKs de cliente de Firebase AI Logic. Estos SDKs de cliente se compilan específicamente para su uso con apps web y para dispositivos móviles, y ofrecen opciones de seguridad contra clientes no autorizados, así como integraciones con otros servicios de Firebase.
Estos SDKs de cliente están disponibles en Swift para las plataformas de Apple, Kotlin y Java para Android, JavaScript para la Web, Dart para Flutter y Unity.
Con estos SDKs de cliente, puedes agregar personalización basada en IA a las apps, crear una experiencia de chat con IA, crear optimizaciones y automatización impulsadas por IA, y mucho más.
Funciones clave
| Entrada multimodal y de lenguaje natural |
Los modelos Gemini son multimodales, por lo que las instrucciones enviadas a Gemini API pueden incluir texto, imágenes, PDFs, video y audio. Algunos modelos Gemini también pueden
generar resultados multimodales.
Se pueden dar instrucciones a los modelos Gemini con entradas en lenguaje natural. |
| Conjunto creciente de capacidades |
Con los SDKs, puedes llamar a Gemini API directamente desde tu app web o para dispositivos móviles para crear experiencias de chat con IA, generar imágenes, usar herramientas (como llamadas a funciones y Grounding con |
| Seguridad y prevención de abusos para apps de producción |
Usa Firebase App Check para ayudar a proteger las APIs que acceden a los modelos de Gemini contra el abuso de clientes no autorizados.
Firebase AI Logic también tiene límites de frecuencia por usuario de forma predeterminada, y estos límites de frecuencia por usuario son completamente configurables. |
| Infraestructura sólida | Aprovecha la infraestructura escalable creada para usarse con apps para dispositivos móviles y web, como administrar archivos con Cloud Storage for Firebase, administrar datos estructurados con las ofertas de bases de datos de Firebase (como Cloud Firestore) y establecer de forma dinámica la configuración del tiempo de ejecución con Firebase Remote Config. |
¿Cómo funciona?
Firebase AI Logic proporciona SDKs de cliente, un servicio de proxy y otras funciones que te permiten acceder a los modelos de IA generativa de Google para crear funciones potenciadas por IA en tus apps web y para dispositivos móviles.
Compatibilidad con los modelos de Google y los proveedores de "Gemini API"
Admitimos todos los modelos Gemini más recientes, y tú eliges tu proveedor de "Gemini API" preferido para acceder a estos modelos. Admitimos Gemini Developer API y Vertex AI Gemini API. Obtén más información sobre las diferencias entre el uso de los dos proveedores de API.
Si decides usar Gemini Developer API, puedes aprovechar su "nivel gratuito" para comenzar a usarlo rápidamente.
SDKs de clientes para dispositivos móviles y la Web
Envías solicitudes a los modelos directamente desde tu app web o para dispositivos móviles con nuestros SDK de cliente de Firebase AI Logic, disponibles en Swift para plataformas de Apple, Kotlin y Java para Android, JavaScript para la Web, Dart para Flutter y Unity.
Si tienes configurados ambos proveedores de Gemini API en tu proyecto de Firebase, puedes cambiar de proveedor de API con solo habilitar la otra API y cambiar algunas líneas de código de inicialización.
Además, varios de nuestros SDKs para clientes ofrecen acceso a la inferencia híbrida e integrada en el dispositivo. Esta configuración permite que tu app use el modelo integrado en el dispositivo cuando esté disponible, pero que vuelva sin problemas al modelo alojado en la nube cuando sea necesario (y viceversa).
Servicio de proxy
Nuestro servicio de proxy actúa como una puerta de enlace entre el cliente y el proveedor de Gemini API que elijas (y los modelos de Google). Proporciona servicios e integraciones importantes para las apps móviles y web. Por ejemplo, puedes configurar Firebase App Check para proteger a tu proveedor de API elegido y tus recursos de backend contra abusos de clientes no autorizados.
Esto es especialmente importante si elegiste usar Gemini Developer API, ya que nuestro servicio de proxy y esta integración de Gemini Developer API garantizan que tu clave de API de Gemini permanezca en el servidor y no se incorpore en la base de código de tus apps.App Check
Ruta de implementación
| Configura tu proyecto de Firebase y conecta tu app a Firebase | Usa el flujo de trabajo guiado en la página Firebase AI Logic de la consola de Firebase para configurar tu proyecto (lo que incluye habilitar las APIs requeridas para el proveedor de Gemini API que elegiste), registrar tu app en tu proyecto de Firebase y, luego, agregar la configuración de Firebase a tu app. | |
| Instala el SDK y, luego, inicialízalo | Instala el SDK de Firebase AI Logic específico para la plataforma de tu app y, luego, inicializa el servicio y crea una instancia del modelo en tu app. | |
| Envía solicitudes de instrucciones a los modelos de Gemini | Usa los SDKs para enviar instrucciones solo de texto o multimodales a un modelo Gemini y generar texto y código, salida estructurada (como JSON) y imágenes.
Crea experiencias más enriquecidas con chat de varios turnos, transmisión bidireccional (incluido el audio) y llamadas a funciones. |
|
| Preparación para la producción | Implementa integraciones importantes para apps web y para dispositivos móviles, como proteger la API del abuso con Firebase App Check y usar Firebase Remote Config para actualizar parámetros en tu código de forma remota (lo más importante es el nombre del modelo). |
Próximos pasos
Comienza a acceder a un modelo desde tu app web o para dispositivos móviles