Créer des expériences hybrides dans les applications Apple avec des modèles hébergés sur l'appareil et dans le cloud

Vous pouvez créer des applications et des fonctionnalités Apple optimisées par l'IA avec l'inférence hybride à l'aide de Firebase AI Logic. L'inférence hybride permet d'exécuter l'inférence à l'aide de modèles sur l'appareil (en particulier le framework Foundation Models d'Apple) lorsqu'ils sont disponibles, et de revenir de manière transparente aux modèles Google hébergés dans le cloud dans le cas contraire (et vice versa).

Cette page explique comment démarrer avec le SDK client et présente d'autres options et fonctionnalités de configuration, comme la température.

Notez que l'inférence sur l'appareil via Firebase AI Logic est compatible avec les applications Apple utilisant le SDK Firebase AI Logic version 12.13.0 ou ultérieure et s'exécutant sur des appareils sur lesquels Apple Intelligence est activé. Il est régi par les Exigences d'utilisation acceptable pour le framework de modèles de fondation d'Apple.

Cas d'utilisation recommandés

  • L'utilisation d'un modèle sur l'appareil pour l'inférence offre les avantages suivants :

    • Confidentialité renforcée
    • Inférence sans frais
    • Fonctionnalités hors connexion
  • L'utilisation de la fonctionnalité hybride offre les avantages suivants :

    • Offrez à tous les clients une expérience d'application similaire, quel que soit l'appareil de l'utilisateur final.
    • Améliorer la disponibilité des fonctionnalités d'IA générative, quels que soient la connectivité Internet, les limites de quota ou les capacités de l'appareil

Fonctionnalités, API et appareils compatibles

Avant d'implémenter l'inférence hybride et sur l'appareil à l'aide de Firebase AI Logic, consultez cette section pour comprendre ce qui est compatible avec les applications Apple.

Fonctionnalités et caractéristiques compatibles pour l'inférence sur l'appareil

L'inférence sur l'appareil n'est compatible qu'avec la génération de texte, en particulier les fonctionnalités de génération de texte suivantes :

Veillez à consulter la liste détaillée des inférences hybrides ou sur l'appareil qui ne sont pas encore prises en charge en bas de cette page.

API et appareils compatibles

Commencer

Assurez-vous d'avoir consulté la section ci-dessus décrivant les fonctionnalités, les API et les appareils compatibles.

Ces étapes de démarrage décrivent la configuration générale requise pour toute demande de requête acceptée que vous souhaitez envoyer.

Étape 1 : Configurez un projet Firebase et associez votre application à Firebase

  1. Connectez-vous à la console Firebase, puis sélectionnez votre projet Firebase.

  2. Dans la consoleFirebase, accédez à Services d'IA > Logique d'IA.

  3. Cliquez sur Premiers pas pour lancer un workflow guidé qui vous aide à configurer les API requises et les ressources pour votre projet.

  4. Configurez votre projet pour utiliser un fournisseur "Gemini API".

    Nous vous recommandons de commencer par utiliser Gemini Developer API. Vous pouvez toujours configurer Vertex AI Gemini API (et ses exigences de facturation) à tout moment.

    Pour Gemini Developer API, la console activera les API requises et créera une clé API Gemini dans votre projet.
    N'ajoutez pas cette clé API Gemini dans le code de votre application. En savoir plus

  5. Si vous y êtes invité dans le workflow de la console, suivez les instructions à l'écran pour enregistrer votre application et l'associer à Firebase.

  6. Passez à l'étape suivante de ce guide pour ajouter le SDK à votre application.

Étape 2 : Ajouter les SDK nécessaires

Utilisez Swift Package Manager (SPM) pour installer et gérer les dépendances Xcode. La prise en charge hybride n'est disponible que lorsque vous utilisez SPM.

La bibliothèque Firebase AI Logic permet d'accéder aux API pour interagir avec les modèles génératifs. La bibliothèque est incluse dans le SDK Firebase pour les plates-formes Apple (firebase-ios-sdk).

Si vous utilisez déjà Firebase, assurez-vous que votre package Firebase est la version 12.13.0 ou ultérieure.

  1. Dans Xcode, à partir de votre projet d'application ouvert, accédez à File > Add Package Dependencies (Fichier > Ajouter des dépendances de package).

  2. Lorsque vous y êtes invité, ajoutez le dépôt du SDK des plates-formes Firebase pour Apple :

    https://github.com/firebase/firebase-ios-sdk
    
  3. Sélectionnez la dernière version du SDK.

  4. Sélectionnez la bibliothèque FirebaseAILogic.

Lorsque vous avez terminé, Xcode commence à résoudre et à télécharger automatiquement vos dépendances en arrière-plan.

Étape 3 : Initialisez le service et créez une instance de session de modèle

Cliquez sur votre fournisseur Gemini API pour afficher le contenu et le code spécifiques à ce fournisseur sur cette page.

Configurez les éléments suivants avant d'envoyer une requête de prompt au modèle.

  1. Initialisez le service pour le fournisseur Gemini API de votre choix.

  2. Créez une instance GenerativeModelSession avec un HybridModel.

  3. Définissez les modèles primary et secondary en fonction de vos préférences. Vous pouvez définir l'ordre des tentatives d'inférence :

    • Tenter d'abord l'inférence sur l'appareil, mais autoriser le retour au cloud : définissez primary sur un modèle "system" et secondary sur un modèle cloud.

    • Tentez d'abord l'inférence dans le cloud, mais autorisez le retour à l'appareil : définissez primary sur un modèle cloud et secondary sur un modèle "système".

    Notez que le SDK ne permet de définir qu'un seul model, ce qui signifie qu'il ne tentera que l'inférence sur l'appareil ou dans le cloud. Toutefois, pour une expérience hybride, vous devez créer un HybridModel et définir les modèles primary et secondary.

    Pour en savoir plus sur le comportement des "modes d'inférence" (ordre des tentatives d'inférence), consultez Options de configuration.

L'exemple suivant montre comment tenter d'abord l'inférence sur l'appareil, mais autoriser le retour au modèle hébergé dans le cloud :

// Initialize the Gemini Developer API backend service
let ai = FirebaseAI.firebaseAI(backend: .googleAI())

// Initialize a cloud model that supports your use case
let cloudModel = ai.geminiModel(name: "GEMINI_MODEL_NAME")
// Initialize an on-device model that supports your use case
let systemModel = FirebaseAI.SystemLanguageModel.default

// Create a Hybrid Model
// Provide your preferred model as `primary` and your fallback model as `secondary`
// In this example, attempt to use on-device model; otherwise, fall back to cloud.
let hybridModel = HybridModel(
  primary: systemModel,
  secondary: cloudModel
)

// Create a GenerativeModelSession with the HybridModel created earlier.
let session = firebaseAI.generativeModelSession(
  model: hybridModel,
)

Étape 4 : Envoyer une requête de prompt à un modèle

Cette section vous explique comment :

Générer du texte à partir d'une entrée textuelle

Avant d'essayer cet exemple, assurez-vous d'avoir terminé la section Premiers pas de ce guide.

Pour générer du texte à partir d'un prompt contenant du texte, utilisez respond(to:) comme suit :

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To generate text output, call `respond(to:)` with the text input
let response = try await session.respond(to: prompt)
print(response.content)

Diffuser du texte à partir d'une entrée textuelle uniquement

Avant d'essayer cet exemple, assurez-vous d'avoir terminé la section Premiers pas de ce guide.

Vous pouvez obtenir des interactions plus rapides en n'attendant pas le résultat complet de la génération du modèle et en utilisant plutôt le streaming pour gérer les résultats partiels. Pour diffuser en continu le texte généré à partir d'un prompt contenant du texte, utilisez streamResponse(to:) comme suit :

// Imports + initialization of Gemini API backend service + creation of model session

// Provide a prompt that contains text
let prompt = "Write a story about a magic backpack."

// To stream generated text output, call `streamResponse(to:)` with the text input
let stream = session.streamResponse(to: prompt)
for try await snapshot in stream {
  print(snapshot.content)
}

Qu'est-ce que tu sais faire d'autre ?

Vous pouvez utiliser différentes options et fonctionnalités de configuration supplémentaires pour vos expériences hybrides :

Fonctionnalités non encore disponibles pour l'inférence hybride ou sur l'appareil

Comme il s'agit d'une version expérimentale, toutes les fonctionnalités de Firebase AI Logic ou des modèles hébergés dans le cloud ne sont pas prises en charge.

  • Les éléments suivants ne sont pas compatibles avec les implémentations hybrides ou sur l'appareil : les modèles Imagen, l'API Gemini Live et les modèles d'invite. De plus, il ne faut pas se fier au nombre de jetons, car il diffère entre les modèles hébergés dans le cloud et ceux sur l'appareil. Il n'y a donc pas de solution de repli intuitive.

  • Les fonctionnalités suivantes ne sont pas encore compatibles avec l'inférence sur l'appareil : Si vous souhaitez utiliser l'une de ces fonctionnalités, nous vous recommandons d'utiliser uniquement un modèle hébergé dans le cloud pour une expérience plus cohérente.

    • Générer du texte à partir d'entrées multimodales, comme des images, des fichiers audio, des vidéos et des documents (PDF)

    • Générer des contenus multimédias, comme des images, des contenus audio ou des vidéos

    • Envoi de requêtes dépassant 4 096 jetons (soit environ 3 000 mots en anglais).

    • Fournir au modèle sur l'appareil des outils intégrés pour l'aider à générer sa réponse (comme l'exécution de code, le contexte d'URL et l'ancrage avec la recherche Google)

  • La surveillance de l'IA dans la console Firebase n'affiche pas de données pour l'inférence sur l'appareil (y compris les journaux sur l'appareil). Toutefois, toute inférence qui utilise un modèle hébergé dans le cloud peut être surveillée comme les autres inférences via Firebase AI Logic.

Autres limites

En plus de ce qui précède, l'inférence sur l'appareil présente les limites suivantes :


Envoyer des commentaires sur votre expérience avec Firebase AI Logic