The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Tworzenie hybrydowych funkcji w aplikacjach internetowych za pomocą modeli na urządzeniu i w chmurze

Twórz aplikacje internetowe i funkcje oparte na AI z wnioskowaniem hybrydowym za pomocą Firebase AI Logic. Wnioskowanie hybrydowe umożliwia uruchamianie wnioskowania za pomocą modeli na urządzeniu, gdy są one dostępne, i płynne przełączanie się na modele hostowane w chmurze w przeciwnym razie (i odwrotnie).

Na tej stronie dowiesz się, jak zacząć korzystać z pakietu SDK klienta. Po zakończeniu standardowej konfiguracji zapoznaj się z dodatkowymi opcjami konfiguracji i funkcjami (takimi jak uporządkowane dane wyjściowe).

Pamiętaj, że wnioskowanie na urządzeniu jest obsługiwane w przypadku aplikacji internetowych działających w Chrome na komputerze.

Przejdź do przykładów kodu

Zalecane przypadki użycia i obsługiwane funkcje

Zalecane przypadki użycia:

Korzystanie z modelu na urządzeniu do wnioskowania zapewnia:
- większą prywatność,
- kontekst lokalny,
- wnioskowanie bezpłatne,
- funkcje offline.
Korzystanie z funkcji hybrydowych zapewnia:
- dotarcie do 100% odbiorców niezależnie od dostępności modelu na urządzeniu lub połączenia z internetem.

Obsługiwane funkcje i możliwości wnioskowania na urządzeniu:

Wnioskowanie na urządzeniu obsługuje tylko generowanie tekstu w ramach jednej tury (nie czatu) z danymi wyjściowymi przesyłanymi strumieniowo lub nieprzesyłanymi strumieniowo. Obsługuje te funkcje generowania tekstu:

Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst.
Generowanie tekstu na podstawie danych wejściowych zawierających tekst i obraz, w szczególności obrazów w formatach JPEG i PNG.

Możesz też generować uporządkowane dane wyjściowe, w tym JSON i wyliczenia.

Zanim zaczniesz

Pamiętaj o tych kwestiach:

Wnioskowanie za pomocą modelu na urządzeniu korzysta z interfejsu Prompt API w Chrome; natomiast wnioskowanie za pomocą modelu hostowanego w chmurze korzysta z wybranego Gemini API dostawcy (interfejsu Gemini Developer API lub Vertex AI Gemini API).
Na tej stronie dowiesz się, jak zacząć tworzyć aplikacje za pomocą hosta lokalnego (więcej informacji o korzystaniu z interfejsów API na hoście lokalnym znajdziesz w dokumentacji Chrome).

Po zakończeniu standardowej konfiguracji zapoznaj się z dodatkowymi opcjami konfiguracji i funkcjami (takimi jak uporządkowane dane wyjściowe).
Gdy zaimplementujesz funkcję, możesz umożliwić użytkownikom wypróbowanie jej w swojej aplikacji.

Pierwsze kroki na hoście lokalnym

Te instrukcje opisują ogólną konfigurację wymaganą w przypadku każdego obsługiwanego żądania prompta, które chcesz wysłać.

Krok 1. Skonfiguruj Chrome i interfejs Prompt API na potrzeby wnioskowania na urządzeniu

Upewnij się, że używasz najnowszej wersji Chrome. Zaktualizuj przeglądarkę w chrome://settings/help.
Wnioskowanie na urządzeniu jest dostępne w Chrome w wersji 139 lub nowszej.
Włącz model multimodalny na urządzeniu, ustawiając tę flagę na Włączone:
- chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
Uruchom ponownie Chrome.
(Opcjonalnie) Pobierz model na urządzeniu przed pierwszym żądaniem.

Interfejs Prompt API jest wbudowany w Chrome, ale model na urządzeniu nie jest domyślnie dostępny. Jeśli nie pobierzesz modelu przed pierwszym żądaniem wnioskowania na urządzeniu, żądanie automatycznie rozpocznie pobieranie modelu w tle.

Uwaga:pobieranie modelu może potrwać kilka minut, więc czekanie na automatyczne pobranie przy pierwszym żądaniu może znacznie opóźnić otrzymanie odpowiedzi na to żądanie.
Wyświetl instrukcje pobierania modelu na urządzeniu
1. Otwórz Narzędzia dla deweloperów > Konsola.
2. Wykonaj zapytanie:
```
await LanguageModel.availability();
```
3. Upewnij się, że dane wyjściowe to available, downloading lub downloadable.
4. Jeśli dane wyjściowe to downloadable, rozpocznij pobieranie modelu, wykonując to polecenie:
```
await LanguageModel.create();
```
5. Możesz użyć tego wywołania zwrotnego monitor, aby nasłuchiwać postępów pobierania i upewnić się, że model jest available przed wysłaniem żądań:
```
const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});
```

Krok 2. Skonfiguruj projekt w Firebase i połącz aplikację z Firebase

Zaloguj się w konsoli Firebase, i wybierz projekt w Firebase.
Nie masz jeszcze projektu w Firebase?

Jeśli nie masz jeszcze projektu w Firebase, kliknij przycisk, aby utworzyć nowy projekt w Firebase, a następnie użyj jednej z tych opcji:
- Opcja 1. Utwórz całkowicie nowy projekt w Firebase (i powiązany z nim Google Cloud projekt) – w pierwszym kroku przepływu pracy wpisz nową nazwę projektu.
- Opcja 2: „Dodaj Firebase” do istniejącego projektu Google Cloud – kliknij Dodaj Firebase do projektu Google Cloud (u dołu strony). W pierwszym kroku procesu zacznij wpisywać nazwę projektu istniejącego projektu, a następnie wybierz projekt z wyświetlonej listy.
Aby utworzyć projekt Firebase, wykonaj pozostałe kroki procesu wyświetlanego na ekranie. Pamiętaj, że gdy pojawi się prośba, nie musisz konfigurować Google Analytics aby korzystać z Firebase AI Logic pakietów SDK.
W konsoli Firebase kliknij Usługi AI > AI Logic.
Kliknij Rozpocznij , aby uruchomić proces z przewodnikiem, który pomoże Ci skonfigurować wymagane interfejsy API i zasoby w projekcie.
Skonfiguruj projekt tak, aby korzystał z dostawcy „Gemini API”.

Zalecamy rozpoczęcie korzystania z Gemini Developer API. W każdej chwili możesz skonfigurować Vertex AI Gemini API (i wymagane do niego rozliczenia).

W przypadku Gemini Developer API konsola włączy wymagane interfejsy API i utworzy klucz interfejsu Gemini API w Twoim projekcie.
Nie dodawaj tego klucza interfejsu Gemini API do kodu aplikacji. Więcej informacji
Jeśli w procesie w konsoli pojawi się prośba, postępuj zgodnie z instrukcjami wyświetlanymi na ekranie, aby zarejestrować aplikację i połączyć ją z Firebase.
Aby dodać pakiet SDK do aplikacji, przejdź do następnego kroku w tym przewodniku.

Krok 3. Dodaj pakiet SDK

Biblioteka Firebase zapewnia dostęp do interfejsów API do interakcji z modelami generatywnymi. Biblioteka jest częścią pakietu Firebase JavaScript SDK dla aplikacji internetowych.

Zainstaluj pakiet Firebase JS SDK dla aplikacji internetowych za pomocą npm:
```
npm install firebase
```

Zainicjuj Firebase w aplikacji:

import { initializeApp } from "firebase/app";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

Krok 4. Zainicjuj usługę i utwórz instancję modelu

Kliknij swojego dostawcę Gemini API, aby wyświetlić na tej stronie treści i kod dotyczące tego dostawcy.

Zanim wyślesz do modelu żądanie prompta, skonfiguruj te elementy:

Zainicjuj usługę dla wybranego dostawcy interfejsu API.
Utwórz instancję GenerativeModel. Pamiętaj, aby wykonać te czynności:
1. Wywołaj getGenerativeModel po interakcji użytkownika (np. kliknięciu przycisku). Jest to warunek wstępny dla inferenceMode.
2. Ustaw mode na jedną z tych wartości:
  - PREFER_ON_DEVICE: użyj modelu na urządzeniu, jeśli jest dostępny; w przeciwnym razie przejdź na model hostowany w chmurze.
  - ONLY_ON_DEVICE: użyj modelu na urządzeniu, jeśli jest dostępny; w przeciwnym razie zgłoś wyjątek.
  - PREFER_IN_CLOUD: użyj modelu hostowanego w chmurze, jeśli jest dostępny; w przeciwnym razie przejdź na model na urządzeniu.
  - ONLY_IN_CLOUD: użyj modelu hostowanego w chmurze, jeśli jest dostępny; w przeciwnym razie zgłoś wyjątek.
  Uwaga: w przypadku żądań wysyłanych do modelu na urządzeniu upewnij się, że jest on obsługiwany przez wnioskowanie na urządzeniu.
  W przypadku żądań wysyłanych poza urządzenie musi ono być online. Domyślny model hostowany w chmurze to gemini-2.5-flash-lite, ale możesz go zastąpić.

import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend, InferenceMode } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create a `GenerativeModel` instance
// Call `getGenerativeModel` after or on an end-user interaction
// Set the mode (for example, use the on-device model if it's available)
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });

Krok 5. Wyślij do modelu żądanie prompta

W tej sekcji dowiesz się, jak wysyłać różne typy danych wejściowych, aby generować różne typy danych wyjściowych, w tym:

generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst;
generowanie tekstu na podstawie danych wejściowych zawierających tekst i obraz (multimodalnych).

Jeśli chcesz generować uporządkowane dane wyjściowe (np. JSON lub wyliczenia), to użyj jednego z tych przykładów „generowania tekstu” i dodatkowo skonfiguruj model tak, aby odpowiadał zgodnie z podanym schematem.

Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst

Zanim wypróbujesz ten przykład, upewnij się, że masz za sobą sekcję Pierwsze kroki w tym przewodniku.

Za pomocą generateContent() możesz generować tekst na podstawie prompta zawierającego tekst:

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Wrap in an async function so you can use await
async function run() {
  // Provide a prompt that contains text
  const prompt = "Write a story about a magic backpack."

  // To generate text output, call `generateContent` with the text input
  const result = await model.generateContent(prompt);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

Pamiętaj, że Firebase AI Logic obsługuje też przesyłanie strumieniowe odpowiedzi tekstowych za pomocą generateContentStream (zamiast generateContent).

Generowanie tekstu na podstawie danych wejściowych zawierających tekst i obraz (multimodalnych)

Zanim wypróbujesz ten przykład, upewnij się, że masz za sobą sekcję Pierwsze kroki w tym przewodniku.

Za pomocą generateContent() możesz generować tekst na podstawie prompta zawierającego tekst i pliki graficzne – podaj każdego pliku wejściowego mimeType i sam plik.

W przypadku wnioskowania na urządzeniu obsługiwane formaty obrazów wejściowych to PNG i JPEG.

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Converts a File object to a Part object.
async function fileToGenerativePart(file) {
  const base64EncodedDataPromise = new Promise((resolve) => {
    const reader = new FileReader();
    reader.onloadend = () => resolve(reader.result.split(',')[1]);
    reader.readAsDataURL(file);
  });
  return {
    inlineData: { data: await base64EncodedDataPromise, mimeType: file.type },
  };
}

async function run() {
  // Provide a text prompt to include with the image
  const prompt = "Write a poem about this picture:";

  const fileInputEl = document.querySelector("input[type=file]");
  const imagePart = await fileToGenerativePart(fileInputEl.files[0]);

  // To generate text output, call `generateContent` with the text and image
  const result = await model.generateContent([prompt, imagePart]);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

Pamiętaj, że Firebase AI Logic obsługuje też przesyłanie strumieniowe odpowiedzi tekstowych za pomocą generateContentStream (zamiast generateContent).

Umożliwianie użytkownikom wypróbowania funkcji

Aby użytkownicy mogli wypróbować Twoją funkcję w aplikacji, musisz zarejestrować się w programie Chrome Origin Trials. Pamiętaj, że te okresy próbne mają ograniczony czas trwania i zakres użycia.

Zarejestruj się w programie Chrome Origin Trial dla interfejsu Prompt API. Otrzymasz token.
Podaj token na każdej stronie internetowej, na której chcesz włączyć funkcję w wersji próbnej. Użyj jednej z tych opcji:
- Podaj token jako metatag w tagu <head>: <meta http-equiv="origin-trial" content="TOKEN">
- Podaj token jako nagłówek HTTP: Origin-Trial: TOKEN
- Podaj token programowo.

Co jeszcze możesz zrobić?

W przypadku funkcji hybrydowych możesz używać różnych dodatkowych opcji konfiguracji i funkcji:

Funkcje, które nie są jeszcze dostępne w przypadku wnioskowania na urządzeniu

W wersji zapoznawczej nie wszystkie funkcje pakietu Web SDK są dostępne w przypadku wnioskowania na urządzeniu. Te funkcje nie są jeszcze obsługiwane w przypadku wnioskowania na urządzeniu (ale zwykle są dostępne w przypadku wnioskowania w chmurze).

Generowanie tekstu na podstawie plików graficznych w formatach innych niż JPEG i PNG.
- Można przejść na model hostowany w chmurze, ale tryb ONLY_ON_DEVICE spowoduje zgłoszenie błędu.
Generowanie tekstu na podstawie danych wejściowych audio, wideo i dokumentów (np. PDF).
- Można przejść na model hostowany w chmurze, ale tryb ONLY_ON_DEVICE spowoduje zgłoszenie błędu.
Generowanie obrazów za pomocą modeli Gemini lub Imagen.
- Można przejść na model hostowany w chmurze, ale tryb ONLY_ON_DEVICE spowoduje zgłoszenie błędu.
Udostępnianie plików za pomocą adresów URL w żądaniach multimodalnych. Musisz udostępniać pliki jako dane wbudowane w modelach na urządzeniu.
Czat wieloetapowy.
- Można przejść na model hostowany w chmurze, ale tryb ONLY_ON_DEVICE spowoduje zgłoszenie błędu.
Dwukierunkowe przesyłanie strumieniowe za pomocą interfejsu Gemini Live API.
Udostępnianie modelowi narzędzi , które pomogą mu generować odpowiedzi (np. wywoływanie funkcji, wykonywanie kodu, kontekst adresu URL, Grounding z Google Search, i Grounding z Google Maps).
Zliczanie tokenów.
- Zawsze zgłasza błąd. Liczba tokenów będzie się różnić w zależności od modelu hostowanego w chmurze i modelu na urządzeniu, więc nie ma intuicyjnego przejścia rezerwowego.
Monitorowanie wykorzystania AI w konsoli Firebase w przypadku wnioskowania na urządzeniu.
- Pamiętaj, że każde wnioskowanie za pomocą modeli hostowanych w chmurze można monitorować tak samo jak inne wnioskowanie za pomocą Firebase AI Logic client SDK dla aplikacji internetowych.

Prześlij opinię o korzystaniu z Firebase AI Logic