Firebase Genkit

Firebase Genkit to platforma open source, która pomaga w tworzeniu, wdrażaniu i monitorowaniu aplikacji opartych na AI gotowych do produkcji.

Logo Genkit

Genkit został zaprojektowany z myślą o deweloperach aplikacji. Ma Ci pomóc łatwo zintegrować zaawansowane funkcje AI z aplikacjami o znanych wzorcach i wzorcach. Opracowuje go ten sam zespół, który odpowiada za Firebase, wykorzystując nasze doświadczenie w tworzeniu narzędzi używanych przez miliony deweloperów na całym świecie.

Użyj Genkit, aby tworzyć aplikacje do generowania niestandardowych treści, korzystania z wyszukiwania semantycznego, obsługi nieuporządkowanych danych wejściowych, odpowiadania na pytania za pomocą firmowych baz danych, samodzielnego podejmowania decyzji, administrowania wywołaniami narzędzi i nie tylko.

Genkit obsługuje obecnie programowanie po stronie serwera w języku JavaScript/TypeScript (Node.js) z obsługą języka Go w trakcie aktywnego programowania.

Możesz śledzić jej rozwój lub dodawać własne materiały do repozytorium GitHub.

Najważniejsze funkcje

Genkit pomoże Ci na każdym etapie rozwoju AI – od tworzenia prototypu po monitorowanie w środowisku produkcyjnym. Masz więc wiele do omówienia.

Na początek przedstawiamy 10 najważniejszych funkcji Genkit, które mogą Ci się spodobać:

1. Wiele modeli, jeden interfejs

Genkit zawiera wtyczki, które od razu dają Ci dostęp do popularnych modeli, oraz elastyczną abstrakcję modeli, która ułatwia integrację dowolnego interfejsu API modelu i używanie modeli obsługiwanych przez społeczność. Aby wypróbować nowy model, wystarczy zmienić 1 argument, ale każdy model może określać konfiguracje niestandardowe.

import { geminiPro } from '@genkit-ai/vertexai';
import { ollama } from 'genkitx-ollama';
import { generate } from '@genkit-ai/ai';

function flipACoin(a, b) {
 return Math.random() > 0.5 ? a : b;
}

const result = await generate({
 model: flipACoin(geminiPro, 'ollama/gemma'),
 config: { temperature: 0.3, maxOutputTokens: 200 },
 prompt: 'What makes you the best LLM out there?',
});

console.log(result.text());

2. Uporządkowane dane wyjściowe

Generowanie danych o silnym typie za pomocą Genkit przy użyciu schematu Zod. Może to pomóc w analizowaniu nieuporządkowanego tekstu, generowaniu kreatywnych treści, wybieraniu zadań i wysyłaniu wyników z powrotem do aplikacji w postaci uporządkowanych obiektów.

import { generate } from "@genkit-ai/ai";
import { geminiPro } from "@genkit-ai/vertexai";
import { z } from "zod";

const CreatureSchema = z.object({
 name: z.string().describe('the name of the creature'),
 hitPoints: z.number().describe('hit points, between 5 and 100'),
 attacks: z.array(z.object({
  name: z.string(),
  damage: z.number().describe('amount of damage, between 2 and 25'),
 })).describe('3 attacks the creature can use')
});

const createCreature = defineFlow({
  name: "createCreature",
  inputSchema: z.string(),
  outputSchema: CreatureSchema,
 },
 (habitat) => {
  const result = await generate({
   model: geminiPro,
   prompt: `You are a brilliant RPG designer. Generate a creature that lives in ${habitat}.`,
   output: {schema: CreatureSchema}
  });
  // strongly typed and ready to go
  return result.output();
 }
)

console.log(await createCreature("a developer conference"));

3. Multimodalne, multimedialne

Genkit to popularny format treści, który obsługuje mieszankę tekstu, danych i dowolnych multimediów. Dzięki temu możesz używać Genkit na potrzeby modeli wykonujących dowolne zadania generatywne (takie jak generowanie obrazów), a nie tylko modele LLM.

import { imagen2, geminiProVision } from '@genkit-ai/vertexai';
import { generate } from '@genkit-ai/ai';

const imageResult = await generate({
 model: imagen2,
 prompt: 'Generate an image of a very specific historical time and place.',
});
const generatedImage = imageResult.media();

const descriptionResult = await generate({
 model: geminiProVision,
 prompt: [
  {
   text: 'What is the historical time and place represented in this picture?',
  },
  { media: generatedImage },
 ],
});
console.log(descriptionResult.text());

4. Daj narzędzia LLM

Genkit ułatwia wykonywanie wywołań funkcji za pomocą LLM za pomocą narzędzi. Narzędzia umożliwiają AI pobieranie danych, wyświetlanie interfejsu użytkownika, zapisywanie danych w bazie danych i wykonywanie innych działań, które możesz zakodować.

import { generate, defineTool } from '@genkit-ai/ai';
import { geminiPro } from '@genkit-ai/vertexai';
import { z } from 'zod';

const createReminder = defineTool(
 {
  name: 'createReminder',
  description: 'Use this to create reminders for things in the future',
  inputSchema: z.object({
   time: z
    .string()
    .describe('ISO timestamp string, e.g. 2024-04-03T12:23:00Z'),
   reminder: z.string().describe('the content of the reminder'),
  }),
  outputSchema: z.number().describe('the ID of the created reminder'),
 },
 (reminder) => db.reminders.create(reminder)
);

const searchNotes = defineTool(
 {
  name: 'searchNotes',
  description: "Use this to search the user's notes for people or phrases",
  inputSchema: z.string().describe('the search query'),
  outputSchema: z.object({ notes: z.array(NoteSchema) }),
 },
 (query) => db.notes.search(query)
);

const result = await generate({
 model: geminiPro,
 tools: [createReminder, searchNotes],
 prompt: `
 You are a note-taking assistant. Using the tools available, try to answer the provided query.
 If you create a reminder, describe in text the reminder you created as a response.

 Query: I took a note about a meeting with Anna - can you set a reminder for the time?
 `,
});
console.log(result.text());

5. Zarządzanie promptami za pomocą Dotprompt

Inżynieria to nie tylko wprowadzanie poprawek w tekście. Na jakość danych wyjściowych wpływa używany model, dostarczone parametry i formatowany format. Genkit zawiera Dotprompt – format pliku promptów, który pozwala umieścić wszystko w jednym pliku, aby ułatwić testowanie i uporządkowanie.

---
model: vertexai/gemini-1.0-pro
config:
 temperature: 0.9
input:
 schema:
  properties:
   location: {type: string}
   style: {type: string}
   name: {type: string}
  required: [location]
 default:
  location: a restaurant
---

You are the world's most welcoming AI assistant and are currently working at {{location}}.

Greet a guest{{#if name}} named {{name}}{{/if}}{{#if style}} in the style of {{style}}{{/if}}.

6. Uruchamiaj przepływy lokalnie

Generatywna AI cechuje się dużą zmiennością wyników, dlatego eksperymentowanie jest niezwykle ważne. Lokalny interfejs programisty Genkit umożliwia interakcję z niezbędnymi komponentami AI, takimi jak modele i moduły pobierania, oraz ręczne testowanie kompleksowych procesów z uwzględnieniem całego napisanego przez Ciebie niestandardowego kodu.

7. Sprawdź logi czasu

Debugowanie złożonych, wieloetapowych przepływów pracy za pomocą AI może być trudne ze względu na losowe i ukryte procesy. Genkit udostępnia inspektora śledzenia w interfejsie programisty, który umożliwia badanie logów czasu w przypadku każdego wywołania modelu i kroku w procesie. Może wyświetlać ślady produkcji, a nawet renderować obrazy.

8. Otwarte i elastyczne rozwiązania

Ekosystem AI rozwija się szybciej niż jakikolwiek zespół. Genkit ma otwarty model wtyczki, który udostępnia gotowe integracje z nowymi modelami, modułami pobierania i innymi elementami. Zespół Genkit utrzymuje niewielki zestaw oficjalnych wtyczek, ale każdy może publikować własne wtyczki Genkit w NPM.

Nie możesz znaleźć wtyczki do integracji, której potrzebujesz? Nie ma problemu. Abstrakcje Genkit są elastyczne i ułatwiają tworzenie niestandardowych komponentów zintegrowanych z platformą, takich jak ten niestandardowy moduł pobierania Firestore:

import { embed } from '@genkit-ai/ai/embedder';
import { Document, defineRetriever } from '@genkit-ai/ai/retriever';
import { textEmbeddingGecko } from '@genkit-ai/vertexai';
import {
 FieldValue,
 VectorQuery,
 VectorQuerySnapshot,
} from '@google-cloud/firestore';
import { Firestore } from 'firebase-admin/firestore';
import * as z from 'zod';
import { augmentedPrompt } from './prompt';

const QueryOptions = z.object({
 k: z.number().optional(),
});

const firestoreArtifactsRetriever = defineRetriever(
 {
  name: 'firestore/artifacts',
  configSchema: QueryOptions,
 },
 async (input, options) => {
  const embedding = await embed({
   embedder: textEmbeddingGecko,
   content: input,
  });

  const db = new Firestore();
  const coll = db.collection('vectors' /* your collection name */);

  const vectorQuery: VectorQuery = coll.findNearest(
   'embedding' /* the name of the field that contains the vector */,
   FieldValue.vector(embedding),
   {
    limit: options.k ?? 3,
    distanceMeasure: 'COSINE',
   }
  );

  const vectorQuerySnapshot: VectorQuerySnapshot = await vectorQuery.get();
  return {
   documents: vectorQuerySnapshot.docs.map((doc) =>
    // doc.data() represents the Firestore document. You may process
    // it as needed to generate a Genkit document object, depending on your
    // storage format.
    Document.fromText(doc.data().content.text)
   ),
  };
 }
);

9. Stworzone do produkcji

Łatwo wdrażaj swoje przepływy na dowolnej platformie, która może obsługiwać aplikację Express.js. Genkit jest w pełni wyposażony w platformę OpenTelemetry i niestandardowe metadane, aby monitorować produkcję na potrzeby korporacji.

Istnieją też oficjalne wtyczki do Google Cloud i Firebase, które ułatwiają eksportowanie danych do pakietu operacyjnego Google Cloud i integrację z usługami Firebase, takimi jak Cloud Functions dla Firebase, Uwierzytelnianie Firebase, Sprawdzanie aplikacji i Firestore.

Zrzut ekranu z Cloud Trace

10. Autoryzacja i obsługa zabezpieczeń

Przy tworzeniu aplikacji dostępnych publicznie należy chronić dane przechowywane w Twoim systemie. W przypadku LLM należy zachować szczególną ostrożność, aby mieć pewność, że model uzyskuje dostęp tylko do danych, na których powinien mieć dostęp, wywołania narzędzi są prawidłowo ograniczone do użytkownika wywołującego LLM, a przepływ jest wywoływany tylko przez zweryfikowane aplikacje klienckie.

Genkit zapewnia mechanizmy zarządzania zasadami autoryzacji i kontekstami.

import { defineFlow, runFlow } from '@genkit-ai/flow';

export const selfSummaryFlow = defineFlow(
 {
  name: 'selfSummaryFlow',
  inputSchema: z.object({uid: z.string()}),
  outputSchema: z.string(),
  authPolicy: (auth, input) => {
   if (!auth) {
    throw new Error('Authorization required.');
   }
   if (input.uid !== auth.uid) {
    throw new Error('You may only summarize your own profile data.');
   }
  }
 },
 async (input) => { ... });

Integracje

Genkit zapewnia integrację z modelami AI, bazami danych wektorowych, platformami telemetrycznymi i nie tylko za pomocą systemu wtyczek. Tymi wtyczkami zarządza zespół Genkit:

Oficjalne wtyczki
googleai Modele generatywne: Gemini Pro, Gemini 1.5 Pro, Gemini Pro Vision
Umieszczanie modeli: wstawianie tekstu gekonu
vertexai Modele generatywne: Gemini Pro, Gemini Pro Vision, Gemini 1.5 Flash, Gemini 1.5 Pro, Imagen2, Anthropic Claude 3
Umieszczanie modeli: wstawianie tekstu gekonu
Ewaluatory: ocena Vertex AI
ollama Modele generatywne: wiele modeli lokalnych, w tym Gemma, Llama 3 i Mistral.
chroma Baza danych wektorów: ChromaDB
pinecone Baza danych wektorowych: Pinecone
google-cloud Narzędzia do monitorowania: Google Cloud Trace, Google Cloud Logging
firebase Wdrożenie w chmurze: Cloud Functions, Uwierzytelnianie Firebase, Sprawdzanie aplikacji
Baza danych wektorowych: magazyn wektorów Cloud Firestore
langchain Używaj sieci i narzędzi LangChain w procesach Genkit

Pierwsze kroki

Przeczytaj przewodnik dla początkujących, aby dowiedzieć się, jak zainstalować Genkit i uruchomić pierwszy przepływ AI.