Вы можете развернуть потоки Firebase Genkit как веб-сервисы, используя любой сервис, на котором может размещаться двоичный файл Go. На этой странице в качестве примера описывается общий процесс развертывания потока образцов по умолчанию и указывается, где необходимо предпринять действия, специфичные для поставщика.
Создайте каталог для примера проекта Genkit:
mkdir -p ~/tmp/genkit-cloud-project
cd ~/tmp/genkit-cloud-project
Если вы собираетесь использовать IDE, откройте ее в этом каталоге.
Инициализируйте модуль Go в каталоге вашего проекта:
go mod init example/cloudrun
Инициализируйте Genkit в своем проекте:
genkit init
Выберите поставщика модели, которого вы хотите использовать.
Примите значения по умолчанию для остальных запросов. Инструмент
genkit
создаст образец исходного файла, который поможет вам приступить к разработке собственных потоков ИИ. Однако в оставшейся части этого руководства вы просто развернете пример потока.Отредактируйте файл примера (
main.go
илиgenkit.go
), чтобы явно указать порт, который должен прослушивать сервер потока:if err := genkit.Init(ctx, &genkit.Options{FlowAddr: ":3400"}, // Add this parameter. ); err != nil { log.Fatal(err) }
Если ваш провайдер требует, чтобы вы прослушивали определенный порт, обязательно настройте Genkit соответствующим образом.
Внедрите некоторую форму аутентификации и авторизации для ограничения доступа к потокам, которые вы планируете развернуть.
Поскольку большинство генеративных сервисов ИИ являются платными, вы, скорее всего, не захотите предоставлять открытый доступ к любым конечным точкам, которые их вызывают. Некоторые службы хостинга предоставляют уровень аутентификации в качестве интерфейса для развернутых на них приложений, который вы можете использовать для этой цели.
Сделайте учетные данные API доступными для развернутой функции. Выполните одно из следующих действий в зависимости от выбранного вами поставщика модели:
Близнецы (ИИ Google)
Убедитесь, что Google AI доступен в вашем регионе .
Создайте ключ API для Gemini API с помощью Google AI Studio.
Сделайте ключ API доступным в развернутой среде.
Большинство хостов приложений предоставляют некоторую систему для безопасной обработки секретов, таких как ключи API. Часто эти секреты доступны вашему приложению в виде переменных среды. Если вы можете назначить свой ключ API переменной
GOOGLE_GENAI_API_KEY
, Genkit будет использовать его автоматически. В противном случае вам необходимо изменить вызовgoogleai.Init()
, чтобы явно установить ключ. (Но не встраивайте ключ непосредственно в код! Используйте средства управления секретами, предоставляемые вашим хостинг-провайдером.)
Близнецы (Vertex AI)
В облачной консоли включите API Vertex AI для своего проекта.
На странице IAM создайте учетную запись службы для доступа к API Vertex AI, если у вас ее еще нет.
Предоставьте учетной записи роль пользователя Vertex AI .
Настройте учетные данные приложения по умолчанию в среде хостинга.
Настройте плагин, указав идентификатор своего проекта Google Cloud и местоположение Vertex AI API, которое вы хотите использовать. Вы можете сделать это либо установив переменные среды
GCLOUD_PROJECT
иGCLOUD_LOCATION
в среде вашего хостинга, либо с помощью вызоваvertexai.Init()
.
Единственный секрет, который вам нужно настроить для этого руководства, — это поставщик модели, но в целом вы должны сделать что-то подобное для каждой службы, которую использует ваш поток.
Необязательно : попробуйте свой алгоритм в пользовательском интерфейсе разработчика:
Настройте локальную среду для выбранного вами поставщика модели:
Близнецы (ИИ Google)
export GOOGLE_GENAI_API_KEY=<your API key>
Близнецы (Vertex AI)
export GCLOUD_PROJECT=<your project ID>
export GCLOUD_LOCATION=us-central1
gcloud auth application-default login
Запустите пользовательский интерфейс:
genkit start
В пользовательском интерфейсе разработчика (http://localhost:4000/) запустите поток:
Нажмите менюПоток предложений .
На вкладке «Ввод JSON» укажите тему модели:
"banana"
Нажмите «Выполнить» .
Если пока все работает так, как ожидалось, вы можете создать и развернуть поток с помощью инструментов вашего провайдера.