Vertex AI로 벡터 유사성 검색 실행

Firebase Data Connect의 벡터 유사성 검색을 소개합니다. Firebase Data Connect의 벡터 유사성 검색은 Google Vertex AI와 통합되는 시맨틱 검색의 Firebase 구현입니다.

이 기능의 핵심은 텍스트 또는 미디어의 시맨틱 의미를 나타내는 부동 소수점 수 배열인 벡터 임베딩입니다. 입력 벡터 임베딩을 사용하여 최근접 이웃 검색을 실행하면 의미상 유사한 모든 콘텐츠를 찾을 수 있습니다. Data Connect는 이 기능에 PostgreSQL의 pgvector 확장 프로그램을 사용합니다.

이 강력한 시맨틱 검색은 추천 엔진 및 검색엔진과 같은 사용 사례를 지원할 수 있습니다. 또한 생성형 AI 흐름의 검색 보강 생성에서 중요한 구성요소입니다. Vertex AI 문서에서 자세히 알아보세요.

Vertex AI의 Embeddings API를 사용하여 벡터 임베딩을 자동으로 생성하는 Data Connect의 내장 지원을 사용하거나 이 API를 사용하여 수동으로 생성할 수 있습니다.

기본 요건

  • 프로젝트에 Data Connect를 설정합니다.

  • Vertex AI API를 사용 설정합니다.

설정

로컬 개발 흐름 (웹, Kotlin Android 또는 iOS 개발자의 경우) 또는 IDX 흐름 (웹 개발자의 경우) 중에서 선택할 수 있습니다. 개발에는 로컬 데이터베이스 또는 프로덕션 Data Connect 프로젝트와 PostgreSQL용 Cloud SQL 인스턴스를 사용할 수 있습니다.

이 안내에서는 빠른 시작 가이드에 따라 Data Connect 프로젝트를 만들었다고 가정합니다.

로컬 PostgreSQL과 통합

  1. 로컬 PostgreSQL 인스턴스를 설정합니다.
  2. Vertex AI 사용자 IAM 역할부여합니다.
  3. 환경에서 Google Cloud 애플리케이션 기본 사용자 인증 정보를 설정합니다.
  4. 로컬 PostgreSQL 인스턴스에 pgvector 확장 프로그램을 설치합니다.
  5. pgvector 저장소 안내에 따라 CREATE EXTENSION vector를 사용하여 확장 프로그램을 사용 설정합니다.

IDX와 통합

  1. 데이터 연결 템플릿을 사용하여 IDX 워크스페이스를 설정합니다.
  2. Vertex AI 사용자 IAM 역할부여합니다.
  3. pgvector 저장소 안내에 따라 CREATE EXTENSION vector를 사용하여 확장 프로그램을 사용 설정합니다.

스키마 설계

벡터 검색을 실행하려면 스키마에 Vector 유형의 새 필드를 추가합니다. 예를 들어 영화 설명을 사용하여 의미 검색을 실행하려면 영화 설명과 연결된 벡터 임베딩을 보유할 필드를 추가합니다. 이 스키마에서는 description 필드의 벡터 임베딩을 저장하기 위해 descriptionEmbedding가 추가됩니다.

type Movie @table {
 id: ID! @col(name: "movie_id") @default(id: ID! @col(name: "movie_id") @default(expr: "uuidV4()")
 title: String!
 description: String
 descriptionEmbedding: Vector! @col(size:768)
 // ...
}

임베딩 생성 및 검색

Data Connect_embed 서버 값을 사용하여 벡터 임베딩을 통합적으로 지원합니다. 이렇게 하면 Data Connect가 내부적으로 Vertex AI의 Embedding API를 호출하여 벡터 임베딩을 생성하도록 지시합니다. _embed 서버 값은 변형과 쿼리 모두에서 사용할 수 있습니다.

변형

Data Connect를 통해 임베딩 생성 및 저장

벡터 검색 앱에서는 데이터베이스에 레코드를 추가하는 즉시 임베딩 생성을 요청하는 것이 좋습니다. 다음은 createMovie 변형으로, Movie 테이블에 영화 레코드를 추가하고 지정된 임베딩 model와 함께 영화 설명을 전달합니다.

mutation createMovie($movieData: Movie_Data! @pick(fields: ["title", "genre", "description"])) {
  movie_insert(data: {
    ...movieData,
    descriptionEmbedding_embed: {model: "textembedding-gecko@003", text: $movieData.description}
  })
}

경우에 따라 영화 설명과 삽입을 업데이트해야 할 수 있습니다.

mutation updateDescription($id: String!, $description: String!) {
  movie_update(id: $id, data: {
    description: $description,
    descriptionEmbedding_embed: {model: "textembedding-gecko@003", text: $description}
  })
}

클라이언트에서 후자의 변형을 호출하려면 다음을 실행합니다.

import { updateMovieDescriptionWithEmbed } from 'lib/dataconnect-sdk/';

await updateMovieDescriptionWithEmbed({ id: movieId, description: description});

// Use the response

쿼리

다음과 같은 쿼리를 사용하여 벡터 임베딩을 가져옵니다. 쿼리에서 반환된 descriptionEmbedding는 일반적으로 사람이 읽을 수 없는 부동 소수점 배열입니다. 따라서 Data Connect 생성 SDK는 이를 직접 반환하는 것을 지원하지 않습니다.

다음 섹션에 설명된 대로 반환된 벡터 임베딩을 사용하여 유사성 검색을 실행할 수 있습니다.

query getMovieDescription($id: String!) @auth(is: PUBLIC) {
 movie(id: $id)
   id
   description
   descriptionEmbedding
}

유사성 검색 수행

이제 유사성 검색을 실행할 수 있습니다.

Vector 필드에 대해 Data Connect는 유사성 검색을 구현하는 GraphQL 함수를 생성합니다. 이 생성된 함수의 이름은 ${pluralType}_${vectorFieldName}_similarity입니다. 다음 예와 참조 목록에 나와 있는 몇 가지 매개변수를 지원합니다.

유사 검색을 호출하는 GraphQL 함수를 정의할 수 있습니다. 위에서 언급한 대로 _embed 서버 값은 Data Connect이 Vertex AI의 Embedding API를 사용하여 벡터 임베딩을 생성하도록 지시합니다. 이 경우 영화 설명 임베딩과 비교하는 데 사용되는 검색 문자열의 임베딩을 만듭니다.

이 예시에서 유사성 검색은 설명이 입력 쿼리와 의미상 가장 가까운 영화를 최대 5개까지 반환합니다. 결과 집합은 거리(가장 가까운 곳부터 가장 먼 곳)의 오름차순으로 정렬됩니다.

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "textembedding-gecko@003", text: $query},
      method: L2,
      within: 2,
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
      }
  }

유사성 쿼리 호출

클라이언트 코드에서 유사성 검색을 호출하려면 다음 단계를 따르세요.

import { searchMovieDescriptionUsingL2similarity} from 'lib/dataconnect-sdk';

const response = await searchMovieDescriptionUsingL2similarity({ query });

// Use the response

커스텀 임베딩 사용

또한 Data Connect를 사용하면 _embed 서버 값을 사용하여 임베딩을 생성하는 대신 임베딩을 Vector로 직접 처리할 수 있습니다.

맞춤 임베딩 저장

Vertex Embeddings API를 사용하여 일치하는 모델을 지정하고 올바른 크기의 임베딩 결과를 요청합니다.

그런 다음 반환된 부동 소수점 배열을 Vector로 변환하여 저장소의 업데이트 작업에 전달합니다.

mutation updateDescription($id: String!, $description: String!, $descriptionEmbedding: Vector!) {
  movie_update(id: $id, data: {
    // title, genre...
    description: $description,
    descriptionEmbedding: $descriptionEmbedding
  })
}

맞춤 임베딩을 사용하여 유사성 검색 수행

동일한 작업을 수행하여 검색어의 임베딩을 검색하고 Vectors로 변환합니다.

그런 다음 _similarity 쿼리를 호출하여 각 검색을 실행합니다.

query searchMovieDescriptionUsingL2Similarity($compare: Vector!, $within: Float, $excludesContent: String, $limit: Int) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare: $compare,
      method: L2,
      within: $within,
      where: {content: {ne: $excludesContent}}, limit: $limit)
      {
        id
        title
        description
      }
  }

프로덕션에 배포

스키마 및 커넥터 배포

일반적인 Data Connect 반복의 마지막 단계는 애셋을 프로덕션에 배포하는 것입니다.

firebase deploy 명령어를 사용하여 Vector 유형이 포함된 스키마를 CloudSQL에 배포하면 Firebase CLI가 CloudSQL 인스턴스에서 Vertex AI 기반 임베딩 생성을 사용 설정하는 데 필요한 단계를 실행합니다.

firebase deploy --only dataconnect

CloudSQL 인스턴스에서 삽입 지원을 수동으로 사용 설정하거나 CLI 오류가 발생하면 이 안내를 따르세요.

벡터 검색 문법

스키마 확장

Data ConnectVector 데이터 유형은 pgvector 확장 프로그램에 의해 정의된 대로 PostgreSQL의 vector 유형에 매핑됩니다. pgvector의 vector 유형은 PostgreSQL에 단일 정밀도 부동 소수점 수 배열로 저장됩니다.

Data Connect에서 Vector 유형은 JSON 숫자의 배열로 표현됩니다. 입력은 float32 값의 배열로 강제 변환됩니다. 변환에 실패하면 오류가 발생합니다.

@col 디렉티브의 크기 매개변수를 사용하여 벡터의 크기를 설정합니다.

type Question @table {
    text: String!
    category: String!
    textEmbedding: Vector! @col(size: 768)
}

sizeVector 유형에만 지원됩니다. 유사성 검색과 같은 Vector 연산을 사용하려면 모든 Vector의 크기가 동일해야 합니다.

directive @col(
  # … existing args
  """
  Defines a fixed column size for certain scalar types.

  - For Vector, size is required.
  - For all other types, size is currently unsupported and hence supplying it will result in a schema error.
  """
  size: Int
) on FIELD_DEFINITION

쿼리 및 변형의 _embed 서버 값

_embed

이 서버 값은 Data Connect 서비스가 Vertex AI의 임베딩 API를 사용하여 임베딩을 생성하고 저장하도록 지시합니다. 이 서버 값은 쿼리와 변형 모두에 사용할 수 있습니다.

유사 검색을 위한 매개변수

method: COSINE|INNER_PRODUCT|L2

근처 이웃을 검색하는 데 사용되는 거리 함수입니다. 현재 지원되는 알고리즘은 pgvector 검색 알고리즘의 하위 집합입니다.

within: float

최근접 이웃 검색이 실행되는 거리에 대한 제약 조건입니다.

where: FDC filter condition

스키마, 쿼리, 변형 가이드를 참고하세요.

limit: int

반환할 결과 수입니다.