Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Vertex AI로 벡터 유사성 검색 수행

Firebase SQL Connect의 벡터 유사성 검색(Google Vertex AI와 통합되는 Firebase의 시맨틱 검색 구현)에 오신 것을 환영합니다.

이 기능의 핵심은 텍스트 또는 미디어의 시맨틱 의미를 나타내는 부동 소수점 수의 배열인 벡터 임베딩입니다. 입력 벡터 임베딩을 사용하여 최근접 이웃 검색을 실행하면 시맨틱 유사성이 있는 모든 콘텐츠를 찾을 수 있습니다. SQL Connect는 이 기능을 위해 PostgreSQL의 pgvector 확장 프로그램을 사용합니다.

이 강력한 시맨틱 검색은 추천 엔진 및 검색 엔진과 같은 사용 사례를 지원할 수 있습니다. 또한 생성형 AI 흐름에서 검색 증강 생성 의 핵심 구성요소이기도 합니다. Vertex AI 문서에서 자세히 알아보세요. learn more.

SQL Connect's의 기본 제공 지원을 사용하여 Vertex AI의 임베딩 API를 통해 벡터 임베딩을 자동으로 생성하거나 해당 API를 사용하여 수동으로 생성할 수 있습니다.

기본 요건

프로젝트에 SQL Connect를 설정합니다.

참고: 설정 흐름을 진행할 때 SQL Connect의 Vertex AI 통합은 특정 PostgreSQL용 Cloud SQL 위치에서만 지원됩니다. 위치 목록을 참고하세요.
Vertex AI API를 사용 설정합니다.

참고: 별도의 Google Cloud 프로젝트를 만들거나 Google Cloud CLI를 설치할 필요가 없습니다.

설정

웹, Kotlin Android 또는 iOS 개발자인 경우 로컬 개발 흐름을 선택하거나 웹 개발자의 경우 IDX 흐름을 선택할 수 있습니다. 개발을 위해 로컬 데이터베이스 또는 프로덕션 SQL Connect 프로젝트와 PostgreSQL용 Cloud SQL 인스턴스를 사용할 수 있습니다.

이 안내에서는 빠른 시작 가이드에 따라 SQL Connect 프로젝트 를 만들었다고 가정합니다.

로컬 PostgreSQL과 통합

로컬 PostgreSQL 인스턴스를 설정합니다.
Vertex AI 사용자 IAM 역할을 부여합니다.
환경에서 Google Cloud 애플리케이션 기본 사용자 인증 정보를 설정합니다.
로컬 PostgreSQL 인스턴스에 pgvector 확장 프로그램을 설치합니다.
pgvector 저장소 안내에 따라 CREATE EXTENSION vector를 사용하여 확장 프로그램을 사용 설정합니다.

IDX와 통합

SQL Connect 템플릿을 사용하여 IDX 작업공간을 설정합니다.
Vertex AI 사용자 IAM 역할을 부여합니다.
pgvector 저장소 안내에 따라 CREATE EXTENSION vector를 사용하여 확장 프로그램을 사용 설정합니다.

스키마 설계

벡터 검색을 실행하려면 스키마에 Vector 유형의 새 필드를 추가합니다. 예를 들어 영화 설명을 사용하여 시맨틱 검색을 실행하려면 영화 설명과 연결된 벡터 임베딩을 저장할 필드를 추가합니다. 이 스키마에서 descriptionEmbedding은 description 필드의 벡터 임베딩을 저장하기 위해 추가됩니다.

type Movie @table {
 id: ID! @col(name: "movie_id") @default(id: ID! @col(name: "movie_id") @default(expr: "uuidV4()")
 title: String!
 description: String
 descriptionEmbedding: Vector! @col(size:768)
 // ...
}

임베딩 생성 및 검색

SQL Connect는 _embed 서버 값을 사용하여 벡터 임베딩에 대한 통합 지원을 제공합니다. 이렇게 하면 SQL Connect가 Vertex AI의 임베딩 API를 내부적으로 호출하여 벡터 임베딩을 생성합니다. _embed 서버 값은 변형과 쿼리 모두에서 사용할 수 있습니다.

변형

SQL Connect을 통해 임베딩 생성 및 저장

벡터 검색 앱에서는 데이터베이스에 레코드를 추가하는 즉시 임베딩이 생성되도록 요청하는 것이 좋습니다. 다음은 createMovie 변형이 Movie 테이블에 영화 레코드를 추가하고 지정된 임베딩 model이 있는 영화 설명을 전달하는 예입니다.

mutation createMovie($title: String!, $description: String!) {
  movie_insert(data: {
    title: $title,
    description: $description,
    descriptionEmbedding_embed: {model: "textembedding-gecko@003", text: $description}
  })
}

경우에 따라 영화 설명과 임베딩을 업데이트해야 할 수도 있습니다.

mutation updateDescription($id: String!, $description: String!) {
  movie_update(id: $id, data: {
    description: $description,
    descriptionEmbedding_embed: {model: "textembedding-gecko@003", text: $description}
  })
}

클라이언트에서 후자 변형을 호출하려면 다음 단계를 따르세요.

import { updateMovieDescription } from 'lib/dataconnect-sdk/';

await updateMovieDescription({ id: movieId, description: description});

// Use the response

쿼리

다음과 같은 쿼리를 사용하여 벡터 임베딩을 가져옵니다. 쿼리에서 반환된 descriptionEmbedding은 일반적으로 사람이 읽을 수 없는 부동 소수점 수의 배열입니다. 따라서 SQL Connect에서 생성된 SDK는 직접 반환을 지원하지 않습니다.

반환된 벡터 임베딩을 사용하여 다음 섹션에 설명된 대로 유사성 검색을 실행할 수 있습니다.

query getMovieDescription($id: String!) @auth(level: PUBLIC) {
 movie(id: $id)
   id
   description
   descriptionEmbedding
}

유사성 검색 실행

이제 유사성 검색을 실행할 수 있습니다.

각 Vector 필드에 대해 SQL Connect는 유사성 검색을 구현하는 GraphQL 함수 를 생성합니다. 생성된 이 함수의 이름은 ${pluralType}_${vectorFieldName}_similarity입니다. 다음 예와 참조 목록에 표시된 대로 몇 가지 매개변수를 지원합니다.

유사성 검색을 호출하는 GraphQL 함수를 정의할 수 있습니다. 위에서 언급한 대로 _embed 서버 값은 SQL Connect가 Vertex AI의 임베딩 API를 사용하여 벡터 임베딩을 생성하도록 지시합니다. 이 경우 영화 설명 임베딩과의 비교에 사용되는 검색어의 임베딩을 만듭니다.

이 예에서 유사성 검색은 설명이 입력 쿼리와 시맨틱으로 가장 가까운 영화를 최대 5개 반환합니다. 결과 집합은 거리의 오름차순으로 정렬됩니다(가장 가까운 것부터 가장 먼 것까지).

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "textembedding-gecko@003", text: $query},
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
      }
  }

유사성 쿼리 조정

method 및 within과 같은 검색 매개변수의 기본값은 대부분의 사용 사례에서 잘 작동합니다. 하지만 쿼리가 너무 다른 결과를 반환하거나 포함하려는 결과가 누락된 경우 이러한 매개변수를 조정해 보세요.

within의 적절한 값을 찾으려면 선택한 필드에 _metadata.distance를 추가하여 각 결과가 쿼리 벡터에서 얼마나 떨어져 있는지 확인할 수 있습니다. 반환된 distance 값을 기반으로 within 매개변수를 설정할 수 있습니다. within 값보다 거리가 짧은 결과만 포함됩니다.

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "textembedding-gecko@003", text: $query},
      within: 2,
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
        _metadata {
          distance
        }
      }
  }

method 매개변수를 설정하여 다양한 거리 함수를 실험해 볼 수도 있습니다.

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "textembedding-gecko@003", text: $query},
      within: .5,
      method: COSINE,
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
        _metadata {
          distance
        }
      }
  }

다른 메서드는 거리에 대해 매우 다른 값을 반환합니다. within을 설정한 경우 method를 변경한 후 해당 값을 다시 조정해야 합니다.

유사성 쿼리 호출

클라이언트 코드에서 유사성 검색을 호출하려면 다음 단계를 따르세요.

import { searchMovieDescriptionUsingL2similarity} from 'lib/dataconnect-sdk';

const response = await searchMovieDescriptionUsingL2similarity({ query });

// Use the response

커스텀 임베딩 사용

SQL Connect를 사용하면 _embed 서버 값을 사용하여 임베딩을 생성하는 대신 Vectors 로 직접 임베딩을 사용할 수도 있습니다.

커스텀 임베딩 저장

Vertex 임베딩 API를 사용하여 일치하는 모델을 지정하고 올바른 측정기준의 임베딩 결과를 요청합니다.

그런 다음 반환된 부동 소수점 수의 배열을 Vector로 변환하여 저장할 업데이트 작업에 전달합니다.

mutation updateDescription($id: String!, $description: String!, $descriptionEmbedding: Vector!) {
  movie_update(id: $id, data: {
    // title, genre...
    description: $description,
    descriptionEmbedding: $descriptionEmbedding
  })
}

커스텀 임베딩을 사용하여 유사성 검색 실행

동일한 작업을 실행하여 검색어의 임베딩을 검색하고 Vectors로 변환합니다.

그런 다음 _similarity 쿼리를 호출하여 각 검색을 실행합니다.

query searchMovieDescriptionUsingL2Similarity($compare: Vector!, $within: Float, $excludesContent: String, $limit: Int) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare: $compare,
      method: L2,
      within: $within,
      where: {content: {ne: $excludesContent}}, limit: $limit)
      {
        id
        title
        description
      }
  }

프로덕션에 배포

스키마 및 커넥터 배포

일반적인 SQL Connect 반복의 마지막 단계는 애셋을 프로덕션에 배포하는 것입니다.

Vector 유형이 포함된 스키마를 firebase deploy 명령어를 사용하여 CloudSQL에 배포하면 Firebase CLI는 CloudSQL 인스턴스에서 Vertex AI 기반 임베딩 생성을 사용 설정하는 데 필요한 단계를 실행합니다.

firebase deploy --only dataconnect

CloudSQL 인스턴스에서 임베딩 지원을 수동으로 사용 설정하거나 CLI 오류가 발생하는 경우 다음 안내를 따르세요.

벡터 검색 구문

스키마 확장 프로그램

SQL Connect의 Vector 데이터 유형은 PostgreSQL의 vector 유형에 매핑됩니다. pgvector 확장 프로그램에 정의된 대로입니다. pgvector의 vector 유형은 PostgreSQL에 단정밀도 부동 소수점 수의 배열로 저장됩니다.

SQL Connect에서 Vector 유형은 JSON 수의 배열로 표시됩니다. 입력은 float32 값의 배열로 강제 변환됩니다. 강제 변환이 실패하면 오류가 발생합니다.

@col 지시어의 크기 매개변수를 사용하여 벡터의 크기를 설정합니다.

type Question @table {
    text: String!
    category: String!
    textEmbedding: Vector! @col(size: 768)
}

size는 Vector 유형에서만 지원됩니다. 유사성 검색과 같은 Vector 작업에서는 모든 Vector의 측정기준 수가 동일해야 합니다.

directive @col(
  # … existing args
  """
  Defines a fixed column size for certain scalar types.

  - For Vector, size is required.
  - For all other types, size is currently unsupported and hence supplying it will result in a schema error.
  """
  size: Int
) on FIELD_DEFINITION

쿼리 및 변형의 `_embed` 서버 값

_embed

이 서버 값은 SQL Connect 서비스가 임베딩을 생성하고 Vertex AI의 임베딩 API를 사용하여 임베딩을 저장하도록 지시합니다. 이 서버 값은 쿼리와 변형 모두에서 사용할 수 있습니다.

유사성 검색을 위한 매개변수

method: COSINE|INNER_PRODUCT|L2

최근접 이웃을 검색하는 데 사용되는 거리 함수입니다. 현재 지원되는 알고리즘은 pgvector 검색 알고리즘의 하위 집합입니다.

within: float

최근접 이웃 검색이 실행되는 거리 내의 제약조건입니다.

where: FDC filter condition

스키마, 쿼리, 변형 가이드를 참고하세요.

limit: int

반환할 결과 수입니다.