Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Melakukan penelusuran kemiripan vektor dengan Vertex AI

Selamat datang di penelusuran kemiripan vektor Firebase SQL Connect — penerapan penelusuran semantik Firebase yang terintegrasi dengan Google Vertex AI.

Inti dari fitur ini adalah penyematan vektor, yang merupakan array bilangan floating point yang merepresentasikan makna semantik teks atau media. Dengan menjalankan penelusuran tetangga terdekat menggunakan embedding vektor input, Anda dapat menemukan semua konten yang memiliki kesamaan semantik. SQL Connect menggunakan ekstensi pgvector PostgreSQL untuk kemampuan ini.

Penelusuran semantik yang canggih ini dapat mendorong kasus penggunaan seperti mesin pemberi saran dan mesin telusur. Hal ini juga merupakan komponen utama dalam Retrieval-Augmented Generation dalam alur AI generatif. Dokumentasi Vertex AI adalah tempat yang tepat untuk mempelajari lebih lanjut.

Anda dapat mengandalkan dukungan bawaan SQL Connect untuk membuat embedding vektor secara otomatis menggunakan Embeddings API Vertex AI, atau menggunakan API tersebut untuk membuatnya secara manual.

Prasyarat

Siapkan SQL Connect untuk project Anda.

Catatan: Saat Anda menyelesaikan alur penyiapan, perlu diketahui bahwa integrasi Vertex AI SQL Connect hanya didukung untuk lokasi Cloud SQL tertentu untuk PostgreSQL. Lihat daftar lokasi.
Aktifkan Vertex AI API.

Catatan: Anda tidak perlu membuat project Google Cloud terpisah atau menginstal Google Cloud CLI.

Penyiapan

Anda dapat memilih antara alur pengembangan lokal (jika Anda adalah developer web, Kotlin Android, atau iOS) atau alur IDX (untuk developer web). Anda dapat menggunakan database lokal atau project SQL Connect produksi dan instance Cloud SQL untuk PostgreSQL untuk pengembangan.

Petunjuk ini mengasumsikan bahwa Anda telah membuat project SQL Connect dengan mengikuti panduan memulai cepat.

Berintegrasi dengan PostgreSQL lokal

Siapkan instance PostgreSQL lokal.
Beri diri Anda peran IAM Vertex AI User.
Di lingkungan Anda, siapkan Google Cloud Kredensial Default Aplikasi.
Di instance PostgreSQL lokal Anda, instal ekstensi pgvector.
Aktifkan ekstensi menggunakan CREATE EXTENSION vector per pgvector petunjuk repositori.

Mengintegrasikan dengan IDX

Siapkan ruang kerja IDX Anda menggunakan template SQL Connect.
Beri diri Anda peran IAM Vertex AI User.
Aktifkan ekstensi menggunakan CREATE EXTENSION vector per pgvector petunjuk repositori.

Mendesain skema

Untuk melakukan penelusuran vektor, tambahkan kolom baru berjenis Vector dalam skema Anda. Misalnya, jika Anda ingin melakukan penelusuran semantik menggunakan deskripsi film, tambahkan kolom untuk menyimpan embedding vektor yang terkait dengan deskripsi film. Dalam skema ini, descriptionEmbedding ditambahkan untuk menyimpan embedding vektor untuk kolom description.

type Movie @table {
 id: ID! @col(name: "movie_id") @default(id: ID! @col(name: "movie_id") @default(expr: "uuidV4()")
 title: String!
 description: String
 descriptionEmbedding: Vector! @col(size:768)
 // ...
}

Membuat dan mengambil embedding

SQL Connect menghadirkan dukungan terintegrasi untuk embedding vektor dengan nilai server _embed. Hal ini mengarahkan SQL Connect untuk membuat embedding vektor dengan memanggil Embedding API Vertex AI secara internal. Nilai server _embed dapat digunakan dalam mutasi dan kueri.

Mutasi

Membuat dan menyimpan embedding melalui SQL Connect

Di aplikasi penelusuran vektor, Anda mungkin ingin meminta agar embedding dibuat segera setelah Anda menambahkan data ke database. Berikut adalah mutasi createMovie yang menambahkan rekaman film ke tabel Movie dan juga meneruskan deskripsi film dengan penyematan model tertentu.

mutation createMovie($title: String!, $description: String!) {
  movie_insert(data: {
    title: $title,
    description: $description,
    descriptionEmbedding_embed: {model: "text-embedding-005", text: $description}
  })
}

Dalam beberapa kasus, Anda mungkin ingin memperbarui deskripsi dan penyematan film.

mutation updateDescription($id: String!, $description: String!) {
  movie_update(id: $id, data: {
    description: $description,
    descriptionEmbedding_embed: {model: "text-embedding-005", text: $description}
  })
}

Untuk memanggil mutasi terakhir dari klien:

import { updateMovieDescription } from 'lib/dataconnect-sdk/';

await updateMovieDescription({ id: movieId, description: description});

// Use the response

Kueri

Ambil embedding vektor menggunakan kueri seperti berikut. Perhatikan bahwa descriptionEmbedding yang ditampilkan oleh kueri adalah array float, yang biasanya tidak dapat dibaca manusia. Oleh karena itu, SDK yang dibuat SQL Connect tidak mendukung pengembaliannya secara langsung.

Anda dapat menggunakan embedding vektor yang ditampilkan untuk melakukan penelusuran kesamaan, seperti yang dijelaskan di bagian berikutnya.

query getMovieDescription($id: String!) @auth(level: PUBLIC) {
 movie(id: $id)
   id
   description
   descriptionEmbedding
}

Melakukan penelusuran kemiripan

Sekarang kita dapat melakukan penelusuran kemiripan.

Untuk setiap kolom Vector, SQL Connect menghasilkan fungsi GraphQL yang menerapkan penelusuran kesamaan. Nama fungsi yang dihasilkan ini adalah ${pluralType}_${vectorFieldName}_similarity. Fungsi ini mendukung beberapa parameter seperti yang ditunjukkan dalam contoh berikut dan dalam daftar referensi.

Anda dapat menentukan fungsi GraphQL yang memanggil penelusuran kesamaan. Seperti yang disebutkan di atas, nilai server _embed mengarahkan SQL Connect untuk membuat embedding vektor menggunakan API Embedding Vertex AI, dalam hal ini untuk membuat embedding untuk string penelusuran yang digunakan untuk perbandingan dengan embedding deskripsi film.

Dalam contoh ini, penelusuran kesamaan akan menampilkan hingga 5 film yang deskripsinya paling mirip secara semantik dengan kueri input. Kumpulan hasil diurutkan dalam urutan menaik jarak - dari terdekat hingga terjauh.

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "text-embedding-005", text: $query},
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
      }
  }

Menyesuaikan kueri kemiripan

Nilai default untuk parameter penelusuran seperti method dan within berfungsi dengan baik untuk sebagian besar kasus penggunaan. Namun, jika Anda melihat bahwa kueri Anda menampilkan hasil yang terlalu berbeda, atau tidak menampilkan hasil yang ingin Anda sertakan, coba sesuaikan parameter ini.

Untuk menemukan nilai yang sesuai untuk within, kita dapat menambahkan _metadata.distance ke kolom yang dipilih untuk melihat seberapa jauh setiap hasil dari vektor kueri. Berdasarkan nilai distance yang ditampilkan, kita dapat menetapkan parameter within; hanya hasil dengan jarak kurang dari nilai within yang akan disertakan:

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "text-embedding-005", text: $query},
      within: 2,
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
        _metadata {
          distance
        }
      }
  }

Anda juga dapat bereksperimen dengan berbagai fungsi jarak dengan menetapkan parameter method.

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "text-embedding-005", text: $query},
      within: .5,
      method: COSINE,
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
        _metadata {
          distance
        }
      }
  }

Perhatikan bahwa metode yang berbeda menampilkan nilai jarak yang sangat berbeda: jika Anda telah menetapkan within, Anda harus menyesuaikan nilai tersebut lagi setelah mengubah method.

Panggil kueri kemiripan

Untuk memanggil penelusuran kesamaan dari kode klien:

import { searchMovieDescriptionUsingL2similarity} from 'lib/dataconnect-sdk';

const response = await searchMovieDescriptionUsingL2similarity({ query });

// Use the response

Menggunakan penyematan kustom

SQL Connect juga memungkinkan Anda bekerja dengan embedding secara langsung sebagai Vectors daripada menggunakan nilai server _embed untuk membuatnya.

Menyimpan penyematan kustom

Dengan menggunakan Vertex Embeddings API, tentukan model yang cocok dan minta hasil embedding dengan dimensi yang benar.

Kemudian, transmisikan array float yang ditampilkan ke Vector untuk diteruskan ke operasi update untuk penyimpanan.

mutation updateDescription($id: String!, $description: String!, $descriptionEmbedding: Vector!) {
  movie_update(id: $id, data: {
    // title, genre...
    description: $description,
    descriptionEmbedding: $descriptionEmbedding
  })
}

Melakukan penelusuran kemiripan menggunakan penyematan kustom

Lakukan operasi yang sama untuk mengambil embedding istilah penelusuran dan mentransformasikannya ke Vectors.

Kemudian, panggil kueri _similarity untuk melakukan setiap penelusuran.

query searchMovieDescriptionUsingL2Similarity($compare: Vector!, $within: Float, $excludesContent: String, $limit: Int) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare: $compare,
      method: L2,
      within: $within,
      where: {content: {ne: $excludesContent}}, limit: $limit)
      {
        id
        title
        description
      }
  }

Men-deploy ke produksi

Deploy skema dan konektor Anda

Langkah terakhir dalam iterasi SQL Connect yang umum adalah men-deploy aset Anda ke produksi.

Saat men-deploy skema yang berisi jenis Vector ke Cloud SQL menggunakan perintah firebase deploy, CLI Firebase akan mengambil langkah-langkah yang diperlukan untuk mengaktifkan pembuatan embedding berbasis Vertex AI di instance Cloud SQL Anda.

firebase deploy --only dataconnect

Jika Anda ingin mengaktifkan dukungan penyematan di instance Cloud SQL secara manual, atau mengalami error CLI, ikuti petunjuk ini.

Sintaksis penelusuran vektor

Ekstensi skema

Jenis data Vector SQL Connect dipetakan ke jenis vector PostgreSQL seperti yang ditentukan oleh ekstensi pgvector. Jenis vector pgvector disimpan sebagai array angka floating point presisi tunggal di PostgreSQL.

Di SQL Connect, jenis Vector direpresentasikan sebagai array angka JSON. Input dipaksa menjadi array nilai float32. Jika pemaksaan gagal, error akan muncul.

Gunakan parameter ukuran pada direktif @col untuk menetapkan dimensi vektor.

type Question @table {
    text: String!
    category: String!
    textEmbedding: Vector! @col(size: 768)
}

size hanya didukung untuk jenis Vector. Vector, seperti penelusuran kesamaan, mengharuskan semua Vector memiliki jumlah dimensi yang sama.

directive @col(
  # … existing args
  """
  Defines a fixed column size for certain scalar types.

  - For Vector, size is required.
  - For all other types, size is currently unsupported and hence supplying it will result in a schema error.
  """
  size: Int
) on FIELD_DEFINITION

Nilai server `_embed` untuk kueri dan mutasi

_embed

Nilai server ini mengarahkan layanan SQL Connect untuk membuat dan menyimpan embedding menggunakan Vertex AI Embedding API. Nilai server ini dapat digunakan pada kueri dan mutasi.

Parameter Untuk penelusuran kemiripan

method: COSINE|INNER_PRODUCT|L2

Fungsi jarak yang digunakan untuk menelusuri tetangga terdekat. Algoritma yang didukung saat ini adalah subkumpulan dari algoritma penelusuran pgvector.

within: float

Batasan pada jarak di mana penelusuran tetangga terdekat dilakukan.

where: FDC filter condition

Lihat panduan skema, kueri, dan mutasi.

limit: int

Jumlah hasil yang akan ditampilkan.