Làm việc với tính năng khôi phục tại một thời điểm (PITR)

Trang này mô tả cách sử dụng tính năng khôi phục tại một thời điểm (PITR) để giữ lại và khôi phục dữ liệu trong Cloud Firestore.

Để tìm hiểu các khái niệm về PITR, hãy xem bài viết Khôi phục tại một thời điểm.

Quyền

Để có quyền cần thiết để quản lý chế độ cài đặt PITR, hãy yêu cầu quản trị viên cấp cho bạn các vai trò IAM sau đây đối với dự án mà bạn muốn bật PITR:

  • Chủ sở hữu kho dữ liệu trên đám mây (roles/datastore.owner)

Đối với vai trò tuỳ chỉnh, hãy đảm bảo rằng bạn đã cấp các quyền sau đây:

  • Cách bật PITR khi tạo cơ sở dữ liệu: datastore.databases.create
  • Cách cập nhật chế độ cài đặt PITR trên cơ sở dữ liệu hiện có: datastore.databases.update,datastore.databases.list
  • Để thực hiện đọc dữ liệu PITR: datastore.databases.get,datastore.entities.get,datastore.entities.list
  • Cách xuất dữ liệu PITR: datastore.databases.export
  • Cách nhập dữ liệu PITR: datastore.databases.import

Trước khi bắt đầu

Vui lòng lưu ý những điểm sau đây trước khi bạn bắt đầu sử dụng PITR:

  • Bạn không thể bắt đầu đọc từ 7 ngày trước ngay sau khi bật PITR.
  • Nếu muốn bật PITR khi tạo cơ sở dữ liệu, bạn phải sử dụng lệnh gcloud firestore databases create. Không hỗ trợ bật PITR trong khi tạo cơ sở dữ liệu bằng Bảng điều khiển GCP.
  • Cloud Firestore bắt đầu giữ lại các phiên bản từ thời điểm đó trở đi sau khi bật PITR.
  • Bạn không thể đọc dữ liệu PITR trong cửa sổ PITR sau khi tắt PITR.
  • Nếu bạn bật lại PITR ngay sau khi tắt, thì dữ liệu PITR trước đây sẽ không còn nữa. Mọi dữ liệu PITR được tạo trước khi vô hiệu hoá PITR sẽ bị xoá sau ngày hết hạn PITR.
  • Nếu bạn vô tình xoá dữ liệu trong vòng một giờ qua và PITR bị vô hiệu hoá, thì bạn có thể khôi phục dữ liệu của mình bằng cách bật PITR trong vòng một giờ sau khi xoá.
  • Mọi lượt đọc được thực hiện trên dữ liệu PITR đã hết hạn sẽ không thành công.

Bật PITR

Trước khi sử dụng PITR, hãy bật tính năng thanh toán cho dự án Google Cloud. Chỉ những dự án trên Google Cloud có bật tính năng thanh toán mới có thể sử dụng chức năng PITR.

Cách bật PITR cho cơ sở dữ liệu của bạn:

Bảng điều khiển

  1. Trong Bảng điều khiển Google Cloud Platform, hãy chuyển đến trang Cơ sở dữ liệu.

    Chuyển đến trang Cơ sở dữ liệu

  2. Chọn cơ sở dữ liệu cần thiết trong danh sách cơ sở dữ liệu.

  3. Trong trình đơn điều hướng, hãy nhấp vào Khôi phục sau thảm hoạ.

  4. Nhấp vào Chỉnh sửa để chỉnh sửa chế độ cài đặt.

  5. Chọn hộp kiểm Bật tính năng khôi phục tại thời điểm, sau đó nhấp vào Lưu.

Việc bật PITR sẽ làm phát sinh chi phí lưu trữ. Vui lòng xem phần Giá để biết thêm thông tin.

Để tắt PITR, hãy bỏ đánh dấu hộp Bật tính năng khôi phục tại một thời điểm cụ thể trên trang Khôi phục sau thảm hoạ trong Bảng điều khiển của GCP.

Google Cloud

Bật PITR trong quá trình tạo cơ sở dữ liệu bằng lệnh gcloud firestore databases create như sau:

gcloud firestore databases create\
  --location=LOCATION\
  [--database=DATABASE_ID; default="(default)"]\
  [--type=TYPE; default="firestore-native"]\
  --enable-pitr

Thay thế các giá trị như sau:

  • Location – vị trí bạn muốn tạo cơ sở dữ liệu.
  • DATABASE_ID – đặt thành mã nhận dạng cơ sở dữ liệu hoặc (mặc định).
  • TYPE – được đặt thành Firestore-native.

Bạn có thể tắt PITR bằng lệnh gcloud firestore databases update như sau:

gcloud firestore databases update\
  [--database=DATABASE_ID; default="(default)"]\
  --no-enable-pitr

Thay thế các giá trị như sau:

  • DATABASE_ID – đặt thành mã nhận dạng cơ sở dữ liệu hoặc (mặc định).

Xem khoảng thời gian lưu giữ và thời gian sử dụng phiên bản sớm nhất

Bảng điều khiển

  1. Trong Bảng điều khiển Google Cloud Platform, hãy chuyển đến trang Cơ sở dữ liệu.

    Chuyển đến trang Cơ sở dữ liệu

  2. Chọn cơ sở dữ liệu cần thiết trong danh sách cơ sở dữ liệu.

  3. Trong trình đơn điều hướng, hãy nhấp vào Khôi phục sau thảm hoạ.

  4. Trong phần Cài đặt, hãy lưu ý về Khoảng thời gian lưu giữThời gian phiên bản sớm nhất.

    • Khoảng thời gian lưu giữ: khoảng thời gian mà Cloud Firestore lưu giữ tất cả các phiên bản dữ liệu cho cơ sở dữ liệu. Giá trị là 1 giờ khi PITR bị tắt và 7 ngày khi PITR được bật.
    • Thời gian phiên bản sớm nhất: dấu thời gian sớm nhất mà tại đó các phiên bản cũ của dữ liệu có thể được đọc trong cửa sổ PITR. Giá trị này được Cloud Firestore liên tục cập nhật và sẽ trở thành lỗi thời ngay khi được truy vấn. Nếu bạn đang sử dụng giá trị này để khôi phục dữ liệu, hãy nhớ tính đến thời gian từ thời điểm giá trị được truy vấn đến thời điểm bạn bắt đầu khôi phục.
    • Khôi phục tại một thời điểm: hiển thị Enabled, nếu PITR được bật. Nếu PITR bị tắt, bạn sẽ thấy Disabled.

Google Cloud

Chạy lệnh gcloud Firestore}} mô tả cơ sở dữ liệu như sau:

gcloud firestore databases describe --database=DATABASE_ID

Thay thế DATABASE_ID bằng mã cơ sở dữ liệu hoặc default.

Sau đây là kết quả:

    appEngineIntegrationMode: ENABLED
    concurrencyMode: PESSIMISTIC
    createTime: '2021-03-24T17:02:35.234Z'
    deleteProtectionState: DELETE_PROTECTION_DISABLED
    earliestVersionTime: '2023-06-12T16:17:25.222474Z'
    etag: IIDayqOevv8CMNTvyNK4uv8C
    keyPrefix: s
    locationId: nam5
    name: projects/PROJECT_ID/databases/(default)
    pointInTimeRecoveryEnablement: POINT_IN_TIME_RECOVERY_DISABLED
    type: FIRESTORE_NATIVE
    uid: 5230c382-dcd2-468f-8cb3-2a1acfde2b32
    updateTime: '2021-11-17T17:48:22.171180Z'
    versionRetentionPeriod: 3600s

ở đâu,

  • earliestVersionTime – dấu thời gian của dữ liệu PITR sớm nhất được lưu trữ.
  • pointInTimeRecoveryEnablement: hiển thị POINT_IN_TIME_RECOVERY_ENABLED nếu PITR được bật. Nếu PITR bị tắt, bạn sẽ thấy POINT_IN_TIME_RECOVERY_DISABLED hoặc trường pointInTimeRecoveryEnablement có thể không hiển thị.
  • versionRetentionPeriod – khoảng thời gian lưu giữ dữ liệu PITR (tính bằng mili giây). Giá trị có thể là một giờ khi PITR được tắt hoặc bảy ngày nếu PITR được bật.

Đọc dữ liệu PITR

Bạn có thể đọc dữ liệu PITR bằng thư viện ứng dụng, phương thức API REST hoặc trình kết nối FirestoreIO Apache Beam.

Thư viện ứng dụng

Java

Bạn phải sử dụng giao dịch ReadOnly để đọc dữ liệu PITR. Bạn không thể chỉ định trực tiếp readTime trong lượt đọc. Hãy xem Giao dịch và ghi theo lô để biết thêm thông tin.

  Firestore firestore = …

  TransactionOptions options =
          TransactionOptions.createReadOnlyOptionsBuilder()
              .setReadTime(
                  com.google.protobuf.Timestamp.newBuilder()
                      .setSeconds(1684098540L)
                      .setNanos(0))
              .build();

  ApiFuture<Void> futureTransaction = firestore.runTransaction(
              transaction -> {
                // Does a snapshot read document lookup
                final DocumentSnapshot documentResult =
                    transaction.get(documentReference).get();

                // Executes a snapshot read query
                final QuerySnapshot queryResult =
                  transaction.get(query).get();
              },
              options);

  // Blocks on transaction to complete
  futureTransaction.get();

Nút

Bạn phải sử dụng giao dịch ReadOnly để đọc dữ liệu PITR. Bạn không thể chỉ định trực tiếp readTime trong lượt đọc. Hãy xem Giao dịch và ghi theo lô để biết thêm thông tin.

  const documentSnapshot = await firestore.runTransaction(
    updateFunction => updateFunction.get(documentRef),
    {readOnly: true, readTime: new Firestore.Timestamp(1684098540, 0)}
);

  const querySnapshot = await firestore.runTransaction(
    updateFunction => updateFunction.get(query),
    {readOnly: true, readTime: new Firestore.Timestamp(1684098540, 0)}
  )

API REST

Việc đọc PITR được hỗ trợ trong tất cả phương thức đọc của Cloud Firestore, đó là get, list, batchGet, listCollectionIds, listDocuments, runQuery, runBottomQuerypartitionQuery.

Để đọc bằng các phương thức REST, hãy thử một trong các phương án sau:

  1. Trong yêu cầu về phương thức đọc, hãy chuyển giá trị readTime dưới dạng dấu thời gian PITR được hỗ trợ trong phương thức readOptions. Dấu thời gian PITR có thể là dấu thời gian chính xác một phần triệu giây trong giờ vừa qua hoặc là dấu thời gian cả phút vượt quá giờ vừa qua, nhưng không được sớm hơn earliestVersionTime.

  2. Dùng tham số readTime cùng với phương thức BeginTransaction trong giao dịch ReadOnly cho nhiều lần đọc PITR.

Tia Apache

Sử dụng trình kết nối Cloud FirestoreIO Apache Beam để đọc hoặc ghi tài liệu trong cơ sở dữ liệu Cloud Firestore ở quy mô lớn bằng Dataflow.

Số lần đọc PITR được hỗ trợ trong phương thức đọc sau đây của trình kết nối Cloud FirestoreIO. Các phương thức đọc này hỗ trợ phương thức withReadTime(@Nullable Instant readTime) mà bạn có thể dùng cho các lượt đọc PITR:

Java

Bạn có thể sử dụng mã sau với mã quy trình Dataflow mẫu cho các thao tác đọc hoặc ghi hàng loạt. Ví dụ này sử dụng phương thức withReadTime(@Nullable Instant readTime) để đọc PITR.

  Instant readTime = Instant.ofEpochSecond(1684098540L);

  PCollection<Document> documents =
      pipeline
          .apply(Create.of(collectionId))
          .apply(
              new FilterDocumentsQuery(
                  firestoreOptions.getProjectId(), firestoreOptions.getDatabaseId()))
          .apply(FirestoreIO.v1().read().runQuery().withReadTime(readTime).withRpcQosOptions(rpcQosOptions).build())
  ...

Để xem danh sách đầy đủ các ví dụ về readTime trong quy trình Dataflow, hãy xem Kho lưu trữ GitHub.

Xuất và nhập từ dữ liệu PITR

Bạn có thể xuất cơ sở dữ liệu của mình sang Cloud Storage từ dữ liệu PITR bằng lệnh gcloud firestore export. Bạn có thể xuất dữ liệu PITR, trong đó dấu thời gian là một dấu thời gian toàn bộ phút trong vòng 7 ngày qua, nhưng không sớm hơn earliestVersionTime. Nếu dữ liệu không còn tồn tại tại dấu thời gian được chỉ định, thì thao tác xuất sẽ không thành công.

Thao tác xuất PITR hỗ trợ tất cả các bộ lọc, bao gồm cả xuất tất cả tài liệu và xuất các bộ sưu tập cụ thể.

  1. Xuất cơ sở dữ liệu, chỉ định tham số snapshot-time cho dấu thời gian khôi phục mong muốn.

    Google Cloud

    Chạy lệnh sau để xuất cơ sở dữ liệu sang bộ chứa của bạn.

    gcloud firestore export gs://[BUCKET_NAME_PATH] \
        --snapshot-time=[PITR_TIMESTAMP] \
        --collection-ids=[COLLECTION_IDS] \
        --namespace-ids=[NAMESPACE_IDS]
    

    Ở đâu,

    • BUCKET_NAME_PATH – một bộ chứa hợp lệ trên Cloud Storage có tiền tố đường dẫn không bắt buộc, nơi lưu trữ các tệp xuất.
    • PITR_TIMESTAMP – dấu thời gian PITR ở độ chi tiết theo phút, ví dụ: 2023-05-26T10:20:00.00Z hoặc 2023-10-19T10:30:00.00-07:00.
    • COLLECTION_IDS – danh sách mã bộ sưu tập hoặc mã nhóm bộ sưu tập, ví dụ như 'specific collection group1','specific collection group2'.
    • NAMESPACE_IDS – danh sách mã không gian tên, ví dụ như 'customer','orders'.

    Vui lòng lưu ý những điểm sau đây trước khi xuất dữ liệu PITR:

    • Hãy chỉ định dấu thời gian ở định dạng RFC 3339. Ví dụ: 2023-05-26T10:20:00.00Z hoặc 2023-10-19T10:30:00.00-07:00.
    • Hãy đảm bảo rằng dấu thời gian mà bạn chỉ định là một dấu thời gian nguyên phút trong vòng 7 ngày qua, nhưng không được sớm hơn earliestVersionTime. Nếu dữ liệu không còn tồn tại tại dấu thời gian được chỉ định, thì hệ thống sẽ tạo lỗi. Dấu thời gian phải là toàn bộ phút, ngay cả khi thời gian được chỉ định nằm trong khoảng một giờ qua.
    • Bạn không bị tính phí cho lần xuất PITR không thành công.
  2. Nhập vào cơ sở dữ liệu.

    Làm theo các bước trong bài viết Nhập tất cả tài liệu để nhập cơ sở dữ liệu mà bạn đã xuất. Nếu đã tồn tại bất kỳ tài liệu nào trong cơ sở dữ liệu của bạn, tài liệu đó sẽ bị ghi đè.