Xoá dữ liệu hàng loạt

Sử dụng dịch vụ xoá hàng loạt được quản lý để xoá dữ liệu khỏi cơ sở dữ liệu của bạn. Tính năng này hỗ trợ việc xoá đối với một hoặc nhiều nhóm bộ sưu tập.

Trang này mô tả cách xoá hàng loạt tài liệu bằng dịch vụ xoá hàng loạt được quản lý. Dịch vụ xoá hàng loạt được quản lý của Cloud Firestore có sẵn thông qua công cụ dòng lệnh gcloudCloud Firestore API REST.

Trước khi bắt đầu

Trước khi có thể sử dụng dịch vụ xoá hàng loạt được quản lý, bạn phải hoàn tất các việc sau:

  1. Để xoá hàng loạt tài liệu, hãy bật tính năng thanh toán cho dự án Google Cloud của bạn. Chỉ những Google Cloud dự án đã bật tính năng thanh toán mới có thể sử dụng chức năng xoá hàng loạt.
  2. Đảm bảo tài khoản của bạn có các quyền cần thiết đối với Cloud Firestore. Nếu bạn là chủ sở hữu dự án, tài khoản của bạn có các quyền cần thiết. Nếu không, các vai trò sau đây sẽ cấp các quyền cần thiết cho thao tác xoá hàng loạt:

    • Cloud Firestore vai trò: Owner, Cloud Datastore Owner, hoặc Cloud Datastore Bulk Admin

Thiết lập gcloud cho dự án của bạn

Bạn có thể bắt đầu thao tác xoá hàng loạt thông qua bảng điều khiển Cloud hoặc công cụ dòng lệnh gcloud. Để sử dụng gcloud, hãy thiết lập công cụ dòng lệnh và kết nối với dự án của bạn theo một trong những cách sau:

Xoá hàng loạt dữ liệu

Thao tác xoá hàng loạt sẽ tìm tất cả tài liệu áp dụng trong cơ sở dữ liệu của bạn rồi xoá chúng theo lô. Bạn vẫn có thể truy vấn hoặc đọc các tài liệu này trong khi kết quả có thể khác nhau dựa trên tiến trình đã thực hiện. Thao tác xoá hàng loạt sẽ không xoá bất kỳ tài liệu nào được thêm hoặc sửa đổi sau khi thao tác bắt đầu.

Xoá hàng loạt các nhóm bộ sưu tập cụ thể

gcloud

Để xoá hàng loạt các nhóm bộ sưu tập cụ thể, hãy sử dụng cờ --collection-ids. Thao tác này chỉ xoá các nhóm bộ sưu tập có mã nhận dạng đã cho. Một nhóm bộ sưu tập bao gồm tất cả tài liệu và tài liệu lồng nhau (ở mọi đường dẫn) có các nhóm bộ sưu tập được chỉ định.

gcloud firestore bulk-delete \
--collection-ids=[COLLECTION_GROUP_ID_1_OR_KIND_1],[COLLECTION_GROUP_ID_2_OR_KIND_2],[SUBCOLLECTION_GROUP_ID_1_OR_KIND_3] \
--database=[DATABASE]
Ví dụ: hãy tưởng tượng nhiều tài liệu đại diện cho các nhà hàng trong bộ sưu tập restaurants cấp cao nhất của cơ sở dữ liệu cymbal. Trong mỗi tài liệu nhà hàng, có nhiều bộ sưu tập con lồng nhau, chẳng hạn như ratings, reviewsoutlets. Để xoá hàng loạt các nhóm bộ sưu tập restaurantsreviews, lệnh của bạn sẽ có dạng như sau:

gcloud firestore bulk-delete \
--collection-ids=restaurants,reviews \
--database='cymbal'

Quản lý thao tác xoá hàng loạt

Sau khi bạn bắt đầu thao tác xoá hàng loạt, Cloud Firestore sẽ gán cho thao tác đó một tên duy nhất. Bạn có thể sử dụng tên thao tác để xoá, huỷ hoặc kiểm tra trạng thái của thao tác.

Tên thao tác có tiền tố là projects/[PROJECT_ID]/databases/[DATABASE_ID]/operations/, ví dụ:

projects/my-project/databases/(default)/operations/ASA1MTAwNDQxNAgadGx1YWZlZAcSeWx0aGdpbi1zYm9qLW5pbWRhEgopEg

Tuy nhiên, bạn có thể bỏ qua tiền tố khi chỉ định tên thao tác cho các lệnh describe, canceldelete.

Liệt kê tất cả thao tác xoá hàng loạt

gcloud

Sử dụng lệnh operations list để xem tất cả thao tác đang chạy và thao tác đã hoàn tất gần đây, bao gồm cả thao tác xoá hàng loạt:

gcloud firestore operations list

Kiểm tra trạng thái thao tác

gcloud

Sử dụng lệnh operations describe để cho biết trạng thái của thao tác xoá hàng loạt.

gcloud firestore operations describe [OPERATION_NAME]

Ước tính thời gian hoàn tất

Yêu cầu về trạng thái của một thao tác diễn ra trong thời gian dài sẽ trả về các chỉ số workEstimatedworkCompleted. Mỗi chỉ số này được trả về theo cả số byte và số tài liệu:

  • workEstimated cho biết tổng số byte và tài liệu ước tính mà một thao tác sẽ xử lý. Cloud Firestore có thể bỏ qua chỉ số này nếu không thể ước tính.

  • workCompleted cho biết số byte và tài liệu đã xoá cho đến nay. Sau khi thao tác hoàn tất, giá trị này sẽ cho biết tổng số byte và tài liệu thực sự được xử lý, có thể lớn hơn giá trị của workEstimated.

Chia workCompleted cho workEstimated để ước tính sơ bộ tiến trình. Ước tính này có thể không chính xác vì còn tuỳ thuộc vào việc thu thập số liệu thống kê bị trì hoãn.

Huỷ thao tác

gcloud

Sử dụng lệnh operations cancel để dừng một thao tác đang diễn ra:

gcloud firestore operations cancel [OPERATION_NAME]

Việc huỷ một thao tác đang chạy sẽ không hoàn tác thao tác đó. Thao tác xoá hàng loạt đã huỷ sẽ không khôi phục các tài liệu đã xoá.

Xoá thao tác

Sử dụng lệnh gcloud firestore operations delete để xoá một thao tác đã hoàn tất khỏi danh sách các thao tác gần đây. Để huỷ một thao tác đang chạy, hãy sử dụng thao tác huỷ trước đó.

gcloud firestore operations delete [OPERATION_NAME]

Thanh toán và giá cho thao tác xoá hàng loạt

Bạn phải bật tính năng thanh toán cho dự án Google Cloud thì mới có thể sử dụng dịch vụ xoá hàng loạt được quản lý.

Các thao tác xoá hàng loạt sẽ bị tính phí cho thao tác đọc và xoá tài liệu theo mức giá được liệt kê trong Cloud Firestore phần giá. Các thao tác xoá hàng loạt sẽ phát sinh một thao tác đọc mục nhập chỉ mục cho mỗi tài liệu được tìm thấy và một thao tác xoá cho mỗi tài liệu bị xoá. Bạn sẽ bị tính phí một thao tác đọc cho tối đa 1.000 mục nhập chỉ mục được đọc. Ví dụ: đối với thao tác xoá hàng loạt đã xoá 1.500 tài liệu, bạn sẽ bị tính phí 2 thao tác đọc tài liệu và 1.500 thao tác xoá tài liệu.

Xin lưu ý rằng Cloud Firestore tính phí dựa trên công việc thực tế đã thực hiện. Nếu thao tác bị huỷ hoặc không thành công do lỗi của người dùng, bạn sẽ bị tính phí dựa trên tiến trình đã thực hiện. Cloud Firestore sẽ không tính phí cho thao tác đọc hoặc xoá đối với những tài liệu không bị xoá cuối cùng, chẳng hạn như tài liệu được sửa đổi sau khi thao tác xoá bắt đầu. Chi phí sẽ được phân bổ vào ngày hoàn tất thao tác.

Các thao tác xoá hàng loạt sẽ không kích hoạt cảnh báo ngân sách của Google Cloud cho đến khi hoàn tất. Tương tự, các thao tác đọc và xoá được thực hiện trong thao tác xoá hàng loạt sẽ được áp dụng cho mức sử dụng gói miễn phí sau khi thao tác hoàn tất. Các thao tác xoá hàng loạt sẽ không ảnh hưởng đến mức sử dụng được hiển thị trong phần mức sử dụng của bảng điều khiển.

Xem chi phí xoá hàng loạt

Các thao tác xoá hàng loạt sẽ áp dụng nhãn goog-firestoremanaged:bulkdelete cho các thao tác bị tính phí. Trên trang báo cáo Thanh toán trên đám mây, bạn có thể sử dụng nhãn này để xem các chi phí liên quan đến thao tác xoá hàng loạt.

Các phương pháp hay nhất

Tránh bỏ qua dữ liệu đã xoá vì có thể làm chậm các truy vấn.