Quản lý việc giữ lại dữ liệu bằng chỉ mục TTL

Trang này mô tả cách sử dụng API MongoDB, bảng điều khiển Cloud và Google Cloud CLI để định cấu hình chỉ mục thời gian tồn tại (TTL).

Tổng quan về thời gian tồn tại

Sử dụng chỉ mục TTL để tự động xoá dữ liệu cũ khỏi cơ sở dữ liệu. Chỉ mục TTL chỉ định một trường nhất định làm thời gian hết hạn cho các tài liệu trong một bộ sưu tập nhất định. Với TTL, bạn có thể giảm chi phí lưu trữ bằng cách dọn dẹp dữ liệu lỗi thời. Dữ liệu thường bị xoá trong vòng 24 giờ sau khi hết thời gian lưu giữ.

Giá

Các thao tác xoá TTL được tính vào chi phí xoá tài liệu. Để biết mức giá của các thao tác xoá, hãy xem Cloud Firestore Mức giá của phiên bản Enterprise.

Giới hạn và ràng buộc

  • Bạn chỉ có thể tạo một chỉ mục TTL cho mỗi bộ sưu tập.
  • Bạn có thể có tối đa 500 chỉ mục TTL.

Xoá TTL

Xin lưu ý những hành vi chính sau đây của việc xoá dựa trên TTL:

  • Việc xoá thông qua TTL không phải là một quy trình diễn ra ngay lập tức. Các chứng từ đã hết hạn vẫn xuất hiện trong các truy vấn và yêu cầu tra cứu cho đến khi quy trình TTL thực sự xoá chúng. Tính kịp thời của việc xoá giao dịch TTL để giảm tổng chi phí sở hữu cho việc xoá. Dữ liệu thường bị xoá trong vòng 24 giờ sau thời gian hết hạn.

  • Việc tạo chỉ mục TTL trên một bộ sưu tập hiện có sẽ dẫn đến việc xoá hàng loạt tất cả dữ liệu đã hết hạn theo chỉ mục TTL mới. Lưu ý rằng thao tác xoá hàng loạt này cũng không diễn ra ngay lập tức và phụ thuộc vào lượng dữ liệu hiện có cho bộ sưu tập đó.

  • Nếu một tài liệu có thời gian hết hạn trong quá khứ và bạn thêm một chỉ mục TTL mới vào bộ sưu tập, thì tài liệu đó sẽ bị xoá trong vòng 24 giờ kể từ khi chỉ mục TTL hoàn tất quá trình thiết lập và trở nên hoạt động.

  • TTL không nhất thiết phải xoá các tài liệu theo cùng thứ tự với dấu thời gian hết hạn của chúng.

  • Việc xoá không được thực hiện theo cách giao dịch. Các tài liệu có cùng thời gian hết hạn không nhất thiết phải bị xoá cùng một lúc. Nếu bạn cần hành vi này, hãy xoá bằng thư viện ứng dụng.

  • Cloud Firestore sẽ luôn tuân theo trường TTL mới nhất để xác định thời gian hết hạn. Ví dụ: nếu một tài liệu đã hết hạn nhưng chưa bị xoá có trường TTL được cập nhật thành một ngày muộn hơn, thì tài liệu đó sẽ không hết hạn và ngày mới sẽ được sử dụng.

  • Cloud Firestore chỉ hết hạn một tài liệu khi trường TTL được đặt thành giá trị Date and time/BSON Date hoặc giá trị Array chứa giá trị Date and time/BSON Date. Để trống trường này hoặc đặt thành một giá trị như null để tắt thời gian hết hạn theo từng tài liệu.

  • TTL được thiết kế để giảm thiểu tác động đến các hoạt động khác trên cơ sở dữ liệu. Các thao tác xoá do TTL điều khiển sẽ được xử lý với mức độ ưu tiên thấp hơn. Các chiến lược khác cũng được áp dụng để giảm thiểu các đợt tăng đột biến lưu lượng truy cập do các thao tác xoá dựa trên TTL gây ra.

Các trường TTL và chỉ mục không phải TTL

Bạn có thể lập chỉ mục hoặc không lập chỉ mục cho trường TTL. Tuy nhiên, vì trường TTL là một dấu thời gian, nên việc đưa trường này vào một chỉ mục không phải TTL có thể ảnh hưởng đến hiệu suất ở tốc độ lưu lượng truy cập cao hơn. Việc thêm một trường dấu thời gian vào chỉ mục không phải TTL có thể tạo ra các điểm truy cập, điều này không phù hợp với các phương pháp hay nhất. Điểm truy cập là tốc độ đọc, ghi và xoá cao đối với một phạm vi tài liệu hẹp.

Quyền

Chủ thể tạo hoặc xoá chỉ mục TTL cần có quyền sau trong dự án:

  • Để xem chỉ mục TTL, bạn cần có quyền datastore.indexes.listdatastore.indexes.get.
  • Bạn cần có quyền datastore.indexes.update để tạo hoặc xoá chỉ mục TTL.
  • Để kiểm tra trạng thái của các thao tác TTL, bạn cần có datastore.operations.listdatastore.operations.get.

Để biết các vai trò chỉ định những quyền này, hãy xem phần Cloud Firestore Vai trò Quản lý danh tính và quyền truy cập.

Trước khi bắt đầu

Trước khi bạn sử dụng gcloud CLI để quản lý chỉ mục TTL, hãy sử dụng lệnh gcloud components update để cập nhật các thành phần lên phiên bản mới nhất hiện có:

gcloud components update

Tạo chỉ mục TTL

Khi tạo chỉ mục TTL, bạn chỉ định một trường tài liệu làm thời gian hết hạn cho các tài liệu trong một tập hợp.

TTL sử dụng một trường được chỉ định để xác định những tài liệu đủ điều kiện xoá. Bạn phải đặt trường TTL thành giá trị Timestamp/BSON Date hoặc giá trị Array chứa giá trị Timestamp/BSON Date. Bạn có thể chọn một trường đã tồn tại hoặc chỉ định một trường mà bạn dự định thêm sau này.

Hãy cân nhắc những điều sau đây trước khi bạn đặt giá trị trường TTL:

  • Giá trị trường TTL có thể là thời gian trong tương lai, hiện tại hoặc quá khứ. Nếu giá trị là thời gian trong quá khứ, thì tài liệu sẽ đủ điều kiện để xoá ngay lập tức. Ví dụ: bạn có thể tạo một chỉ mục TTL bằng trường expireAt, sau đó thêm chỉ mục này vào các tài liệu hiện có.

  • Việc sử dụng bất kỳ kiểu dữ liệu nào khác hoặc không đặt giá trị trường TTL sẽ tắt TTL cho từng tài liệu.

Để tạo chỉ mục TTL, hãy làm theo các bước sau:

MongoDB API

Thêm lựa chọn chỉ mục expireAfterSeconds khi gọi phương thức createIndex():

db.COLLECTION_NAME.createIndex({"TTL_FIELD": 1, "expireAfterSeconds": EXPIRATION_OFFSET_SECONDS})

Ví dụ:

db.restaurants.createIndex({"ts": 1, "expireAfterSeconds": 3600})

expireAfterSeconds xác định TTL là một chỉ mục TTL và là độ lệch giữa giá trị dấu thời gian trong trường TTL và thời gian hết hạn. Nếu expireAfterSeconds được đặt thành 0, thì thời gian hết hạn sẽ được cung cấp trực tiếp theo giá trị dấu thời gian trong trường TTL.

Hãy lưu ý các giới hạn sau:

  • Chỉ mục TTL phải chứa đúng một trường.
  • Bạn không thể dùng chỉ mục TTL trong các truy vấn.
  • Bạn chỉ có thể tạo một chỉ mục TTL cho mỗi bộ sưu tập.
  • Nhật ký kiểm tra để tạo chỉ mục TTL bằng MongoDB API sử dụng tên phương thức google.firestore.admin.v1.FirestoreAdmin.UpdateField.

Bảng điều khiển Google Cloud

  1. Trong bảng điều khiển Cloud, hãy chuyển đến trang Cơ sở dữ liệu.

    Chuyển đến phần Cơ sở dữ liệu

  2. Chọn cơ sở dữ liệu cần thiết trong danh sách cơ sở dữ liệu.

  3. Trong trình đơn điều hướng, hãy nhấp vào Thời gian tồn tại.

  4. Nhấp vào Tạo chính sách.

  5. Nhập tên bộ sưu tập và tên trường dấu thời gian.

  6. Nhấp vào Tạo.

Bảng điều khiển sẽ quay lại trang Thời gian tồn tại. Nếu thao tác bắt đầu thành công, trang sẽ thêm một mục vào bảng chỉ mục TTL. Khi thất bại, trang sẽ hiển thị một thông báo lỗi.

gcloud

  1. Cài đặtkhởi chạy CLI gcloud CLI.

  2. Dùng lệnh firestore fields ttls update để định cấu hình chỉ mục TTL. Thêm cờ --async để ngăn gcloud CLI chờ thao tác hoàn tất.

     gcloud firestore fields ttls update
    ttl_field --collection-group=collection_name
    --enable-ttl 

Thời lượng tạo chỉ mục TTL

Ngay cả trên một cơ sở dữ liệu trống, bạn cũng có thể mất mười phút trở lên để tạo một chỉ mục TTL. Sau khi bạn bắt đầu một thao tác, việc đóng thiết bị đầu cuối sẽ không huỷ thao tác đó.

Xem chỉ mục TTL

Để xem chỉ mục TTL, hãy làm theo các bước sau:

MongoDB API

Sử dụng phương thức listIndexes() để xem chỉ mục TTL. Ví dụ:

db.restaurants.listIndexes()

Xin lưu ý rằng đầu ra sẽ bao gồm cả chỉ mục TTL và chỉ mục không phải TTL. Chỉ mục TTL sẽ bao gồm lựa chọn expireAfterSeconds.

Bảng điều khiển Google Cloud

  1. Trong bảng điều khiển Cloud, hãy chuyển đến trang Cơ sở dữ liệu.

    Chuyển đến phần Cơ sở dữ liệu

  2. Chọn cơ sở dữ liệu cần thiết trong danh sách cơ sở dữ liệu.

  3. Trong trình đơn điều hướng, hãy nhấp vào Thời gian tồn tại.

Bảng điều khiển liệt kê các chỉ mục TTL cho cơ sở dữ liệu của bạn và bao gồm trạng thái của từng chỉ mục.

gcloud

  1. Cài đặtkhởi chạy CLI gcloud CLI.

  2. Dùng lệnh firestore fields ttls list để định cấu hình chỉ mục TTL. Lệnh sau đây liệt kê tất cả các chỉ mục TTL.

    gcloud firestore fields ttls list
    

    Để liệt kê các chỉ mục TTL trong một bộ sưu tập cụ thể, hãy sử dụng lệnh sau:

    gcloud firestore fields ttls list  --collection-group=collection_name
    

Xem thông tin chi tiết về thao tác

Bạn có thể sử dụng gcloud CLI để xem thêm thông tin chi tiết về một chỉ mục TTL đang ở trạng thái CREATING.

Sử dụng lệnh operations list để xem tất cả các thao tác đang chạy và đã hoàn tất gần đây:

gcloud firestore operations list

Phản hồi bao gồm thông tin ước tính về tiến trình của thao tác.

Xoá chỉ mục TTL

Để xoá chỉ mục TTL, hãy làm theo các bước sau:

MongoDB API

Sử dụng phương thức dropIndex() để thả chỉ mục TTL. Ví dụ:

Xoá chỉ mục TTL bằng tên chỉ mục

db.restaurants.dropIndex("ts_1")

Xoá chỉ mục TTL bằng định nghĩa chỉ mục

db.restaurants.dropIndex({"ts": 1})

Xin lưu ý rằng nhật ký kiểm tra để thả chỉ mục TTL bằng MongoDB API sẽ sử dụng tên phương thức google.firestore.admin.v1.FirestoreAdmin.UpdateField.

Bảng điều khiển Google Cloud

  1. Trong bảng điều khiển Cloud, hãy chuyển đến trang Cơ sở dữ liệu.

    Chuyển đến phần Cơ sở dữ liệu

  2. Chọn cơ sở dữ liệu cần thiết trong danh sách cơ sở dữ liệu.

  3. Trong trình đơn điều hướng, hãy nhấp vào Thời gian tồn tại.

  4. Trong bảng chỉ mục TTL, hãy tìm hàng cho chỉ mục TTL. Trong hàng này của bảng, hãy nhấp vào nút Xoá (thùng rác).

  5. Xác nhận bằng cách nhấp vào Xoá.

Bảng điều khiển sẽ quay lại trang Thời gian tồn tại. Khi thành công, Cloud Firestore sẽ xoá chỉ mục TTL khỏi bảng.

gcloud

  1. Cài đặtkhởi chạy CLI gcloud CLI.

  2. Dùng lệnh firestore fields ttls update để định cấu hình chỉ mục TTL. Thêm cờ --async để ngăn gcloud CLI chờ thao tác hoàn tất.

    gcloud firestore fields ttls update ttl_field --collection-group=collection_name --disable-ttl
    

Theo dõi việc xoá TTL

Bạn có thể sử dụng Cloud Monitoring để xem các chỉ số về việc xoá dựa trên TTL. Cloud Firestore cung cấp các chỉ số sau cho TTL:

Loại chỉ số Tên chỉ số Nội dung mô tả chỉ số
firestore.googleapis.com/document/ttl_deletion_count Số lượng xoá theo thời gian tồn tại (TTL)

Tổng số tài liệu bị xoá theo chỉ mục TTL.

firestore.googleapis.com/document/ttl_expiration_to_deletion_delays Thời gian tồn tại (TTL) hết hạn đến khi xoá

Khoảng thời gian đã trôi qua kể từ khi một tài liệu hết hạn theo chỉ mục TTL và thời điểm tài liệu đó thực sự bị xoá.

Để thiết lập trang tổng quan có chỉ số Cloud Firestore, hãy xem phần quản lý trang tổng quan tuỳ chỉnhthêm tiện ích trang tổng quan.