Cấu trúc cơ sở dữ liệu của bạn

Hướng dẫn này trình bày một số khái niệm chính về kiến ​​trúc dữ liệu và các phương pháp hay nhất để cấu trúc dữ liệu JSON trong Cơ sở dữ liệu thời gian thực Firebase của bạn.

Việc xây dựng một cơ sở dữ liệu có cấu trúc hợp lý đòi hỏi phải suy tính trước khá nhiều. Quan trọng nhất, bạn cần lập kế hoạch về cách dữ liệu sẽ được lưu và sau đó được truy xuất để làm cho quá trình đó trở nên dễ dàng nhất có thể.

Cách cấu trúc dữ liệu: đó là cây JSON

Tất cả dữ liệu Cơ sở dữ liệu thời gian thực Firebase được lưu trữ dưới dạng đối tượng JSON. Bạn có thể coi cơ sở dữ liệu như một cây JSON được lưu trữ trên đám mây. Không giống như cơ sở dữ liệu SQL, không có bảng hoặc bản ghi. Khi bạn thêm dữ liệu vào cây JSON, nó sẽ trở thành một nút trong cấu trúc JSON hiện có với khóa liên kết. Bạn có thể cung cấp khóa của riêng mình, chẳng hạn như ID người dùng hoặc tên ngữ nghĩa hoặc chúng có thể được cung cấp cho bạn bằng cách sử dụng push() .

Nếu bạn tạo khóa riêng thì chúng phải được mã hóa UTF-8, có thể có kích thước tối đa là 768 byte và không được chứa các tệp . , $ , # , [ , ] , / hoặc ASCII các ký tự điều khiển 0-31 hoặc 127. Bạn cũng không thể sử dụng các ký tự điều khiển ASCII trong chính các giá trị đó.

Ví dụ: hãy xem xét một ứng dụng trò chuyện cho phép người dùng lưu trữ hồ sơ cơ bản và danh sách liên hệ. Hồ sơ người dùng thông thường được đặt tại một đường dẫn, chẳng hạn như /users/$uid . Người dùng alovelace có thể có một mục cơ sở dữ liệu trông giống như thế này:

{
  "users": {
    "alovelace": {
      "name": "Ada Lovelace",
      "contacts": { "ghopper": true },
    },
    "ghopper": { ... },
    "eclarke": { ... }
  }
}

Mặc dù cơ sở dữ liệu sử dụng cây JSON nhưng dữ liệu được lưu trữ trong cơ sở dữ liệu có thể được biểu diễn dưới dạng các kiểu gốc nhất định tương ứng với các kiểu JSON có sẵn để giúp bạn viết mã dễ bảo trì hơn.

Các phương pháp hay nhất về cấu trúc dữ liệu

Tránh lồng dữ liệu

Vì Cơ sở dữ liệu thời gian thực Firebase cho phép lồng dữ liệu sâu tới 32 cấp độ, nên bạn có thể nghĩ rằng đây phải là cấu trúc mặc định. Tuy nhiên, khi bạn tìm nạp dữ liệu tại một vị trí trong cơ sở dữ liệu của mình, bạn cũng truy xuất tất cả các nút con của nó. Ngoài ra, khi bạn cấp cho ai đó quyền truy cập đọc hoặc ghi tại một nút trong cơ sở dữ liệu của mình, bạn cũng cấp cho họ quyền truy cập vào tất cả dữ liệu trong nút đó. Vì vậy, trên thực tế, tốt nhất bạn nên giữ cấu trúc dữ liệu của mình càng phẳng càng tốt.

Để biết ví dụ về lý do tại sao dữ liệu lồng nhau không tốt, hãy xem xét cấu trúc lồng nhiều lớp sau:

{
  // This is a poorly nested data architecture, because iterating the children
  // of the "chats" node to get a list of conversation titles requires
  // potentially downloading hundreds of megabytes of messages
  "chats": {
    "one": {
      "title": "Historical Tech Pioneers",
      "messages": {
        "m1": { "sender": "ghopper", "message": "Relay malfunction found. Cause: moth." },
        "m2": { ... },
        // a very long list of messages
      }
    },
    "two": { ... }
  }
}

Với thiết kế lồng nhau này, việc lặp qua dữ liệu sẽ trở thành vấn đề. Ví dụ: liệt kê tiêu đề của các cuộc trò chuyện yêu cầu toàn bộ cây chats , bao gồm tất cả các thành viên và tin nhắn, phải được tải xuống máy khách.

Làm phẳng cấu trúc dữ liệu

Thay vào đó, nếu dữ liệu được chia thành các đường dẫn riêng biệt, còn được gọi là không chuẩn hóa, thì dữ liệu đó có thể được tải xuống một cách hiệu quả trong các lệnh gọi riêng biệt nếu cần. Hãy xem xét cấu trúc phẳng này:

{
  // Chats contains only meta info about each conversation
  // stored under the chats's unique ID
  "chats": {
    "one": {
      "title": "Historical Tech Pioneers",
      "lastMessage": "ghopper: Relay malfunction found. Cause: moth.",
      "timestamp": 1459361875666
    },
    "two": { ... },
    "three": { ... }
  },

  // Conversation members are easily accessible
  // and stored by chat conversation ID
  "members": {
    // we'll talk about indices like this below
    "one": {
      "ghopper": true,
      "alovelace": true,
      "eclarke": true
    },
    "two": { ... },
    "three": { ... }
  },

  // Messages are separate from data we may want to iterate quickly
  // but still easily paginated and queried, and organized by chat
  // conversation ID
  "messages": {
    "one": {
      "m1": {
        "name": "eclarke",
        "message": "The relay seems to be malfunctioning.",
        "timestamp": 1459361875337
      },
      "m2": { ... },
      "m3": { ... }
    },
    "two": { ... },
    "three": { ... }
  }
}

Giờ đây, bạn có thể duyệt qua danh sách phòng bằng cách chỉ tải xuống một vài byte cho mỗi cuộc trò chuyện, nhanh chóng tìm nạp siêu dữ liệu để liệt kê hoặc hiển thị các phòng trong giao diện người dùng. Tin nhắn có thể được tìm nạp riêng biệt và hiển thị khi chúng đến, cho phép giao diện người dùng luôn phản hồi nhanh chóng.

Tạo dữ liệu có quy mô

Khi xây dựng ứng dụng, tốt hơn hết bạn nên tải xuống một tập hợp con của danh sách. Điều này đặc biệt phổ biến nếu danh sách chứa hàng nghìn bản ghi. Khi mối quan hệ này là tĩnh và một chiều, bạn có thể chỉ cần lồng các đối tượng con vào bên dưới đối tượng cha.

Đôi khi, mối quan hệ này năng động hơn hoặc có thể cần phải chuẩn hóa dữ liệu này. Nhiều khi bạn có thể không chuẩn hóa dữ liệu bằng cách sử dụng truy vấn để truy xuất một tập hợp con dữ liệu, như đã thảo luận trong Truy xuất dữ liệu .

Nhưng ngay cả điều này có thể là không đủ. Ví dụ, hãy xem xét mối quan hệ hai chiều giữa người dùng và nhóm. Người dùng có thể thuộc về một nhóm và các nhóm bao gồm danh sách người dùng. Khi đến lúc quyết định người dùng thuộc về nhóm nào, mọi thứ trở nên phức tạp.

Điều cần thiết là một cách tinh tế để liệt kê các nhóm mà người dùng thuộc về và chỉ tìm nạp dữ liệu cho các nhóm đó. Chỉ mục của các nhóm có thể giúp ích rất nhiều ở đây:

// An index to track Ada's memberships
{
  "users": {
    "alovelace": {
      "name": "Ada Lovelace",
      // Index Ada's groups in her profile
      "groups": {
         // the value here doesn't matter, just that the key exists
         "techpioneers": true,
         "womentechmakers": true
      }
    },
    ...
  },
  "groups": {
    "techpioneers": {
      "name": "Historical Tech Pioneers",
      "members": {
        "alovelace": true,
        "ghopper": true,
        "eclarke": true
      }
    },
    ...
  }
}

Bạn có thể nhận thấy rằng điều này trùng lặp một số dữ liệu bằng cách lưu trữ mối quan hệ trong cả bản ghi của Ada và trong nhóm. Bây giờ alovelace được lập chỉ mục trong một nhóm và techpioneers được liệt kê trong hồ sơ của Ada. Vì vậy, để xóa Ada khỏi nhóm, nó phải được cập nhật ở hai nơi.

Đây là sự dư thừa cần thiết cho mối quan hệ hai chiều. Nó cho phép bạn tìm nạp tư cách thành viên của Ada một cách nhanh chóng và hiệu quả, ngay cả khi danh sách người dùng hoặc nhóm có quy mô lên tới hàng triệu hoặc khi các quy tắc bảo mật Cơ sở dữ liệu thời gian thực ngăn chặn quyền truy cập vào một số bản ghi.

Cách tiếp cận này, đảo ngược dữ liệu bằng cách liệt kê các ID làm khóa và đặt giá trị thành true, giúp việc kiểm tra khóa đơn giản như đọc /users/$uid/groups/$group_id và kiểm tra xem nó có phải là null hay không. Việc lập chỉ mục nhanh hơn và hiệu quả hơn nhiều so với việc truy vấn hoặc quét dữ liệu.

Bước tiếp theo