Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

בניית מסד הנתונים שלך

במדריך הזה מוסברים כמה מהמושגים העיקריים בארכיטקטורת נתונים ומוצגות שיטות מומלצות לארגון נתוני ה-JSON במסד נתונים בזמן אמת ב-Firebase.

כדי לבנות מסד נתונים מובנה בצורה נכונה, צריך לתכנן מראש. הכי חשוב לתכנן איך הנתונים יישמרו ואיך ישוחזרו בהמשך, כדי שהתהליך יהיה קל ככל האפשר.

איך הנתונים מובנים: הם מוצגים כעץ JSON

כל הנתונים ב-מסד נתונים בזמן אמת ב-Firebase מאוחסנים כאובייקטים בפורמט JSON. אפשר לחשוב על מסד הנתונים כעל עץ JSON שמתארח בענן. בניגוד למסד נתונים של SQL, אין טבלאות או רשומות. כשמוסיפים נתונים לעץ ה-JSON, הם הופכים לצומת במבנה ה-JSON הקיים עם מפתח משויך. אתם יכולים לספק מפתחות משלכם, כמו מזהי משתמשים או שמות סמנטיים, או שהמערכת יכולה לספק אותם באמצעות push().

לדוגמה, אפליקציית צ'אט שמאפשרת למשתמשים לשמור פרופיל בסיסי ורשימת אנשי קשר. פרופיל משתמש טיפוסי נמצא בנתיב, למשל /users/$uid. יכול להיות שלמשתמש alovelace יש רשומה במסד הנתונים שנראית בערך כך:

{
  "users": {
    "alovelace": {
      "name": "Ada Lovelace",
      "contacts": { "ghopper": true },
    },
    "ghopper": { ... },
    "eclarke": { ... }
  }
}

למרות שבמסד הנתונים נעשה שימוש בעץ JSON, אפשר לייצג נתונים שמאוחסנים במסד הנתונים כסוגים מקוריים מסוימים שתואמים לסוגי JSON זמינים, כדי לעזור לכם לכתוב קוד שקל יותר לתחזק.

שיטות מומלצות למבנה נתונים

הימנעו מקינון נתונים

מסד הנתונים בזמן אמת ב-Firebase מאפשר קינון נתונים בעומק של עד 32 רמות, ולכן יכול להיות שתחשבו שזה צריך להיות מבנה ברירת המחדל. עם זאת, כשמאחזרים נתונים במיקום מסוים במסד הנתונים, מאחזרים גם את כל צמתי הצאצא שלו. בנוסף, כשמעניקים למישהו גישת קריאה או כתיבה בצומת במסד הנתונים, מעניקים לו גם גישה לכל הנתונים שמתחת לצומת הזה. לכן, בפועל, מומלץ לשמור על מבנה נתונים שטוח ככל האפשר.

כדי להבין למה נתונים בתצוגת עץ הם בעייתיים, אפשר לעיין במבנה הבא של נתונים בתצוגת עץ:

{
  // This is a poorly nested data architecture, because iterating the children
  // of the "chats" node to get a list of conversation titles requires
  // potentially downloading hundreds of megabytes of messages
  "chats": {
    "one": {
      "title": "Historical Tech Pioneers",
      "messages": {
        "m1": { "sender": "ghopper", "message": "Relay malfunction found. Cause: moth." },
        "m2": { ... },
        // a very long list of messages
      }
    },
    "two": { ... }
  }
}

בגלל העיצוב המקונן הזה, יש בעיה באיטרציה של הנתונים. לדוגמה, כדי להציג את שמות השיחות בצ'אט, צריך להוריד ללקוח את כל עץ chats, כולל כל החברים וההודעות.

השטחת מבני נתונים

אם הנתונים מפולגים לנתיבים נפרדים, שנקראים גם דה-נורמליזציה, אפשר להוריד אותם ביעילות בבקשות נפרדות, לפי הצורך. כדאי לשקול את המבנה השטוח הזה:

{
  // Chats contains only meta info about each conversation
  // stored under the chats's unique ID
  "chats": {
    "one": {
      "title": "Historical Tech Pioneers",
      "lastMessage": "ghopper: Relay malfunction found. Cause: moth.",
      "timestamp": 1459361875666
    },
    "two": { ... },
    "three": { ... }
  },

  // Conversation members are easily accessible
  // and stored by chat conversation ID
  "members": {
    // we'll talk about indices like this below
    "one": {
      "ghopper": true,
      "alovelace": true,
      "eclarke": true
    },
    "two": { ... },
    "three": { ... }
  },

  // Messages are separate from data we may want to iterate quickly
  // but still easily paginated and queried, and organized by chat
  // conversation ID
  "messages": {
    "one": {
      "m1": {
        "name": "eclarke",
        "message": "The relay seems to be malfunctioning.",
        "timestamp": 1459361875337
      },
      "m2": { ... },
      "m3": { ... }
    },
    "two": { ... },
    "three": { ... }
  }
}

עכשיו אפשר לעבור על רשימת החדרים על ידי הורדה של כמה בייטים לכל שיחה, ואחזור מהיר של מטא-נתונים לצורך רישום או הצגה של חדרים בממשק משתמש. אפשר לאחזר את ההודעות בנפרד ולהציג אותן כשהן מגיעות, כך שממשק המשתמש נשאר מהיר ומגיב.

יצירת נתונים שניתנים להרחבה

כשמפתחים אפליקציות, לרוב עדיף להוריד קבוצת משנה של רשימה. זה קורה בדרך כלל אם הרשימה מכילה אלפי רשומות. אם הקשר הזה הוא סטטי וחד-כיווני, אפשר פשוט להציב את אובייקטי הצאצא מתחת לאובייקט האב.

לפעמים הקשר הזה דינמי יותר, או שיש צורך לבצע דה-נורמליזציה של הנתונים. במקרים רבים אפשר לבצע דה-נורמליזציה של הנתונים באמצעות שאילתה כדי לאחזר קבוצת משנה של הנתונים, כמו שמוסבר במאמר בנושא מיון וסינון נתונים.

אבל יכול להיות שגם זה לא יספיק. לדוגמה, נניח שיש קשר דו-כיווני בין משתמשים לקבוצות. משתמשים יכולים להיות חברים בקבוצה, וקבוצות מורכבות מרשימה של משתמשים. כשמגיע הזמן להחליט לאילו קבוצות משתמש משתייך, המצב מסתבך.

צריך דרך אלגנטית לרשום את הקבוצות שהמשתמש שייך אליהן ולאחזר רק את הנתונים של הקבוצות האלה. אינדקס של קבוצות יכול לעזור מאוד במקרה הזה:

// An index to track Ada's memberships
{
  "users": {
    "alovelace": {
      "name": "Ada Lovelace",
      // Index Ada's groups in her profile
      "groups": {
         // the value here doesn't matter, just that the key exists
         "techpioneers": true,
         "womentechmakers": true
      }
    },
    ...
  },
  "groups": {
    "techpioneers": {
      "name": "Historical Tech Pioneers",
      "members": {
        "alovelace": true,
        "ghopper": true,
        "eclarke": true
      }
    },
    ...
  }
}

יכול להיות שתשימו לב שחלק מהנתונים משוכפלים, כי הקשר נשמר גם ברשומה של עדה וגם בקבוצה. עכשיו alovelace מאונדקס בקבוצה, ו-techpioneers מופיע בפרופיל של Ada. לכן, כדי למחוק את Ada מהקבוצה, צריך לעדכן את המידע בשני מקומות.

זוהי יתירות הכרחית לקשרים דו-כיווניים. הכלי מאפשר לכם לאחזר במהירות וביעילות את החברויות של Ada, גם כשרשימת המשתמשים או הקבוצות גדלה למיליונים או כשכללי האבטחה של מסד נתונים בזמן אמת מונעים גישה לחלק מהרשומות.

בגישה הזו, הנתונים מוצגים בצורה הפוכה: המזהים מופיעים כמפתחות והערך מוגדר כ-true. כך אפשר לבדוק אם מפתח מסוים קיים פשוט על ידי קריאת /users/$uid/groups/$group_id ובדיקה אם הוא null. האינדקס מהיר ויעיל בהרבה מביצוע שאילתות או סריקה של הנתונים.

השלבים הבאים

קריאה וכתיבה של נתונים ב-Realtime Database