Cloud Firestore Enterprise edition in Native mode is now available! Learn more.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

אופטימיזציה של ביצועי השאילתות

כדי לפתור בעיות שקשורות לשאילתות איטיות, משתמשים בQuery Explain כדי לקבל את תוכנית הביצוע של השאילתה ואת פרופיל הביצוע בזמן הריצה. בקטע הבא מפורטים השלבים שאפשר לבצע כדי לשפר את הביצועים של השאילתות, בהתאם לפרופיל הביצוע:

הגבלת מספר התוצאות

כדי לזהות אם השאילתה מחזירה הרבה מסמכים, משתמשים בשדה records returned (רשומות שהוחזרו) בעץ הביצוע. כדאי להגביל את מספר המסמכים שמוחזרים באמצעות השלב limit(...). כך מקטינים את גודל הבייטים של התוצאות בסדרות כשמחזירים אותן ללקוחות ברשת. במקרים שבהם הצומת Limit קודם לצומת MajorSort, מנוע השאילתות יכול לאחד את הצמתים Limit ו-MajorSort ולהחליף מימוש מלא בזיכרון ומיון במיון TopN, וכך להקטין את דרישת הזיכרון של השאילתה.

הגבלת גודל מסמך התוצאה

כדאי להגביל את גודל המסמך שמוחזר באמצעות select(...) כדי להחזיר רק את השדות הנדרשים, או באמצעות remove_fields(...) כדי להשליך שדות גדולים מדי. כך אפשר לצמצם את עלויות החישוב והזיכרון של עיבוד תוצאות הביניים, ואת גודל התוצאות בבייט אחרי הסריאליזציה כשהן מוחזרות ללקוחות ברשת. במקרים שבהם כל השדות שמופיעים בשאילתה מכוסים על ידי אינדקס רגיל, השאילתה מכוסה באופן מלא על ידי סריקת האינדקס, כך שלא צריך לאחזר מסמכים מהאחסון הראשי.

שימוש באינדקסים

כדי להגדיר אינדקסים ולבצע אופטימיזציה שלהם:

זיהוי אם השאילתה משתמשת באינדקס

כדי לזהות אם השאילתה משתמשת באינדקס, בודקים את צמתי העלה בעץ הביצוע. אם צומת העלה של עץ הביצוע הוא צומת TableScan, המשמעות היא שהשאילתה לא משתמשת באינדקס וסורקת מסמכים מהאחסון הראשי. אם נעשה שימוש באינדקס, צומת העלה של עץ הביצוע יציג את מזהה האינדקס ואת שדות האינדקס של האינדקס.

איך מזהים אינדקס טוב יותר

אינדקס שימושי לשאילתה אם הוא יכול להקטין את מספר המסמכים שמנוע השאילתות צריך לאחזר מהאחסון הראשי, או אם סדר השדות שלו יכול לספק את דרישת המיון של השאילתה.

אם נעשה שימוש באינדקס בשאילתה, אבל מנוע השאילתות עדיין מאחזר ומוחק הרבה מסמכים, כפי שמצוין על ידי צומת Scan שמחזיר הרבה רשומות ואחריו צומת Filter שמחזיר מעט רשומות, זה סימן לכך שפרדיקט השאילתה שסופק באמצעות האינדקס לא סלקטיבי. כדי ליצור אינדקס מתאים יותר, אפשר לעיין במאמר יצירת אינדקסים.

אם נעשה שימוש באינדקס בשאילתה, אבל מנוע השאילתות עדיין מבצע סידור מחדש בזיכרון של קבוצת התוצאות, כפי שמצוין על ידי צומת MajorSort בעץ הביצוע של השאילתה, זה סימן לכך שאי אפשר להשתמש באינדקס כדי לספק את דרישת המיון של השאילתה. כדי ליצור אינדקס מתאים יותר, אפשר לעיין בקטע הבא.

יצירת אינדקסים

פועלים לפי ההוראות בתיעוד לניהול אינדקסים כדי ליצור אינדקסים. כדי לוודא שהשאילתה יכולה להשתמש באינדקסים, צריך ליצור אינדקסים רגילים (לא Multikey) עם שדות בסדר הבא:

כל השדות שישמשו באופרטורים של שוויון. כדי למקסם את הסיכוי לשימוש חוזר בשאילתות, כדאי לסדר את השדות בסדר יורד לפי מספר הפעמים שהם מופיעים באופרטורים של שוויון בין שאילתות.
כל השדות שיופיעו במיון (באותו הסדר).
שדות שישמשו באופרטורים של טווח או אי-שוויון בסדר יורד של סלקטיביות אילוצי השאילתה.
שדות שיוחזרו כחלק משאילתה באינדקס: הכללת שדות כאלה באינדקס מאפשרת לאינדקס לכסות את השאילתה, ומונעת את הצורך באחזור מסמך מהאחסון הראשי.

הפעלת סריקה של אינדקס או טבלה

כשמריצים שאילתה ב-Cloud Firestore, המערכת משתמשת באופן אוטומטי בכל האינדקסים שיכולים לייעל את השאילתה. לכן, לא צריך לציין אינדקס לשאילתות. עם זאת, לשאילתות שחיוניות לעומס העבודה שלכם, מומלץ להשתמש באפשרות forceIndex כדי לקבל ביצועים עקביים יותר.

במקרים מסוימים, יכול להיות ש-Cloud Firestore יבחר אינדקס שיגרום לעלייה בחביון של השאילתה. אם ביצעתם את השלבים לפתרון בעיות שקשורות לירידה בביצועים ואישרתם שכדאי לנסות אינדקס אחר לשאילתה, אתם יכולים לציין את האינדקס באמצעות האפשרות forceIndex.

אפשר להשתמש באפשרות forceIndex בכל שלב קלט בפעולות של צינורות כדי לבטל את תוכנית השאילתה שמוגדרת כברירת מחדל ב-Cloud Firestore ולציין אינדקס לשימוש, או כדי לאלץ סריקה של טבלה.

אילוץ אינדקס ספציפי

כדי לאלץ את השאילתה להשתמש באינדקס ספציפי, צריך לספק את מזהה האינדקס כמחרוזת לאפשרות forceIndex. אפשר למצוא את מזהה האינדקס במסוף או בהודעות שגיאה.

בדוגמה הבאה, המתכנן נאלץ להשתמש באינדקס עם המזהה CICAgOi36pgK:

Node.js

// Force Planner to use Index ID CICAgOi36pgK
await db.pipeline()
  .collectionGroup({ collectionId: "customers", forceIndex: "CICAgOi36pgK" })
  .limit(100)
  .execute();test.firestore.js

Java

// Force Planner to use Index ID CICAgOi36pgK
Pipeline.Snapshot results1 =
    firestore.pipeline()
      .collectionGroup("customers", new CollectionGroupOptions()
          .withHints(new CollectionHints().withForceIndex("CICAgOi36pgK")))
      .limit(100)
      .execute().get();PipelineSnippets.java

המשך

// Force Planner to use Index ID CICAgOi36pgK
snapshot1 := client.Pipeline().
	CollectionGroup("customers", firestore.WithForceIndex("CICAgOi36pgK")).
	Limit(100).
	Execute(ctx)pipeline_snippets_general.go

ריכזנו כאן כמה תרחישי שימוש שבהם כדאי להשתמש באינדקס ספציפי:

בדיקת הביצועים של אינדקסים שונים.
לוודא שנעשה שימוש באינדקס ספציפי וידוע כאופטימלי לשאילתה.
ביטול האופטימיזציה כשהבחירה שמוגדרת כברירת מחדל לא אופטימלית לשאילתה מסוימת.

אם האינדקס שצוין לא נמצא, השאילתה נכשלת.

הפעלת סריקת טבלה

סריקת טבלה קוראת מסמכים באוסף או בקבוצת אוספים בלי להשתמש באינדקסים משניים. כדי לכפות סריקת טבלה, מגדירים את forceIndex לערך primary.

בדוגמה הבאה מתבצעת סריקת טבלה:

// Force Planner to only do a Full-Table Scan
db.pipeline()
  .collectionGroup({ collectionId: "customers", forceIndex: "primary" })
  .limit(100)

יכול להיות שתשתמשו בסריקת טבלה במקרים הבאים:

לאוספים קטנים מאוד שבהם התקורה של האינדקס לא מוצדקת.
לשאילתות שנותנות גישה לרוב המסמכים באוסף.
לניפוי באגים ולהשוואת ביצועים.

שימוש ב-`forceIndex` עם Query Explain

אפשר להשתמש בQuery Explain במצבים explain או analyze כדי לראות את ההשפעות של forceIndex:

כדי לוודא ש-Cloud Firestore השתמש באינדקס שצוין ב-forceIndex, צריך לבדוק את צמתי העלה של עץ הביצוע כדי למצוא את מזהה האינדקס.
מוודאים שצומת TableScan מופיע בתוכנית כשמשתמשים ב-forceIndex: "primary".
במצב analyze, אפשר להשוות בין מדדי הביצועים – כמו זמן האחזור, המסמכים שנסרקו והערכים באינדקס שנסרקו – עם forceIndex ובלי forceIndex, כדי לשפר את ביצועי השאילתות.

שיטות מומלצות להשגת היעד `forceIndex`

‫forceIndex אמנם מאפשרת שליטה רבה יותר על ביצוע השאילתות, אבל אופטימיזציית השאילתות של Cloud Firestore בדרך כלל יעילה לרוב תרחישי השימוש. כדאי לפעול לפי השיטות המומלצות הבאות כשמשתמשים ב-forceIndex:

חשוב להשתמש ב-forceIndex בחוכמה. אם אתם רואים שהביצועים לא אופטימליים עם תוכנית השאילתה שמוגדרת כברירת מחדל, כדאי להשתמש בהסבר על שאילתה כדי לאבחן את הבעיה לפני שמכריחים שימוש באינדקס.
כשמשתמשים ב-forceIndex, חשוב לבדוק את השאילתות עם נפחי נתונים ריאליים כדי להבין את הביצועים שלהן ואת מאפייני העלות שלהן.
מומלץ להימנע משימוש ב-forceIndex: "primary" באוספים גדולים בסביבות ייצור.