Cloud Firestore Enterprise edition in Native mode is now available! Learn more.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Informacje o zapytaniach w czasie rzeczywistym na dużą skalę

W tym dokumencie znajdziesz wskazówki dotyczące skalowania aplikacji bezserwerowej, która obsługuje ponad tysiąc operacji na sekundę lub setki tysięcy użytkowników jednocześnie. Zawiera on zaawansowane tematy, które pomogą Ci dogłębnie poznać system. Jeśli dopiero zaczynasz korzystać z Cloud Firestore, zapoznaj się z krótkim przewodnikiem.

Cloud Firestore i pakiety SDK Firebase na urządzenia mobilne i do internetu zapewniają zaawansowany model tworzenia aplikacji bezserwerowych, w których kod po stronie klienta ma bezpośredni dostęp do bazy danych. Pakiety SDK umożliwiają klientom nasłuchiwanie aktualizacji danych w czasie rzeczywistym. Możesz używać aktualizacji w czasie rzeczywistym do tworzenia responsywnych aplikacji, które nie wymagają infrastruktury serwerowej. Uruchomienie aplikacji jest bardzo proste, ale warto poznać ograniczenia systemów, które składają się na Cloud Firestore, aby aplikacja bezserwerowa skalowała się i działała dobrze przy zwiększonym ruchu.

Wskazówki dotyczące skalowania aplikacji znajdziesz w sekcjach poniżej.

Wybierz lokalizację bazy danych blisko użytkowników

Ten diagram przedstawia architekturę aplikacji działającej w czasie rzeczywistym:

Przykładowa architektura aplikacji działającej w czasie rzeczywistym

Gdy aplikacja działająca na urządzeniu użytkownika (mobilnym lub w internecie) nawiązuje połączenie z Cloud Firestore, jest ono kierowane do serwera front-end Cloud Firestore w tym samym regionie, w którym znajduje się Twoja baza danych. Jeśli na przykład baza danych znajduje się w regionie us-east1, połączenie jest kierowane do frontendu Cloud Firestore, który również znajduje się w regionie us-east1. Te połączenia są długotrwałe i pozostają otwarte, dopóki nie zostaną wyraźnie zamknięte przez aplikację. Interfejs odczytuje dane z bazowych Cloud Firestore systemów pamięci masowej.

Odległość między fizyczną lokalizacją użytkownika a lokalizacją bazy danych Cloud Firestore ma wpływ na opóźnienie odczuwane przez użytkownika. Na przykład użytkownik w Indiach, którego aplikacja komunikuje się z bazą danych w regionie Google Cloud w Ameryce Północnej, może odczuwać wolniejsze działanie aplikacji niż w przypadku, gdyby baza danych znajdowała się bliżej, np. w Indiach lub w innej części Azji.

Projektowanie z myślą o niezawodności

Poniższe tematy dotyczą zwiększania niezawodności aplikacji lub mają na nią wpływ:

Włączanie trybu offline

Pakiety SDK Firebase zapewniają trwałość danych w trybie offline. Jeśli aplikacja na urządzeniu użytkownika nie może połączyć się z Cloud Firestore, pozostaje dostępna dzięki pracy z danymi przechowywanymi lokalnie w pamięci podręcznej. Zapewnia to dostęp do danych nawet wtedy, gdy użytkownicy mają problemy z połączeniem internetowym lub całkowicie tracą dostęp na kilka godzin lub dni. Więcej informacji o trybie offline znajdziesz w artykule Włączanie danych offline.

Automatyczne ponawianie prób

Pakiety SDK Firebase zajmują się ponawianiem operacji i przywracaniem przerwanych połączeń. Pomaga to uniknąć błędów przejściowych spowodowanych ponownym uruchomieniem serwerów lub problemami z siecią między klientem a bazą danych.

Wybór lokalizacji regionalnych i wieloregionalnych

Wybór między lokalizacjami regionalnymi a wieloregionalnymi wiąże się z kilkoma kompromisami. Główna różnica polega na sposobie replikacji danych. Ma to wpływ na gwarancje dostępności aplikacji. Instancja wieloregionowa zapewnia większą niezawodność i trwałość danych, ale wiąże się z wyższymi kosztami.

Omówienie systemu zapytań w czasie rzeczywistym

Zapytania w czasie rzeczywistym, zwane też odbiornikami migawek, umożliwiają aplikacji nasłuchiwanie zmian w bazie danych i otrzymywanie powiadomień o niskim opóźnieniu, gdy tylko dane ulegną zmianie. Aplikacja może uzyskać ten sam wynik, okresowo odpytując bazę danych o aktualizacje, ale często jest to wolniejsze, droższe i wymaga więcej kodu. Przykłady konfigurowania i używania zapytań w czasie rzeczywistym znajdziesz w artykule Otrzymywanie aktualizacji w czasie rzeczywistym. W kolejnych sekcjach znajdziesz szczegółowe informacje o tym, jak działają odbiorniki migawek, oraz opis niektórych sprawdzonych metod skalowania zapytań w czasie rzeczywistym przy zachowaniu wydajności.

Wyobraź sobie 2 użytkowników, którzy łączą się z Cloud Firestore za pomocą aplikacji do przesyłania wiadomości utworzonej przy użyciu jednego z pakietów SDK na urządzenia mobilne.

Klient A zapisuje w bazie danych, aby dodać i zaktualizować dokumenty w kolekcji o nazwie chatroom:

collection chatroom:
    document message1:
      from: 'Sparky'
      message: 'Welcome to Cloud Firestore!'

    document message2:
      from: 'Santa'
      message: 'Presents are coming'

Klient B nasłuchuje aktualizacji w tej samej kolekcji za pomocą narzędzia do nasłuchiwania zrzutów.Klient B otrzymuje natychmiastowe powiadomienie, gdy ktoś utworzy nową wiadomość.Na poniższym diagramie przedstawiono architekturę narzędzia do nasłuchiwania zrzutów:

Architektura połączenia detektora zrzutu

Gdy klient B połączy z bazą danych odbiornik migawki, nastąpi ta sekwencja zdarzeń:

Klient B otwiera połączenie z Cloud Firestore i rejestruje odbiorcę, wywołując onSnapshot(collection("chatroom")) za pomocą pakietu Firebase SDK. Ten odbiornik może być aktywny przez wiele godzin.
Cloud Firestore Frontend wysyła zapytania do bazowego systemu pamięci masowej, aby zainicjować zbiór danych. Wczytuje cały zbiór wyników pasujących dokumentów. Nazywamy to zapytaniem o stan. Następnie system sprawdza reguły zabezpieczeń Firebase bazy danych, aby potwierdzić, że użytkownik ma dostęp do tych danych. Jeśli użytkownik jest autoryzowany, baza danych zwraca mu dane.
Zapytanie klienta B przechodzi wtedy w tryb nasłuchiwania. Nasłuchujący rejestruje się w obsłudze subskrypcji i czeka na aktualizacje danych.
Klient A wysyła teraz operację zapisu, aby zmodyfikować dokument.
Baza danych zatwierdza zmianę dokumentu w swoim systemie pamięci masowej.
System zatwierdza tę samą aktualizację w wewnętrznym dzienniku zmian. Dziennik zmian ustala ścisłą kolejność zmian w miarę ich wprowadzania.
Dziennik zmian z kolei rozprowadza zaktualizowane dane do puli modułów obsługi subskrypcji.
Uruchamia się wyszukiwarka zapytań odwrotnych, aby sprawdzić, czy zaktualizowany dokument pasuje do jakichkolwiek zarejestrowanych obecnie detektorów migawek. W tym przykładzie dokument pasuje do odbiornika zrzutów klienta B. Jak sama nazwa wskazuje, dopasowywanie zapytań odwrotnych można traktować jako zwykłe zapytanie do bazy danych, ale wykonywane w odwrotnej kolejności. Zamiast przeszukiwać dokumenty w poszukiwaniu tych, które pasują do zapytania, skutecznie przeszukuje zapytania w poszukiwaniu tych, które pasują do przychodzącego dokumentu. Gdy system znajdzie pasujący dokument, przekaże go do detektorów zrzutów. Następnie system sprawdza reguły zabezpieczeń Firebase bazy danych, aby upewnić się, że dane otrzymują tylko autoryzowani użytkownicy.
System przekazuje aktualizację dokumentu do pakietu SDK na urządzeniu klienta B, a następnie wywoływana jest funkcja zwrotna onSnapshot. Jeśli lokalne utrwalanie jest włączone, pakiet SDK zastosuje aktualizację również w pamięci podręcznej.

Kluczowym elementem skalowalności Cloud Firestore jest zwielokrotnienie wyjściowe z dziennika zmian na moduły obsługi subskrypcji i serwery frontendu. Zwielokrotnienie wyjściowe umożliwia wydajne rozpowszechnianie pojedynczej zmiany danych w celu obsługi milionów zapytań w czasie rzeczywistym i połączonych użytkowników. Uruchamiając wiele replik wszystkich tych komponentów w różnych strefach (lub w przypadku wdrożenia w wielu regionach – w różnych regionach), Cloud Firestore osiąga wysoką dostępność i skalowalność.

Warto zauważyć, że wszystkie operacje odczytu wykonywane z mobilnych i internetowych pakietów SDK postępują zgodnie z powyższym modelem. Aby zachować gwarancje spójności, wykonują one zapytanie o sondowanie, a potem przechodzą w tryb nasłuchiwania. Dotyczy to też detektorów w czasie rzeczywistym, wywołań służących do pobierania dokumentu i zapytań jednorazowych. Pobieranie pojedynczych dokumentów i zapytania jednorazowe można traktować jako krótkotrwałe detektory zrzutów, które mają podobne ograniczenia dotyczące wydajności.

Stosowanie sprawdzonych metod skalowania zapytań w czasie rzeczywistym

Aby projektować skalowalne zapytania w czasie rzeczywistym, stosuj te sprawdzone metody.

Analizowanie dużego ruchu związanego z zapisem w systemie

W tej sekcji dowiesz się, jak system reaguje na rosnącą liczbę żądań zapisu.

Cloud FirestoreDzienniki zmian, które obsługują zapytania w czasie rzeczywistym,Cloud Firestore automatycznie skalują się w poziomie wraz ze wzrostem ruchu związanego z zapisem. Gdy szybkość zapisu w bazie danych przekroczy możliwości pojedynczego serwera, dziennik zmian zostanie podzielony na kilka serwerów, a przetwarzanie zapytań zacznie korzystać z danych z kilku modułów obsługi subskrypcji zamiast z jednego. Z perspektywy klienta i pakietu SDK jest to w pełni przejrzyste i nie wymaga żadnych działań ze strony aplikacji w przypadku podziału. Ten diagram pokazuje, jak skalują się zapytania w czasie rzeczywistym:

Architektura zwielokrotnienia wyjściowego historii zmian

Automatyczne skalowanie umożliwia zwiększanie ruchu związanego z zapisem bez ograniczeń, ale w miarę wzrostu ruchu system może potrzebować trochę czasu na reakcję. Aby uniknąć tworzenia hotspotu zapisu, postępuj zgodnie z zaleceniami reguły 5-5-5. Key Visualizer to przydatne narzędzie do analizowania punktów zapisu.

Wiele aplikacji ma przewidywalny wzrost organiczny, który Cloud Firestore można obsłużyć bez środków ostrożności. Jednak zadania wsadowe, takie jak importowanie dużego zbioru danych, mogą zbyt szybko zwiększyć liczbę zapisów. Podczas projektowania aplikacji pamiętaj, skąd pochodzi ruch związany z zapisami.

Jak interakcje zapisu i odczytu wpływają na siebie

System zapytań w czasie rzeczywistym można traktować jako potok łączący operacje zapisu z czytnikami. Za każdym razem, gdy dokument zostanie utworzony, zaktualizowany lub usunięty, zmiana jest propagowana z systemu pamięci masowej do aktualnie zarejestrowanych odbiorców. Struktura dziennika zmian Cloud Firestore gwarantuje silną spójność, co oznacza, że aplikacja nigdy nie otrzymuje powiadomień o aktualizacjach, które są nieuporządkowane w porównaniu z momentem, w którym baza danych zatwierdziła zmiany danych. Upraszcza to tworzenie aplikacji, ponieważ eliminuje przypadki brzegowe związane ze spójnością danych.

Ten połączony potok oznacza, że operacja zapisu powodująca hotspoty lub rywalizację o blokady może negatywnie wpływać na operacje odczytu. Gdy operacje zapisu nie powiodą się lub zostaną ograniczone, odczyt może się zatrzymać w oczekiwaniu na spójne dane z dziennika zmian. Jeśli tak się stanie w Twojej aplikacji, możesz zauważyć zarówno powolne operacje zapisu, jak i powiązane z nimi powolne czasy odpowiedzi na zapytania. Unikanie hotspotów to klucz do uniknięcia tego problemu.

Zadbaj o to, aby dokumenty i operacje zapisu były małe

Podczas tworzenia aplikacji z użyciem odbiorników zrzutów zwykle chcesz, aby użytkownicy szybko dowiadywali się o zmianach danych. Aby to osiągnąć, staraj się ograniczać rozmiar. System może bardzo szybko przesyłać małe dokumenty zawierające dziesiątki pól. Przetwarzanie większych dokumentów zawierających setki pól i duże ilości danych trwa dłużej.

Podobnie preferuj krótkie i szybkie operacje zatwierdzania i zapisu, aby utrzymać niskie opóźnienie. Duże partie mogą zwiększyć przepustowość z perspektywy autora, ale mogą też wydłużyć czas powiadamiania słuchaczy o migawkach. W porównaniu z innymi systemami baz danych, w których można używać przetwarzania wsadowego w celu zwiększenia wydajności, jest to często sprzeczne z intuicją.

Używaj wydajnych odbiorników

Wraz ze wzrostem szybkości zapisu w bazie danych usługa Cloud Firestore rozdziela przetwarzanie danych na wiele serwerów. Algorytm dzielenia na fragmenty usługi Cloud Firestore próbuje umieszczać dane z tej samej kolekcji lub grupy kolekcji na tym samym serwerze dziennika zmian. System stara się zmaksymalizować możliwą przepustowość zapisu, przy jednoczesnym utrzymaniu jak najmniejszej liczby serwerów zaangażowanych w przetwarzanie zapytania.

Niektóre wzorce mogą jednak nadal prowadzić do nieoptymalnego działania w przypadku odbiorców stanu. Jeśli na przykład aplikacja przechowuje większość danych w jednej dużej kolekcji, odbiornik może potrzebować połączenia z wieloma serwerami, aby otrzymać wszystkie potrzebne dane. Stanie się tak nawet wtedy, gdy zastosujesz filtr zapytania. Połączenie z wieloma serwerami zwiększa ryzyko wolniejszych odpowiedzi.

Aby uniknąć wolniejszych odpowiedzi, zaprojektuj schemat i aplikację tak, aby system mógł obsługiwać odbiorców bez łączenia się z wieloma różnymi serwerami. Najlepiej podzielić dane na mniejsze kolekcje o mniejszej częstotliwości zapisu.

Można to porównać do zapytań dotyczących wydajności w relacyjnej bazie danych, które wymagają pełnego skanowania tabeli. W relacyjnej bazie danych zapytanie wymagające skanowania całej tabeli jest odpowiednikiem odbiornika migawek, który monitoruje kolekcję o dużej liczbie zmian. Może działać wolniej niż zapytanie, które baza danych może obsłużyć za pomocą bardziej szczegółowego indeksu. Zapytanie z bardziej szczegółowym indeksem działa jak odbiornik migawki, który obserwuje pojedynczy dokument lub kolekcję, która zmienia się rzadziej. Aby jak najlepiej poznać zachowanie aplikacji i potrzeby związane z Twoim przypadkiem użycia, przeprowadź test obciążeniowy.

Zadbaj o szybkie wykonywanie zapytań odpytujących

Kolejnym kluczowym elementem responsywnych zapytań w czasie rzeczywistym jest zapewnienie szybkości i wydajności zapytania o dane początkowe. Gdy nowy odbiornik migawki po raz pierwszy nawiązuje połączenie, musi załadować cały zestaw wyników i wysłać go na urządzenie użytkownika. Powolne zapytania sprawiają, że aplikacja działa mniej responsywnie. Obejmuje to na przykład zapytania, które próbują odczytać wiele dokumentów, lub zapytania, które nie korzystają z odpowiednich indeksów.

W pewnych okolicznościach detektor może też wrócić ze stanu nasłuchiwania do stanu odpytywania. Dzieje się to automatycznie i jest niewidoczne dla pakietów SDK i aplikacji. Stan odpytywania może być wywoływany przez te warunki:

System ponownie równoważy dziennik zmian z powodu zmian obciążenia.
Hotspoty powodują nieudane lub opóźnione zapisy w bazie danych.
Chwilowe ponowne uruchomienie serwera tymczasowo wpływa na słuchaczy.

Jeśli zapytania o stan są wystarczająco szybkie, stan ten staje się niewidoczny dla użytkowników aplikacji.

Preferowanie detektorów o długim czasie działania

Otwieranie i utrzymywanie aktywnych odbiorników tak długo, jak to możliwe, jest często najbardziej opłacalnym sposobem tworzenia aplikacji korzystającej z Cloud Firestore. W przypadku korzystania z Cloud Firestore opłata jest naliczana za dokumenty zwracane do aplikacji, a nie za utrzymywanie otwartego połączenia. Odbiornik długotrwałej migawki odczytuje tylko dane potrzebne do obsługi zapytania przez cały okres jego istnienia. Obejmuje to początkowe sondowanie, a następnie powiadomienia, gdy dane faktycznie się zmienią. Zapytania jednorazowe ponownie odczytują dane, które mogły się nie zmienić od czasu ostatniego wykonania zapytania przez aplikację.

W przypadku aplikacji, które muszą przetwarzać duże ilości danych, odbiorniki migawek mogą nie być odpowiednie. Jeśli na przykład w Twoim przypadku użycia przez dłuższy czas przesyłanych jest wiele dokumentów na sekundę, lepiej będzie użyć jednorazowych zapytań wykonywanych z mniejszą częstotliwością.

Co dalej

Dowiedz się, jak korzystać z funkcji nasłuchiwania stanu.
Dowiedz się więcej o sprawdzonych metodach.