Co to jest ponowne indeksowanie w Elasticsearch?

Co to jest ponowne indeksowanie w Elasticsearch?
Co to jest ponowne indeksowanie w Elasticsearch?
Anonim

Reindeks to koncepcja kopiowania istniejących danych z indeksu źródłowego do indeksu docelowego, który może znajdować się w tym samym lub innym klastrze. Elasticsearch ma do tego celu dedykowany punkt końcowy _reindex. Ponowne indeksowanie jest najczęściej wymagane do aktualizacji mapowania lub ustawień.

Ile czasu zajmuje ponowna indeksacja Elasticsearch?

Przesłanie 1000 rekordów do nowego indeksu zajęło ponad 40 minut, ale jeśli nie robię tego w ogóle, to ten sam reindeks zajmuje 5 minut.

Co oznacza reindeksowanie?

REINDEX odbudowuje indeks używając danych przechowywanych w tabeli indeksu, zastępując starą kopię indeksu. Istnieje kilka scenariuszy, w których można użyć REINDEX: Indeks został uszkodzony i nie zawiera już prawidłowych danych. … Indeks stał się „rozdęty”, to znaczy zawiera wiele pustych lub prawie pustych stron.

Co to jest indeksowanie danych w Elasticsearch?

Indeks można traktować jako zoptymalizowaną kolekcję dokumentów, a każdy dokument to zbiór pól, które są parami klucz-wartość, które zawierają dane. Domyślnie Elasticsearch indeksuje wszystkie dane w każdym polu, a każde indeksowane pole ma dedykowaną, zoptymalizowaną strukturę danych.

Co to jest indeksowanie zbiorcze w Elasticsearch?

Elasticsearch obsługuje również indeksowanie zbiorcze dokumentów. Zbiorczy interfejs API oczekuje par akcji/metadanych JSON rozdzielonych znakami nowego wiersza. Kiedykonstruując dokumenty w PHP, proces jest podobny. Najpierw tworzysz obiekt tablicy akcji (na przykład obiekt indeksu), a następnie tworzysz obiekt treści dokumentu.

Zalecana: