W workowaniu, każde pojedyncze drzewa są niezależne od siebie ponieważ uwzględniają inny podzbiór cech i próbek.
Co się pakuje w drzewo decyzyjne?
Bagging (agregacja ładowania początkowego) jest używany gdy naszym celem jest zmniejszenie wariancji drzewa decyzyjnego. Tutaj pomysł polega na stworzeniu kilku podzbiorów danych z próby treningowej wybranej losowo z podmianą. … Wykorzystywana jest średnia wszystkich predykcji z różnych drzew, która jest bardziej niezawodna niż pojedyncze drzewo decyzyjne.
Dlaczego workowanie generuje skorelowane drzewa?
Wszystkie nasze drzewa w workach mają tendencję do wykonywania takich samych cięć, ponieważ wszystkie mają te same cechy. To sprawia, że wszystkie te drzewa wyglądają bardzo podobnie, co zwiększa korelację. Aby rozwiązać korelację drzew, pozwalamy losowemu lasowi losowo wybrać tylko m predyktorów podczas wykonywania podziału.
Co to jest workowanie losowego lasu?
Bagging to algorytm zespołowy, który dopasowuje wiele modeli do różnych podzbiorów treningowego zestawu danych, a następnie łączy predykcje ze wszystkich modeli. Losowy las to rozszerzenie workowania, które również losowo wybiera podzbiory funkcji używanych w każdej próbce danych.
Jak działa pakowanie w losowym lesie?
Algorytm losowego lasu jest w rzeczywistości algorytmem workowania: również tutaj losujemy próbki bootstrapu z twojego zestawu treningowego. Jednak oprócz sampli bootstrapowych równieżnarysuj losowe podzbiory cech do treningu poszczególnych drzew; w workowaniu zapewniamy każdemu drzewu pełen zestaw funkcji.