Die Bootstrap-Sampling-Methode ist ein sehr einfaches Konzept und ein Baustein für einige der fortgeschritteneren Algorithmen für maschinelles Lernen wie AdaBoost und XGBoost. Als ich jedoch meine Data Science-Reise begann, konnte ich den Punkt nicht ganz verstehen. Meine Ziele sind es also zu erklären, was die Bootstrap-Methode ist und warum es wichtig ist zu wissen!

Technisch gesehen ist die Bootstrap-Sampling-Methode eine Resampling-Methode, die Zufallsstichprobe mit Ersatz verwendet.,

Keine Sorge, wenn das verwirrend klang, lassen Sie es mich mit einem Diagramm erklären:

Angenommen, Sie haben ein erstes Beispiel mit 3 Beobachtungen. Mit der Bootstrap-Sampling-Methode erstellen Sie auch ein neues Sample mit 3 Beobachtungen. Jede Beobachtung hat die gleiche Chance, ausgewählt zu werden (1/3). In diesem Fall ist die zweite Beobachtung wurde zufällig gewählt und wird die erste Beobachtung in unserem neuen Probe.,

After choosing another observation at random, you chose the green observation.

Lastly, the yellow observation is chosen again at random. Remember that bootstrap sampling using random sampling with replacement., Dies bedeutet, dass es sehr gut möglich ist, dass eine bereits ausgewählte Beobachtung erneut ausgewählt wird.

Und das ist die Essenz der Bootstrap-Sampling!

Bedeutung des Bootstrap-Samplings

Großartig, jetzt verstehen Sie, was Bootstrap-Sampling ist, und Sie wissen, wie einfach das Konzept ist, aber jetzt fragen Sie sich wahrscheinlich, was es so nützlich macht.

Es ist der Baustein für viele moderne Algorithmen für maschinelles Lernen

Wenn Sie mehr über maschinelles Lernen erfahren, werden Sie mit ziemlicher Sicherheit auf den Begriff „Bootstrap-Aggregation“ stoßen, der auch als „Absacken“bezeichnet wird., Bagging ist eine Technik, die in vielen anderen Algorithmen für maschinelles Lernen wie Random Forests, AdaBoost, Gradient Boost und XGBoost verwendet wird.

Schauen Sie sich meinen Artikel über Ensemble Learning, Bagging und Boosting an.

Es kann verwendet werden, um die Parameter einer Population zu schätzen

Manchmal haben Sie bei der Schätzung der Parameter einer Population (dh Mittelwert, Standardfehler) eine Stichprobe, die nicht groß genug ist, um davon auszugehen, dass die Stichprobenverteilung normal verteilt ist. In einigen Fällen kann es auch schwierig sein, den Standardfehler der Schätzung herauszufinden., In beiden Fällen kann Bootstrap Sampling verwendet werden, um diese Probleme zu umgehen.

Im Wesentlichen wird unter der Annahme, dass die Stichprobe repräsentativ für die Population ist, eine Bootstrap-Stichprobe durchgeführt, um eine Schätzung der Stichprobenverteilung der fraglichen Stichprobenstatistik zu liefern.

Dieser Punkt ist etwas statistischer, wenn Sie ihn also nicht verstehen, machen Sie sich keine Sorgen. Alles, was Sie verstehen müssen, ist, dass das Bootstrap-Sampling als Grundlage für das „Absacken“ dient, eine Technik, die viele Modelle für maschinelles Lernen verwenden.

Danke fürs Lesen!,

Wenn Sie möchten, um mehr zu erfahren machine-learning-Grundlagen und bleiben Sie up to date mit meinen Inhalten, können Sie dies hier tun.

Wenn Sie Ihr Lernen fortsetzen möchten, lesen Sie hier meinen Artikel über Ensemble Learning, Bagging und Boosting.

Terence Shin