a Bootstrap mintavételi módszer egy nagyon egyszerű koncepció, amely építőeleme néhány fejlettebb gépi tanulási algoritmusnak, például az Adaboostnak és az Xgboostnak. Azonban, amikor elkezdtem az adattudományi utazást, nem tudtam teljesen megérteni annak lényegét. Tehát a célom, hogy elmagyarázzam, mi a bootstrap módszer, és miért fontos tudni!
technikailag a bootstrap mintavételi módszer egy újramintázási módszer, amely véletlenszerű mintavételt alkalmaz cserével.,
Ne aggódj, ha ez úgy hangzott, zavaros, hadd magyarázzam el egy ábra:
Tegyük fel, hogy van egy kezdeti minta 3 megfigyelések. A bootstrap mintavételi módszer, akkor hozzon létre egy új mintát 3 megfigyelések is. Minden megfigyelésnek egyenlő esélye van a kiválasztásra (1/3). Ebben az esetben a második megfigyelést véletlenszerűen választottuk ki, ez lesz az első megfigyelés az új mintánkban.,
After choosing another observation at random, you chose the green observation.
Lastly, the yellow observation is chosen again at random. Remember that bootstrap sampling using random sampling with replacement., Ez azt jelenti, hogy nagyon lehetséges, hogy egy már kiválasztott megfigyelést újra válasszanak.
és ez a lényege bootstrap mintavétel!
A Bootstrap mintavétel fontossága
nagyszerű, most már megérted, mi a bootstrap mintavétel, és tudod, milyen egyszerű a koncepció, de most valószínűleg azon tűnődsz, hogy mi teszi olyan hasznossá.
ez számos modern gépi tanulási algoritmus építőköve
ahogy többet megtudsz a gépi tanulásról, szinte biztosan találkozol a “bootstrap aggregálás” kifejezéssel, más néven “zsákolás”., A zsákolás olyan technika, amelyet sok együttes gépi tanulási algoritmusban használnak, mint a véletlenszerű erdők, az AdaBoost, a gradiens boost és az XGBoost.
nézze meg az ensemble learning, bagging, and boosting című cikkemet.
használható a
populáció paramétereinek becslésére néha egy populáció paramétereinek becslésekor (azaz átlagos, standard hiba), lehet, hogy olyan minta van, amely nem elég nagy ahhoz, hogy feltételezze, hogy a mintavételi eloszlást általában elosztják. Bizonyos esetekben nehéz lehet a becslés standard hibájának kidolgozása., Mindkét esetben, bootstrap mintavétel lehet használni, hogy a munka körül ezeket a problémákat.
lényegében azzal a feltételezéssel, hogy a minta reprezentatív a populációra, a bootstrap mintavételt a kérdéses mintavételi statisztika mintavételi eloszlásának becslésére végzik.
Ez a pont egy kicsit statisztikai jellegű, tehát ha nem érti, ne aggódjon. Mindössze annyit kell értenie, hogy a bootstrap mintavétel alapja a “zsákolásnak”, amely olyan technika, amelyet sok gépi tanulási modell használ.
Köszönjük az olvasást!,
Ha többet szeretne megtudni a gépi tanulás alapjairól, és naprakészen szeretne maradni a tartalmammal, itt megteheti.
Ha folytatni szeretné a tanulást, nézze meg az ensemble learning, bagging, and boosting című cikkemet itt.