metoda de eșantionare Bootstrap este un concept foarte simplu și este un bloc de construcție pentru unii dintre cei mai avansați algoritmi de învățare automată, cum ar fi AdaBoost și XGBoost. Cu toate acestea, când am început călătoria mea în știința datelor, nu am putut înțelege destul de bine punctul. Deci, obiectivele mele sunt să explic ce este metoda bootstrap și de ce este important să știți!tehnic vorbind, metoda de eșantionare bootstrap este o metodă de reeșantionare care utilizează eșantionarea aleatorie cu înlocuire.,
nu vă faceți griji dacă sună confuz, permiteți-mi să explic cu o diagrama:
să Presupunem că aveți un eșantion inițial cu 3 observații. Folosind metoda de eșantionare bootstrap, veți crea un nou eșantion cu 3 observații, de asemenea. Fiecare observație are șanse egale de a fi aleasă (1/3). În acest caz, a doua observație a fost aleasă la întâmplare și va fi prima observație din noul nostru eșantion.,
After choosing another observation at random, you chose the green observation.
Lastly, the yellow observation is chosen again at random. Remember that bootstrap sampling using random sampling with replacement., Aceasta înseamnă că este foarte posibil ca o observație deja aleasă să fie aleasă din nou.
și aceasta este esența eșantionării bootstrap!mare, acum ați înțeles ce Bootstrap de eșantionare este, și știi cât de simplu este conceptul, dar acum vă întrebați, probabil, ceea ce o face atât de util.
este blocul de construcție pentru mulți algoritmi moderni de învățare automată
pe măsură ce aflați mai multe despre învățarea automată, veți întâlni aproape sigur termenul „agregare bootstrap”, cunoscut și sub numele de „insacuire”., Bagging – ul este o tehnică folosită în mulți algoritmi de învățare a mașinilor de ansamblu, cum ar fi păduri aleatorii, AdaBoost, gradient boost și XGBoost.
vezi articolul meu despre ansamblul de învățare, insacuire, și stimularea.uneori, atunci când se estimează parametrii unei populații (adică medie, eroare standard), este posibil să aveți un eșantion care nu este suficient de mare pentru a presupune că distribuția eșantionului este distribuită în mod normal. De asemenea, în unele cazuri, poate fi dificil să se elaboreze eroarea standard a estimării., În ambele cazuri, eșantionarea bootstrap poate fi utilizată pentru a rezolva aceste probleme.
în esență, în ipoteza că eșantionul este reprezentativ pentru populație, eșantionarea bootstrap este efectuată pentru a furniza o estimare a distribuției eșantionării statisticii eșantionului în cauză.
acest punct este puțin mai statistic, deci dacă nu îl înțelegeți, nu vă faceți griji. Tot ce trebuie să înțelegeți este că eșantionarea bootstrap servește ca bază pentru „insacuire”, care este o tehnică pe care o folosesc multe modele de învățare automată.
Vă mulțumim pentru lectură!,
dacă doriți să aflați mai multe elemente fundamentale ale învățării automate și să fiți la curent cu conținutul meu, puteți face acest lucru aici.
dacă doriți să vă continuați învățările, consultați articolul meu despre învățarea ansamblului, ambalarea și stimularea aici.