Ultima actualizare pe 6 mai 2020
Probabilitatea cuantifică incertitudinea rezultatelor unei variabile aleatorii.este relativ ușor de înțeles și de calculat probabilitatea pentru o singură variabilă. Cu toate acestea, în învățarea automată, avem adesea multe variabile aleatorii care interacționează în moduri adesea complexe și necunoscute.,există tehnici specifice care pot fi utilizate pentru a cuantifica probabilitatea pentru mai multe variabile aleatorii, cum ar fi probabilitatea comună, marginală și condiționată. Aceste tehnici oferă baza pentru o înțelegere probabilistică a potrivirii unui model predictiv la date.în acest post, veți descoperi o introducere blândă a probabilității comune, marginale și condiționale pentru mai multe variabile aleatorii.după ce ați citit acest post, veți ști:
- Probabilitatea comună este probabilitatea ca două evenimente să apară simultan.,
- Probabilitatea marginală este probabilitatea unui eveniment indiferent de rezultatul unei alte variabile.
- probabilitatea condiționată este probabilitatea ca un eveniment să apară în prezența unui al doilea eveniment.
începeți proiectul cu noua mea carte Probability for Machine Learning, inclusiv tutoriale pas cu pas și fișierele de cod sursă Python pentru toate exemplele.
Să începem.
- actualizare Octombrie / 2019: eroare minoră fixă, mulțumesc Anna.
- actualizare Nov / 2019: a descris calculul simetric al probabilității comune.,
O Introducere sumară în Comun, Marginal și Probabilitatea Condiționată
Photo by Masterbutler, unele drepturi rezervate.acest tutorial este împărțit în trei părți; acestea sunt:
- probabilitatea unei variabile aleatorii
- Probabilitatea mai multor variabile aleatorii
- Probabilitatea Independenței și exclusivității
probabilitatea unei variabile aleatorii
Probabilitatea cuantifică probabilitatea unui eveniment.,mai exact, cuantifică cât de probabil este un rezultat specific pentru o variabilă aleatorie, cum ar fi răsturnarea unei monede, aruncarea unui zar sau desenarea unei cărți de joc dintr-o punte.
Probabilitatea oferă o măsură a cât de probabil este ca ceva să se întâmple.
— pagina 57, probabilitate: pentru începătorul entuziast, 2016.
pentru o variabilă aleatoare x, P (x) este o funcție care atribuie o probabilitate tuturor valorilor lui x.,
- densitatea probabilității lui x = P(x)
probabilitatea unui eveniment specific A pentru o variabilă aleatorie x este notată ca P(x=A) sau pur și simplu ca P(A).probabilitatea evenimentului A = P(A)
probabilitatea este calculată ca numărul de rezultate dorite împărțit la totalul rezultatelor posibile, în cazul în care toate rezultatele sunt la fel de probabile.
- probabilitate = (numărul de rezultate dorite)/(numărul total de rezultate posibile)
acest lucru este intuitiv Dacă ne gândim la o variabilă aleatoare discretă, cum ar fi rola unei matrițe., De exemplu, probabilitatea de a muri de rulare 5 se calculează ca un rezultat de rulare 5 (1) împărțit la numărul total de discrete rezultate (6) sau 1/6 sau despre 0.1666 sau despre 16.666%.suma probabilităților tuturor rezultatelor trebuie să fie egală cu una. Dacă nu, nu avem probabilități valide.
- suma probabilităților pentru toate rezultatele = 1.0.probabilitatea unui rezultat imposibil este zero. De exemplu, este imposibil să rotiți un 7 cu o matriță standard cu șase fețe.
- probabilitatea unui rezultat imposibil = 0.,0
probabilitatea unui anumit rezultat este una. De exemplu, este sigur că o valoare între 1 și 6 va apărea atunci când se rostogolește o matriță cu șase fețe.probabilitatea unui anumit rezultat = 1.0
probabilitatea ca un eveniment să nu apară, numit complement.acest lucru poate fi calculat cu un minus probabilitatea evenimentului sau 1-P (A). De exemplu, probabilitatea de a nu se filmează un 5 ar fi 1 – P(5) sau 1 – 0.166 sau despre 0.833 sau despre 83.333%.,
- probabilitatea evenimentului a = 1-P (A)
acum că suntem familiarizați cu probabilitatea unei variabile aleatorii, să luăm în considerare probabilitatea pentru mai multe variabile aleatorii.
doriți să aflați probabilitatea pentru învățarea automată
luați acum cursul meu gratuit de e-mail de 7 zile (cu cod de probă).Faceți clic pentru a vă înscrie și pentru a obține, de asemenea, o versiune gratuită de Ebook PDF a cursului.,
descărcați gratuit Mini-curs
Probabilitatea mai multor variabile aleatorii
în învățarea automată, este posibil să lucrăm cu multe variabile aleatorii.
de exemplu, având în vedere un tabel de date, cum ar fi în excel, fiecare rând reprezintă o observație sau un eveniment separat, iar fiecare coloană reprezintă o variabilă aleatoare separată.
variabilele pot fi discrete, ceea ce înseamnă că iau un set finit de valori sau continuu, ceea ce înseamnă că iau o valoare reală sau numerică.,ca atare ,suntem interesați de Probabilitatea în două sau mai multe variabile aleatoare.acest lucru este complicat, deoarece există multe modalități prin care variabilele aleatorii pot interacționa, ceea ce, la rândul lor, le afectează probabilitățile.acest lucru poate fi simplificat prin reducerea discuției la doar două variabile aleatorii (X, Y), deși principiile se generalizează la mai multe variabile.și mai departe, pentru a discuta Probabilitatea a doar două evenimente, unul pentru fiecare variabilă (X=A, Y=B), deși am putea discuta la fel de ușor grupuri de evenimente pentru fiecare variabilă.,prin urmare, vom introduce probabilitatea mai multor variabile aleatorii ca probabilitatea evenimentului A și a evenimentului B, care în prescurtare este X=a și Y=B.
presupunem că cele două variabile sunt legate sau dependente într-un fel.ca atare, există trei tipuri principale de probabilitate pe care am putea dori să le luăm în considerare; acestea sunt:
- probabilitate comună: probabilitatea evenimentelor A și B.
- probabilitate marginală: probabilitatea evenimentului X = o variabilă dată Y.
- probabilitate condiționată: probabilitatea evenimentului un eveniment dat B.,aceste tipuri de probabilitate formează baza unei mari părți a modelării predictive cu probleme precum clasificarea și regresia. De exemplu:
- probabilitatea unui rând de date este probabilitatea comună pentru fiecare variabilă de intrare.
- probabilitatea unei valori specifice a unei variabile de intrare este probabilitatea marginală între valorile celorlalte variabile de intrare.
- modelul predictiv în sine este o estimare a probabilității condiționate a unei ieșiri dat un exemplu de intrare.,Probabilitatea comună, marginală și condiționată sunt fundamentale în învățarea automată.să aruncăm o privire mai atentă la fiecare la rândul său.
Probabilitatea comună a două variabile
am putea fi interesați de Probabilitatea a două evenimente simultane, de exemplu, rezultatele a două variabile aleatoare diferite.Probabilitatea a două (sau mai multe) evenimente se numește probabilitatea comună. Probabilitatea comună a două sau mai multe variabile aleatorii este denumită distribuția probabilității comune.,de exemplu, probabilitatea comună a evenimentului A și a evenimentului B este scrisă formal ca:
- P (A și B)
„și” sau conjuncția este notată folosind capitalul inversat „U” operator „^” sau uneori o virgulă „,”.
- P(A ^ B)
- P(A, B)
probabilitatea comună pentru evenimentele A și B este calculată ca probabilitatea evenimentului un eveniment dat B înmulțit cu probabilitatea evenimentului B.,acest lucru poate fi declarat formal după cum urmează:
- P(A și B) = P(a dat B) * P(B)
calculul probabilității comune este uneori numit regula fundamentală a probabilității sau „regula produsului” de probabilitate sau „regula lanțului” de probabilitate.aici, P (a dat B) este probabilitatea de eveniment A având în vedere că evenimentul B a avut loc, numit probabilitatea condiționată, descrisă mai jos.probabilitatea comună este simetrică, ceea ce înseamnă că P(A și B) este aceeași cu P(B și A)., Calculul folosind probabilitatea condiționată este, de asemenea, simetrice, de exemplu:
- P(a și B) = P(A dat B) * P(B) = P(B-a dat O) * P(A)
Probabilității Marginale
Am putea fi interesat în probabilitatea unui eveniment pentru o variabilă aleatoare, indiferent de rezultatul de o altă variabilă aleatoare.de exemplu, probabilitatea lui X=A pentru toate rezultatele lui Y.
probabilitatea unui eveniment în prezența tuturor (sau a unui subset de) rezultate ale celeilalte variabile aleatorii se numește probabilitatea marginală sau distribuția marginală., Probabilitatea marginală a unei variabile aleatoare în prezența unor variabile aleatorii suplimentare este denumită distribuția probabilității marginale.
se numește probabilitate marginală, deoarece dacă toate rezultatele și probabilitățile pentru cele două variabile au fost stabilite împreună într-un tabel (X ca coloane, Y ca rânduri), atunci probabilitatea marginală a unei variabile (X) ar fi suma probabilităților pentru cealaltă variabilă (y rânduri) pe marginea tabelului.,
nu există o notație specială pentru Probabilitatea marginală; este doar suma sau unirea tuturor probabilităților tuturor evenimentelor pentru a doua variabilă pentru un eveniment fix dat pentru prima variabilă.
- P (X = A)=sum P(X=A, Y = yi) pentru toți y
aceasta este o altă regulă fundamentală importantă în probabilitate, denumită „regula sum.”
probabilitatea marginală este diferită de probabilitatea condiționată (descrisă în continuare), deoarece consideră unirea tuturor evenimentelor pentru a doua variabilă, mai degrabă decât probabilitatea unui singur eveniment.,
probabilitate condiționată
am putea fi interesați de probabilitatea unui eveniment având în vedere apariția unui alt eveniment.probabilitatea unui eveniment dat apariției unui alt eveniment se numește probabilitatea condiționată. Probabilitatea condiționată de la una la una sau mai multe variabile aleatorii este denumită distribuția probabilității condiționale.,
De exemplu, probabilitatea condiționată a evenimentului Un anumit eveniment B este scris în mod oficial ca:
- P(O dat B)
„dat” este notată folosind pipe „|” operator; de exemplu:
- P(A | B)
probabilitatea condiționată pentru evenimente de Un anumit eveniment B se calculează după cum urmează:
- P(O dat B) = P(a și B) / P(B)
Acest mod de calcul presupune că probabilitatea evenimentului B nu este zero, de exemplu, nu este imposibil.
noțiunea de eveniment un eveniment dat B nu înseamnă că evenimentul B a avut loc (de ex., este sigur); în schimb, este probabilitatea ca evenimentul A să apară după sau în prezența evenimentului B pentru un anumit proces.
Probabilitatea Independenței și exclusivității
când se iau în considerare mai multe variabile aleatorii, este posibil ca acestea să nu interacționeze.
este posibil să știm sau să presupunem că două variabile nu depind una de cealaltă, în schimb sunt independente.
alternativ, variabilele pot interacționa, dar evenimentele lor pot să nu apară simultan, denumită exclusivitate.,
vom arunca o privire mai atentă asupra probabilității mai multor variabile aleatorii în aceste condiții în această secțiune.dacă o variabilă nu depinde de o a doua variabilă, aceasta se numește independență sau independență statistică.acest lucru are un impact asupra calculării probabilităților celor două variabile.de exemplu, am putea fi interesați de probabilitatea comună a evenimentelor independente A și B, care este aceeași cu probabilitatea lui A și a probabilității lui B.,
Probabilități sunt combinate folosind multiplicare, prin urmare, probabilitatea comună de evenimente independente este calculat ca probabilitatea evenimentului a, înmulțită cu probabilitatea evenimentului B.
Acest lucru poate fi precizat în mod oficial, după cum urmează:
- Comune de Probabilitate: P(a și B) = P(A) * P(B)
Cum am putea intui, marginale probabilitatea unui eveniment pentru un independent variabilă aleatoare este pur și simplu probabilitatea de eveniment.,
este ideea probabilității unei singure variabile aleatorii care este familiarizată cu:
- probabilitate marginală: P(A)
ne referim la probabilitatea marginală a unei probabilități independente ca fiind pur și simplu probabilitatea.în mod similar, probabilitatea condiționată a unui anumit B atunci când variabilele sunt independente este pur și simplu probabilitatea lui A, deoarece probabilitatea lui B nu are efect. De exemplu:
- probabilitate condiționată: P (a dat B) = P(A)
s-ar putea să fim familiarizați cu noțiunea de Independență statistică față de eșantionare., Aceasta presupune că un eșantion nu este afectat de eșantioane anterioare și nu afectează eșantioanele viitoare.mulți algoritmi de învățare automată presupun că eșantioanele dintr-un domeniu sunt independente una de cealaltă și provin din aceeași distribuție de probabilitate, denumită independentă și distribuită identic sau i.i.d. pe scurt.
exclusivitate
dacă apariția unui eveniment exclude apariția altor evenimente, atunci se spune că evenimentele se exclud reciproc.se spune că probabilitatea evenimentelor este disjunctă, ceea ce înseamnă că nu pot interacționa, sunt strict independente.,dacă probabilitatea evenimentului A se exclude reciproc cu evenimentul B, atunci probabilitatea comună a evenimentului A și a evenimentului B este zero.
- P(a și B) = 0.0
în Schimb, probabilitatea unui rezultat poate fi descris ca Un eveniment sau un eveniment B, a declarat în mod oficial, după cum urmează:
- P(a sau B) = P(A) + P(B)
„sau” este numit, de asemenea, o uniune și este notată cu un capital de „U” scrisoare; de exemplu:
- P(a sau B) = P(A U B)
Dacă evenimentele nu sunt reciproc exclusive, am putea fi interesat în rezultatul fie cazul.,probabilitatea evenimentelor care nu se exclud reciproc este calculată ca probabilitatea evenimentului A și probabilitatea evenimentului B minus probabilitatea ca ambele evenimente să aibă loc simultan.acest lucru poate fi declarat în mod oficial, după cum urmează:
- P(A sau B) = P(A) + P(B) – P(A și B)
Lectură suplimentară
această secțiune oferă mai multe resurse pe această temă, dacă sunteți în căutarea de a merge mai adânc.
Cărți
- probabilitate: pentru începătorul entuziast, 2016.
- recunoașterea modelelor și învățarea automată, 2006.,
- Machine Learning: o perspectivă probabilistică, 2012.
articole
- probabilitate, Wikipedia.
- notație în Probabilitate și Statistică, Wikipedia.
- independența (teoria probabilităților), Wikipedia.
- variabile aleatoare independente și distribuite identic, Wikipedia.
- exclusivitate reciprocă, Wikipedia.
- distribuție marginală, Wikipedia.
- distribuția probabilității comune, Wikipedia.
- probabilitate condiționată, Wikipedia.,
rezumat
În acest post, ați descoperit o introducere blândă a probabilității comune, marginale și condiționale pentru mai multe variabile aleatorii.mai exact, ați învățat:
- Probabilitatea comună este probabilitatea ca două evenimente să apară simultan.
- Probabilitatea marginală este probabilitatea unui eveniment indiferent de rezultatul unei alte variabile.
- probabilitatea condiționată este probabilitatea ca un eveniment să apară în prezența unui al doilea eveniment.
aveți întrebări?,
puneți întrebările în comentariile de mai jos și voi face tot posibilul pentru a răspunde.ia un mâner pe probabilitate pentru Machine Learning!
Dezvoltați-vă înțelegerea probabilității
…cu doar câteva linii de cod python
Descoperiți cum în noul meu Ebook:
probabilitate pentru Machine LearningAcesta oferă tutoriale de auto-studiu și proiecte end-to-end pe:
Teorema Bayes, optimizare Bayesian, distribuții, probabilitate maximă, Cross-entropie, calibrarea modele
și mult mai mult…,în cele din urmă valorificați incertitudinea în proiectele dvs.
săriți academicienii. Doar Rezultate.Vezi ce este în interiorul
Tweet Share Share