t .eet Share Share

sidst opdateret den 6.maj 2020

Sandsynlighed kvantificerer usikkerheden om resultaterne af en tilfældig variabel.

det er relativt let at forstå og beregne sandsynligheden for en enkelt variabel. Ikke desto mindre har vi i maskinlæring ofte mange tilfældige variabler, der interagerer på ofte komplekse og ukendte måder.,

der er specifikke teknikker, der kan bruges til at kvantificere sandsynligheden for flere tilfældige variabler, såsom den fælles, marginale og betingede sandsynlighed. Disse teknikker danner grundlag for en probabilistisk forståelse af tilpasning af en forudsigelig model til data.

i dette indlæg vil du opdage en mild introduktion til fælles, marginal og betinget sandsynlighed for flere tilfældige variabler.

efter at have læst dette indlæg, vil du vide:

  • fælles sandsynlighed er sandsynligheden for to hændelser, der forekommer samtidigt.,
  • Marginal sandsynlighed er sandsynligheden for en begivenhed uanset resultatet af en anden variabel.
  • betinget sandsynlighed er sandsynligheden for, at en begivenhed forekommer i nærvær af en anden begivenhed.Kick-start dit projekt med min nye bog Sandsynlighed for Machine Learning, herunder trin-for-trin tutorials og Python kildekode filer til alle eksempler.

    lad os komme i gang.

    • opdatering okt / 2019: Fast mindre tastefejl, tak Anna.
    • opdatering Nov / 2019: beskrevet den symmetriske beregning af fælles sandsynlighed.,

    En Blid Introduktion til Fælles, Marginale og Betingede Sandsynlighed
    Foto af Masterbutler, nogle rettigheder reserveret.

    Oversigt

    Denne tutorial er opdelt i tre dele; de er:

    1. Sandsynligheden for at En Tilfældig Variabel
    2. Sandsynligheden for, at Flere Tilfældige Variabler
    3. Sandsynligheden for Uafhængighed og Eksklusivitet

    Sandsynligheden for at En Tilfældig Variabel

    Sandsynlighed kvantificerer sandsynligheden for en hændelse.,

    specifikt kvantificerer det, hvor sandsynligt et specifikt resultat er for en tilfældig variabel, såsom flip af en mønt, terningkast eller tegning af et spillekort fra et dæk.

    Sandsynlighed giver et mål for, hvor sandsynligt det er for noget at ske.

    — side 57, Sandsynlighed: for den entusiastiske begynder, 2016.

    for en tilfældig variabel x er P (.) en funktion, der tildeler en sandsynlighed for alle værdier af..,

    • sandsynlighedstæthed af = =p (.)

    sandsynligheden for en bestemt begivenhed A for en tilfældig variabel variable betegnes som P (==A) eller blot som p(A).

    • Sandsynlighed for begivenhed a = p(a)

    sandsynlighed beregnes som antallet af ønskede resultater divideret med de samlede mulige resultater, hvis alle resultater er lige sandsynlige.

    • Sandsynlighed = (antal ønskede resultater)/(samlet antal mulige resultater)

    Dette er intuitivt, hvis vi tænker på en diskret tilfældig variabel, såsom rullen af en matrice., For eksempel er sandsynligheden for en matrice rullende en 5 beregnes som et resultat af rullende en 5 (1) divideret med det samlede antal diskrete resultater (6) eller 1/6 eller omkring 0.1666 eller omkring 16.666%.

    summen af sandsynlighederne for alle resultater skal svare til en. Hvis ikke, har vi ikke gyldige sandsynligheder.

    • summen af sandsynlighederne for alle resultater = 1.0.

    sandsynligheden for et umuligt resultat er nul. For eksempel er det umuligt at rulle en 7 med en standard seks-sidet dør.

    • Sandsynlighed for umuligt resultat = 0.,0

    sandsynligheden for et bestemt resultat er en. For eksempel er det sikkert, at en værdi mellem 1 og 6 vil forekomme, når man ruller en seks-sidet matrice.

    • Sandsynlighed for bestemt resultat = 1.0

    sandsynligheden for, at en begivenhed ikke forekommer, kaldet komplementet.

    dette kan beregnes med en minus sandsynligheden for begivenheden eller 1 – p(a). For eksempel vil sandsynligheden for ikke at rulle en 5 være 1 – p(5) eller 1 – 0.166 eller omkring 0.833 eller omkring 83.333%.,

    • Sandsynlighed for ikke Begivenhed A = 1-p (a)

    nu hvor vi er bekendt med sandsynligheden for en tilfældig variabel, lad os overveje sandsynligheden for flere tilfældige variabler.

    vil du lære Sandsynlighed for maskinlæring

    Tag mit gratis 7-dages e-mail-crashkursus nu (med prøvekode).

    Klik for at tilmelde dig og også få en gratis PDF ebook version af kurset.,

    Download Din GRATIS Mini-Kursus

    Sandsynligheden for, at Flere Tilfældige Variabler

    I machine learning, vi er tilbøjelige til at arbejde med mange tilfældige variabler.i betragtning af en datatabel, såsom i e .cel, repræsenterer hver række en separat observation eller begivenhed, og hver kolonne repræsenterer en separat tilfældig variabel.

    variabler kan enten være diskrete, hvilket betyder, at de påtager sig et begrænset sæt værdier eller kontinuerligt, hvilket betyder, at de får en reel eller numerisk værdi.,

    som sådan er vi interesserede i sandsynligheden på tværs af to eller flere tilfældige variabler.dette er kompliceret, da der er mange måder, hvorpå tilfældige variabler kan interagere, hvilket igen påvirker deres sandsynligheder.

    dette kan forenkles ved at reducere diskussionen til kun to tilfældige variabler (,, y), selvom principperne generaliseres til flere variabler.

    Og videre for at diskutere sandsynligheden for kun to begivenheder, en for hver variabel (==A, Y = b), selvom vi lige så let kunne diskutere grupper af begivenheder for hver variabel.,

    derfor introducerer vi sandsynligheden for flere tilfældige variabler som sandsynligheden for begivenhed A og begivenhed B, som i stenografi er==A og Y = B.

    vi antager, at de to variabler er relaterede eller afhængige på en eller anden måde.

    Som sådan, der er tre vigtigste typer af sandsynligheden vi måske ønsker at overveje; de er:

    • Fælles Sandsynlighed: Sandsynligheden for hændelser A og B.
    • Marginale Sandsynlighed: Sandsynligheden for hændelsen X=En given variabel Y.
    • Betinget Sandsynlighed: Sandsynligheden for at En given begivenhed begivenhed B.,

    disse typer af sandsynlighed danner grundlaget for meget af forudsigelig modellering med problemer som klassificering og regression. For eksempel:

    • sandsynligheden for en række data er den fælles sandsynlighed på tværs af hver inputvariabel.
    • sandsynligheden for en bestemt værdi af en inputvariabel er den marginale sandsynlighed på tværs af værdierne for de andre inputvariabler.
    • den prædiktive model selv er et skøn over den betingede sandsynlighed for et output givet et input eksempel.,

    fælles, marginale, og betinget sandsynlighed er grundlæggende i machine learning.

    lad os se nærmere på hver igen.

    fælles sandsynlighed for to variabler

    Vi kan være interesseret i sandsynligheden for to samtidige hændelser, f.eks. resultaterne af to forskellige tilfældige variabler.

    sandsynligheden for to (eller flere) begivenheder kaldes den fælles sandsynlighed. Den fælles sandsynlighed for to eller flere tilfældige variabler betegnes som den fælles sandsynlighedsfordeling.,for eksempel skrives den fælles sandsynlighed for begivenhed A og begivenhed B formelt som:

    • P(A og B)

    “og” eller konjunktionen betegnes ved hjælp af den opadrettede kapital “U” – operatør “^” eller undertiden et komma “,”.

    • P(A ^ B)
    • P(A, B)

    den fælles sandsynlighed for begivenheder A og B beregnes som sandsynligheden for begivenhed a given begivenhed B multipliceret med sandsynligheden for begivenhed B.,

    dette kan formelt angives som følger:

    • P(A og b) = p(a givet b) * p(b)

    beregningen af den fælles sandsynlighed kaldes undertiden den grundlæggende sandsynlighedsregel eller sandsynlighedsreglen “produkt” eller sandsynlighedsreglen “kæde”.

    Her er p(a givet B) sandsynligheden for begivenhed A, da begivenhed B har fundet sted, kaldet den betingede sandsynlighed, beskrevet nedenfor.

    den fælles sandsynlighed er symmetrisk, hvilket betyder, at P(A og B) er den samme som p(b og a)., Beregning ved hjælp af den betingede sandsynlighed er også symmetrisk, for eksempel:

    • P(A og B) = P(A B) * P(B) = P(B givet A) * P(A)

    Marginale Sandsynlighed

    Vi kan være interesseret i sandsynligheden for en hændelse for en stokastisk variabel, uanset udfaldet af en anden tilfældig variabel.sandsynligheden for a for alle resultater af Y.

    sandsynligheden for en begivenhed i nærvær af alle (eller en delmængde af) resultater af den anden tilfældige variabel kaldes den marginale Sandsynlighed eller den marginale fordeling., Den marginale Sandsynlighed for en tilfældig variabel i nærvær af yderligere tilfældige variabler betegnes som den marginale sandsynlighedsfordeling.

    det kaldes den marginale sandsynlighed, fordi hvis alle resultater og sandsynligheder for de to variabler blev lagt sammen i en tabel (columns som kolonner, Y som rækker), ville den marginale Sandsynlighed for en variabel (.) være summen af sandsynligheder for den anden variabel (Y rækker) på bordets margen.,

    Der er ingen særlig notation for den marginale Sandsynlighed; det er bare summen eller foreningen over alle sandsynligheder for alle begivenheder for den anden variabel for en given fast begivenhed for den første variabel.

    • P (==a) = sum P (.=A, Y=yi) for alle y

    Dette er en anden vigtig grundlæggende regel i Sandsynlighed, benævnt “sum regel.”

    Den marginale sandsynlighed er forskellig fra den betingede sandsynlighed (beskrevet nedenfor), fordi det mener foreningen af alle begivenheder, for den anden variabel snarere end sandsynligheden for en enkelt hændelse.,

    betinget sandsynlighed

    Vi kan være interesseret i sandsynligheden for en begivenhed i betragtning af forekomsten af en anden begivenhed.

    sandsynligheden for en begivenhed i betragtning af forekomsten af en anden begivenhed kaldes den betingede sandsynlighed. Den betingede sandsynlighed for en til en eller flere tilfældige variabler betegnes som den betingede sandsynlighedsfordeling.,

    For eksempel, at den betingede sandsynlighed af tilfælde af En given hændelse B er skrevet formelt som:

    • P(A B)

    “givet” er angivet ved hjælp af røret “|” operatør; for eksempel:

    • P(A | B)

    Den betingede sandsynlighed for begivenheder af En given hændelse B er beregnet som følger:

    • P(A B) = P(A og B) / P(B)

    Denne beregning forudsætter, at sandsynligheden for, at hændelsen B er ikke nul, fx er det ikke umuligt.

    begrebet begivenhed en given begivenhed B betyder ikke, at Begivenhed B har fundet sted (f. eks., er sikker); i stedet er det sandsynligheden for, at Begivenhed a forekommer efter eller i nærvær af begivenhed b for et givet forsøg.

    Sandsynlighed for uafhængighed og eksklusivitet

    når man overvejer flere tilfældige variabler, er det muligt, at de ikke interagerer.

    Vi kan vide eller antage, at to variabler ikke er afhængige af hinanden i stedet er uafhængige.

    skiftevis kan variablerne interagere, men deres begivenheder forekommer muligvis ikke samtidigt, benævnt eksklusivitet.,

    Vi vil se nærmere på sandsynligheden for flere tilfældige variabler under disse omstændigheder i dette afsnit.

    uafhængighed

    Hvis en variabel ikke er afhængig af en anden variabel, kaldes dette uafhængighed eller statistisk uafhængighed.

    dette har indflydelse på beregningen af sandsynlighederne for de to variabler.

    for eksempel kan vi være interesserede i den fælles sandsynlighed for uafhængige begivenheder A og B, hvilket er det samme som sandsynligheden for a og sandsynligheden for B.,

    Sandsynligheder er kombineret med multiplikation, og derfor er den fælles sandsynlighed for uafhængige hændelser er beregnet som sandsynligheden for En begivenhed, ganget med sandsynligheden for, at begivenheden B.

    Dette kan være anført formelt som følger:

    • Fælles Sandsynlighed: P(A og B) = P(A) * P(B)

    Som vi kan intuit, den marginale sandsynlighed for en hændelse for et uafhængige stokastiske variable er simpelthen sandsynligheden for, at begivenheden.,

    Det er ideen om sandsynligheden af en enkelt stokastisk variabel, der er bekendt med:

    • Marginale Sandsynlighed: P(A)

    Vi henvise til den marginale sandsynlighed for en uafhængig sandsynlighed som blot sandsynligheden.

    tilsvarende er den betingede sandsynlighed for a givet B, når variablerne er uafhængige, simpelthen sandsynligheden for a, da sandsynligheden for b ikke har nogen virkning. For eksempel:

    • betinget sandsynlighed: p(a givet b) = p(a)

    Vi er muligvis bekendt med begrebet statistisk uafhængighed fra prøveudtagning., Dette forudsætter, at en prøve ikke påvirkes af tidligere prøver og ikke påvirker fremtidige prøver.mange maskinlæringsalgoritmer antager, at prøver fra et domæne er uafhængige af hinanden og kommer fra den samme sandsynlighedsfordeling, benævnt uafhængig og identisk distribueret, eller kort sagt.

    eksklusivitet

    Hvis forekomsten af en begivenhed udelukker forekomsten af andre begivenheder, siges begivenhederne at være gensidigt eksklusive.

    sandsynligheden for begivenhederne siges at være usammenhængende, hvilket betyder, at de ikke kan interagere, er strengt uafhængige.,

    Hvis sandsynligheden for begivenhed a udelukker hinanden med begivenhed B, er den fælles sandsynlighed for begivenhed A og begivenhed B nul.

    • P(A og B) = 0.0

    i Stedet, sandsynligheden for at et resultat kan beskrives som en begivenhed, En event-eller B, anført formelt som følger:

    • P(A eller B) = P(A) + P(B)

    “eller” er der også kaldes en union, og som er betegnet som et stort “U” brev; for eksempel:

    • P(A eller B) = P(A U B)

    Hvis begivenheder er ikke gensidigt udelukkende, kan vi være interesseret i resultatet af begge tilfælde.,

    sandsynligheden for ikke-gensidigt eksklusive begivenheder beregnes som sandsynligheden for begivenhed A og sandsynligheden for begivenhed B minus sandsynligheden for, at begge begivenheder forekommer samtidigt.

    Dette kan være anført formelt som følger:

    • P(A eller B) = P(A) + P(B) – P(A og B)

    Yderligere Læsning

    Dette afsnit giver flere ressourcer om emnet, hvis du ønsker at gå dybere.

    bøger

    • Sandsynlighed: for den entusiastiske nybegynder, 2016.
    • mønstergenkendelse og maskinlæring, 2006.,
    • Machine Learning: et probabilistisk perspektiv, 2012.

    artikler

    • Sandsynlighed, Probabilityikipedia.
    • Notation i sandsynlighed og statistik, Wikipedia.
    • uafhængighed( sandsynlighedsteori), .ikipedia.
    • uafhængige og identisk distribuerede tilfældige variabler, .ikipedia.
    • gensidig eksklusivitet, Mutualikipedia.
    • Marginal distribution, .ikipedia.
    • fælles sandsynlighedsfordeling, .ikipedia.
    • betinget sandsynlighed, Conditionalikipedia.,

    resum.

    i dette indlæg opdagede du en mild introduktion til fælles, marginal og betinget sandsynlighed for flere tilfældige variabler.

    specifikt lærte du:

    • fælles sandsynlighed er sandsynligheden for to hændelser, der forekommer samtidigt.
    • Marginal sandsynlighed er sandsynligheden for en begivenhed uanset resultatet af en anden variabel.
    • betinget sandsynlighed er sandsynligheden for, at en begivenhed forekommer i nærvær af en anden begivenhed.

    har du spørgsmål?,
    stil dine spørgsmål i kommentarerne nedenfor, og jeg vil gøre mit bedste for at svare.

    få styr på sandsynligheden for maskinindlæring!

    udvikle din forståelse af Sandsynlighed

    …med bare et par linjer af python-kode

    Oplev, hvordan i min nye e-Bog:
    Sandsynlighed for Machine Learning

    Det giver self-undersøgelse tutorials og end-to-end-projekter på:
    Bayes Teorem, Bayesian-Optimering, – Distributioner, Maksimale Sandsynlighed for, på Tværs af Entropi, Kalibrering af Modeller
    og meget mere…,

    endelig udnytte usikkerhed i dine projekter

    Spring akademikere. Bare Resultater.Se hvad der er inde

    t Shareeet Share Share