Tweet share Podělte

Naposledy Aktualizován dne 6. Května roku 2020

Pravděpodobnost kvantifikuje nejistotu výsledků náhodné veličiny.

je poměrně snadné pochopit a vypočítat pravděpodobnost pro jednu proměnnou. Nicméně ve strojovém učení máme často mnoho náhodných proměnných, které interagují často složitými a neznámými způsoby.,

existují specifické techniky, které lze použít k kvantifikaci pravděpodobnosti pro více náhodných proměnných, jako je společná, marginální a podmíněná pravděpodobnost. Tyto techniky poskytují základ pro pravděpodobnostní porozumění přizpůsobení prediktivního modelu datům.

v tomto příspěvku objevíte jemný úvod do společné, marginální a podmíněné pravděpodobnosti pro více náhodných proměnných.

po přečtení tohoto příspěvku budete vědět:

  • společná pravděpodobnost je pravděpodobnost dvou událostí vyskytujících se současně.,
  • marginální pravděpodobnost je pravděpodobnost události bez ohledu na výsledek jiné proměnné.
  • podmíněná pravděpodobnost je pravděpodobnost jedné události vyskytující se v přítomnosti druhé události.

Kick-start svůj projekt s mým novým knihy pravděpodobnosti pro strojové učení, včetně krok za krokem tutoriály a soubory zdrojového kódu Python pro všechny příklady.

začněme.

  • aktualizace říjen / 2019: Opraven menší překlep, díky Anna.
  • aktualizace Nov / 2019: popsal symetrický výpočet pravděpodobnosti kloubu.,

Jemný Úvod do Kloubu, Marginální a Podmíněná Pravděpodobnost
Foto Masterbutler, některá práva jsou vyhrazena.

Přehled

Tento výukový program je rozdělen do tří částí; jsou to:

  1. Pravděpodobnost, že Náhodná Proměnná.
  2. Pravděpodobnosti Více Náhodných Veličin
  3. Pravděpodobnost, Nezávislost a Exkluzivitu

Pravděpodobnost, že Náhodná Proměnná.

Pravděpodobnost kvantifikuje pravděpodobnost události.,

konkrétně kvantifikuje, jak pravděpodobný je konkrétní výsledek pro náhodnou proměnnou, jako je Hod mincí, hod kostkou nebo kreslení hrací karty z balíčku.

Pravděpodobnost udává míru pravděpodobnosti, že se něco stane.

– Strana 57, Pravděpodobnost: pro nadšeného začátečníka, 2016.

pro náhodnou proměnnou x, P (x) je funkce, která přiřadí pravděpodobnost všem hodnotám x.,

  • hustota pravděpodobnosti X = P(x)

pravděpodobnost konkrétní události a pro náhodnou proměnnou x je označena jako P(x=a) nebo jednoduše jako P (a).

  • Pravděpodobnost jevu A = P(A)

Pravděpodobnost je počítána jako počet požadovaných výsledků vydělený celkovým možné výsledky, v případě, že všechny výsledky jsou stejně pravděpodobné.

  • Pravděpodobnost = (počet požadovaných výstupů) / (celkový počet možných výsledků)

Toto je intuitivní, pokud si myslíme, že o diskrétní náhodné proměnné-jako hod kostkou., Například, pravděpodobnost, že zemřou rolling 5 se počítá jako jeden výsledek válcování 5 (1) děleno celkový počet diskrétních výstupů (6) nebo 1/6 nebo o 0.1666 nebo o 16.666%.

součet pravděpodobností všech výsledků se musí rovnat jedné. Pokud ne, nemáme platné pravděpodobnosti.

  • součet pravděpodobností pro všechny výsledky = 1.0.

pravděpodobnost nemožného výsledku je nulová. Například není možné vrátit 7 se standardní šestistrannou matricí.

  • Pravděpodobnost nemožného výsledku = 0.,0

pravděpodobnost určitého výsledku je jedna. Například je jisté, že hodnota mezi 1 a 6 nastane při válcování šestistranné formy.

  • pravděpodobnost určitého výsledku = 1,0

pravděpodobnost události, která se nevyskytuje, nazývaná KOMPLEMENT.

to lze vypočítat jedním mínus pravděpodobnost události nebo 1-P(a). Například, pravděpodobnost, ne válcování 5 by 1 – P(5) nebo 1 – 0.166 nebo o 0.833 nebo o 83.333%.,

  • pravděpodobnost události a = 1-P (a)

Nyní, když jsme obeznámeni s pravděpodobností jedné náhodné proměnné, uvažujme pravděpodobnost pro více náhodných proměnných.

Chcete se Dozvědět Pravděpodobnost Strojového Učení

Vezměte si své zdarma 7-denní e-mailový rychlokurz teď (s ukázkový kód).

kliknutím se zaregistrujete a získáte také bezplatnou verzi PDF Ebook kurzu.,

Stáhněte si ZDARMA Mini-Kurz,

Pravděpodobnosti Více Náhodných Veličin

V strojového učení, je pravděpodobné, že pracovat s mnoha náhodných veličin.

například vzhledem k tabulce dat, například v Excelu, představuje každý řádek samostatné pozorování nebo událost a každý sloupec představuje samostatnou náhodnou proměnnou.

proměnné mohou být buď diskrétní, což znamená, že přebírají konečnou sadu hodnot, nebo spojité, což znamená, že přebírají skutečnou nebo číselnou hodnotu.,

jako takový nás zajímá pravděpodobnost napříč dvěma nebo více náhodnými proměnnými.

to je komplikované, protože existuje mnoho způsobů, jak mohou náhodné proměnné interagovat, což zase ovlivňuje jejich pravděpodobnosti.

to lze zjednodušit snížením diskuse na pouhé dvě náhodné proměnné (X, Y), i když principy se zobecňují na více proměnných.

A dále, diskutovat o pravděpodobnost, že právě dvě události, jedna pro každou proměnnou (X=A, Y=B), i když bychom mohli stejně snadno o skupiny událostí pro každou proměnnou.,

Proto, představíme pravděpodobnosti více náhodných veličin, jako pravděpodobnost, událost a a událost B, který je v zkratka je X=a a Y=B.

Budeme předpokládat, že dvě proměnné jsou příbuzné nebo závislé nějakým způsobem.

Jako takový, tam jsou tři hlavní typy pravděpodobností chtít zvážit, jsou:

  • Společná Pravděpodobnost: Pravděpodobnost události a a B.
  • Marginální Pravděpodobnosti: Pravděpodobnost, že událost X=danou proměnnou Y.
  • Podmíněná Pravděpodobnost: Pravděpodobnost jevu A vzhledem k události B.,

tyto typy pravděpodobnosti tvoří základ hodně prediktivního modelování s problémy, jako je klasifikace a regrese. Například:

  • pravděpodobnost řady dat je společná Pravděpodobnost v každé vstupní proměnné.
  • pravděpodobnost specifické hodnoty jedné vstupní proměnné je mezní Pravděpodobnost v hodnotách ostatních vstupních proměnných.
  • samotný prediktivní model je odhad podmíněné pravděpodobnosti výstupu daného vstupního příkladu.,

společná, okrajová a podmíněná pravděpodobnost jsou základem strojového učení.

podívejme se na každý postupně.

společná Pravděpodobnost dvou proměnných

můžeme mít zájem o pravděpodobnost dvou souběžných událostí, např. o výsledky dvou různých náhodných proměnných.

pravděpodobnost dvou (nebo více) událostí se nazývá společná pravděpodobnost. Společná pravděpodobnost dvou nebo více náhodných proměnných se označuje jako společné rozdělení pravděpodobnosti.,

například, společný pravděpodobnost událost a a událost B je napsán formálně jako:

  • P(a B)

„a“ nebo spojení je označován pomocí vzhůru nohama kapitálu „U“ operátor „^“ nebo někdy čárka „,“.

  • P(A ^ B)
  • P (A, B)

společná pravděpodobnost událostí a A B se vypočítá jako pravděpodobnost události a dané události B vynásobená pravděpodobností události B.,

To může být uvedeno, formálně takto:

  • P(a B) = P(B) * P(B)

výpočet společného pravděpodobnost je někdy nazýván základní pravidlo pravděpodobnosti nebo „součinu“ pravděpodobnosti nebo „chain rule“ pravděpodobnosti.

zde P (dané B) je pravděpodobnost události a vzhledem k tomu, že došlo k události B, nazývané podmíněná pravděpodobnost, popsaná níže.

pravděpodobnost kloubu je symetrická, což znamená, že P(A A B) je stejná jako P(B A a)., Výpočet pomocí podmíněné pravděpodobnosti je také symetrické, například:

  • P(a B) = P(B) * P(B) = P(B vzhledem k A) * P(A)

Marginální Pravděpodobnost

může zajímat pravděpodobnost, že událost na jedné náhodné veličiny, bez ohledu na výsledek další náhodnou proměnnou.

například pravděpodobnost X=a pro všechny výsledky y.

pravděpodobnost jedné události v přítomnosti všech (nebo podmnožiny) výsledků druhé náhodné proměnné se nazývá marginální Pravděpodobnost nebo marginální rozdělení., Marginální pravděpodobnost jedné náhodné proměnné v přítomnosti dalších náhodných proměnných se označuje jako rozdělení marginální pravděpodobnosti.

To se nazývá marginální pravděpodobnostní, protože pokud jsou všechny výsledky a pravděpodobnosti pro obě proměnné byly stanoveny spolu v tabulce (X sloupcích a Y řádcích), pak marginální pravděpodobnost jedné proměnné (X) by součet pravděpodobností pro ostatní proměnné (Y řádků) na okraji tabulky.,

neexistuje žádná zvláštní notace pro mezní pravděpodobnost; je to jen součet nebo spojení všech pravděpodobností všech událostí pro druhou proměnnou pro danou pevnou událost pro první proměnnou.

  • P(X=a) = sum P (X=a, Y=yi) pro všechny y

toto je další důležité základní pravidlo v pravděpodobnosti, označované jako „pravidlo součtu.“

marginální Pravděpodobnost se liší od podmíněné pravděpodobnosti (popsané dále), protože považuje spojení všech událostí pro druhou proměnnou spíše než pravděpodobnost jediné události.,

podmíněná pravděpodobnost

můžeme mít zájem o pravděpodobnost události vzhledem k výskytu jiné události.

pravděpodobnost jedné události vzhledem k výskytu jiné události se nazývá podmíněná pravděpodobnost. Podmíněná pravděpodobnost jedné až jedné nebo více náhodných proměnných se označuje jako podmíněné rozdělení pravděpodobnosti.,

například, podmíněná pravděpodobnost jevu A vzhledem k jevu B je napsán formálně jako:

  • P(A B)

„vzhledem k tomu,“ je označován pomocí pipe „|“ operátor; například:

  • P(A | B)

podmíněná pravděpodobnost událostí pro danou událost B se vypočte takto:

  • P(A B) = P(a B) / P(B)

Tento výpočet předpokládá, že pravděpodobnost jevu B je různé od nuly, např. není nemožné.

pojem události a daná událost B neznamená, že došlo k události B (např., je jisté); místo toho je pravděpodobnost události a vyskytující se po nebo v přítomnosti události B pro danou studii.

Pravděpodobnost nezávislosti a exkluzivity

při zvažování více náhodných proměnných je možné, že nereagují.

můžeme vědět nebo předpokládat, že dvě proměnné nejsou na sobě závislé, místo toho jsou nezávislé.

proměnné mohou střídavě interagovat, ale jejich události se nemusí vyskytovat současně, označované jako exkluzivita.,

podrobněji se podíváme na pravděpodobnost více náhodných proměnných za těchto okolností v této části.

Independence

Pokud jedna proměnná nezávisí na druhé proměnné, nazývá se to nezávislost nebo statistická nezávislost.

to má vliv na výpočet pravděpodobnosti obou proměnných.

například nás může zajímat společná pravděpodobnost nezávislých událostí A A B, která je stejná jako pravděpodobnost A a pravděpodobnost B.,

a Pravděpodobnost, že jsou spojeny pomocí násobení, tedy společné pravděpodobnost, nezávislé jevy, je počítána jako pravděpodobnost události násobí pravděpodobnost události B.

To může být uvedeno, formálně takto:

  • Společná Pravděpodobnost: P(a B) = P(A) * P(B)

Jak jsme mohli vytušit, mezní pravděpodobnost pro událost pro nezávislé náhodné veličiny je prostě pravděpodobnost události.,

To je nápad pravděpodobnost jedné náhodné proměnné, které jsou obeznámeni s:

  • Marginální Pravděpodobnosti: P(A)

Máme na mysli marginální pravděpodobnost, nezávislé pravděpodobnost jednoduše jako pravděpodobnost.

podobně podmíněná pravděpodobnost daného B, když jsou proměnné nezávislé, je jednoduše pravděpodobnost a jako pravděpodobnost B nemá žádný účinek. Například:

  • podmíněná pravděpodobnost: P(daný B) = P (A)

můžeme být obeznámeni s pojmem statistické nezávislosti na odběru vzorků., To předpokládá, že jeden vzorek není ovlivněn předchozími vzorky a neovlivňuje budoucí vzorky.

Mnoho algoritmů strojového učení předpokládat, že vzorky z domény jsou nezávislé na sobě a pocházejí ze stejného rozdělení pravděpodobnosti, označované jako nezávislé a identicky distribuované, nebo já.jsem.d. pro krátké.

exkluzivita

Pokud výskyt jedné události vylučuje výskyt jiných událostí, pak se o událostech říká, že se vzájemně vylučují.

pravděpodobnost událostí se říká, že jsou disjoint, což znamená, že nemohou interagovat, jsou přísně nezávislé.,

Pokud se pravděpodobnost události a vzájemně vylučuje s událostí B, pak je společná pravděpodobnost události a a události B nulová.

  • P(a B) = 0.0

Místo toho, pravděpodobnost, že výsledek lze popsat jako událost nebo událost B, je uvedeno formálně takto:

  • P(A nebo B) = P(A) + P(B)

„nebo“ je také nazýván unie a je označován jako hlavní město „U“ dopis; například:

  • P(A nebo B) = P(A U B)

Pokud události, které nejsou vzájemně exkluzivní, jsme může mít zájem na výsledku události.,

pravděpodobnost vzájemně se vylučujících událostí se vypočítá jako pravděpodobnost události a a pravděpodobnost události B minus pravděpodobnost obou událostí vyskytujících se současně.

To může být uvedeno, formálně takto:

  • P(A nebo B) = P(A) + P(B) – P(a a B)

Další Čtení

Tento oddíl poskytuje více prostředků na toto téma, pokud máte zájem jít hlouběji.

knihy

  • pravděpodobnost: pro nadšeného začátečníka, 2016.
  • rozpoznávání vzorů a strojové učení, 2006.,
  • strojové učení: pravděpodobnostní perspektiva, 2012.

články

  • Pravděpodobnost, Wikipedia.
  • zápis v pravděpodobnosti a statistice, Wikipedia.
  • Independence (teorie pravděpodobnosti), Wikipedia.
  • nezávislé a identicky distribuované náhodné proměnné, Wikipedia.
  • vzájemná exkluzivita, Wikipedie.
  • marginální distribuce, Wikipedia.
  • společné rozdělení pravděpodobnosti, Wikipedia.
  • podmíněná pravděpodobnost, Wikipedie.,

Shrnutí

V tomto příspěvku, objevil jemný úvod do kloubu, marginální a podmíněné pravděpodobnosti více náhodných veličin.

konkrétně jste se dozvěděli:

  • společná pravděpodobnost je pravděpodobnost dvou událostí vyskytujících se současně.
  • marginální pravděpodobnost je pravděpodobnost události bez ohledu na výsledek jiné proměnné.
  • podmíněná pravděpodobnost je pravděpodobnost jedné události vyskytující se v přítomnosti druhé události.

máte nějaké dotazy?,
Ptejte se v komentářích níže a já se budu snažit odpovědět.

Získejte přehled o pravděpodobnosti strojového učení!

rozvíjejte své chápání pravděpodobnosti

…s jen pár řádek python kódu

Zjistit, jak můj nový Ebook:
Pravděpodobnost Strojového Učení

To poskytuje self-studium cvičení a end-to-end projektů na:
Bayesova Věta, Bayesovská Optimalizace, Pravděpodobnosti, Maximální Pravděpodobnost, Cross-Entropy, Kalibrace Modelů
a mnohem více…,

konečně využijte nejistotu ve svých projektech

přeskočte akademiky. Jen Výsledky.Podívejte se, co je uvnitř

Tweet Share