última atualização em 6 de Maio de 2020
probabilidade quantifica a incerteza dos resultados de uma variável aleatória.
é relativamente fácil de entender e calcular a probabilidade para uma única variável. No entanto, no aprendizado de máquinas, muitas vezes temos muitas variáveis aleatórias que interagem de maneiras muitas vezes complexas e desconhecidas.,
Existem técnicas específicas que podem ser usadas para quantificar a probabilidade de múltiplas variáveis aleatórias, tais como a probabilidade conjunta, marginal e condicional. Estas técnicas fornecem a base para uma compreensão probabilística de encaixar um modelo preditivo aos dados.
neste post, você vai descobrir uma introdução suave à probabilidade conjunta, marginal e condicional para múltiplas variáveis aleatórias.
Após ler este post, você saberá:
- probabilidade conjunta é a probabilidade de dois eventos ocorrendo simultaneamente.,
- probabilidade Marginal é a probabilidade de um evento independentemente do resultado de outra variável.
- probabilidade condicional é a probabilidade de um evento ocorrer na presença de um segundo evento.
kick-start o seu projecto com a minha nova probabilidade de livro para a aprendizagem de máquinas, incluindo tutoriais passo-a-passo e os ficheiros de código-fonte Python para todos os exemplos.vamos começar.
- Update Oct / 2019:pequeno erro fixo, obrigado Anna.
- Update Nov / 2019: Described the symmetrical calculation of joint probability.,
a Gentle Introduction to Joint, Marginal, and Conditional Probability
Photo by Masterbutler, some rights reserved.
Descrição
Este tutorial está dividido em três partes; são eles:
- Probabilidade de Uma Variável Aleatória
- Probabilidade de Várias Variáveis Aleatórias
- Probabilidade de Independência e Exclusividade
Probabilidade de Uma Variável Aleatória
Probabilidade quantifica a probabilidade de um evento.,
especificamente, quantifica a probabilidade de um resultado específico ser para uma variável aleatória, como o lançamento de uma moeda, o lançamento de um dado, ou o desenho de uma carta de jogo a partir de um baralho.
Probability gives a measure of how likely it is for something to happen.
— Page 57, Probability: For the Enthusiastic Beginner, 2016.
para uma variável aleatória x, P (x)é uma função que atribui uma probabilidade a todos os valores de X.,
- Densidade de Probabilidade de x = P(x)
A probabilidade de um evento específico, Um para uma variável aleatória x é denotado como P(x=A), ou simplesmente como P(A).
- Probabilidade do Evento A = P(A)
a Probabilidade é calculada como o número de resultados desejados dividido pelo número total de resultados possíveis, no caso em que todos os resultados são igualmente prováveis.
- Probability = (number of desired outcomes) / (total number of possible outcomes)
This is intuitive if we think about a discrete random variable such as the roll of a die., Por exemplo, a probabilidade de um dado rolando a 5 é calculada como um resultado de rolar a 5 (1) dividido pelo número total de resultados discretos (6) ou 1/6 ou cerca de 0.1666 ou cerca de 16.666%.
a soma das probabilidades de todos os resultados deve ser igual a uma. Se não, não temos probabilidades válidas.
- soma das probabilidades de todos os resultados = 1, 0.
a probabilidade de um resultado impossível é zero. Por exemplo, é impossível rolar um 7 com uma matriz padrão de seis lados.
- probabilidade do resultado impossível = 0.,0
a probabilidade de um determinado resultado é uma. Por exemplo, é certo que um valor entre 1 e 6 ocorrerá ao rolar um dado de seis lados.
- probabilidade de certo resultado = 1,0
a probabilidade de um evento não ocorrer, chamado de complemento.
isto pode ser calculado por um menos a probabilidade do evento, ou 1 – P(a). Por exemplo, a probabilidade de não rolar um 5 seria 1 – P(5) ou 1 – 0.166 ou cerca de 0.833 ou cerca de 83.333%.,
- Probabilidade de Evento A = 1 – P(A)
Agora que estamos familiarizados com a probabilidade de uma variável aleatória, vamos considerar a probabilidade de várias variáveis aleatórias.
quer aprender a probabilidade de aprendizagem por máquina
faça agora o meu curso gratuito de 7 dias de acidente por e-mail (com código de exemplo).
Clique para se inscrever e também obter uma versão ebook PDF livre do curso.,
baixe o seu Mini-curso gratuito
probabilidade de múltiplas variáveis aleatórias
na aprendizagem com máquinas, é provável que trabalhemos com muitas variáveis aleatórias.
Por exemplo, dada uma tabela de dados, como no excel, cada linha representa uma observação ou evento separado, e cada coluna representa uma variável aleatória separada.
variáveis podem ser discretas, significando que elas assumem um conjunto finito de valores, ou contínuas, significando que elas assumem um valor real ou numérico.,como tal, estamos interessados na probabilidade de duas ou mais variáveis aleatórias.
isto é complicado, pois há muitas maneiras de variáveis aleatórias poderem interagir, O que, por sua vez, impacta as suas probabilidades.
isto pode ser simplificado reduzindo a discussão para apenas duas variáveis aleatórias (X, Y), embora os princípios generalizem para múltiplas variáveis.
E mais, para discutir a probabilidade de apenas dois eventos, um para cada variável (X=A, Y=B), embora pudéssemos facilmente discutir grupos de eventos para cada variável.,
Portanto, vamos introduzir a probabilidade de várias variáveis aleatórias como a probabilidade do evento A e o evento B, que em taquigrafia é X=A e Y=B.
Vamos supor que as duas variáveis estão relacionadas ou dependentes de alguma forma.
Como tal, existem três tipos principais de probabilidade de nós pode querer considerar; são eles:
- Conjunta de Probabilidade: Probabilidade de eventos A e B.
- Marginal de Probabilidade: a Probabilidade do evento X=Uma determinada variável Y.
- Probabilidade Condicional: Probabilidade de eventos de Um determinado evento B.,
estes tipos de probabilidade formam a base de grande parte da modelagem preditiva com problemas como classificação e regressão. Por exemplo:
- a probabilidade de uma linha de dados é a probabilidade conjunta de cada variável de entrada.
- a probabilidade de um valor específico de uma variável de entrada é a probabilidade marginal entre os valores das outras variáveis de entrada.
- o modelo preditivo em si é uma estimativa da probabilidade condicional de uma saída dado um exemplo de entrada.,
probabilidade conjunta, marginal e condicional são fundamentais na aprendizagem de máquinas.vamos dar uma olhada em cada um por sua vez.
probabilidade conjunta de duas variáveis
podemos estar interessados na probabilidade de dois eventos simultâneos, por exemplo, os resultados de duas variáveis aleatórias diferentes.
a probabilidade de dois (ou mais) eventos é chamada de probabilidade conjunta. A probabilidade conjunta de duas ou mais variáveis aleatórias é referida como a distribuição de probabilidade conjunta.,
Por exemplo, a probabilidade conjunta do evento a e do evento B é escrita formalmente como:
- P(A E B)
o “e” ou conjunção é denotado usando o capital de cabeça para baixo “U” operador “^” ou por vezes uma vírgula”,”.
- P(A ^ B)
- P(A, B)
a probabilidade conjunta para os Eventos A E B é calculada como a probabilidade de Evento A dado evento B multiplicada pela probabilidade de Evento B.,
Este pode ser declarado formalmente da seguinte forma:
- P(A e B) = P(A dado B) * P(B)
O cálculo da probabilidade conjunta é às vezes chamada de a regra fundamental da probabilidade ou do produto “regra” da probabilidade ou a “regra da cadeia” de probabilidade.
aqui, P (a given B) é a probabilidade do evento A dado que o evento B ocorreu, chamada de probabilidade condicional, descrita abaixo.
a probabilidade da articulação é simétrica, significando que P(A E B) é a mesma que P (B e A)., O cálculo usando a probabilidade condicional é também simétrica, por exemplo:
- P(A e B) = P(A dado B) * P(B) = P(B dado A) * P(A)
Probabilidade Marginal
Nós pode estar interessado na probabilidade de um evento para uma variável aleatória, independentemente do resultado da outra variável aleatória.
Por exemplo, a probabilidade de X=A para todos os resultados de Y.
A probabilidade de um evento, na presença de todo (ou um subconjunto de) resultados das outras variável aleatória é chamado a probabilidade marginal ou marginal de distribuição., A probabilidade marginal de uma variável aleatória na presença de variáveis aleatórias adicionais é referida como a distribuição de probabilidade marginal.
Ele é chamado a probabilidade marginal, porque se todos os resultados e probabilidades para as duas variáveis foram colocados juntos em uma tabela (X, como colunas, Y como linhas), então a probabilidade marginal de uma variável (X) seria a soma das probabilidades para a variável Y (linhas) sobre a margem do quadro.,
não existe notação especial para a probabilidade marginal; é apenas a soma ou união sobre todas as probabilidades de todos os eventos para a segunda variável para um dado evento fixo para a primeira variável.
- P ( X = a)=soma P(X=A, Y = yi) para todos os y
esta é outra importante regra fundamental na probabilidade, referida como a “regra da soma.”
a probabilidade marginal é diferente da probabilidade condicional (descrita a seguir) porque considera a união de todos os eventos para a segunda variável ao invés da probabilidade de um único evento.,
Probabilidade Condicional
podemos estar interessados na probabilidade de um evento dada a ocorrência de outro evento.
a probabilidade de um evento dada a ocorrência de outro evento é chamada de probabilidade condicional. A probabilidade condicional de uma a uma ou mais variáveis aleatórias é referida como a distribuição de probabilidade condicional.,
Por exemplo, a probabilidade condicional do evento A dado o evento B é escrito formalmente como:
- P(A dado B)
O “dado” é indicado usar o pipe “|” operador; por exemplo:
- P(A | B)
A probabilidade condicional para eventos de Um determinado evento B é calculado da seguinte forma:
- P(A dado B) = P(A e B) / P(B)
Este cálculo assume que a probabilidade do evento B é diferente de zero, por exemplo, não é impossível.
a noção de evento um dado evento B não significa que o evento B ocorreu (e.g., is certain); instead, it is the probability of event a occurring after or in the presence of event B for a given trial.
probabilidade de independência e exclusividade
ao considerar múltiplas variáveis aleatórias, é possível que elas não interajam.
Podemos saber ou assumir que duas variáveis não são dependentes uma da outra em vez disso são independentes.alternadamente, as variáveis podem interagir, mas os seus eventos não podem ocorrer simultaneamente, referidos como exclusividade.,
iremos analisar mais de perto a probabilidade de múltiplas variáveis aleatórias nestas circunstâncias nesta secção.se uma variável não é dependente de uma segunda variável, isso é chamado de independência ou independência estatística.
isto tem um impacto no cálculo das probabilidades das duas variáveis.por exemplo, podemos estar interessados na probabilidade conjunta de eventos independentes A E B, que é a mesma que a probabilidade de A e a probabilidade de B.,
Probabilidades são combinados usando multiplicação, portanto, o conjunto de probabilidade de eventos independentes é calculado como a probabilidade de Um evento multiplicado pela probabilidade do evento B.
Este pode ser declarado formalmente da seguinte forma:
- Conjunta de Probabilidade: P(A e B) = P(A) * P(B)
Como podemos intuir, a probabilidade marginal para um evento independente variável aleatória é simplesmente a probabilidade de o evento.,
é a ideia de probabilidade de uma única variável aleatória que está familiarizada com:
- probabilidade Marginal: P(A)
referimo-nos à probabilidade marginal de uma probabilidade independente como simplesmente a probabilidade.
similarmente, a probabilidade condicional de um dado B quando as variáveis são independentes é simplesmente a probabilidade de A como a probabilidade de B não tem efeito. Por exemplo:
- Probabilidade Condicional: P(A dado B) = P(A)
Podemos estar familiarizado com a noção de independência estatística da amostragem., Isto pressupõe que uma amostra não é afectada por amostras anteriores e não afecta amostras futuras.
muitos algoritmos de aprendizagem de máquinas assumem que as amostras de um domínio são independentes umas das outras e vêm da mesma distribuição de probabilidade, referidos como independentes e identicamente distribuídos, ou i. i. d. para abreviar.
exclusividade
Se a ocorrência de um evento excluir a ocorrência de outros eventos, então os eventos são considerados mutuamente exclusivos.
a probabilidade dos eventos é dita disjunta, significando que eles não podem interagir, são estritamente independentes.,
Se a probabilidade do evento a é mutuamente exclusiva com o evento B, então a probabilidade conjunta do evento a e do evento B é zero.
- P(A e B) = 0.0
em Vez disso, a probabilidade de um resultado pode ser descrito como evento A ou do evento B, declarou formalmente da seguinte forma:
- P(A ou B) = P(A) + P(B)
O “ou” é também chamado de uma união e é denotado como um capital “U” carta; por exemplo:
- P(A ou B) = P(A U B)
Se os eventos não são mutuamente exclusivos, podemos estar interessados no resultado de qualquer evento.,
a probabilidade de eventos não mutuamente exclusivos é calculada como a probabilidade do evento a e a probabilidade do evento B menos a probabilidade de ambos os eventos ocorrerem simultaneamente.
Este pode ser declarado formalmente da seguinte forma:
- P(A ou B) = P(A) + P(B) – P(A e B)
Ler Mais
Esta seção fornece mais recursos sobre o tema, se você está olhando para ir mais fundo.
Books
- Probability: For the Enthusiastic Beginner, 2016.reconhecimento de padrões e aprendizagem de máquinas, 2006.,
- Machine Learning: a Probabilistic Perspective, 2012.
Articles
- Probability, Wikipedia.
- Notation in probability and statistics, Wikipedia.
- Independence (probability theory), Wikipedia.
- Independent and identically distributed random variables, Wikipedia.
- Mutual exclusivity, Wikipedia.
- distribuição Marginal, Wikipédia.
- distribuição de probabilidade conjunta, Wikipédia.
- Probabilidade Condicional, Wikipédia.,
resumo
neste post, descobriu uma introdução suave à probabilidade conjunta, marginal e condicional para múltiplas variáveis aleatórias.
especificamente, você aprendeu:
- probabilidade conjunta é a probabilidade de dois eventos ocorrendo simultaneamente.
- probabilidade Marginal é a probabilidade de um evento independentemente do resultado de outra variável.
- probabilidade condicional é a probabilidade de um evento ocorrer na presença de um segundo evento.tem alguma pergunta?,Faça suas perguntas nos comentários abaixo e farei o meu melhor para responder.
Get a Handle on Probability for Machine Learning!
desenvolva a sua compreensão da probabilidade
…with just a few lines of python code
Discover how in my new eBook:
Probability for Machine LearningIt provides self-study tutorials and end-to-end projects on:
Bayes Theorem, Bayesian Optimization, Distributions, Maximum Probability, Cross-Entropy, Calibrating Models
and much more…,finalmente aproveitar a incerteza em seus projetos
saltar os acadêmicos. Apenas Resultados.Ver o que está dentro de
Tweet Share