Una introducción suave a la probabilidad conjunta, Marginal y condicional

Tweet Share Share

última actualización el 6 de mayo de 2020

la probabilidad cuantifica la incertidumbre de los resultados de una variable aleatoria.

es relativamente fácil de entender y calcular la probabilidad para una sola variable. Sin embargo, en el aprendizaje automático, a menudo tenemos muchas variables aleatorias que interactúan de maneras a menudo complejas y desconocidas.,

existen técnicas específicas que se pueden utilizar para cuantificar la probabilidad de múltiples variables aleatorias, como la probabilidad conjunta, marginal y condicional. Estas técnicas proporcionan la base para una comprensión probabilística de la adaptación de un modelo predictivo a los datos.

en este post, descubrirás una introducción suave a la probabilidad conjunta, marginal y condicional para múltiples variables aleatorias.

Después de leer este post, sabrás:

La probabilidad conjunta es la probabilidad de que dos eventos ocurran simultáneamente.,
La probabilidad Marginal es la probabilidad de un evento independientemente del resultado de otra variable.
La probabilidad condicional es la probabilidad de que un evento ocurra en presencia de un segundo evento.

inicia tu proyecto con My new book Probability for Machine Learning, que incluye tutoriales paso a paso y los archivos de código fuente de Python para todos los ejemplos.

comencemos.

actualización Oct / 2019: Corregido error menor, gracias Anna.
actualización Nov / 2019: describe el cálculo simétrico de la probabilidad conjunta.,

Una introducción suave a la probabilidad conjunta, Marginal y condicional
foto de Masterbutler, algunos derechos reservados.

resumen

Este tutorial se divide en tres partes; son:

probabilidad de una Variable aleatoria
probabilidad de múltiples Variables aleatorias
probabilidad de Independencia y exclusividad

probabilidad de una Variable aleatoria

probabilidad cuantifica la probabilidad de un evento.,

Específicamente, cuantifica la probabilidad de un resultado específico para una variable aleatoria, como tirar una moneda, tirar un dado o sacar una carta de un mazo.

Probabilidad da una medida de la probabilidad de que algo suceda.

– página 57, probabilidad: para el principiante entusiasta, 2016.

para una variable aleatoria x, P (x) es una función que asigna una probabilidad a todos los valores de x.,

Densidad de Probabilidad de x = P(x)

La probabilidad de un evento específico para Una variable aleatoria x se denota como P(x=A), o simplemente como P(a).

probabilidad de Evento A = P(A)

la probabilidad se calcula como el número de resultados deseados dividido por el total de resultados posibles, en el caso en que todos los resultados son igualmente probables.

Probability = (number of desired outcomes)/(total number of possible outcomes)

esto es intuitivo si pensamos en una variable aleatoria discreta como el rollo de un dado., Por ejemplo, la probabilidad de que un dado ruede un 5 se calcula como un resultado de rodar un 5 (1) dividido por el número total de resultados discretos (6) o 1/6 o aproximadamente 0.1666 o aproximadamente 16.666%.

la suma de las probabilidades de todos los resultados debe ser igual a uno. Si no, no tenemos probabilidades válidas.

suma de las probabilidades para todos los resultados = 1.0.

La probabilidad de un resultado imposible es cero. Por ejemplo, es imposible rodar un 7 con un dado estándar de seis lados.

probabilidad de resultado imposible = 0.,0

la probabilidad de un determinado resultado es una. Por ejemplo, es seguro que un valor entre 1 y 6 se producirá al rodar un dado de seis lados.

probabilidad de cierto resultado = 1.0

la probabilidad de que un evento no ocurra, llamado complemento.

esto se puede calcular por uno menos la probabilidad del evento, o 1 – P(A). Por ejemplo, la probabilidad de no rodar un 5 sería 1 – P(5) o 1 – 0.166 o aproximadamente 0.833 o aproximadamente 83.333%.,

probabilidad de no evento A = 1-P (A)

ahora que estamos familiarizados con la probabilidad de una variable aleatoria, consideremos la probabilidad de múltiples variables aleatorias.

quiero aprender la probabilidad para el aprendizaje automático

tome mi curso intensivo de correo electrónico gratuito de 7 días ahora (con código de muestra).

Haga clic para inscribirse y también obtenga una versión gratuita en PDF del curso.,

descargue su Mini-Curso Gratuito

probabilidad de múltiples Variables aleatorias

en el aprendizaje automático, es probable que trabajemos con muchas variables aleatorias.

por ejemplo, dada una tabla de datos, como en excel, cada fila representa una observación o evento separado, y cada columna representa una variable aleatoria separada.

Las Variables pueden ser discretas, lo que significa que toman un conjunto finito de valores, o continuas, lo que significa que toman un valor real o numérico.,

como tal, estamos interesados en la probabilidad a través de dos o más variables aleatorias.

esto es complicado ya que hay muchas formas en que las variables aleatorias pueden interactuar, lo que, a su vez, afecta sus probabilidades.

esto se puede simplificar reduciendo la discusión a solo dos variables aleatorias (X, Y), aunque los principios generalizan a múltiples variables.

y además, para discutir la probabilidad de solo dos eventos, uno para cada variable (X=A, y = B), aunque podríamos discutir fácilmente grupos de eventos para cada variable.,

por lo tanto, introduciremos la probabilidad de múltiples variables aleatorias como la probabilidad del evento A y el evento B, que en forma abreviada es X=A E y=B.

asumimos que las dos variables están relacionadas o dependen de alguna manera.

como tal, hay tres tipos principales de probabilidad que podríamos considerar; son:

probabilidad conjunta: probabilidad de Eventos A y B.
probabilidad Marginal: probabilidad de Evento X=una variable dada Y.
probabilidad condicional: probabilidad de evento a evento dado B.,

estos tipos de probabilidad forman la base de gran parte del modelado predictivo con problemas como la clasificación y la regresión. Por ejemplo:

La probabilidad de una fila de datos es la probabilidad conjunta a través de cada variable de entrada.
La probabilidad de un valor específico de una variable de entrada es la probabilidad marginal a través de los valores de las otras variables de entrada.
el modelo predictivo en sí es una estimación de la probabilidad condicional de una salida dada un ejemplo de entrada.,

la probabilidad conjunta, marginal y condicional son fundamentales en el aprendizaje automático.

echemos un vistazo más de cerca a cada uno por turno.

Probabilidad Conjunta de Dos Variables

Podemos estar interesados en la probabilidad de dos eventos simultáneos, por ejemplo, los resultados de dos variables aleatorias.

la probabilidad de dos (o más) eventos se llama probabilidad conjunta. La probabilidad conjunta de dos o más variables aleatorias se conoce como la distribución de probabilidad conjunta.,

por ejemplo, la probabilidad conjunta del evento A y el evento B se escribe formalmente como:

P(A y B)

El «y» o conjunción se denota usando el operador «u» mayúscula «^» o a veces una coma «,».

P(a ^ B)
P(a, B)

La probabilidad conjunta de los sucesos a y B se calcula como la probabilidad de Un evento a dado el evento B multiplicada por la probabilidad del evento B.,

esto puede ser declarado formalmente como sigue:

p(A y B) = P(A dado B) * P(B)

el cálculo de la probabilidad conjunta a veces se llama la regla fundamental de probabilidad o la «regla de producto» de probabilidad o la «regla de cadena» de probabilidad.

Aquí, P (A dado B) es la probabilidad del evento a dado que el evento B ha ocurrido, llamado la probabilidad condicional, descrita a continuación.

la probabilidad conjunta es simétrica, lo que significa que P(A y B) es lo mismo que P (B y A)., El cálculo utilizando la probabilidad condicional también es simétrica, por ejemplo:

P(a y B) = P(a dado B) * P(B) = P(B dado A) * P(a)

Probabilidad Marginal

Podemos estar interesados en la probabilidad de un evento para una variable aleatoria, independientemente del resultado de la otra variable aleatoria.

por ejemplo, la probabilidad de X=A para todos los resultados de Y.

la probabilidad de un evento en presencia de todos (o un subconjunto de) resultados de la otra variable aleatoria se llama probabilidad marginal o distribución marginal., La probabilidad marginal de una variable aleatoria en presencia de variables aleatorias adicionales se conoce como la distribución de probabilidad marginal.

se llama probabilidad marginal porque si todos los resultados y probabilidades para las dos variables se presentan juntos en una tabla (X como columnas, y como filas), entonces la probabilidad marginal de una variable (X) sería la suma de probabilidades para la otra variable (filas Y) en el margen de la tabla.,

no hay notación especial para la probabilidad marginal; es solo la suma o unión sobre todas las probabilidades de todos los eventos para la segunda variable para un evento fijo dado para la primera variable.

P (X=a)=suma P(X=A, y = yi) para todos y

Esta es otra regla fundamental importante en probabilidad, conocida como la «regla de suma.»

la probabilidad marginal es diferente de la probabilidad condicional (descrita a continuación) porque considera la Unión de todos los eventos para la segunda variable en lugar de la probabilidad de un solo evento.,

probabilidad condicional

podemos estar interesados en la probabilidad de un evento dada la ocurrencia de otro evento.

la probabilidad de un evento dada la ocurrencia de otro evento se llama probabilidad condicional. La probabilidad condicional de una a una o más variables aleatorias se conoce como la distribución de probabilidad condicional.,

por ejemplo, la probabilidad condicional de Evento un evento dado B se escribe formalmente como:

P(a dado B)

El «dado» se denota usando el operador pipe»|»; por ejemplo:

P(A | B)

la probabilidad condicional para eventos un evento dado B se calcula de la siguiente manera:

P(a dado b) = p(a y B) / P(B)

este cálculo asume que la probabilidad del evento B no es cero, por ejemplo, no es imposible.

la noción de evento a dado evento B no significa que el evento B ha ocurrido (e. g., es cierto); en cambio, es la probabilidad de que el evento A ocurra después o en presencia del evento B para un ensayo dado.

probabilidad de Independencia y exclusividad

al considerar múltiples variables aleatorias, es posible que no interactúen.

podemos saber o asumir que dos variables no son dependientes entre sí en lugar de ser independientes.

alternativamente, las variables pueden interactuar pero sus eventos pueden no ocurrir simultáneamente, lo que se conoce como exclusividad.,

echaremos un vistazo más de cerca a la probabilidad de múltiples variables aleatorias bajo estas circunstancias en esta sección.

Independencia

si una variable no depende de una segunda variable, esto se denomina independencia o independencia estadística.

esto tiene un impacto en el cálculo de las probabilidades de las dos variables.

por ejemplo, podemos estar interesados en la probabilidad conjunta de eventos independientes A y B, que es lo mismo que la probabilidad de A y la probabilidad de B.,

Las probabilidades se combinan usando la multiplicación, por lo tanto la probabilidad conjunta de eventos independientes se calcula como la probabilidad del evento a multiplicada por la probabilidad del evento B.

esto se puede afirmar formalmente de la siguiente manera:

probabilidad conjunta: P(A y B) = P(A) * P(B)

como podríamos intuir, la probabilidad marginal de un evento para una variable aleatoria independiente es simplemente la probabilidad del evento.,

es la idea de probabilidad de una sola variable aleatoria que están familiarizados con:

probabilidad Marginal: p (a)

nos referimos a la probabilidad marginal de una probabilidad independiente como simplemente la probabilidad.

del mismo modo, la probabilidad condicional de a dado B cuando las variables son independientes es simplemente la probabilidad de A como la probabilidad de B no tiene efecto. Por ejemplo:

probabilidad condicional: P (A dado B) = P(A)

podemos estar familiarizados con la noción de independencia estadística del muestreo., Esto supone que una muestra no se ve afectada por muestras anteriores y no afecta a muestras futuras.

muchos algoritmos de aprendizaje automático asumen que las muestras de un dominio son independientes entre sí y provienen de la misma distribución de probabilidad, conocida como independiente e idénticamente distribuida, o I.i.d. para abreviar.

exclusividad

si la ocurrencia de un evento excluye la ocurrencia de otros eventos, entonces se dice que los eventos son mutuamente excluyentes.

la probabilidad de los eventos se dice que son disjuntos, lo que significa que no pueden interactuar, son estrictamente independientes.,

si la probabilidad del evento A es mutuamente excluyente con el evento B, entonces la probabilidad conjunta del evento A y el evento B es cero.

p(A y B) = 0.0

en su lugar, la probabilidad de un resultado se puede describir como evento a o evento B, expresado formalmente de la siguiente manera:

p(A O B) = P(A) + P(B)

El «o» también se llama una unión y se denota como una letra «u» mayúscula; por ejemplo:

P(A o b) = p(a u b)

Si los eventos no son mutuamente excluyentes, podemos estar interesados en el resultado de cualquiera de los eventos.,

la probabilidad de eventos no mutuamente excluyentes se calcula como la probabilidad del evento A y la probabilidad del evento B menos la probabilidad de que ambos eventos ocurran simultáneamente.

esto se puede declarar formalmente de la siguiente manera:

P(A O B) = P(A) + P(B) – P(A y B)

lectura adicional

esta sección proporciona más recursos sobre el tema si está buscando profundizar.

libros

probabilidad: para el principiante entusiasta, 2016.
reconocimiento de patrones y aprendizaje automático, 2006.,
Machine Learning: a Probabilistic Perspective, 2012.

Artículos

Probabilidad de Wikipedia.
Notación en Probabilidad y Estadística, Wikipedia.
Independencia (teoría de la probabilidad), Wikipedia.
variables aleatorias independientes e idénticamente distribuidas, Wikipedia.
exclusividad Mutua, Wikipedia.
Distribución Marginal, Wikipedia.
Distribución de probabilidad conjunta, Wikipedia.
probabilidad condicional, Wikipedia.,

resumen

en este post, descubriste una introducción suave a la probabilidad conjunta, marginal y condicional para múltiples variables aleatorias.

Específicamente, aprendiste:

La probabilidad conjunta es la probabilidad de que dos eventos ocurran simultáneamente.
La probabilidad Marginal es la probabilidad de un evento independientemente del resultado de otra variable.
La probabilidad condicional es la probabilidad de que un evento ocurra en presencia de un segundo evento.

¿tiene alguna pregunta?,Haga sus preguntas en los comentarios a continuación y haré mi mejor esfuerzo para responder.

Conseguir una Manija en la Probabilidad para el Aprendizaje de Máquina!

desarrolle su comprensión de la probabilidad

…con solo unas pocas líneas de código python

descubre cómo en mi nuevo Ebook:
probabilidad para aprendizaje automático

proporciona tutoriales de autoaprendizaje y proyectos de extremo a extremo sobre:
Teorema de Bayes, optimización Bayesiana, distribuciones, máxima verosimilitud, entropía cruzada, modelos de calibración
y mucho más…,

finalmente aprovecha la incertidumbre en tus proyectos

Sáltate lo académico. Sólo Resultados.Ver Lo que está Dentro de

Tweet Compartir Compartir

Ottima

Una introducción suave a la probabilidad conjunta, Marginal y condicional

resumen

probabilidad de una Variable aleatoria

quiero aprender la probabilidad para el aprendizaje automático

probabilidad de múltiples Variables aleatorias

Probabilidad Conjunta de Dos Variables

Probabilidad Marginal

probabilidad condicional

probabilidad de Independencia y exclusividad

Independencia

exclusividad

lectura adicional

libros

Artículos

resumen

Conseguir una Manija en la Probabilidad para el Aprendizaje de Máquina!

desarrolle su comprensión de la probabilidad

finalmente aprovecha la incertidumbre en tus proyectos

Deja una respuesta

Entradas recientes

Archivos

Meta