una matriz de correlación es una tabla que muestra los coeficientes de correlación entre las variables. Cada celda de la tabla muestra la correlación entre dos variables. Una matriz de correlación se utiliza para resumir los datos, como entrada en un análisis más avanzado y como diagnóstico para análisis avanzados.

Cree su propia matriz de correlación

Las decisiones clave a tomar al crear una matriz de correlación incluyen: elección de la estadística de correlación, codificación de las variables, tratamiento de los datos faltantes y presentación.,

un ejemplo de una matriz de correlación

normalmente, una matriz de correlación es «cuadrada», con las mismas variables que se muestran en las filas y columnas. He mostrado un ejemplo a continuación. Esto muestra correlaciones entre la importancia declarada de varias cosas para las personas. La línea de 1.00 s que va de la parte superior izquierda a la parte inferior derecha es la diagonal principal, lo que muestra que cada variable siempre se correlaciona perfectamente consigo misma. Esta matriz es simétrica, con la misma correlación se muestra por encima de la diagonal principal siendo una imagen especular de los que están por debajo de la diagonal principal.,

Cree su propia matriz de correlación

aplicaciones de una matriz de correlación

hay tres razones generales para calcular una matriz de correlación:

  1. Para resumir una gran cantidad de datos donde el objetivo es ver patrones. En nuestro ejemplo anterior, el patrón observable es que todas las variables se correlacionan entre sí.
  2. para entrar en otros análisis., Por ejemplo, las personas comúnmente usan matrices de correlación como entradas para el análisis factorial exploratorio, el análisis factorial confirmatorio, los modelos de ecuaciones estructurales y la regresión lineal al excluir los valores faltantes en parejas.
  3. Como diagnóstico al comprobar otros análisis. Por ejemplo, con la regresión lineal, Una gran cantidad de correlaciones sugiere que las estimaciones de regresión lineal no serán confiables.

estadística de correlación

La mayoría de las matrices de correlación utilizan la correlación Producto-momento (r) de Pearson. También es común usar la correlación de Spearman y el Tau-b de Kendall., Ambos son correlaciones no paramétricas y menos susceptibles a valores atípicos que r.

codificación de las variables

si también tiene datos de una encuesta, deberá decidir cómo codificar los datos antes de calcular las correlaciones. Por ejemplo, si a los encuestados se les dio opciones de estar en total desacuerdo, algo en desacuerdo, ni estar de acuerdo ni en desacuerdo, algo de acuerdo y totalmente de acuerdo, se podrían asignar códigos de 1, 2, 3, 4 y 5, respectivamente (o, matemáticamente equivalente desde la perspectiva de la correlación, puntuaciones de -2, -1, 0, 1 y 2)., Sin embargo, otras codificaciones son posibles, tales como -4, -1, 0, 1, 4. Los cambios en las codificaciones tienden a tener poco efecto, excepto cuando son extremas.

tratamiento de los valores faltantes

los datos que utilizamos para calcular las correlaciones a menudo contienen valores faltantes. Esto puede deberse a que no recopilamos estos datos o no conocemos las respuestas. Existen varias estrategias para tratar con los valores faltantes al calcular matrices de correlación. Una buena práctica suele ser utilizar la imputación múltiple. Sin embargo, las personas usan más comúnmente valores faltantes en parejas (a veces conocidos como correlaciones parciales)., Esto implica calcular la correlación utilizando todos los datos no faltantes para las dos variables. Alternativamente, algunos utilizan la eliminación listwise, también conocida como eliminación en mayúsculas y minúsculas, que solo utiliza observaciones sin datos faltantes. Tanto la eliminación por pares como la de mayúsculas y minúsculas suponen que los datos faltan completamente al azar. Esta es la razón por la que la imputación múltiple es generalmente la opción preferible.,

Presentation

al presentar una matriz de correlación, deberá considerar varias opciones, incluyendo:

  • Si desea mostrar la matriz completa, como arriba o solo los bits no redundantes, como abajo (podría decirse que los valores 1.00 en la diagonal principal también deben eliminarse).
  • Cómo formatear los números (por ejemplo, la mejor práctica es eliminar los 0 antes de los lugares decimales y alinear decimales los números, como se mencionó anteriormente, pero esto puede ser difícil de hacer en la mayoría del software).
  • Si se debe mostrar significación estadística (por ejemplo, mediante la codificación por colores de las células rojas).,
  • Si codificar los valores de acuerdo con las estadísticas de correlación (como se muestra a continuación).
  • reorganizar las filas y columnas para que los patrones sean más claros.

Quiero crear fácilmente su propia matriz de correlación? Aprende cómo!

Cree su propia matriz de correlación