en korrelationsmatris är en tabell som visar korrelationskoefficienter mellan variabler. Varje cell i tabellen visar korrelationen mellan två variabler. En korrelationsmatris används för att sammanfatta data, som en ingång till en mer avancerad analys och som en diagnostik för avancerade analyser.

skapa din egen korrelationsmatris

viktiga beslut som ska fattas när du skapar en korrelationsmatris inkluderar: val av korrelationsstatistik, kodning av variablerna, behandling av saknade data och presentation.,

ett exempel på en korrelationsmatris

typiskt är en korrelationsmatris ”kvadratisk”, med samma variabler som visas i raderna och kolumnerna. Jag har visat ett exempel nedan. Detta visar korrelationer mellan den angivna betydelsen av olika saker för människor. Linjen på 1,00 s går från övre vänstra till nedre högra är huvuddiagonalen, vilket visar att varje variabel alltid perfekt korrelerar med sig själv. Denna matris är symmetrisk, med samma korrelation visas ovanför huvuddiagonalen är en spegelbild av de under huvuddiagonalen.,

skapa din egen korrelationsmatris

applikationer av en korrelationsmatris

det finns tre breda skäl för att beräkna en korrelationsmatris:

  1. för att sammanfatta en stor mängd data där målet är att se mönster. I vårt exempel ovan är det observerbara mönstret att alla variabler i hög grad korrelerar med varandra.
  2. att mata in i andra analyser., Till exempel använder människor ofta korrelationsmatriser som ingångar för undersökande faktoranalys, bekräftande faktoranalys, strukturella ekvationsmodeller och linjär regression när man utesluter saknade värden parvis.
  3. som diagnostisk vid kontroll av andra analyser. Till exempel, med linjär regression, tyder en hög mängd korrelationer på att de linjära regressionsuppskattningarna kommer att vara opålitliga.

Korrelationsstatistik

de flesta korrelationsmatriser använder Pearsons Produktmomentkorrelation (r). Det är också vanligt att använda Spearmans korrelation och Kendalls Tau-b., Båda dessa är icke-parametriska korrelationer och mindre mottagliga för avvikande värden än r.

kodning av variablerna

om du också har data från en undersökning måste du bestämma hur du kodar data innan du beräknar korrelationerna. Till exempel, om respondenterna fick val av starkt oense, något oense, varken överens eller oense, något överens, och starkt överens, Du kan tilldela koder av 1, 2, 3, 4 och 5, respektive (eller matematiskt motsvarande ur korrelationssynpunkt, poäng av -2, -1, 0, 1 och 2)., Andra lister är dock möjliga, såsom -4, -1, 0, 1, 4. Förändringar i lister tenderar att ha liten effekt, utom när extrem.

behandling av saknade värden

de data som vi använder för att beräkna korrelationer innehåller ofta saknade värden. Detta kan antingen bero på att vi inte samlar in dessa data eller inte vet svaren. Olika strategier finns för att hantera saknade värden vid beräkning korrelation matriser. En bästa praxis är vanligtvis att använda flera imputation. Men människor använder oftare parvisa saknade värden (ibland kända som partiella korrelationer)., Detta innebär computing korrelation med hjälp av alla icke-saknade data för de två variablerna. Alternativt kan vissa använda listwise radering, även känd som case-wise radering, som endast använder observationer utan saknade data. Både parvis och fallvis radering antar att data saknas helt slumpmässigt. Det är därför flera imputation är i allmänhet det föredragna alternativet.,

Presentation

När du presenterar en korrelationsmatris måste du överväga olika alternativ, inklusive:

  • Om du vill visa hela matrisen, som ovan eller bara de icke-redundanta bitarna, enligt nedan (förmodligen bör 1,00-värdena i huvuddiagonalen också tas bort).
  • hur man formaterar siffrorna (till exempel är bästa praxis att ta bort 0s före decimalerna och decimalerna-justera siffrorna, som ovan, men det kan vara svårt att göra i de flesta program).
  • Om du vill visa statistisk signifikans (t.ex. av färgkodande celler röda).,
  • Om du vill färgkoda värdena enligt korrelationsstatistiken (som visas nedan).
  • omarrangera rader och kolumner för att göra mönstren tydligare.

vill du enkelt skapa din egen korrelationsmatris? Lär dig hur!

skapa din egen korrelationsmatris