en korrelationsmatri.er en tabel, der viser korrelationskoefficienter mellem variabler. Hver celle i tabellen viser sammenhængen mellem to variabler. En korrelationsmatri.bruges til at opsummere data, som input til en mere avanceret analyse og som diagnostik til avancerede analyser.
Opret dit eget correlation matrix
Vigtige beslutninger, der skal træffes, når at skabe en sammenhæng matrix, der omfatter: valg af korrelation statistik, kodning af variable, behandling af manglende data, og præsentation.,
et eksempel på en korrelationsmatri.
typisk er en korrelationsmatri. “firkantet” med de samme variabler vist i rækker og kolonner. Jeg har vist et eksempel nedenfor. Dette viser korrelationer mellem den angivne betydning af forskellige ting for mennesker. Linjen på 1, 00 s, der går fra øverste venstre til nederste højre, er hoveddiagonalen, hvilket viser, at hver variabel altid perfekt korrelerer med sig selv. Denne Matri.er symmetrisk, med den samme korrelation er vist over de vigtigste diagonal er et spejlbillede af dem under de vigtigste diagonal.,
Opret dit eget correlation matrix
anvendelse af et correlation matrix
Der er tre overordnede grunde til beregning af en correlation matrix:
- At sammenfatte en stor mængde data, hvor målet er at se mønstre. I vores eksempel ovenfor er det observerbare mønster, at alle variabler i høj grad korrelerer med hinanden.
- til input i andre analyser., For eksempel bruger folk ofte korrelationsmatrixeser som input til sonderende faktoranalyse, bekræftende faktoranalyse, strukturelle ligningsmodeller og lineær regression, når man udelukker manglende værdier parvis.
- som diagnostisk ved kontrol af andre analyser. For eksempel med lineær regression antyder en høj mængde korrelationer, at de lineære regressionsoverslag vil være upålidelige.
Korrelationsstatistik
de fleste korrelationsmatrixeser bruger Pearsons Produktmomentkorrelation (r). Det er også almindeligt at bruge Spearmans korrelation og Kendalls Tau-B., Begge disse er ikke-parametriske korrelationer og mindre modtagelige for outliers end r.
kodning af variablerne
Hvis du også har data fra en undersøgelse, skal du beslutte, hvordan du skal kode dataene, før du beregner korrelationerne. For eksempel, hvis respondenterne blev givet valg af Stærkt Uenig, Lidt Uenig, Hverken Enig eller Uenig, Lidt Enig, og helt Enig, kan du tildele koder på 1, 2, 3, 4, og 5, henholdsvis (eller tilsvarende matematisk set fra den sammenhæng, der scores -2, -1, 0, 1 og 2)., Imidlertid er andre kodninger mulige, såsom -4, -1, 0, 1, 4. Ændringer i kodninger har tendens til at have ringe effekt, undtagen når ekstrem.
behandling af manglende værdier
de data, vi bruger til at beregne korrelationer, indeholder ofte manglende værdier. Dette kan enten skyldes, at vi ikke indsamlede disse data eller ikke kender svarene. Der findes forskellige strategier til håndtering af manglende værdier ved beregning af korrelationsmatri .er. En bedste praksis er normalt at bruge flere imputationer. Men folk bruger mere almindeligt parvis manglende værdier (nogle gange kendt som delvise korrelationer)., Dette indebærer computing korrelation ved hjælp af alle de ikke-manglende data for de to variabler. Alternativt bruger nogle listwiseise sletning, også kendt som case-deletionise sletning, som kun bruger observationer uden manglende data. Både parvis og sagsvis sletning antager, at data mangler helt tilfældigt. Dette er grunden til flere imputation er generelt den foretrukne løsning.,
Præsentation
Når at præsentere en correlation matrix, vil du nødt til at overveje forskellige muligheder, herunder:
- Om at vise hele matrix som ovenfor, eller bare de ikke-redundante bits, som nedenfor (velsagtens 1.00 værdier i de vigtigste diagonal, bør også fjernes).
- Sådan formateres tallene (for eksempel er bedste praksis at fjerne 0 ‘ erne før decimalerne og decimalerne-juster tallene som ovenfor, men det kan være svært at gøre i de fleste soft .are).
- om der skal vises statistisk signifikans (F.ved farvekodning celler rød).,
- om der skal farvekode værdierne i henhold til korrelationsstatistikken (som vist nedenfor).omarrangering af rækker og kolonner for at gøre mønstre klarere.
Vil du nemt oprette din egen correlation matrix? Lær hvordan!
Opret din egen korrelationsmatri<