det er En sammenheng matrix er en tabell som viser sammenhengen koeffisienter mellom variabler. Hver celle i tabellen viser sammenhengen mellom to variabler. En korrelasjon matrix er brukt til å oppsummere data, som et innspill til en mer avansert analyse, og som et diagnostisk for avanserte analyser.

Opprett din egen korrelasjon matrix

– Tasten for beslutningene som skal tas når du oppretter en korrelasjon matrix inkluderer: valg av korrelasjon statistikk, koding av variabler, behandling av manglende data og presentasjon.,

Et eksempel på at det er en sammenheng matrix

Vanligvis, en korrelasjon matrix er «square», med de samme variablene som vises i rader og kolonner. Jeg har vist et eksempel nedenfor. Dette viser korrelasjoner mellom oppgitt betydningen av ulike ting til folk. Linjen 1,00 s går fra øverst til venstre til nederst til høyre er den viktigste diagonal, som viser at hver variabel alltid perfekt korrelerer med seg selv. Dette matrise er symmetrisk, med samme korrelasjon er vist ovenfor de viktigste diagonal være et speilbilde av de som er under hoved-diagonalen.,

Opprett din egen korrelasjon matrix

Programmer av en korrelasjon matrix

Det er tre bred grunner for å beregne korrelasjon matrise:

  1. for Å oppsummere en stor mengde data, hvor målet er å se mønstre. I vårt eksempel ovenfor, observerbare mønsteret er at alle variablene som er svært korrelerer med hverandre.
  2. Hvis du innspill til andre analyser., For eksempel, folk ofte bruker korrelasjon matriser som innganger for eksplorerende faktoranalyse, bekreftende faktoranalyse, strukturelle ligningen modeller, og lineær regresjon når unntatt manglende verdier parvis.
  3. Som en diagnostisk ved kontroll av andre analyser. For eksempel, med lineær regresjon, en høy andel av sammenhenger tyder på at lineær regresjon anslag vil være upålitelig.

Korrelasjon statistikk

de Fleste korrelasjon matriser bruke pearsons Produkt-Moment Korrelasjon (r). Det er også vanlig å bruke Spearman ‘s Korrelasjon og Kendall’ s Tau-b., Begge disse er ikke-parametrisk sammenhenger og mindre utsatt for ekstreme verdier enn r.

Koding av variablene

Hvis du har også data fra en undersøkelse, må du bestemme deg for hvordan å kode dataene før beregning av korrelasjoner. For eksempel, hvis respondentene ble gitt valg av Sterkt Uenig, Noe Uenig, Verken Enig eller Uenig, Litt Enig og helt Enig, du kan tilordne koder på 1, 2, 3, 4, og 5, henholdsvis (eller, matematisk tilsvarende fra perspektivet av korrelasjon, score -2, -1, 0, 1 og 2)., Imidlertid, andre codings er mulig, for eksempel -4, -1, 0, 1, 4. Endringer i codings har en tendens til å ha liten effekt, bortsett fra når ekstreme.

Behandling av manglende verdier

data som vi bruker til å beregne korrelasjoner inneholder ofte manglende verdier. Dette kan enten være fordi vi ikke samle inn disse dataene, eller ikke vet svarene. Ulike strategier finnes for å håndtere manglende verdier når computing korrelasjon matriser. Beste praksis er vanligvis å bruke flere godtgjørelsessystemet. Imidlertid, folk mer vanlig bruk parvis manglende verdier (noen ganger kjent som delvis korrelasjoner)., Dette innebærer computing sammenheng med alle de ikke-mangler data for de to variablene. Alternativt, noen bruker listwise sletting, også kjent som sak-messig sletting, som bare bruker observasjoner med ingen mangler data. Både parvis og case-messig sletting anta at data mangler helt tilfeldig. Dette er grunnen til at flere godtgjørelsessystemet er generelt å foretrekke alternativet.,

Presentasjon

Ved å presentere en korrelasjon matrise, vil du trenger for å vurdere ulike alternativer, inkludert:

  • Om du vil vise hele matrisen, som nevnt ovenfor, eller bare non-redundant biter, som nedenfor (uten tvil den 1.00 verdier i de viktigste diagonal bør også fjernes).
  • Hvordan å formatere tall (for eksempel, beste praksis er å fjerne 0s før desimaler og desimal-align tallene, som ovenfor, men dette kan være vanskelig å gjøre i de fleste programvare).
  • Om du ønsker å vise statistisk signifikans (f.eks. ved fargekoding celler red).,
  • Om du skal farge-kode verdier i henhold til den korrelasjon statistikk (som vist nedenfor).
  • Omorganisere rader og kolonner for å lage mønstre tydeligere.

Ønsker å enkelt lage dine egne korrelasjon matrix? Lær hvordan!

Opprett din egen korrelasjon matrix