o matrice de corelație este un tabel care prezintă coeficienții de corelație între variabile. Fiecare celulă din tabel arată corelația dintre două variabile. O matrice de corelație este utilizată pentru a rezuma datele, ca intrare într-o analiză mai avansată și ca diagnostic pentru analize avansate.

Creați-vă propria matrice de corelație

deciziile cheie care trebuie luate la crearea unei matrice de corelație includ: alegerea statisticii corelației, codarea variabilelor, tratarea datelor lipsă și prezentarea.,

un exemplu de matrice de corelație

De obicei, o matrice de corelație este „pătrată”, cu aceleași variabile prezentate în rânduri și coloane. Am arătat un exemplu mai jos. Acest lucru arată corelații între importanța declarată a diferitelor lucruri pentru oameni. Linia de 1.00 s care merge de la stânga sus la dreapta jos este diagonala principală, ceea ce arată că fiecare variabilă se corelează întotdeauna perfect cu ea însăși. Această matrice este simetrică, cu aceeași corelație este prezentată deasupra diagonalei principale fiind o imagine în oglindă a celor de sub diagonala principală.,

Creați-vă propria matricea de corelație

Aplicații ale unei matrice de corelație

sunt trei mari motive pentru calculul unei matrice de corelație:

  1. Pentru a rezuma o cantitate mare de date în cazul în care obiectivul este de a vedea modele. În exemplul nostru de mai sus, Modelul observabil este că toate variabilele se corelează foarte mult între ele.
  2. pentru a introduce în alte analize., De exemplu, oamenii folosesc în mod obișnuit matricele de corelație ca intrări pentru analiza factorilor exploratori, analiza factorilor de confirmare, modelele de ecuații structurale și regresia liniară atunci când exclud valorile lipsă în pereche.
  3. ca diagnostic la verificarea altor analize. De exemplu, cu regresia liniară, o cantitate mare de corelații sugerează că estimările de regresie liniară vor fi nesigure.

Statistica corelației

majoritatea matricelor de corelație utilizează corelația produs-Moment a lui Pearson (r). De asemenea, este comună utilizarea corelației lui Spearman și a lui Kendall Tau-b., Ambele sunt corelații non-parametrice și mai puțin sensibile la valori aberante decât r.

codificarea variabilelor

Dacă aveți și date dintr-un sondaj, va trebui să decideți cum să codați datele înainte de a calcula corelațiile. De exemplu, în cazul în care respondenții s-au dat opțiuni de puternic nu sunt de acord, oarecum nu sunt de acord, nici nu sunt de acord, oarecum sunt de acord, și puternic de acord, ai putea atribui coduri de 1, 2, 3, 4, și 5, respectiv (sau, matematic echivalent din perspectiva corelației, scoruri de -2, -1, 0, 1, și 2)., Cu toate acestea, sunt posibile și alte codări, cum ar fi -4, -1, 0, 1, 4. Modificările codărilor tind să aibă un efect redus, cu excepția cazurilor extreme.

tratamentul valorilor lipsă

datele pe care le folosim pentru a calcula corelațiile conțin adesea valori lipsă. Acest lucru se poate întâmpla fie pentru că nu am colectat aceste date, fie nu cunoaștem răspunsurile. Există diverse strategii pentru a face față valorilor lipsă atunci când se calculează matricele de corelație. Cea mai bună practică este, de obicei, utilizarea imputării multiple. Cu toate acestea, oamenii folosesc mai frecvent valori lipsă pereche (uneori cunoscute sub numele de corelații parțiale)., Aceasta implică corelarea calculului folosind toate datele care nu lipsesc pentru cele două variabile. În mod alternativ, unii folosesc ștergerea listwise, cunoscută și sub denumirea de ștergere case-wise, care folosește doar observații fără date lipsă. Atât ștergerea perechilor, cât și ștergerea cazurilor presupun că datele lipsesc complet la întâmplare. Acesta este motivul pentru care imputarea multiplă este, în general, opțiunea preferabilă.,

Prezentare

atunci Când prezintă o matrice de corelație, va trebui să ia în considerare diferite opțiuni, inclusiv:

  • Dacă pentru a arăta întreaga matrice, ca mai sus sau doar non-redundante de biți, ca mai jos (probabil 1.00 valorilor din diagonala principală ar trebui să fie, de asemenea, eliminate).
  • cum să formatați numerele (de exemplu, cea mai bună practică este să eliminați 0s înainte de zecimale și zecimale-aliniați numerele, ca mai sus, dar acest lucru poate fi dificil de făcut în majoritatea software-ului).
  • dacă să arate semnificație statistică (de exemplu, prin celule de codificare a culorilor roșu).,
  • dacă se codifică valorile în funcție de statisticile de corelație (după cum se arată mai jos).
  • rearanjarea rândurilor și coloanelor pentru a face modelele mai clare.

doriți să creați cu ușurință propria matrice de corelație? Aflați cum!

creați propria matrice de corelație