een correlatiematrix is een tabel met correlatiecoëfficiënten tussen variabelen. Elke cel in de tabel toont de correlatie tussen twee variabelen. Een correlatiematrix wordt gebruikt om gegevens samen te vatten, als input in een meer geavanceerde analyse, en als diagnose voor geavanceerde analyses.

Creëer uw eigen correlatiematrix

belangrijke beslissingen die moeten worden genomen bij het maken van een correlatiematrix zijn: keuze van correlatiestatistieken, codering van de variabelen, behandeling van ontbrekende gegevens en presentatie.,

een voorbeeld van een correlatiematrix

een correlatiematrix is meestal “vierkant”, met dezelfde variabelen in de rijen en kolommen. Ik heb hieronder een voorbeeld getoond. Dit toont correlaties tussen het verklaarde belang van verschillende dingen voor mensen. De lijn van 1,00 s van linksboven naar rechtsonder is de hoofddiagonaal, die laat zien dat elke variabele altijd perfect correleert met zichzelf. Deze matrix is symmetrisch, met dezelfde correlatie wordt getoond boven de hoofddiagonaal is een spiegelbeeld van die onder de hoofddiagonaal.,

Creëer uw eigen correlatiematrix

toepassingen van een correlatiematrix

Er zijn drie grote redenen om een correlatiematrix te berekenen:

  1. om een grote hoeveelheid gegevens samen te vatten waarbij het doel is om patronen te zien. In ons voorbeeld hierboven is het waarneembare patroon dat alle variabelen sterk met elkaar correleren.
  2. voor input in andere analyses., Bijvoorbeeld, mensen gebruiken correlatiematrixen algemeen als input voor verkennende factoranalyse, bevestigende factoranalyse, structurele vergelijkingsmodellen, en lineaire regressie wanneer het uitsluiten van ontbrekende waarden paarsgewijs.
  3. als diagnose bij het controleren van andere analyses. Bijvoorbeeld, met lineaire regressie, een groot aantal correlaties suggereert dat de lineaire regressie schattingen onbetrouwbaar zal zijn.

Correlatiestatistiek

De meeste correlatiematrixen gebruiken Pearson ‘ s product-Moment correlatie (r). Het is ook gebruikelijk om Spearman ’s correlatie en Kendall’ s Tau-b gebruiken., Beide zijn niet-parametrische correlaties en minder gevoelig voor uitschieters dan r.

codering van de variabelen

Als u ook gegevens uit een enquête hebt, moet u beslissen hoe u de gegevens codeert voordat u de correlaties berekent. Bijvoorbeeld, als de respondenten keuzes kregen van Strongly Disagree, Somewhat Disagree, NY Agree, Somewhat Disagree, Somewhat, and Strongly Agree, zou u codes kunnen toewijzen van respectievelijk 1, 2, 3, 4 en 5 (of, wiskundig equivalent vanuit het perspectief van correlatie, scores van -2, -1, 0, 1 en 2)., Andere coderingen zijn echter mogelijk, zoals -4, -1, 0, 1, 4. Veranderingen in coderingen hebben meestal weinig effect, behalve in extreme gevallen.

behandeling van ontbrekende waarden

de gegevens die we gebruiken om correlaties te berekenen bevatten vaak ontbrekende waarden. Dit kan zijn omdat we deze gegevens niet hebben verzameld of omdat we de reacties niet kennen. Er bestaan verschillende strategieën voor het omgaan met ontbrekende waarden bij het berekenen van correlatiematrixen. Een beste praktijk is meestal om meerdere toerekeningen te gebruiken. Echter, mensen meer in het algemeen gebruik paarsgewijs ontbrekende waarden (soms bekend als gedeeltelijke correlaties)., Dit impliceert het berekenen van correlatie gebruikend alle niet-ontbrekende gegevens voor de twee variabelen. Als alternatief gebruiken sommigen listwise deletion, ook bekend als case-wise deletion, die alleen observaties gebruikt zonder ontbrekende gegevens. Zowel paarsgewijs als case-wise schrapping veronderstellen dat gegevens volledig willekeurig ontbreken. Daarom is meervoudige toerekening over het algemeen de voorkeursoptie.,

presentatie

wanneer u een correlatiematrix presenteert, moet u rekening houden met verschillende opties, waaronder:

  • of u de hele matrix wilt weergeven, zoals hierboven of alleen de niet-redundante bits, zoals hieronder (de 1,00 waarden in de hoofddiagonaal moeten ook worden verwijderd).
  • Hoe de getallen te formatteren (bijvoorbeeld, het beste is om de 0 ‘ s vóór de decimalen te verwijderen en decimaal-lijn de getallen uit, zoals hierboven, maar dit kan moeilijk zijn om te doen in de meeste software).
  • of statistische significantie moet worden getoond (bijv. door cellen rood met kleurcodering).,
  • of de waarden moeten worden gecodeerd volgens de correlatiestatistieken (zoals hieronder weergegeven).
  • de rijen en kolommen herschikken om patronen duidelijker te maken.

wilt u eenvoudig uw eigen correlatiematrix maken? Leer hoe!

Creëer uw eigen correlatiematrix