a korrelációs mátrix egy táblázat, amely korrelációs együtthatókat mutat a változók között. A táblázat minden cellája a két változó közötti korrelációt mutatja. Egy korrelációs mátrixot használnak az adatok összefoglalására, egy fejlettebb elemzésbe történő bevitelként, valamint a fejlett elemzések diagnosztikájaként.

hozzon létre saját korrelációs mátrixot

a korrelációs mátrix létrehozásakor meghozandó legfontosabb döntések a következők: korrelációs statisztika kiválasztása, a változók kódolása, a hiányzó adatok kezelése és bemutatása.,

egy példa a korrelációs mátrix

általában egy korrelációs mátrix “négyzet”, ugyanazokkal a változókkal látható a sorok és oszlopok. Az alábbiakban bemutattam egy példát. Ez összefüggéseket mutat a különböző dolgok kifejezett fontossága között az emberek számára. A bal felső sarokban a jobb alsó sarokban lévő 1,00 s vonal a fő átló, ami azt mutatja, hogy minden változó mindig tökéletesen korrelál önmagával. Ez a mátrix szimmetrikus, ugyanazzal a korrelációval a fő átló felett látható, mint a fő átló alatti tükörkép.,

hozzon létre saját korrelációs mátrixot

korrelációs mátrix alkalmazása

a korrelációs mátrix kiszámításának három fő oka van:

  1. összefoglalni egy nagy mennyiségű adatot, ahol a cél a minták megtekintése. A fenti példánkban a megfigyelhető minta az, hogy az összes változó nagymértékben korrelál egymással.
  2. más elemzésekbe való bevitelhez., Például, az emberek gyakran használják korrelációs mátrixok bemenetként feltáró tényező elemzés, megerősítő tényező elemzés, szerkezeti egyenlet modellek, és lineáris regresszió, ha kizárják a hiányzó értékeket páronként.
  3. diagnosztikaként más elemzések ellenőrzésekor. Például lineáris regresszióval nagy mennyiségű korreláció azt sugallja, hogy a lineáris regressziós becslések megbízhatatlanok lesznek.

korrelációs statisztika

a legtöbb korrelációs mátrix Pearson termék-pillanatnyi korrelációját (r) használja. Az is gyakori, hogy Spearman korrelációját és Kendall tau-b-jét használják., Mindkettő nem parametrikus korreláció, és kevésbé érzékeny a kiugró értékekre, mint r.

A

változók kódolása ha egy felmérésből származó adatok is vannak, akkor el kell döntenie, hogyan kell kódolni az adatokat a korrelációk kiszámítása előtt. Például, ha a válaszadók kaptak döntéseket erősen nem értenek egyet, némileg nem értenek egyet, sem nem értenek egyet, némileg egyetértenek, és határozottan egyetértenek, akkor lehet rendelni kódok 1, 2, 3, 4, illetve 5, illetve (vagy matematikailag egyenértékű szempontjából korreláció, pontszámok -2, -1, 0, 1, és 2)., Más kódolások azonban lehetségesek, például -4, -1, 0, 1, 4. A kódolás változásainak általában kevés hatása van, kivéve, ha extrém.

hiányzó értékek kezelése

a korrelációk kiszámításához használt adatok gyakran hiányzó értékeket tartalmaznak. Ennek oka lehet, hogy nem gyűjtöttük ezeket az adatokat, vagy nem ismerjük a válaszokat. Különböző stratégiák léteznek a hiányzó értékek kezelésére a korrelációs mátrixok kiszámításakor. A legjobb gyakorlat általában több imputáció használata. Az emberek azonban gyakrabban használják a páronként hiányzó értékeket (néha részleges korrelációknak nevezik)., Ez magában foglalja a korreláció kiszámítását a két változó összes nem hiányzó adatának felhasználásával. Alternatív megoldásként egyesek a listwise törlést, más néven eseti törlést használják, amely csak hiányzó adatok nélküli megfigyeléseket használ. Mind a páros, mind az eseti törlés feltételezi, hogy az adatok véletlenszerűen hiányoznak. Ez az oka annak, hogy a többszörös imputáció általában az előnyös lehetőség.,

Bemutató

Amikor bemutatja a korrelációs mátrix, meg kell vizsgálni a különböző lehetőségeket, beleértve a:

  • – E mutatni az egész mátrix, mint a fenti, vagy csak a nem redundáns bit, mint az alábbi (vitathatatlanul az 1.00 értékek a fő átlós is el kell távolítani).
  • a számok formázása (például a legjobb gyakorlat a 0-k eltávolítása a decimális helyek előtt, a számok tizedes igazítása, mint fent, de ez a legtöbb szoftverben nehéz lehet).
  • statisztikai szignifikancia megjelenítése (pl. színkódoló sejtek vörös).,
  • Színkódolni kell az értékeket a korrelációs statisztikák szerint (az alábbiak szerint).
  • a sorok és oszlopok átrendezése a minták világosabbá tétele érdekében.

szeretné könnyen létrehozni saját korrelációs mátrixát? Ismerje meg, hogyan!

saját korrelációs mátrix létrehozása