korelační matice je tabulka ukazující korelační koeficienty mezi proměnnými. Každá buňka v tabulce ukazuje korelaci mezi dvěma proměnnými. Korelační matice se používá k shrnutí dat, jako vstup do pokročilejší analýzy a jako diagnostika pro pokročilé analýzy.

Vytvořit vlastní korelační matice

Klíčová rozhodnutí mají být provedeny při vytváření korelační matice patří: volba srovnávací statistika, kódování proměnných, ošetření chybějících dat a prezentace.,

příklad korelační matice

Typicky, korelační matice je „náměstí“, se stejným proměnných v řádcích a sloupcích. Ukázal jsem příklad níže. To ukazuje korelace mezi uvedeným významem různých věcí pro lidi. Linie 1, 00 s, která jde zleva nahoře vpravo dole, je hlavní úhlopříčkou, která ukazuje, že každá proměnná vždy dokonale koreluje se sebou samým. Tato matice je symetrická, přičemž stejná korelace je zobrazena nad hlavní úhlopříčkou jako zrcadlový obraz těch pod hlavní úhlopříčkou.,

Vytvořit vlastní korelační matice

Aplikace z korelační matice

Existují tři hlavní důvody pro výpočet korelační matice:

  1. shrnout velké množství dat, kde cílem je vidět vzory. V našem příkladu výše, pozorovatelný vzor je, že všechny proměnné vysoce korelují mezi sebou.
  2. pro vstup do jiných analýz., Například, lidé běžně používají korelační matice jako vstupy pro explorační faktorová analýza, konfirmační faktorová analýza, strukturální rovnice modely, a lineární regrese, kdy kromě chybějící hodnoty párového.
  3. jako diagnostika při kontrole jiných analýz. Například při lineární regresi vysoké množství korelací naznačuje, že odhady lineární regrese budou nespolehlivé.

korelační statistika

většina korelačních matic používá Pearsonovu korelaci mezi součinem a momentem (r). Je také běžné používat Spearmanovu korelaci a Kendallovu Tau-b., Oba z nich jsou non-parametrické korelace a méně citlivé na odlehlé hodnoty než r.

Kódování proměnných

Pokud máte také údaje z průzkumu, budete muset rozhodnout, jak se kód data před computing korelace. Například, pokud respondentů byly dané volby Silně Nesouhlasím, spíše Nesouhlasím, Ani Souhlasím, ani Nesouhlasím, Poněkud Souhlasím, a Rozhodně Souhlasím, dalo by se přiřadit kódy 1, 2, 3, 4, a 5, respektive (nebo, matematicky ekvivalentní z hlediska korelace, skóre -2, -1, 0, 1 a 2)., Jsou však možné i další kódování, například -4, -1, 0, 1, 4. Změny v kódování mají tendenci mít malý účinek, s výjimkou extrémních.

léčba chybějících hodnot

data, která používáme k výpočtu korelací, často obsahují chybějící hodnoty. Může to být buď proto, že jsme tyto údaje neshromažďovali, nebo neznáme odpovědi. Existují různé strategie pro řešení chybějících hodnot při výpočtu korelačních matric. Osvědčeným postupem je obvykle použití vícenásobné imputace. Lidé však častěji používají párové chybějící hodnoty (někdy známé jako částečné korelace)., To zahrnuje výpočet korelace pomocí všech non-chybějící data pro dvě proměnné. Alternativně někteří používají odstranění listwise, známé také jako případové vymazání, které používá pouze pozorování bez chybějících dat. Párová i případová vymazání předpokládají, že data chybí zcela náhodně. To je důvod, proč vícenásobná imputace je obecně výhodnější volbou.,

Prezentace

Při představování korelační matice, které budete potřebovat, aby zvážila různé možnosti, včetně:

  • Zda chcete zobrazit celý matrix, jak je uvedeno výše, nebo jen non-redundantní bity, jak je uvedeno níže (pravděpodobně 1.00 hodnoty na hlavní diagonále by měl být také odstraněny).
  • jak formátovat čísla (například nejlepší praxí je odstranit 0s před desetinnými místy a desítkovou čárkou-zarovnejte čísla, jak je uvedeno výše,ale ve většině softwaru To může být obtížné).
  • zda se má zobrazit statistická významnost (např.,
  • zda barvit-kódovat hodnoty podle korelační statistiky (jak je uvedeno níže).
  • přeskupení řádků a sloupců, aby byly vzory jasnější.

Chcete snadno vytvořit vlastní korelační matici? Naučte se jak!

Vytvořte si vlastní korelační matici