Multiple lineære regression er en metode, vi kan bruge til at forstå forholdet mellem to eller flere forklarende variable, og en responsvariabel.
denne vejledning forklarer, hvordan du udfører flere lineære regression i E .cel.Bemærk: Hvis du kun har en forklarende variabel, skal du i stedet udføre simpel lineær regression.,
Eksempel: Multipel Lineær Regression i Excel
Antag at vi ønsker at vide, hvis antallet af timer brugt på at studere, og antallet af prep eksamener taget påvirker det resultat, at en studerende modtager på en bestemt college adgangsgivende eksamen.
for at udforske dette forhold kan vi udføre flere lineære regression ved hjælp af studerede timer og prep-eksamener taget som forklarende variabler og eksamensresultat som en responsvariabel.
Udfør følgende trin i E .cel for at udføre en multipel lineær regression.Trin 1: indtast dataene.,
Indtast følgende data for antallet af timer, der er undersøgt, er prep eksamener taget, og eksamen score modtaget for 20 studerende:
Trin 2: Udfør multipel lineær regression.
gå til fanen Data langs det øverste bånd i E .cel og klik på dataanalyse. Hvis du ikke kan se denne mulighed, skal du først installere free Analysis ToolPak.
Når du klikker på dataanalyse, vises et nyt vindue. Vælg Regression og klik på OK.,
for Input Y-område skal du udfylde arrayet med værdier for responsvariablen. For Input Range-område skal du udfylde arrayet med værdier for de to forklarende variabler. Marker afkrydsningsfeltet ud for etiketter, så e .cel ved, at vi inkluderede variabelnavne i inputintervallerne. For outputområde skal du vælge en celle, hvor du vil have output fra regressionen vist. Klik derefter på OK.
følgende output vises automatisk:
Trin 3: Fortolke outputtet.,
Her er hvordan man fortolker de mest relevante tal i output:
R S .uare: 0.734. Dette er kendt som bestemmelseskoefficienten. Det er andelen af variansen i responsvariablen, der kan forklares med de forklarende variabler. I dette eksempel kan 73, 4% af variationen i eksamensresultaterne forklares med antallet af undersøgte timer og antallet af afsluttede eksamener.
Standard fejl: 5.366. Dette er den gennemsnitlige afstand, som de observerede værdier falder fra regressionslinjen. I dette eksempel falder de observerede værdier i gennemsnit 5.,366 enheder fra regressionslinjen.
F: 23.46. Dette er den samlede F statistik for regressionsmodellen, beregnet som regression MS/resterende MS.
signifikans F: 0,0000. Dette er den p-værdi, der er forbundet med den samlede F-statistik. Det fortæller os, om regressionsmodellen som helhed er statistisk signifikant eller ej. Med andre ord fortæller det os, om de to forklarende variabler tilsammen har en statistisk signifikant tilknytning til responsvariablen. I dette tilfælde er p-værdien mindre end 0.,05, hvilket indikerer, at de forklarende variabler timer studeret og prep eksamener taget tilsammen har en statistisk signifikant sammenhæng med eksamen score.
P-værdier. De individuelle p-værdier fortæller os, om hver forklarende variabel er statistisk signifikant eller ej. Vi kan se, at undersøgte timer er statistisk signifikant (p = 0.00), mens prep-eksamener taget (p = 0.52) ikke er statistisk signifikant ved α = 0.05. Da Prep eksamener taget ikke er statistisk signifikant, kan vi ende med at beslutte at fjerne det fra modellen.,
koefficienter: koefficienterne for hver forklarende variabel fortæller os den gennemsnitlige forventede ændring i responsvariablen, forudsat at den anden forklarende variabel forbliver konstant. For hver ekstra time, der bruges på at studere, forventes den gennemsnitlige eksamensscore for eksempel at stige med 5, 56, forudsat at prep-eksamener, der er taget, forbliver konstante.
Her er en anden måde at tænke på dette: Hvis elev A og elev B begge tage den samme mængde af prep eksamen, men studerende En undersøgelser for en time mere, så de studerende forventes at tjene en score, der er 5.56 point højere end elev B.,
vi fortolker koefficienten for intercept at betyde, at den forventede eksamen score for en studerende, der studerer nul timer og tager nul prep eksamener er 67.67.
Estimerede regressionsligning: Vi kan bruge koefficienterne fra outputtet af modellen til at skabe følgende estimerede regressionsligning:
eksamen score = 67.67 + 5.56*(timer) – 0.60*(prep eksamener)
Vi kan bruge denne estimerede regressions-ligningen til at beregne den forventede eksamen score for en studerende, der er baseret på det antal timer, de studerer, og antallet af prep eksamener, de træffer., For eksempel, en studerende, der studerer i tre timer og tager en eksamen prep, som forventes at få en score på 83.75:
eksamen score = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
husk, at prep-eksamen taget var ikke statistisk signifikant (p = 0.52), kan vi beslutte at fjerne det, fordi det ikke tilføje nogen forbedring i forhold til den samlede model. I dette tilfælde kunne vi udføre simpel lineær regression ved kun at studere timer som den forklarende variabel.
resultaterne af denne enkle lineære regressionsanalyse kan findes her.