Multippel lineær regresjon er en metode vi kan bruke for å forstå forholdet mellom to eller flere forklarende variabler og en responsvariabel.
Denne veiledningen forklarer hvordan du skal utføre multippel lineær regresjon i Excel.
Merk: Hvis du bare har en forklarende variabel, bør du i stedet utføre enkel lineær regresjon.,
Eksempel: Multippel Lineær Regresjon i Excel
la oss Anta at vi ønsker å vite om det antall timer brukt på å studere og antall prep eksamener tatt påvirker resultat at en student mottar på enkelte college inngangen eksamen.
for Å utforske dette forholdet kan vi utføre multippel lineær regresjon ved hjelp av timer studert og prep eksamener tatt som forklarende variabler og eksamen poengsum som en responsvariabel.
– Utfør følgende trinn i Excel til å gjennomføre en multippel lineær regresjon.
Trinn 1: Angi data.,
skriv Inn følgende data for antall timer studert, eksamen prep tatt, og eksamen score fikk for 20 studenter:
Trinn 2: Utføre multippel lineær regresjon.
Langs den øverste båndet i Excel, kan du gå til kategorien Data, og klikk på Data-Analyse. Hvis du ikke ser dette alternativet, må du først installere gratis analyseverktøy.
Når du klikker på Data Analyse, og et nytt vindu vil dukke opp. Velg Regresjon, og klikk på OK.,
For Input Y Utvalg, fyll ut tabell med verdier for responsvariabel. For Innspill X Område, fyll ut tabell med verdier for de to forklarende variabler. Merk av i boksen ved siden av Etiketter, slik Excel vet at vi inkluderte variabelen navn i inndata varierer. For Utgang Rekkevidde, velger du en celle hvor du ønsker utgangen av regresjon til å vises. Deretter klikker du OK.
følgende resultat vil automatisk vises:
Trinn 3: Tolker utgang.,
Her er hvordan du skal tolke de mest relevante numrene i den utgang:
R Square: 0.734. Dette er kjent som determinasjonskoeffisient. Det er den andelen av variansen i respons variabel som kan forklares av den forklarende variabler. I dette eksemplet, 73.4% av variasjonen i eksamen score kan forklares med antall timer studert og antall prep eksamener tatt.
Standard feil: 5.366. Dette er gjennomsnittlig avstand at de observerte verdiene faller fra regresjons-linje. I dette eksemplet er de observerte verdiene fall et gjennomsnitt på 5.,366 enheter fra regresjons-linje.
F: 23.46. Dette er den generelle F statistikk for regresjonsmodell, beregnet som regresjon MS / rester av MS.
Betydning F: 0.0000. Dette er p-verdi knyttet til den generelle F statistikken. Det forteller oss om en regresjonsmodell som helhet er statistisk signifikant. Med andre ord, den forteller oss om de to forklarende variabler sammen har en statistisk signifikant assosiasjon med responsvariabel. I dette tilfellet er p-verdien er mindre enn 0.,05, noe som indikerer at den forklarende variabler timer studert og prep eksamener tatt kombinert har en statistisk signifikant assosiasjon med eksamen score.
P-verdier. Den enkelte p-verdier forteller oss om ikke hver forklarende variabel er statistisk signifikant. Vi kan se at timer studert er statistisk signifikant (p = 0.00) mens prep eksamener tatt (p = 0.52) er ikke statistisk signifciant på α = 0.05. Siden prep eksamener tatt er ikke statistisk signifikante, og vi kan ende opp med å bestemmer deg for å fjerne det fra modellen.,
Koeffisienter: koeffisientene for hver forklarende variabel fortelle oss gjennomsnittlig forventet endring i responsvariabel, forutsatt at de andre forklarende variable holdes konstant. For eksempel, for hver ekstra time med studier, gjennomsnittlig eksamen score er forventet å øke med i 5,56, forutsatt at eksamen prep tatt forblir konstant.
Her er en annen måte å tenke på dette: Hvis En student og student B både ta samme mengde prep eksamen, men studenten En studiene for en time mer, da En student er forventet å tjene en poengsum som er i 5,56-poeng høyere enn student B.,
Vi tolke koeffisient for skjæringspunktet til å bety at forventet eksamen score for en student som studerer null timer og tar null eksamen prep er 67.67.
Beregnede regresjonsligningen: Vi kan bruke koeffisientene fra produksjon av modellen til å lage følgende beregnede regresjonsligningen:
eksamen score = 67.67 + i 5,56*(timer) – 0.60*(eksamen prep)
Vi kan bruke denne beregnede regresjonsligningen til å beregne forventet eksamen score for en student, basert på antall timer de studerer og antall eksamen prep de tar., For eksempel, en student som studerer i tre timer og tar en eksamen prep er forventet å få en poengsum av 83.75:
eksamen score = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
husk at fordi prep eksamener tatt var ikke statistisk signifikant (p = 0.52), vi kan bestemme seg for å fjerne den fordi den ikke legger til noen forbedring i den generelle modellen. I dette tilfellet, kunne vi utføre enkel lineær regresjon ved hjelp av bare timer studert som forklarende variabel.
resultatene av denne enkel lineær regresjon analyse kan bli funnet her.