multipel linjär regression är en metod som vi kan använda för att förstå förhållandet mellan två eller flera förklarande variabler och en svarsvariabel.
denna handledning förklarar hur man utför flera linjära regression i Excel.
Obs! Om du bara har en förklarande variabel bör du istället utföra enkel linjär regression.,
exempel: multipel linjär Regression i Excel
Antag att vi vill veta om antalet timmar som spenderas på att studera och antalet prep-tentor som tas påverkar poängen som en student får på en viss college – inträdesprov.
för att utforska detta förhållande kan vi utföra flera linjära regressioner med hjälp av studerade timmar och prep-tentor som tas som förklarande variabler och examensresultat som en svarsvariabel.
utför följande steg i Excel för att utföra en multipel linjär regression.
Steg 1: Ange data.,
Ange följande data för antalet studerade timmar, prep-tentor och examensresultat för 20 studenter:
steg 2: utför flera linjära regressioner.
längs det övre bandet i Excel, gå till fliken Data och klicka på dataanalys. Om du inte ser det här alternativet måste du först installera free Analysis ToolPak.
När du klickar på dataanalys kommer ett nytt fönster att dyka upp. Välj Regression och klicka på OK.,
för Input Y Range, fyll i matrisen av värden för svarsvariabeln. För Input X Range, fyll i matrisen av värden för de två förklarande variablerna. Markera rutan bredvid etiketter så Excel vet att vi inkluderade variabelnamnen i inmatningsområdena. För Utmatningsområde, välj en cell där du vill att regressionsutgången ska visas. Klicka sedan på OK.
följande utmatning visas automatiskt:
steg 3: tolka utmatningen.,
här är hur man tolkar de mest relevanta siffrorna i utmatningen:
R kvadrat: 0,734. Detta kallas bestämningskoefficienten. Det är andelen variansen i svarsvariabeln som kan förklaras av de förklarande variablerna. I detta exempel kan 73,4% av variationen i tentamenspoängen förklaras av antalet studerade timmar och antalet prep-tentor som tagits.
standardfel: 5.366. Detta är det genomsnittliga avståndet som de observerade värdena faller från regressionslinjen. I detta exempel faller de observerade värdena i genomsnitt 5.,366 enheter från regressionslinjen.
f: 23,46. Detta är den totala f-statistiken för regressionsmodellen, beräknad som regressions MS / Rest ms
signifikans F: 0.0000. Detta är p-värdet associerat med den totala f-statistiken. Det berättar om regressionsmodellen som helhet är statistiskt signifikant. Med andra ord berättar det om de två förklarande variablerna tillsammans har en statistiskt signifikant koppling till svarsvariabeln. I detta fall är p-värdet mindre än 0.,05, vilket indikerar att de förklarande variablerna timmar studerade och prep tentor som tagits i kombination har en statistiskt signifikant förening med examensresultat.
p-värden. De enskilda p-värdena berättar om varje förklarande variabel är statistiskt signifikant. Vi kan se att timmar som studerats är statistiskt signifikanta (p = 0.00) medan prep-tentor tas (p = 0.52) inte är statistiskt signifikant vid α = 0.05. Eftersom prep tentor tas är inte statistiskt signifikant, kan vi sluta besluta att ta bort den från modellen.,
koefficienter: koefficienterna för varje förklarande variabel berättar för oss Den genomsnittliga förväntade förändringen i svarsvariabeln, förutsatt att den andra förklarande variabeln förblir konstant. Till exempel, för varje ytterligare timme tillbringade studera, den genomsnittliga examen poäng förväntas öka med 5,56, förutsatt att prep tentor tas förblir konstant.
här är ett annat sätt att tänka på detta: om student a och student B båda tar samma mängd prep tentor men student a studier för en timme mer, förväntas student a tjäna en poäng som är 5.56 poäng högre än student B.,
vi tolkar koefficienten för intercept att betyda att den förväntade tentamen poäng för en student som studerar noll timmar och tar noll prep tentor är 67.67.
Beräknad regressionsekvation: vi kan använda koefficienterna från modellens utgång för att skapa följande beräknade regressionsekvation:
exam score = 67.67 + 5.56*(timmar) – 0.60*(prep-tentor)
Vi kan använda denna uppskattade regressionsekvation för att beräkna den förväntade tentamenspoängen för en student, baserat på antalet timmar de studerar och antalet prep-tentor de tar., Till exempel, en student som studerar i tre timmar och tar en prep examen förväntas få en poäng på 83.75:
examen poäng = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
Tänk på att eftersom prep-tentor inte var statistiskt signifikanta (p = 0.52) kan vi besluta att ta bort det eftersom det inte lägger till någon förbättring till den övergripande modellen. I det här fallet kan vi utföra enkel linjär regression med endast timmar som studerats som den förklarande variabeln.
resultaten av denna enkla linjär regressionsanalys finns här.