regresia liniară multiplă este o metodă pe care o putem folosi pentru a înțelege relația dintre două sau mai multe variabile explicative și o variabilă de răspuns.acest tutorial explică modul de efectuare a regresiei liniare multiple în Excel.Notă: Dacă aveți o singură variabilă explicativă, ar trebui să efectuați în schimb o regresie liniară simplă.,
exemplu: regresie liniară multiplă în Excel
Să presupunem că vrem să știm dacă numărul de ore petrecute studiind și numărul de examene prep luate afectează scorul pe care un student îl primește la un anumit examen de admitere la facultate.pentru a explora această relație, putem efectua regresie liniară multiplă folosind orele studiate și examenele prep luate ca variabile explicative și scorul examenului ca variabilă de răspuns.
efectuați următorii pași în Excel pentru a efectua o regresie liniară multiplă.pasul 1: Introduceți datele.,
introduceți următoarele date pentru numărul de ore studiate, examenele prep luate și scorul examenului primit pentru 20 de studenți:
Pasul 2: Efectuați regresie liniară multiplă.
de-a lungul panglicii de sus din Excel, accesați fila Date și faceți clic pe analiza datelor. Dacă nu vedeți această opțiune, atunci trebuie să instalați mai întâi instrumentul de analiză gratuit.
odată ce faceți clic pe analiza datelor, va apărea o fereastră nouă. Selectați regresie și faceți clic pe OK.,
Pentru intervalul de intrare Y, completați tabloul de valori pentru variabila de răspuns. Pentru intervalul de intrare X, completați matricea de valori pentru cele două variabile explicative. Bifați caseta de lângă etichete, astfel încât Excel să știe că am inclus numele variabilelor în intervalele de intrare. Pentru intervalul de ieșire, selectați o celulă în care doriți să apară ieșirea regresiei. Apoi faceți clic pe OK.
următoarea ieșire va apărea în mod automat:
Pasul 3: Interpreta de ieșire.,iată cum să interpretați cele mai relevante numere din ieșire:
R pătrat: 0.734. Acesta este cunoscut sub numele de coeficientul de determinare. Proporția varianței în variabila de răspuns poate fi explicată prin variabilele explicative. În acest exemplu, 73, 4% din variația scorurilor la examen poate fi explicată prin numărul de ore studiate și numărul de examene prep luate.
eroare Standard: 5.366. Aceasta este distanța medie pe care valorile observate cad de la linia de regresie. În acest exemplu, valorile observate scad în medie 5.,366 de unități de la linia de regresie.
F: 23.46. Aceasta este statistica generală F pentru modelul de regresie, calculată ca regresie MS / MS reziduală.
semnificație F: 0.0000. Aceasta este valoarea p asociată cu statistica generală F. Ne spune dacă modelul de regresie în ansamblu este sau nu semnificativ statistic. Cu alte cuvinte, ne spune dacă cele două variabile explicative combinate au o asociere semnificativă statistic cu variabila de răspuns. În acest caz, valoarea p este mai mică de 0.,05, ceea ce indică faptul că variabilele explicative orele studiate și examenele prep luate combinate au o asociere semnificativă statistic cu scorul examenului.
P-valori. Valorile P individuale ne spun dacă fiecare variabilă explicativă este sau nu semnificativă statistic. Putem observa că orele studiate sunt semnificative statistic (p = 0.00), în timp ce examenele prep luate (p = 0.52) nu sunt semnifcante statistic la α = 0.05. Deoarece examenele prep luate nu sunt semnificative din punct de vedere statistic, putem ajunge să decidem să o eliminăm din model.,
coeficienți: coeficienții pentru fiecare variabilă explicativă ne spun modificarea medie așteptată a variabilei de răspuns, presupunând că cealaltă variabilă explicativă rămâne constantă. De exemplu, pentru fiecare oră suplimentară petrecută la studiu, scorul mediu al examenului este de așteptat să crească cu 5, 56, presupunând că examenele prep luate rămân constante.
Iată un alt mod de a gândi acest lucru: dacă studentul A și studentul B iau ambele aceeași cantitate de examene prep, dar studentul a studiază încă o oră, atunci studentul A este de așteptat să câștige un scor cu 5, 56 puncte mai mare decât elevul B.,
interpretăm coeficientul pentru interceptare pentru a însemna că scorul așteptat al examenului pentru un student care studiază zero ore și ia examene de pregătire zero este 67.67.
Estimată ecuație de regresie: putem folosi coeficienții de ieșire din model pentru a crea următoarele estimat ecuație de regresie:
examen scor = 67.67 + 5.56*(ore) – 0.60*(pregatire examene)
putem folosi această estimat ecuație de regresie pentru a calcula temperatura de examen scor pentru un student, bazat pe numărul de ore de studiu și numărul de pregatire examene pe care le iau., De exemplu, un student care studiază timp de trei ore și are o pregatire examen este de așteptat pentru a primi un scor de 83.75:
punctajul de la examen = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
Țineți minte că pentru pregatire examene luate nu a fost semnificativă statistic (p = 0.52), s-ar putea decide pentru a elimina-l, deoarece nu aduce nici o îmbunătățire de ansamblu model. În acest caz, am putea efectua regresie liniară simplă folosind doar ore studiate ca variabilă explicativă.rezultatele acestei analize simple de regresie liniară pot fi găsite aici.