wielokrotna regresja liniowa jest metodą, której możemy użyć, aby zrozumieć zależność między dwiema lub więcej zmiennymi objaśniającymi a zmienną odpowiedzi.
Ten samouczek wyjaśnia, jak wykonać wielokrotną regresję liniową w programie Excel.
Uwaga: Jeśli masz tylko jedną zmienną objaśniającą, powinieneś zamiast tego wykonać prostą regresję liniową.,
przykład: wielokrotna regresja liniowa w programie Excel
Załóżmy, że chcemy wiedzieć, czy liczba godzin spędzonych na nauce i liczba zdanych egzaminów wstępnych wpływa na wynik, który student otrzymuje na określonym egzaminie wstępnym na studia.
aby zbadać tę zależność, możemy wykonać wielokrotną regresję liniową, wykorzystując przebadane godziny i egzaminy przygotowawcze jako zmienne wyjaśniające i wynik egzaminu jako zmienną odpowiedzi.
wykonaj następujące kroki w programie Excel, aby przeprowadzić wielokrotną regresję liniową.
Krok 1: Wprowadź dane.,
wprowadź następujące dane dotyczące liczby godzin przebadanych, zdanych egzaminów wstępnych i wyniku uzyskanego dla 20 uczniów:
Krok 2: Wykonaj wielokrotną regresję liniową.
wzdłuż górnej wstążki w programie Excel przejdź do zakładki Dane i kliknij analizę danych. Jeśli nie widzisz tej opcji, musisz najpierw zainstalować darmowy Analysis ToolPak.
Po kliknięciu analizy Danych pojawi się nowe okno. Wybierz regresję i kliknij OK.,
Dla wejściowego zakresu Y należy wypełnić tablicę wartości zmiennej odpowiedzi. Dla wejściowego zakresu X należy wypełnić tablicę wartości dla dwóch zmiennych objaśniających. Zaznacz pole obok etykiet, aby program Excel wiedział,że uwzględniliśmy nazwy zmiennych w zakresach wprowadzania. W polu zakres wyjściowy wybierz komórkę, w której chcesz wyświetlić wynik regresji. Następnie kliknij OK.
automatycznie pojawi się następujące wyjście:
Krok 3: zinterpretuj wyjście.,
oto jak interpretować najistotniejsze liczby na wyjściu:
R kwadrat: 0.734. Jest to znane jako współczynnik determinacji. Jest to proporcja wariancji w zmiennej odpowiedzi, którą można wyjaśnić zmiennymi objaśniającymi. W tym przykładzie, 73.4% zmiany w wynikach egzaminu można wyjaśnić przez liczbę godzin studiowanych i liczba egzaminów przygotowawczych podjętych.
błąd standardowy: 5.366. Jest to średnia odległość, jaką obserwowane wartości spadają od linii regresji. W tym przykładzie obserwowane wartości spadają średnio o 5.,366 jednostek z linii regresji.
F: 23.46. Jest to ogólna statystyka F dla modelu regresji, obliczona jako regresja MS / pozostały MS.
Znaczenie F: 0.0000. Jest to wartość p związana z ogólną statystyką F. Mówi nam, czy model regresji jako całość jest statystycznie istotny. Innymi słowy, mówi nam, czy dwie zmienne objaśniające połączone mają statystycznie istotny związek ze zmienną odpowiedzi. W tym przypadku wartość p jest mniejsza niż 0.,05, który wskazuje, że zmienne objaśniające godziny przebadane i egzaminy przygotowawcze podjęte łącznie mają statystycznie istotny związek z wynikiem egzaminu.
wartości P. Poszczególne wartości p mówią nam, czy każda zmienna objaśniająca jest statystycznie istotna. Widzimy, że godziny przebadane są istotne statystycznie (p = 0,00), podczas gdy egzaminy przygotowawcze (p = 0,52) nie są istotne statystycznie przy α = 0,05. Ponieważ egzaminy przygotowawcze nie są istotne statystycznie, możemy skończyć decydując się na usunięcie go z modelu.,
współczynniki: współczynniki dla każdej zmiennej objaśniającej mówią nam średnią oczekiwaną zmianę zmiennej odpowiedzi, zakładając, że inna zmienna objaśniająca pozostaje stała. Na przykład, za każdą dodatkową godzinę spędzoną na nauce, oczekuje się, że średni wynik egzaminu wzrośnie o 5.56, zakładając, że egzaminy przygotowawcze podjęte pozostaje stała.
oto inny sposób myślenia o tym: jeśli student A i student B zdają taką samą liczbę egzaminów wstępnych, ale student A studiuje przez godzinę dłużej, oczekuje się, że student a uzyska wynik o 5,56 punktów wyższy niż student B.,
współczynnik intercepcji interpretujemy tak, że oczekiwany wynik egzaminu dla ucznia, który studiuje zero godzin i przystępuje do zerowych egzaminów wstępnych wynosi 67,67.
szacowane równanie regresji: możemy użyć współczynników z wyjścia modelu, aby utworzyć następujące szacowane równanie regresji:
wynik egzaminu = 67.67 + 5.56*(godziny) – 0.60*(egzaminy przygotowawcze)
możemy użyć tego szacowanego równania regresji, aby obliczyć oczekiwany wynik egzaminu dla ucznia, na podstawie liczby godzin studiowania i liczby egzaminów przygotowawczych, które podejmują., Na przykład student, który uczy się przez trzy godziny i przystępuje do jednego egzaminu wstępnego, oczekuje się, że otrzyma wynik 83,75:
wynik egzaminu= 67.67 + 5.56*(3) – 0.60*(1) = 83.75
należy pamiętać, że ponieważ egzaminy wstępne nie były istotne statystycznie (p = 0,52), możemy zdecydować się na usunięcie go, ponieważ nie dodaje to żadnej poprawy do ogólnego modelu. W tym przypadku możemy wykonać prostą regresję liniową, wykorzystując tylko godziny badane jako zmienna objaśniająca.
wyniki tej prostej analizy regresji liniowej można znaleźć tutaj.