regressão linear múltipla é um método que podemos usar para entender a relação entre duas ou mais variáveis explicativas e uma variável de resposta.
Este tutorial explica como realizar regressão linear múltipla no Excel.Nota: Se só tiver uma variável explicativa, deve efectuar uma regressão linear simples.,
Exemplo: Regressão Linear Múltipla no Excel
Suponha que queremos saber se o número de horas passadas a estudar e o número de prep exames efetuados afeta a pontuação que um aluno recebe em um determinado exame de entrada da faculdade.
para explorar esta relação, podemos realizar regressão linear múltipla usando horas estudadas e pré-exames feitos como variáveis explicativas e pontuação de exame como uma variável de resposta.
execute os seguintes passos no Excel para conduzir uma regressão linear múltipla.
Passo 1: Introduza os dados.,
entre os seguintes dados para o número de horas estudadas, preparação exames efetuados, de provas e pontuação recebida para 20 alunos:
Passo 2: Executar a regressão linear múltipla.
ao longo da fita superior do Excel, vá para a página de dados e clique na análise de dados. Se você não vê esta opção, então você precisa primeiro instalar a Ferramenta de análise gratuita.
Uma vez que você clicar na análise de dados, uma nova janela irá aparecer. Seleccione regressão e carregue em OK.,
Para o Intervalo Y de Entrada, preencha a matriz de valores para a variável de resposta. Para a gama de entrada X, preencher a lista de valores para as duas variáveis explicativas. Assinale a opção ao lado das etiquetas para que o Excel saiba que incluímos os nomes das variáveis nas gamas de entrada. Para o intervalo de saída, seleccione uma célula onde gostaria que a saída da regressão aparecesse. clicar.
O seguinte resultado aparecerá automaticamente:
Passo 3: Interpretar o resultado.,
Aqui está como interpretar os números mais relevantes na saída:
R quadrado: 0.734. Isto é conhecido como o coeficiente de determinação. É a proporção da variância na variável resposta que pode ser explicada pelas variáveis explicativas. Neste exemplo, 73,4% da variação nas pontuações do exame pode ser explicada pelo número de horas estudadas e pelo número de exames pré-escolares realizados.erro padrão: 5.366. Esta é a distância média que os valores observados descem da linha de regressão. Neste exemplo, os valores observados descem em média 5.,366 unidades da linha de regressão.
F: 23, 46. Esta é a estatística f global para o modelo de regressão, calculada como regressão MS / em residual
significância F: 0 ,0000. Este é o valor p associado à Estatística F. Diz – nos se o modelo de regressão como um todo é estatisticamente significativo. Por outras palavras, diz – nos se as duas variáveis explicativas combinadas têm uma associação estatisticamente significativa com a variável resposta. Neste caso, o valor p é inferior a 0.,05, O que indica que as variáveis explicativas horas estudadas e exames pré-realizados combinados têm uma associação estatisticamente significativa com a pontuação do exame.valores de
P. Os valores individuais de p indicam se cada variável explicativa tem ou não significado estatístico. Podemos ver que as horas estudadas são estatisticamente significativas (p = 0, 00) enquanto os exames pré-clínicos realizados (p = 0, 52) não são estatisticamente significantes em α = 0, 05. Uma vez que os exames pré-realizados não são estatisticamente significativos, podemos acabar decidindo removê-lo do modelo.,coeficientes
: os coeficientes para cada variável explicativa indicam-nos a variação média esperada na variável de resposta, assumindo que a outra variável explicativa permanece constante. Por exemplo, para cada hora adicional de estudo, espera-se que a pontuação média do exame aumente em 5.56, assumindo que os exames de preparação realizados permaneçam constantes.
Aqui está outra maneira de pensar sobre isso: se o estudante a e o estudante B ambos fazem a mesma quantidade de exames de preparação, mas o estudante a estuda por mais uma hora, então o estudante A é esperado para ganhar uma pontuação que é 5.56 pontos mais alta do que o estudante B.,
interpretamos o coeficiente para a interceptação como significando que a pontuação esperada para o exame de um estudante que estuda zero horas e faz exames de preparação zero é 67,67.
Estimados da equação de regressão: podemos utilizar os coeficientes a partir da saída do modelo para criar a seguinte equação de regressão estimada:
nota no exame = 67.67 + 5.56*(horas) – 0.60*(prep exames)
podemos usar este estimados da equação de regressão para calcular o esperado exame de pontuação para o aluno, com base no número de horas de estudo e o número de prep de exames que tomar., Por exemplo, um aluno que estuda para três horas e leva uma preparação para o exame é esperado para receber uma pontuação de 83.75:
nota no exame = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
Mantenha em mente que, como preparação exames efetuados, não foi estatisticamente significante (p = 0,52), podemos decidir removê-lo, porque ele não adiciona qualquer melhoria para o modelo global. Neste caso, poderíamos realizar uma regressão linear simples usando apenas horas estudadas como variável explicativa.
os resultados desta análise de regressão linear simples podem ser encontrados aqui.