Como realizar Regressão Linear Múltipla no Excel

regressão linear múltipla é um método que podemos usar para entender a relação entre duas ou mais variáveis explicativas e uma variável de resposta.

Este tutorial explica como realizar regressão linear múltipla no Excel.Nota: Se só tiver uma variável explicativa, deve efectuar uma regressão linear simples.,

Exemplo: Regressão Linear Múltipla no Excel

Suponha que queremos saber se o número de horas passadas a estudar e o número de prep exames efetuados afeta a pontuação que um aluno recebe em um determinado exame de entrada da faculdade.

para explorar esta relação, podemos realizar regressão linear múltipla usando horas estudadas e pré-exames feitos como variáveis explicativas e pontuação de exame como uma variável de resposta.

execute os seguintes passos no Excel para conduzir uma regressão linear múltipla.

Passo 1: Introduza os dados.,

entre os seguintes dados para o número de horas estudadas, preparação exames efetuados, de provas e pontuação recebida para 20 alunos:

Passo 2: Executar a regressão linear múltipla.

ao longo da fita superior do Excel, vá para a página de dados e clique na análise de dados. Se você não vê esta opção, então você precisa primeiro instalar a Ferramenta de análise gratuita.

Uma vez que você clicar na análise de dados, uma nova janela irá aparecer. Seleccione regressão e carregue em OK.,

Para o Intervalo Y de Entrada, preencha a matriz de valores para a variável de resposta. Para a gama de entrada X, preencher a lista de valores para as duas variáveis explicativas. Assinale a opção ao lado das etiquetas para que o Excel saiba que incluímos os nomes das variáveis nas gamas de entrada. Para o intervalo de saída, seleccione uma célula onde gostaria que a saída da regressão aparecesse. clicar.

O seguinte resultado aparecerá automaticamente:

Passo 3: Interpretar o resultado.,

Aqui está como interpretar os números mais relevantes na saída:

R quadrado: 0.734. Isto é conhecido como o coeficiente de determinação. É a proporção da variância na variável resposta que pode ser explicada pelas variáveis explicativas. Neste exemplo, 73,4% da variação nas pontuações do exame pode ser explicada pelo número de horas estudadas e pelo número de exames pré-escolares realizados.erro padrão: 5.366. Esta é a distância média que os valores observados descem da linha de regressão. Neste exemplo, os valores observados descem em média 5.,366 unidades da linha de regressão.

F: 23, 46. Esta é a estatística f global para o modelo de regressão, calculada como regressão MS / em residual

significância F: 0 ,0000. Este é o valor p associado à Estatística F. Diz – nos se o modelo de regressão como um todo é estatisticamente significativo. Por outras palavras, diz – nos se as duas variáveis explicativas combinadas têm uma associação estatisticamente significativa com a variável resposta. Neste caso, o valor p é inferior a 0.,05, O que indica que as variáveis explicativas horas estudadas e exames pré-realizados combinados têm uma associação estatisticamente significativa com a pontuação do exame.valores de

P. Os valores individuais de p indicam se cada variável explicativa tem ou não significado estatístico. Podemos ver que as horas estudadas são estatisticamente significativas (p = 0, 00) enquanto os exames pré-clínicos realizados (p = 0, 52) não são estatisticamente significantes em α = 0, 05. Uma vez que os exames pré-realizados não são estatisticamente significativos, podemos acabar decidindo removê-lo do modelo.,coeficientes

: os coeficientes para cada variável explicativa indicam-nos a variação média esperada na variável de resposta, assumindo que a outra variável explicativa permanece constante. Por exemplo, para cada hora adicional de estudo, espera-se que a pontuação média do exame aumente em 5.56, assumindo que os exames de preparação realizados permaneçam constantes.

Aqui está outra maneira de pensar sobre isso: se o estudante a e o estudante B ambos fazem a mesma quantidade de exames de preparação, mas o estudante a estuda por mais uma hora, então o estudante A é esperado para ganhar uma pontuação que é 5.56 pontos mais alta do que o estudante B.,

interpretamos o coeficiente para a interceptação como significando que a pontuação esperada para o exame de um estudante que estuda zero horas e faz exames de preparação zero é 67,67.

Estimados da equação de regressão: podemos utilizar os coeficientes a partir da saída do modelo para criar a seguinte equação de regressão estimada:

nota no exame = 67.67 + 5.56*(horas) – 0.60*(prep exames)

podemos usar este estimados da equação de regressão para calcular o esperado exame de pontuação para o aluno, com base no número de horas de estudo e o número de prep de exames que tomar., Por exemplo, um aluno que estuda para três horas e leva uma preparação para o exame é esperado para receber uma pontuação de 83.75:

nota no exame = 67.67 + 5.56*(3) – 0.60*(1) = 83.75

Mantenha em mente que, como preparação exames efetuados, não foi estatisticamente significante (p = 0,52), podemos decidir removê-lo, porque ele não adiciona qualquer melhoria para o modelo global. Neste caso, poderíamos realizar uma regressão linear simples usando apenas horas estudadas como variável explicativa.

os resultados desta análise de regressão linear simples podem ser encontrados aqui.

Ottima

Como realizar Regressão Linear Múltipla no Excel

Exemplo: Regressão Linear Múltipla no Excel

Deixe uma resposta

Artigos recentes

Arquivo

Meta