neste tutorial, você verá como realizar a regressão linear múltipla em Python usando tanto sklearn e statsmodels.,s a serem abordados:

  1. Analisando o exemplo a ser utilizado neste tutorial
  2. Verificação de Linearidade
  3. execução de regressão linear múltipla em Python
  4. Adicionando um tkinter Interface Gráfica do Usuário (GUI) para coletar a entrada de usuários e, em seguida, exibir a previsão de resultados

Ao final deste tutorial, você será capaz de criar a seguinte interface em Python:

Exemplo de Regressão Linear Múltipla em Python

No exemplo a seguir, vamos usar a regressão linear múltipla para prever o índice de ações com preço (que eu.,e. a variável dependente) de uma economia fictícia utilizando 2 independente/variáveis de entrada:

  • Taxa de Juros
  • Taxa de Desemprego

por Favor, note que você terá que validar que vários pressupostos são atendidos antes de aplicar modelos de regressão linear. Mais notavelmente, você tem que se certificar de que existe uma relação linear entre a variável dependente e a variável independente/s (mais sobre o que sob a verificação de linearidade seção).,

agora Vamos saltar para o conjunto de dados que iremos usar:

Para começar, você pode capturar o acima conjunto de dados em Python usando Pandas DataFrame (para conjuntos de dados maiores, você pode considerar a importação de dados):

a Verificação de Linearidade

Antes de executar um modelo de regressão linear, é aconselhável para validar que certas premissas são atendidas.

Como referido anteriormente, poderá querer verificar se existe uma relação linear entre a variável dependente e a variável independente/S.,

no nosso exemplo, poderá querer verificar se existe uma relação linear entre o:

para efectuar uma verificação rápida da linearidade, poderá usar diagramas de dispersão (utilizando a biblioteca matplotlib). Por exemplo, pode utilizar o código abaixo para traçar a relação entre o Stock_Index_Price e a taxa de juro:

irá notar que existe de facto uma relação linear entre o Stock_Index_Price e a taxa de juro.,ates, o índice de ações com preço também sobe:

E para o segundo caso, você pode usar este código para traçar a relação entre o Stock_Index_Price e o Unemployment_Rate:

Como você pode ver, uma relação linear também existe entre o Stock_Index_Price e o Unemployment_Rate – quando as taxas de desemprego subir, o índice de ações com preço vai para baixo (aqui ainda temos uma relação linear, mas com uma inclinação negativa):

em seguida, vamos fazer a regressão linear múltipla em Python.,

executando a regressão Linear múltipla

Depois de adicionar os dados ao Python, poderá usar o sklearn e o statsmodels para obter os resultados de regressão.

qualquer método funcionaria, mas vamos rever ambos os métodos para fins de ilustração.

em seguida, Você pode copiar o código abaixo em Python:

uma Vez que você executar o código em Python, você vai observar três partes:

(1) A primeira parte mostra a saída gerada pelo sklearn:

Este resultado inclui o intercepto e os coeficientes., Você pode usar esta informação para construir a equação de regressão linear múltipla da seguinte forma:

Stock_Index_Price = (Intercept) + (Interest_Rate coeficiente)*X1 + (Unemployment_Rate coeficiente)*X2

E depois de ligar os números:

Stock_Index_Price = (1798.4040) + (345.5401)*X1 + (-250.1466)*X2

(2) A segunda parte apresenta as previsões de saída usando sklearn:

Imagine que você deseja para prever o índice de ações com preço depois de recolhidos os seguintes dados:

  • Taxa de Juros = 2.75 (i.e.,, X1= 2.75)
  • Taxa de Desemprego = 5.3 (i.é., X2= 5.3)

Se você conectar os dados na equação de regressão, você vai obter o mesmo resultado previsto como apresentado na segunda parte:

Stock_Index_Price = (1798.4040) + (345.5401)*(2.75) + (-250.1466)*(5.3) = 1422.86

(3) A terceira parte apresenta um amplo quadro com informações estatísticas geradas pelo statsmodels.,

Esta informação pode fornecer insights adicionais sobre o modelo utilizado (tais como o ajuste do modelo, erros-padrão, etc.):

Observe que os coeficientes capturado nesta tabela (destacado em vermelho) correspondem com os coeficientes gerados pelo sklearn.é um bom sinal! obtivemos resultados consistentes aplicando sklearn e statsmodels.

em seguida, você verá como criar uma interface gráfica em Python para coletar dados dos usuários, e então exibir os resultados da previsão.,

GUI usada para a regressão Linear múltipla em Python

é aqui que a diversão real começa!

Por que não criar uma Interface gráfica de usuário (GUI) que permitirá aos usuários inserir as variáveis independentes, a fim de obter o resultado previsto?

pode ser que alguns dos usuários podem não saber muito sobre a introdução dos dados no código Python em si, por isso faz sentido criá-los uma interface simples, onde eles podem gerenciar os dados de uma forma simplificada.,

pode até criar um ficheiro em lote para lançar o programa Python, pelo que os utilizadores terão de fazer duplo-click no ficheiro em lote para lançar a interface gráfica.

Aqui é o código Python para seu final de Regressão GUI:

uma Vez que você executar o código, você verá esta interface gráfica, o que inclui a saída gerada pelo sklearn e os diagramas de dispersão:

Recordar que anteriormente fizemos uma previsão utilizando os seguintes valores:

  • Taxa de Juros = 2.75
  • Taxa de Desemprego = 5.,3

digite esses valores nas caixas de entrada, e depois clique no botão ‘Predict Stock Index Price’:

agora verá o resultado previsto de 1422.86, que corresponde ao valor que viu antes.

Pode também querer verificar o tutorial seguinte para saber mais sobre a incorporação de gráficos numa GUI tkinter.

conclusão

regressão Linear é frequentemente utilizada na aprendizagem de máquinas. Você já viu alguns exemplos de como realizar regressão linear múltipla em Python usando sklearn e statsmodels.,

Antes de aplicar modelos de regressão linear, certifique-se verificar que existe uma relação linear entre a variável dependente (por exemplo, o que você está tentando prever) e a variável independente/s (isto é, a variável de entrada/s).