V tomto tutoriálu uvidíte, jak provádět vícenásobné lineární regrese v Pythonu pomocí obou sklearn a statsmodels.,s bude pokryta:

  1. Revize příklad, aby být použity v tomto tutoriálu
  2. Kontrola Linearity
  3. Provedení mnohonásobné lineární regrese v Pythonu
  4. Přidání tkinter Grafické Uživatelské Rozhraní (GUI) k získání vstupu od uživatele, a pak zobrazit výsledky predikce

na konci tohoto kurzu, budete moci vytvořit následující rozhraní v Pythonu:

Příklad Vícenásobné Lineární Regrese v Pythonu

V následujícím příkladu budeme používat vícenásobné lineární regrese předpovědět akciový index cena (i.,e., závislá proměnná) fiktivní ekonomiky pomocí 2 nezávislých/vstupní proměnné:

  • Úroková Sazba
  • Míra Nezaměstnanosti

vezměte Prosím na vědomí, že budete muset potvrdit, že několik předpokladů, že jsou splněny předtím, než budete aplikovat lineární regresní modely. Především se musíte ujistit, že existuje lineární vztah mezi závislou proměnnou a nezávislou proměnnou/s (více o tom v části Kontrola linearity).,

Pojďme se teď skočit do objektu dataset, které budeme používat:

Pro začátek, můžete zachytit výše uvedených údajů v Pythonu pomocí Pandy Datovém (pro větší soubory dat, můžete zvážit, zda importovat údaje):

Kontrola Linearity

Před provedením modelu lineární regrese, je vhodné ověřit, že některé předpoklady jsou splněny.

jak bylo uvedeno výše, možná budete chtít zkontrolovat, zda existuje lineární vztah mezi závislou proměnnou a nezávislou proměnnou/s.,

V našem příkladu, možná budete chtít zkontrolovat, že lineární vztah existuje mezi:

proveďte rychlou kontrolu linearity, můžete použít rozptylové diagramy (s využitím knihovna matplotlib). Například, můžete použít níže uvedený kód s cílem vykreslit vztah mezi Stock_Index_Price a Interest_Rate:

všimněte Si, že skutečně lineární vztah existuje mezi Stock_Index_Price a Interest_Rate.,ates jít nahoru, akciový index cena také jde nahoru:

A v druhém případě, můžete tento kód použít, aby plot vztah mezi Stock_Index_Price a Unemployment_Rate:

Jak můžete vidět, lineární vztah existuje také mezi Stock_Index_Price a Unemployment_Rate – když míra nezaměstnanosti jít nahoru, akciový index cena jde dolů (tady stále máme lineární vztah, ale s negativním sklonem):

Next, budeme provádět skutečné vícenásobné lineární regrese v Pythonu.,

Provedení Mnohonásobné Lineární Regrese

Jakmile jste přidali dat do Pythonu, můžete použít oba sklearn a statsmodels získat výsledky regrese.

obě metody by fungovaly, ale podívejme se na obě metody pro ilustrační účely.

můžete potom zkopírujte níže uvedený kód v Pythonu:

Jakmile jste spustit kód v Pythonu, budete pozorovat tři části:

(1) první část ukazuje výstup generovaný sklearn:

Tento výstup zahrnuje zachytit a koeficienty., Můžete použít tyto informace, aby vytvořit více lineární regresní rovnice takto:

Stock_Index_Price = (Intercept) + (Interest_Rate coef)*X1 + (Unemployment_Rate coef)*X2

A jakmile se připojíte čísla:

Stock_Index_Price = (1798.4040) + (345.5401)*X1 + (-250.1466)*X2

(2) druhá část zobrazuje předpokládaný výstup pomocí sklearn:

Představte si, že chcete předpovědět akciový index cenu poté, co jste shromážděny následující údaje:

  • Úroková Sazba = 2.75 (tj., X1= 2.75)
  • Míra Nezaměstnanosti = 5.3 (tj. X2= 5.3)

Pokud připojíte dat do regresní rovnice, dostanete stejné, předpokládané výsledky, jak jsou zobrazeny v druhé části:

Stock_Index_Price = (1798.4040) + (345.5401)*(2.75) + (-250.1466)*(5.3) = 1422.86

(3) třetí část zobrazuje komplexní tabulka s statistické informace generované statsmodels.,

Tyto informace vám může poskytnout další poznatky o použitém modelu (např. fit modelu, standardní odchylky, atd.):

Všimněte si, že koeficienty zachyceny v této tabulce (zvýrazněny červeně) zápas s koeficienty generované sklearn.

to je dobré znamení! máme konzistentní výsledky použitím sklearn i statsmodels.

dále uvidíte, jak vytvořit GUI v Pythonu, abyste získali vstup od uživatelů, a poté zobrazte výsledky predikce.,

GUI používá pro více lineární regrese v Pythonu

to je místo, kde začíná skutečná zábava!

proč nevytvořit grafické uživatelské rozhraní (GUI), které umožní uživatelům zadávat nezávislé proměnné, aby získali předpokládaný výsledek?

může se stát, že někteří uživatelé nemusí vědět mnoho o zadávání dat do samotného kódu Pythonu, takže má smysl vytvořit jim jednoduché rozhraní, kde mohou data spravovat zjednodušeným způsobem.,

můžete dokonce vytvořit dávkový soubor pro spuštění programu Python, takže uživatelé budou muset dvakrát kliknout na dávkový soubor, aby mohli spustit GUI.

Zde je úplný Python kód pro váš konečný Regresní GUI:

Jakmile jste spustit kód, uvidíš, že to GUI, které obsahuje výstup generovaný sklearn a rozptylové diagramy:

Připomeňme si, že dříve jsme udělali predikce pomocí následujících hodnot:

  • Úroková Sazba = 2.75
  • Míra Nezaměstnanosti = 5.,3

Zadejte tyto hodnoty do vstupního pole a pak klepněte na tlačítko ‚Předpovědět Akciový Index Cen tlačítko:

Budete nyní vidět předpověděl výsledek 1422.86, což se shoduje s hodnotou, kterou jste předtím viděli.

možná budete také chtít zkontrolovat následující tutoriál, abyste se dozvěděli více o vkládání grafů na Tkinter GUI.

závěr

lineární regrese se často používá ve strojovém učení. Viděli jste několik příkladů, jak provést více lineární regrese v Pythonu pomocí sklearn i statsmodels.,

před použitím lineárních regresních modelů zkontrolujte, zda existuje lineární vztah mezi závislou proměnnou (tj. co se snažíte předvídat) a nezávislou proměnnou/s (tj.