Major League Baseball je první 134 letech 1876-2009, některé z jeho nejvíce zajímavé a neobvyklé události byly 260 no-hitters (18, které byly perfektní hry. V roce 2010, džbány hodil šest no-hitters, z nichž dva (a téměř třetina) byly perfektní. V tomto článku zkoumáme, zda jednoduché matematické modely mohou vysvětlit frekvenci dokonalých her a ne-hitters v průběhu let., Zkoumáme také, zda nadhazovači, kteří skutečně předvedli perfektní hry, byli ti, kteří“ měli být očekáváni“.
během prvních 134 let Major League Baseball, 1876-2009, některé z jeho nejzajímavějších a neobvyklých událostí byly 260 no-hitters (18 z nich byly perfektní hry“No-Hitter – BR Bullpen.“Baseball-Reference.com -Major League Baseball statistiky a historie. Web. Červen-Červenec 2010. http://www.baseball-reference.com/bullpen/No_hitter., „Perfektní hra.“Baseball-Reference.com -Major League Baseball statistiky a historie. Web. Červen-Červenec 2010. http://www.baseball-reference.com/bullpen/Perfect_game.)., V roce 2010, džbány hodil šest no-hitters, z nichž dva (a téměř třetina) byly perfektní. V tomto článku zkoumáme, zda jednoduché matematické modely mohou vysvětlit frekvenci dokonalých her a ne-hitters v průběhu let. Zkoumáme také, zda nadhazovači, kteří skutečně předvedli perfektní hry, byli ti, kteří“ měli být očekáváni“.
PERFEKTNÍ HRY,
Od roku 1876 do roku 2009, džbány hodil 18 perfektní hry., Každý byl dosažen jiným džbánem a pouze jednou před rokem 2010 (cesta zpět v roce 1880) se ve stejném roce objevily dvě perfektní hry (viz tabulka 1). Z těchto dokonalých her přišlo během pravidelné sezóny 17. V tomto článku uvažujeme pouze o pravidelných sezónních událostech.
nejjednodušší MODEL
možná nejjednodušší přístup k modelování výskytu dokonalých her je léčit všechna roční období, všechny džbány a všechny baterie. Vzhledem k tomuto zdánlivě nerealistickému předpokladu se člověk může zeptat, kolik dokonalých her by mělo být položeno?,
v Průběhu prvního 134 let historii Major League Baseball, celkově na procentu základu (OBP) byl přibližně 0.3279,standardní definice OBP je (H + BB + HBP)/(AB + BB + HBP + SF). Dosažení základny na chybě se v této definici nepoužívá. Seznam zkratek používaných v tomto článku naleznete v příloze. což znamená, že v asi 1?3 talířových vzhledů, těsto dosáhlo základny. Přesto, aby bylo hřiště perfektní hra, nadhazovač musí odejít 27 po sobě jdoucích pálkařů, které mu hrozí., Pravděpodobnost pitching out je (1-OBP), a tak pravděpodobnost pitching perfektní hra je (1-OBP) 27.
obecně platí, že proto, počtu perfektní hry lze očekávat podle této analýzy je:
důvodem pro „2“ je, že buď tým ve hře, může pitch perfektní hra. 195,177 pravidelné sezóny hry byly hrál od 1876-2009, takže počet dokonalé hry, které lze očekávat od 1876-2009 je 195,177 * 2 * (1-.3279)27 = 8, 55, jen polovina z 17 pozorovaných.,
k této záležitosti lze přistupovat opačným způsobem a vypočítat OBP potřebné k získání výsledku 17 dokonalých her. Řešení rovnice (1) pro OBP, máme
To vede k 0.3106 OBP. Z pohledu OBP je rozdíl 0,0173 (tj.3279 – .3106), nebo o 5% OBP hodnoty, může představovat rozdíl mezi pozorovaným počtem perfektní hry (17) a číslo se očekává, že z tohoto jednoduchého modelu (8.55)., To demonstruje citlivost očekávaného počtu dokonalých her na variace v OBP. Představujeme v grafu 1 vztah mezi OBP a očekávaným počtem dokonalých her. Jak se OBP zvyšuje, více pálkařů se dostává na základnu a pravděpodobnost dokonalé hry se zmenšuje.
Jsme na vědomí, že OBP se pohybovaly od minima 0.267 v roce 1880 na vysokých 0.379 v roce 1894. Pokud by tyto hodnoty přetrvávaly během 134 studovaných let, očekávaný počet dokonalých her by byl 89 a jeden. Roční směrodatná odchylka OBP vážená hrou je 0.,0150, takže jeden rozsah standardní odchylky pro OBP dává rozsah 0,3129 až 0,3429 (tj.3279 ± 0.0150. To má za následek očekávaný počet dokonalých her v rozmezí od 4,6 do 15.5, který se blíží, ale nedosahuje pozorovaný počet 17 perfektní hry. To dále demonstruje citlivost očekávaných dokonalých her na malé změny v OBP. To také naznačuje, že i když tento jednoduchý model není příliš uspokojivý, není zcela neslučitelný s pozorovaným počtem dokonalých her.,
meziroční MODEL
výsledky jednoduchého modelu nás vedly k posouzení revidovaného modelu, ve kterém se používá stejný přístup, ale ve kterém se každý rok posuzuje samostatně. Je zřejmé, že ne všechny roky v baseballu byly podobné, jak je uvedeno výše rozsahem pozorovaných hodnot OBP v průběhu let. Pokud vezmeme v úvahu každý rok Samostatně, s vlastním OBP, jak by se změnil očekávaný počet dokonalých her?,
při Použití rovnice (1) pro každý rok individuálně a s ohledem na počet zápasů hrál, jsme vypočítán očekávaný počet dokonalých her pro každý rok. Po shrnutí těchto her jsme zjistili, že očekávaný počet dokonalých her v letech 1876-2009 byl 10.6. Rok s nejnižší očekávaný počet perfektní hry byl roku 1894, s 0.004 očekává perfektní hry, počet her hrál (799) byl malý a OBP (0.379) vysoká.
největší počet dokonalých her (0.451) byl očekáván v roce 1884, kdy byl OBP nízký .,279 a počet her hrál vysokou 1,544, čtvrtý-nejvyšší počet zápasů v sezoně, před rokem 1960. Že 10.6 perfektní hry byly očekávány tímto modelem spíše než skutečné 17 naznačuje, že je zapotřebí lepší přístup k dosažení realističtějšího výsledku. Ještě více znepokojující je, že standardní OBP opomíjí dosažení základní on error (ROE), který vlastně počítá směrem k v v-bat horizontu, snížení OBP, a jeden hráč dosáhl metu na chybu fólie jinak perfektní hra., V historii baseballu se odehrálo nejméně pět téměř dokonalých her, rozdělených pouze jednou chybou.Děkujeme anonymnímu rozhodčímu za to, že navrhl začlenit ROE do naší analýzy.
ZAČLENIT TĚSTA DOSAŽENÍ ZÁKLADNY NA CHYBY,
Vyplňte údaje pro těsta dosažení základny na chyby je k dispozici pouze za 40 let od roku 1960 do současnosti.Ruizi, Williame. „Téměř Dokonalé Hry.“The Baseball Research Journal 20 (1991): 46-51. Tisek. Celkový počet chyb každý rok za všechny roky od roku 1876 do současnosti však lze snadno najít., Zajímavé je, že za 40 let kompletní údaje, poměr těsta dosažení základny na chybě celkový počet chyb je téměř konstantní, v průměru 63.4% se směrodatnou odchylkou 1,1%. Můžeme tedy důvodně vzít 63.4% z celkového počtu chyb v celé historii baseballu, nebo rok od roku, pro ty, let, pro které je neúplné nebo žádné ROE údaje, jako odhad pro počet těsta dosáhl metu na chybu., OBP upravena tak, aby začlenit dosažení základny na chybu, tak se stane:
Všimněte si, že deska vystoupení těch těsta dosažení základny na chyby již byly zahrnuty ve jmenovateli (jako outs) v AB. Provedení stejné analýzy jako udělat pro Nejjednodušší Model (OBPROE = 0.3490 s směrodatná odchylka 0.0165) vede k očekávanému počtu perfektní hry z roku 1876 do roku 2009 3,6; one-standardní odchylka rozsah výnosy 1,8 až 7.1 očekává perfektní hry., Tyto výsledky jsou prezentovány v Grafu 2, kde je zřejmé, že jedna standardní odchylka rozsah OBPROE přichází zdaleka včetně skutečného počtu perfektní hry. Použití OBPROE na meziroční model vede k okrajově realističtějšímu očekávání 4, 3 dokonalých her v letech 1876-2009. Vidíme však, že nastavení OBP začlenit ROE zhoršuje chybě, a dále zdůrazňuje, že je třeba větší pozor na výskyt perfektní hry.,
DŽBÁN-DŽBÁN MODEL
Pro předchozí modely, všechny těsta a džbány byly předpokládat, že mají stejné schopnosti v celé historii baseballu (v nejjednodušším modelu), nebo pro každý rok samostatně (v roce modelu). To vede k očekávání méně než jedné třetiny skutečného počtu dokonalých her, když se vezme v úvahu jikry. Protože předpoklad rovných schopností je nereálný, prozkoumali jsme sofistikovanější model., Vzhledem k průběhu hry, a jistě no-hitter, zdá se, závisí více na džbán výkon než na to, že jednoho pálkaře (viz, například, Frohlich papír na no-hitters), jako další krok jsme považovali za model, ve kterém džbány mají různé schopnosti. Konkrétně jsme zvažovali výkon každého jednotlivého nadhazovače. Jak často konkrétní džbán generuje výstupy? Povede tato variace v pitching schopnosti k výsledkům více v souladu s těmi, které se vyskytly v historii baseballu?,
Na tyto otázky odpovědět, sestavili jsme dat (OBPROE) pro každý džbán v každém roce své kariéry (tj. je-li nadhazovač hodil deset let, má deset samostatných datových sad).Baseballový archiv Seana Lahmana. Web. Červen-Červenec 2010. http://www.baseball1.com. Od ROE údaje pro každý džbán není k dispozici, budeme předpokládat, že každý džbán byl předmětem stejnou pravděpodobnost těsto dosažení základny na chybu jako všechny ostatní džbány v každém jednotlivém roce.
tato hodnota je rozdíl mezi meziročním OBP a bez zahrnutí ROE, který označujeme ROE_diff., V prvních letech baseballu, kdy bylo v průměru spácháno asi deset chyb na hru, je tato hodnota až 0,097, což znamená, že přibližně 10% všech pálkařů dosáhlo základny chyby. V posledních letech je hodnota asi 0,01, což znamená, že asi 1% všech baterií dosáhne základny chyby. Přirozeně, to má za následek velký handicap pro nadhazovače v prvních letech baseballu s ohledem na snadnost nadhazování perfektní hru., Pro džbán, pravděpodobnost, že těsto se stává (viz Dodatek pro odvození):
Jsme pak za kolik her každý nadhazovač začal každý rok (od nadhazovač nesmí nadhazovat perfektní hra, jestli to, že se nespustí). Budeme dále uvažovat pouze džbány, kdo hodil nejméně 54 out v sezóně eliminovat případy velmi nízké dat (Jsme na vědomí, že relaxační tuto podmínku minimální 27 out potřeba na hřišti perfektní hra vede k rozdíl menší než polovina ideální hra za 134 let považován za)., Pravděpodobnost, že džbán nadhazuje perfektní hru, je, stejně jako dříve, pravděpodobnost, že se zvýší na 27. sílu, P (Out) 27.
poté jsme použili počítač k simulaci, zda by daná hra byla „dokonalá“ pomocí generátoru náhodných čísel, který by označil perfektní hru, když (rovnoměrně distribuovaná ) náhodná hodnota byla menší než P(Out)27. To bylo provedeno pro každou hru zahájenou každým džbánem v každém roce – celkem více než 39 000 případů.Například, protože Roger Clemens hodil 23 let, 23 z 39,000 + případů jsou roky, které položil Clemens., Tato simulační metoda je velmi podobná metodě, kterou použili Arbesman a Strogatz ve své studii 56-herního úderu Joe Dimaggia.Arbesman, S. A S. H. Strogatz. „Monte Carlo přístup k Joe DiMaggio a pruhy v baseballu.“arXiv: 0807. 5082v2. 1. srpna 2008. Jeden takový výpočet přináší baseballový „vesmír“, simulaci historie baseballu z let 1876-2009 pomocí hodnot OBP džbánu z těchto let. Spustili jsme simulaci pro 2000 vesmírů a analyzovali výstup pro průměrný počet dokonalých her a jejich distribuci., Kromě toho jsme sestavili výsledky, pro které nadhazovači měli s největší pravděpodobností hodit perfektní hry.
V našem vesmírů, odhadovaný počet dokonalých her v rozmezí od 3 do 35 nad 134 let, s průměrnou být 15.9 (viz Graf 3) se směrodatnou odchylkou 4.1, což znamená, že skutečná hodnota 17 spadá do jedné směrodatné odchylky vypočtené hodnotě.,
samozřejmě, jeden může obsahovat více aspektů hry baseballu, jako jsou rozdíly v schopnosti praštit mezi různými týmy,‘ sestava nebo změnu zasáhnout schopnost v rámci jedné sestavy. Ve své studii no-hitters, FrohlichRetrosheet ML odpalování a pitching rozdělí pro každý rok. Toto je pro sezónu 1996, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. diskutovali o tomto problému s variací a zjistili, že účinek je malý. Vyloučili jsme některé další baseballové akce, jako jsou strikeouts, dvojité a trojité hry, a dosažení základny na rušení z našich novin., Tyto události a další mohou být obtížné zahrnout do modelování, může být problematické získat spolehlivé údaje pro, vyskytují se zřídka, nebo je nepravděpodobné, že by mít velký vliv na výsledky.
Jako kontrola přiměřenosti výpočtů, jsme se podívali na to, jak džbány, kdo vlastně rozbil perfektní hry dařilo v simulaci, stejně jako na džbány, kteří většinou šikmé perfektní hry v těchto simulací. Umístili jsme džbány v pořadí podle počtu dokonalých her „posazených“ každým džbánem do vesmírů 2,000 a zkoumali, kde bylo umístěno skutečných 17 dokonalých herních džbánů., Osm z 17 byli v top 1% (v horní 84 nad 8,300 nadhazovači, kteří položili v první Lize) v našem žebříčku, zatímco šest dalších bylo v top 5% (85–420), jeden v top 10%, a ostatní
dva v top 25%. tyto výsledky jsou uvedeny v tabulce 2. Top 10 džbány s největším počtem dokonalých her v simulacích jsou uvedeny v tabulce 3. Všichni jsou dobře známí mezi fanoušky baseballu, i když jen jeden z nich (Sandy Koufax) ve skutečnosti hodil perfektní hru. Jeden z ostatních (Walter Johnson) hodil „téměř dokonalou hru.,“
bereme na vědomí, že jen asi 2700 z více než 8300 džbánů v historii baseballu někdy hodil perfektní hru v simulaci 2000 baseballových vesmírů. Ostatní buď postrádali potřebnou úroveň dovedností, nebo nikdy nezačali hru. Směrodatná odchylka výsledků uvedených v tabulce 3 je asi 16 her.
ne-HITTERS
Všechny perfektní hry jsou ne-hitters, ale ne-hitters jsou častější než perfektní hry, protože nejsou rozděleny procházkou, hit-by-pitch, nebo chyba. Přesto je pitching no-hitter docela úspěch., V perfektní hře, jedinými pravděpodobnostmi jsou dostat se na základnu a ven. Naproti tomu při modelování ne-hitterů je třeba také řešit pravděpodobnosti chůze, hit-by-pitch a dosažení základny na chybě. Během pravidelných sezón 1876-2009 bylo 250 jednorázových no-hitterů.
FrolichRetrosheet ML odpalování a pitching rozdělí pro každý rok. Toto je pro sezónu 1996, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. přiblížil se k obecnější otázce, jak často by měl být jakýkoli daný počet zásahů získán v baseballové hře., On za hity a výstupy, zatímco ignoruje všechny ostatní události, a vyvinula negativní binomické vzorce pro rozdělení počtu hitů, které lze očekávat, že ve hře vzhledem k celkové pravděpodobnosti hit každý rok studoval. Na tomto modelu pak stavěl, nejprve měnil schopnosti průměrných nadhazovačů a poté měnil schopnosti průměrných pálkařů. Našel dobré shodě s předpovídají, počet tří-hit hry přes deset-hit hry pro pětileté období od roku 1989 do roku 1993. Jeho výsledky mimo tento rozsah zásahů však byly méně uspokojivé., Jeho model předpověděl pouze asi dvě třetiny skutečného počtu no-hitters pro období 1900-93.
naše úsilí je zaměřeno na získání lepších výsledků v modelování no-hitters. Matematicky jsme modelovali počet no-hitters v letech 1876-2009 a poté porovnali náš výsledek se skutečnou hodnotou.
NEJJEDNODUŠŠÍ no-HITTER MODEL
Jsme přehodnotili náš počítačový model, aby znovu naše vesmíry baseballové historie začleněním tři typy událostí, které mohou nastat v baseballu: (1) hity; (2) procházky, hit-o-hřiště a dosažení základny na chyby; a (3) výstupy., Vyšetřovat no-hitter problém, potřebovali jsme projít sestavy jednoho těsta v době, přes každou hru (pokud všichni pálkaři se předpokládá, že mají stejné schopnosti). Náhodné číslo bylo vybráno rovnoměrně rozloženo, aby se zjistilo, zda je těsto venku, dostal zásah, nebo dosáhl základny procházkou, hit-by-pitch nebo dosažení chyby. Pokud byl hit získán před nahráním 27 outů, hra nebyla žádným hitterem. Na druhou stranu, pokud bylo zaznamenáno 27 outů, aniž by byly získány žádné hity, hra byla považována za ne-hitter., To se opakovalo, aby simulovalo 2 000 vesmírů s 195 177 hrami v každém.
nejprve, stejně jako pro modelování dokonalých her, jsme použili pravděpodobnosti outů, hitů a BB+HBP +ROE (jak bylo popsáno výše) pro roky 134 od roku 1876 do roku 2009. Pravděpodobnost výpadku byla 0,6510; pravděpodobnost zásahu byla 0,2374; a pravděpodobnost BB, HBP nebo ROE byla 0,1116. Tato počáteční simulace promítla neuspokojivých 123 no-hitters v průměrném vesmíru se standardní odchylkou 14, 5 no-hitters. (Cílový počet no-hitters byl 250).,
meziroční ne-HITTER MODEL
Spustili jsme simulaci znovu,ale nyní jsme vypočítali pravděpodobnosti outů, hitů a BB+HBP+ROE zvlášť pro každou sezónu. Pravděpodobnosti byly vloženy do programu spolu s počtem her, které se konají každý rok. Opět jsme simulovali 2000 baseballových vesmírů. Tyto výsledky byly o něco lepší, ale stále neuspokojivé. Tato simulace produkovala v průměru 135,4 no-hitters se standardní odchylkou 14,8. To naznačilo, stejně jako u naší perfektní analýzy her, že bychom mohli lépe opakovat náš přístup džbánu po džbánu.,
DŽBÁN-DŽBÁN no-HITTER MODEL
Jsme přehodnotili náš džbán-džbán přístup pro dokonalé-hry, modelování, aby prošetřila no-hitters stejným způsobem, jako jsme to udělali s použitím Nejjednodušší no-Hitter a Rok-na-Rok no-Hitter modely; to znamená, že jsme uvažovali v případě, dostat se na základnu bez zásahu kromě případu hitů a případ výstupy. Podívali jsme se na pravděpodobnosti různých událostí pro každého nadhazovače, který začal hru pro každý rok a pokračoval, jak je popsáno ve výše uvedené části „perfektní hra“., Opět jsme zvažovali pouze nadhazovače, kteří začali alespoň jeden zápas a v této sezóně hráli alespoň 54 outů. výsledky byly zarážející. V 2000 vesmíry jsme běželi, co jsme našli v průměru 243 no-hitters, z méně než 4% z 250 jeden džbán no-hitters, že skutečně došlo v 1876-2009. Směrodatná odchylka byla 15,7 no-hitters. Tento poslední model, který používá jednotlivá data džbánu, tak opět poskytuje obrovské zlepšení oproti předchozím modelům., Výsledky simulací tří metod pro vyšetřování ne-hitterů jsou uvedeny v grafu 4.
DISKUSE A ZÁVĚR
Modelování vzácné události je náchylný k významné relativní chyba, zda je modelování extrémní chování na finančních trzích nebo vzácné počasí. Totéž platí pro modelování vzácných událostí v baseballu. Naše analýza a simulace ukazují, že použití víceletých kombinovaných dat vede k nepřesným předpovědím výskytu vzácných událostí (jako jsou perfektní hry a ne-hitters)., Pomocí rok dat lepší výsledky bit, zatímco včetně džbán-džbán dat v každém roce jeho kariéry výrazně lepší výsledky pro oba perfektní hra a no-hitter studií. To znamená, že ti, kteří položili ne-hitters a perfektní hry měl, obecně, mnohem lepší pitching schopnost než průměrný džbán v historii baseballu.
abychom mohli provádět výpočty, potřebovali jsme upravit neúplné dostupné údaje týkající se batterů, které dosáhly základny chybou., Navzdory nedostatku údajů v prvních letech Major League Baseball jsou získané výsledky zcela realistické. Protože jsme provedli analýzu během sezóny 2010, Zahrnuli jsme pouze kompletní roční období. S množstvím perfektní hry (a jedna dokonalá hra rozdělena chudým výzvu rozhodčího) a no-hitters v roce 2010, zdá se, že v roce 2010 byla zvláštní sezóna takové, které by neměly přijít spolu velmi často, alespoň pro perfektní hry a no-hitters., Zatímco schopnost nadhazovače hodit perfektní hru je jistě posílena mnohem nižší mírou chyb v moderní hře, můžeme se považovat za štěstí, že jsme byli svědky takové zvláštní sezóny.
člověk by se mohl zeptat, zda týmy poražené v dokonalých hrách měly menší útočnou schopnost než ligový průměr a zda by tento aspekt měl ovlivnit počet dokonalých her. Ukazuje se, že v 17 dokonalých hrách pravidelné sezóny měl poražený tým lepší standardní OBP než ligový průměr sedmkrát a horší OBP desetkrát., V průměru byla standardní OBP poraženého týmu o 0,0046 nižší než ligový průměr. Podrobnosti jsou uvedeny v tabulce 4. Z toho usuzujeme, stejně jako Frohlich v případě no-hitter, že variace v těstíčku schopnosti má malý vliv na perfektní hry.
Tabulka 1 ukazuje, 42-rok propast mezi pravidelné sezóny ideální hra šikmé Charlie Robertson v roce 1922 a jeden hodil Jim Bunning v roce 1964. To nás zajímalo, zda se v simulacích vyskytuje podobný jev s velkou mezerou., Podívali jsme se na nejdelší mezeru v každé z našich simulací 2,000 universe perfect game pitcher-by-pitcher. Naše nejdelší mezera mezi dokonalé hry, v průměru 24.1 let, standardní odchylka 12,4 let, s minimální nejdelší mezera je tři roky a maximální nejdelší mezera je 86 let v naší 2,000 vesmíry. V tomto článku jsme ukázali, jak lze aplikovat matematické metody na modelování i vzácných aspektů baseballu. Doufáme, že tato práce povede k dalšímu matematickému vyšetřování otázek týkajících se největší americké hry.,
Dodatek
v tomto článku byly použity následující zkratky.
AB – At-Netopýry
BB – Základny na Kuličky
BF – Pálkaři Čelí
H – Hity
HBP – Hit Hřiště
OBP – Na-Base Procento
ROE – Dosáhl Základny na Chyby
SF – Oběť Létat
Odvození Pravděpodobnosti, Hit, a Dosažení Základnu bez zásahu pro Jednotlivé Džbány z Dostupných Údajů