Gjennom Major League Baseball er første 134 år, 1876-2009, noen av sine mest interessante og uvanlige hendelser har vært 260 ingen-hitters (18 som har vært perfekt spill. I 2010, mugger kastet seks ikke-hitters, to av dem (og nesten en tredjedel) var perfekt. I dette innlegget, vi undersøke om enkle matematiske modeller kan forklare frekvens av perfekt spill og ikke-hitters over år., Vi kan også undersøke om mugger som faktisk slo det perfekte spill var de som «burde ha vært forventet» å gjøre det.
Gjennom Major League Baseball er første 134 år, 1876-2009, noen av sine mest interessante og uvanlige hendelser har vært 260 ingen-hitters (18 som har vært perfekt spill»No-Hitter – BR Bullpen.»Baseball-Reference.com – Major League Baseball Statistikk og Historie. Web. Juni-Juli 2010. http://www.baseball-reference.com/bullpen/No_hitter.,»PerfectGame.»Baseball-Reference.com – Major League Baseball Statistikk og Historie. Web. Juni-Juli 2010. http://www.baseball-reference.com/bullpen/Perfect_game.)., I 2010, mugger kastet seks ikke-hitters, to av dem (og nesten en tredjedel) var perfekt. I dette innlegget, vi undersøke om enkle matematiske modeller kan forklare frekvens av perfekt spill og ikke-hitters over år. Vi kan også undersøke om mugger som faktisk slo det perfekte spill var de som «burde ha vært forventet» å gjøre det.
PERFEKT SPILL
Fra 1876 gjennom 2009, mugger kastet 18 perfekt spill., Hver ble oppnådd av en annen mugge og bare en gang før 2010 (helt tilbake i 1880) gjorde to perfekte spill oppstå i det samme året (se Tabell 1). Av disse perfekte spill, 17 kom under den ordinære sesongen. I dette innlegget, vi vurderer bare vanlige sesongen hendelser.
ENKLESTE MODELLEN
Muligens den enkleste måten å modellere forekomst av perfekt spill er å behandle alle årstider, alle kannene, og alle røre likt. Gitt denne tilsynelatende urealistisk forutsetning, man kan spørre seg, hvor mange perfekt spill burde ha vært reist?,
i Løpet av de første 134 år i Major League Baseball historie, samlet på-base prosent (OBP) har vært ca 0.3279,standard definisjon av OBP er (H + BB + HBP)/(AB + BB + HBP + SF). Nå base på en feil er ikke brukt i denne definisjonen. For en liste over forkortelser som brukes i denne artikkelen, vennligst se Vedlegg. noe som betyr at i ca 1?3 av plate opptredener, batter nådd bunnen. Likevel, for å pitch et perfekt spill, en start mugge må bryte den 27 etterfølgende hitters han står overfor., Sannsynligheten for å kaste en ut er (1-OBP), og slik at sannsynligheten for pitching et perfekt spill er (1-OBP)27.
generelt, derfor er antallet perfekt spill for å bli forventet i henhold til denne analysen er:
grunnen til «2», er at begge lag i en kamp kan pitch et perfekt spill. 195,177 vanlige sesongen ble spilt fra 1876-2009, slik at antall perfekte spill for å bli forventet fra 1876-2009 er 195,177 * 2 * (1-.3279)27 = 8.55, bare halvparten av de 17 observert.,
En kan nærme seg denne saken i motsatt vei og beregne OBP nødvendig for å oppnå resultat av 17 perfekt spill. Løse ligning (1) for OBP, har vi
Dette fører til en 0.3106 OBP. Fra perspektivet av OBP, en forskjell på 0.0173 (som er, .3279 – .3106), eller ca 5% av OBP verdi, kan forklare forskjellen mellom observert antall perfekte spill (17) og antall forventet fra denne enkle modellen (8.55)., Dette viser følsomheten av forventet antall perfekte spill for variasjoner i OBP. Vi presenterer i figur 1 forholdet mellom OBP og forventet antall perfekte spill. Som OBP øker, mer røre få på base og sannsynligheten for et perfekt spill krymper.
Vi oppmerksom på at OBP har varierte fra lave 0.267 i 1880 til en høy av 0.379 i 1894. Hvis disse verdiene vedvarte gjennom 134 år studert, forventet antall perfekte spill ville ha vært 89 og ett hhv. År-for-år game-vektet standardavvik av OBP er 0.,0150, så en standard-avvik utvalg for OBP gir en rekke 0.3129 å 0.3429 (som er, .3279 ± 0.0150. Dette resulterer i forventet antall perfekte spill til å variere fra 4,6 til 15.5, som kommer nær, men ikke når det observert antall 17 perfekt spill. Dette nærmere, viser følsomheten av forventet perfekt spill til små endringer i OBP. Det indikerer også at mens denne enkle modellen er ikke veldig tilfredsstillende, det er ikke helt uforenlig med observert antall perfekte spill.,
ÅR-FOR-ÅR MODELLEN
resultatene av den enkle modellen fått oss til å vurdere en revidert modell der den samme tilnærmingen er benyttet, men som hvert år er vurdert separat. Klart, ikke alle år i fotball, har vært likt, som indikert ovenfor ved utvalg av observert OBP verdier over år. Hvis vi betrakter hvert år for seg, og med sin egen OBP, hvordan ville forventet antall perfekte spill for endring?,
Søker ligning (1) til hvert år individuelt og ta hensyn til det antall ordinære sesongen spilte spill, har vi beregnet forventet antall perfekte spill for hvert år. Etter å summere disse spillene, finner vi at forventet antall perfekte spill i 1876-2009 var 10.6. Det året med lavest forventet antall perfekte spillene var i 1894, med 0.004 forventet perfekt spill; antall spilte spill (799) var liten og OBP (0.379) høy.
Den største antallet perfekt spill (0.451) var forventet i 1884, da OBP var lav .,279 og antall spill spilt en høy 1,544, den fjerde høyeste antall kamper i en sesong før 1960. Som 10.6 perfekt spill ble forventet av denne modellen, snarere enn den faktiske 17 angir at en bedre tilnærming er nødvendig for å få et mer realistisk resultat. Enda mer problematisk er at standard-OBP unnlater å nå base på feil (ROE), som faktisk teller mot en ut i på-bat sikt å senke OBP, og en enkelt spiller å nå base på en feil foils en ellers perfekt spill., Minst fem nesten-perfekt spill, brutt opp av bare en enkelt feil, har skjedd i baseball historie.Vi takker en anonym referee for å foreslå å innlemme ROGN i vår analyse.
INNLEMME RØRER å NÅ BASE PÅ FEIL
Komplette data for rører å nå base på en feil er bare tilgjengelig for 40 år fra 1960 til i dag.Ruiz, William. «Nær Perfekt Spill.»Baseball Forskning Tidsskrift 20 (1991): 46-51. Skrive. Det totale antall feil hvert år for alle år fra 1876 til i dag, derimot, kan lett bli plassert., Det er interessant, for den 40 år med komplette data, forholdet mellom rører å nå base på en feil til det totale antall feil er nesten konstant, gjennomsnittlig 63.4% med et standard avvik på 1,1%. Dermed kan vi med rimelighet ta 63.4% av det totale antall feil over hele baseball historie, eller år for år, for de årene som det ikke er ufullstendig eller ingen ROGN data, som et estimat for antall rører å nå base på en feil., Den OBP justert å innlemme nå base på en feil blir således:
Merk at plate opptredener av de rører å nå base på en feil har allerede blitt inkludert i nevneren (som outs) i AB. Utfører samme analyse som er gjort for den Enkleste Modellen (OBPROE = 0.3490 med standardavvik 0.0165) fører til forventet antall perfekte spill fra 1876 gjennom 2009 på 3,6; en-standard-avvik utvalg avkastning på 1,8 til 7.1 forventet perfekt spill., Disse resultatene er presentert i figur 2, der det er klart at ett standardavvik utvalg av OBPROE kommer ikke i nærheten, inkludert den sanne antall perfekte spill. Søker OBPROE til år-for-år-modellen fører til marginalt mer realistisk forventning på 4,3 perfekt spill fra 1876-2009. Vi ser imidlertid at justering av OBP å innlemme ROGN forverrer feil og ytterligere understreker behovet for en mer forsiktig ser på forekomsten av perfekt spill.,
MUGGE-AV-MUGGE MODELL
For tidligere modeller, alle røre og mugger ble antatt å ha lik mulighet til gjennom baseball historie (i den enkleste modellen) eller for hvert år individuelt (i år-for-år-modellen). Dette fører til forventninger om mindre enn en tredjedel av det faktiske antallet perfekt spill når ROGN er tatt hensyn til. Fordi lik evne til antakelsen er urealistisk, vi utforsket en mer sofistikert modell., Siden løpet av et spill, og sikkert av en ikke-hitter, synes å avhenge mer på en mugge ytelse enn på en enkelt hitter (se, for eksempel, Frohlich er papir på ingen-hitters), som et neste trinn, har vi vurdert en modell der kannene har forskjellige evner. Spesielt, vurderte vi resultatene for hver enkelt mugge. Hvor ofte gjør en bestemt mugge generere outs? Vil variasjonen i pitching evne føre til resultater mer på linje med de som har oppstått i baseball historie?,
for Å besvare disse spørsmålene, har vi samlet dataene (OBPROE) for hver mugge i hvert år av sin karriere (dvs. hvis en mugge reist ti år, han har ti separate datasett).Sean Lahman er Baseball Arkiv. Web. Juni-Juli 2010. http://www.baseball1.com. Siden ROGN data for hver mugge er ikke tilgjengelig, og vi antok at hver mugge var gjenstand for den samme sannsynligheten for en batter å nå base på en feil som alle andre mugger i hvert enkelt år.
denne verdien er forskjellen mellom år for år OBP med og uten inkludert ROGN, som vi betegne av ROE_diff., For første årene av baseball, når i gjennomsnitt om lag ti feil per kamp ble begått, denne verdien er så høy som 0.097, noe som betyr at ca 10% av alle røre nådd base på en feil. For de siste årene, verdien er ca 0.01, som betyr at ca 1% av alle røre nå base på en feil. Naturligvis, dette resulterer i et stort handicap for mugger i baseball er første årene med hensyn til å lette på pitching et perfekt spill., For en mugge, sannsynligheten for å få en røren ut blir (se Vedlegg for avledning):
Vi har så vurdert hvor mange spill hver mugge gang hvert år (siden en mugge ikke pitch en perfekt kamp hvis han ikke starter). Vi har videre vurdert bare mugger som stemte minst 54 outs i en sesong for å eliminere tilfeller av svært lave data (Vi at en avslappende denne tilstanden til minimum 27 outs nødvendig for å pitch et perfekt spill fører til en forskjell på mindre enn en halv perfekte spillet over 134 år vurdert)., Sannsynligheten for pitcher pitching et perfekt spill er, som før, er sannsynligheten for at en ut hevet til 27. makt, P(Ut)27.
Vi har brukt en datamaskin til å simulere om et gitt spill ville være «perfekt» ved hjelp av en tilfeldig nummer generator som ville merke av et perfekt spill når (jevnt fordelt på ) tilfeldig verdi var mindre enn S(Ut)27. Dette ble gjort for hvert spill startet av hver mugge i hvert år—mer enn 39,000 tilfeller i det hele tatt.For eksempel, siden Roger Clemens spisst 23 år, 23 39,000+ tilfeller er de årene reist av Clemens., Denne simuleringen metoden er svært lik den som ble brukt av Arbesman og Strogatz i sin studie av Joe DiMaggio er 56-spillet treffer strek.Arbesman, S. og S. H. Strogatz. «En Monte Carlo Tilnærming til Joe DiMaggio og Striper i Baseball.»arXiv:0807.5082v2. 1. August 2008. En slik beregning gir en baseball «universet», en simulering av baseball historie fra 1876-2009 ved hjelp av mugge OBP verdier fra disse årene » – spill. Vi kjørte simulering for 2000 universer og analysert utgang for gjennomsnittlig antall perfekte spill og sin distribusjon., I tillegg har vi satt sammen resultatene for som mugger burde ha vært mest sannsynlig til å pitch perfect spill.
I vår universer, estimert antall perfekte spill varierte fra 3 til 35 over 134 år, med gjennomsnittlig blir 15.9 (se Diagram 3) med et standardavvik på 4,1, noe som betyr den sanne verdi av 17 faller godt innenfor ett standardavvik av den beregnede verdi.,
selvfølgelig, kan man inkludere flere aspekter av spillet baseball, for eksempel variasjon i evne til å treffe mellom de forskjellige lagene’ lagoppstillinger eller variasjon i evne til å treffe innenfor en enkelt gruppe. I sin studie av ikke-hitters, FrohlichRetrosheet ML vatt og pitching deler for hvert år. Dette er etter 1996-sesongen, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. har diskutert dette treffer variasjon saken og fant effekten å være liten. Vi har ekskludert noen andre baseball hendelser som strikeouts, dobbelt-og tremannsrom du spiller, og nå base på forstyrrelser fra vår papir., Disse hendelsene, og andre kan være vanskelig å inkludere i modellering, kan være problematisk å skaffe pålitelige data for, forekommer sjelden, eller er det lite sannsynlig har stor innflytelse på resultatene.
Som en sjekk på reasonability av beregninger, vi så på hvordan krukkene som faktisk stemte perfekt spill fór i simuleringer, samt på kanner som oftest slo perfekt spill i disse simuleringene. Vi rangert mugger i rekkefølge etter antall perfekte spill «spisst» ved hver mugge i 2000 universer og undersøkt hvor den faktiske 17 perfekte spillet mugger plassert., Åtte av de 17 var i topp 1% (i toppen 84 av de over 8,300 mugger som har reist i de Store Ligaene) i vår ranking, mens seks andre var i topp 5% (85–420th), én mer i topp 10%, og den andre
to i topp 25%. Disse resultatene vises i Tabell 2. Topp 10 mugger med størst antall perfekte spill i simuleringene er presentert i Tabell 3. Alle er godt kjent blant baseball-fans, selv om bare en av dem (Sandy Koufax) faktisk slo et perfekt spill. En av de andre (Walter Johnson) lægra seg en «nær-perfekte spillet.,»
Vi oppmerksom på at det kun om 2,700 av mer enn 8,300 mugger i baseball historie noen gang reist et perfekt spill i simulering 2 000 baseball universer. Andre, enten manglet nødvendig ferdighetsnivå eller aldri startet en kamp. Standardavviket til resultatene vises i Tabell 3 er ca 16 spill.
INGEN-HITTERS
perfekt spill er ikke-hitters, men nei-hitters er mer vanlig enn perfekt spill siden de ikke er brutt opp av en tur, hit-av-banen, eller feil. Likevel, pitching et ikke-hitter er ganske en prestasjon., I et perfekt spill, bare sannsynligheter som er involvert for å få på base og en ut. I kontrast, i modellering ingen-hitters, må man også ta med sannsynlighetene for en spasertur, en hit-av-banen, og nå base på en feil. Det var 250 enkelt-mugge ingen-hitters under 1876-2009 vanlig sesonger.
FrolichRetrosheet ML vatt og pitching deler for hvert år. Dette er etter 1996-sesongen, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. nærmet seg det mer generelle spørsmålet om hvor ofte en gitt antall treff bør innhentes i en baseball spillet., Han regnes som treff og outs, samtidig som de ignorerer alle andre hendelser, og utviklet en negativ binomial formel for fordeling av antall treff som kan forventes i et spill gitt den samlede sannsynligheten for at en hit hvert år studerte han. Han bygget på denne modellen, første varierende gjennomsnittlig mugger’ evner og deretter varierende gjennomsnittlig røre’ evner. Han fant god avtale med å forutsi antall av tre-treffer spill gjennom ti-treffer spill for fem-års periode fra 1989 til 1993. Hans resultater utenfor dette området treff, men var mindre tilfredsstillende., Hans modell spådd bare om lag to tredeler det faktiske antallet ikke-hitters for 1900-93 periode.
Vår innsats er fokusert på å få bedre resultater i modellering ingen-hitters. Vi modelleres matematisk antall ikke-hitters i 1876-2009 og deretter sammenlignet med våre resultat for den sanne verdi.
ENKLESTE INGEN-HITTER MODELL
Vi revidert våre datamaskinen modell for å gjenopprette våre befolket av baseball historie ved å innlemme tre typer hendelser som kan oppstå i en baseball spillet: (1) treff; (2) turer, hit-av-plasser og nå base på en feil; og (3) outs., For å undersøke ikke-hitter problem, vi har behov for å gå gjennom lagoppstillinger en røren i en tid gjennom hvert spill (der alle røre antas å ha lik mulighet). Et tilfeldig nummer som ble valgt jevnt fordelt på for å avgjøre om en røren var ute, fikk en hit, eller nådd bunnen av en tur, slå-av-banen eller nå på en feil. Hvis en hit ble innhentet før 27 outs blir tatt opp, spillet ikke klarte å være en ikke-hitter. På den annen side, hvis 27 outs ble spilt inn uten noen treff blir innhentet, spillet ble ansett for å være en ikke-hitter., Dette ble gjentatt for å simulere 2,000 universer med 195,177 spill i hver.
for det Første, som vi gjorde for modellering perfekt spill, har vi brukt sannsynlighetene for outs, treff, og BB+HBP +ROGN (som beskrevet tidligere) for 134 år fra 1876 gjennom 2009. Sannsynligheten for at en ut var 0.6510; sannsynligheten for at en hit var 0.2374, og sannsynligheten for en BB, HBP, eller ROGN ble 0.1116. Denne første simulering anslått en utilfredsstillende 123 ingen-hitters i en gjennomsnittlig universet med et standardavvik på 14.5 nei-hitters. (Målet antall ikke-hitters var 250).,
ÅR-FOR-ÅR INGEN-HITTER MODELL
Vi kjørte simulering igjen, men nå har vi beregnet sannsynligheter for outs, treff, og BB+HBP+ROGN separat for hver sesong. Sannsynlighetene var innspill til programmet sammen med det antall spill som finner sted hvert år. Nok en gang har vi simulert 2,000 baseball universer. Disse resultatene ble litt bedre, men fortsatt ikke tilfredsstillende. Denne simuleringen produsert 135.4 ingen-hitters i gjennomsnitt med et standardavvik på 14.8. Dette er angitt, som med våre perfekte spillet analyse, som vi kan bli bedre av å gjenta våre mugge-av-mugge tilnærming.,
MUGGE-AV-MUGGE INGEN-HITTER MODELL
Vi revidert våre mugge-av-mugge tilnærming for perfekt-spillet modellering for å undersøke ikke-hitters på samme måte som vi gjorde med den Enkleste Ingen-Hitter og År-til-År Ingen-Hitter modeller; det vil si at vi anså saken for å få på base uten en hit i tillegg til tilfelle av treff, og saken outs. Vi så på sannsynligheten for de ulike hendelser for hver mugge som startet et spill for hvert år, og fortsatte som beskrevet i ovennevnte «Perfekte Spillet» – delen., Nok en gang har vi bare vurdert mugger som startet på minst ett spill og lægra seg minst 54 outs i denne sesongen. resultatene var slående. I 2000 universer vi kjørte, fant vi et gjennomsnitt på 243 ingen-hitters, av ved mindre enn 4% fra 250 enkelt mugge ingen-hitters som faktisk skjedde i 1876-2009. Standardavviket var 15.7 ingen-hitters. Dermed, denne siste modellen, som bruker individuelle mugge data, som igjen gir en stor forbedring i forhold til tidligere modeller., Resultatene av simuleringene av tre metoder for å undersøke ikke-hitters er presentert i Diagram 4.
DISKUSJON OG KONKLUSJON
Modellering sjeldne hendelser er utsatt for betydelig relativ feil om man er modellering ekstrem atferd i finansmarkedene eller sjeldne værhendelser. Det samme er tilfelle i modellering sjeldne forekomster i baseball. Våre analyser og simuleringer viser at bruk av flerårig kombinert data fører til feilaktige spådommer for forekomst av sjeldne hendelser (for eksempel perfekt spill og ikke-hitters)., Ved hjelp av år-til-år-data bedre resultater litt, mens blant annet mugge-av-mugge data i hvert år av sin karriere sterkt forbedret resultatene for både den perfekt for spill og den ikke-hitter studier. Dette indikerer at de som har reist ingen-hitters og perfekt spill hadde, generelt, langt overlegen pitching evne enn gjennomsnittlig mugge i baseball historie.
for å kunne utføre beregninger, er det nødvendig å justere for ufullstendige data tilgjengelig vedrørende rører å nå base via feil., Til tross for mangel på data i de tidlige årene av Major League Baseball, resultatene er ganske realistisk. Siden har vi utført analyser i løpet av 2010-sesongen, vi bare følger komplette sesonger. Med den mengde perfekt spill (og en perfekt spill brutt opp av en dårlig samtale med en oppmann) og ikke-hitters i 2010, ser det ut til at 2010 var et spesielt sesong av den typen som ikke burde komme sammen veldig ofte, minst perfekt for spill og ikke-hitters., Mens en mugge evne til å kaste et perfekt spill er sikkert forbedret med mye lavere pris på feil i det moderne spillet, kan vi vurdere oss selv så heldig å ha vært vitne til en slik en spesiell sesong.
Man kan spørre om lag beseiret i perfekt spill hadde mindre støtende evne enn league-gjennomsnittet, og om dette aspektet bør påvirke antall perfekte spill. Det viser seg at i de 17 ordinære sesongen perfekte spill, de beseiret lag hadde bedre standard OBP enn league gjennomsnittlig syv ganger og verre OBP ti ganger., I gjennomsnitt standard OBP av de beseiret lag var 0.0046 mindre enn league gjennomsnitt. Detaljer er presentert i Tabell 4. Vi konkluderer ut fra dette, akkurat som Frohlich gjorde i den ikke-hitter tilfelle, at variasjonen i røren evne har en liten effekt på perfekt spill.
Tabell 1 viser en 42-år gap mellom den ordinære sesongen perfekte spillet slo av Charlie Robertson i 1922, og den slo av Jim Bunning i 1964. Dette gjorde oss lurer på om en tilsvarende stort gap fenomenet oppstår i simuleringer., Vi så på den lengste hull i hver av våre 2,000 universet perfekte spillet mugge-av-mugge simuleringer. Vår lengste gapet mellom perfekte spill gjennomsnitt 24.1 år med et standardavvik på 12,4 år, med minimum lengste gap å være tre år, og maksimalt lengste gapet blir 86 år i vår 2,000 universer. Vi har vist i denne artikkelen hvordan man kan bruke matematiske metoder for å modellere selv sjelden aspekter av baseball. Vi håper at dette arbeidet vil føre til ytterligere matematiske undersøkelser spørsmål om usas største spillet.,
Bilag
følgende forkortelser er brukt i dette papiret.
AB – På-Flaggermus
BB – Baser på Baller
BF – Røre Møtt
H – Treff
HBP – Truffet av Tonehøyder
OBP – På-Base Prosentandel
ROGN – Nådd Base på Feil
SF – Offer Fly
Avledning av Sannsynligheten for Ut, Hit, og Nå Base uten en Hit for Individuelle Mugger fra Tilgjengelige Data