Durch Major League Baseball ersten 134 Jahre, 1876-2009, einige seiner interessantesten und ungewöhnlichsten Ereignisse wurden die 260 No-Hitters (18 davon haben perfekte Spiele gewesen. Im Jahr 2010 warfen Pitcher sechs No-Hitter, von denen zwei (und fast ein Drittel) perfekt waren. In diesem Artikel untersuchen wir, ob einfache mathematische Modelle die Häufigkeit perfekter Spiele und No-Hitters im Laufe der Jahre erklären können., Wir untersuchen auch, ob die Pitcher, die tatsächlich die perfekten Spiele aufgeschlagen haben, diejenigen waren, von denen „hätte erwartet werden sollen“.
Durch Major League Baseball ersten 134 Jahre, 1876-2009, einige seiner interessantesten und ungewöhnlichsten Ereignisse wurden die 260 no-hitters (18 davon wurden perfekte Spiele“No-Hitter – BR Bullpen.“Baseball-Reference.com -Major League Baseball Statistiken und Geschichte. Web. Juni-Juli 2010. http://www.baseball-reference.com/bullpen/No_hitter., „Perfect“.“Baseball-Reference.com -Major League Baseball Statistiken und Geschichte. Web. Juni-Juli 2010. http://www.baseball-reference.com/bullpen/Perfect_game.)., Im Jahr 2010 warfen Pitcher sechs No-Hitter, von denen zwei (und fast ein Drittel) perfekt waren. In diesem Artikel untersuchen wir, ob einfache mathematische Modelle die Häufigkeit perfekter Spiele und No-Hitters im Laufe der Jahre erklären können. Wir untersuchen auch, ob die Pitcher, die tatsächlich die perfekten Spiele aufgeschlagen haben, diejenigen waren, von denen „hätte erwartet werden sollen“.
PERFEKTE SPIELE
Von 1876 bis 2009 warfen Pitcher 18 perfekte Spiele., Jeder wurde von einem anderen Krug erreicht und nur einmal vor 2010 (zurück in 1880) traten im selben Jahr zwei perfekte Spiele auf (siehe Tabelle 1). Von diesen perfekten Spielen kamen 17 in der regulären Saison. In diesem Papier betrachten wir nur Veranstaltungen der regulären Saison.
EINFACHSTES MODELL
Möglicherweise ist der einfachste Ansatz zur Modellierung des Auftretens perfekter Spiele, alle Jahreszeiten, alle Krüge und alle Teig gleichermaßen zu behandeln. Angesichts dieser scheinbar unrealistischen Annahme kann man sich fragen, wie viele perfekte Spiele hätte gespielt werden sollen?,
In den ersten 134 jahren der Major League Baseball geschichte, die insgesamt auf-basis prozentsatz (OBP) wurde etwa 0,3279,die standard definition von OBP ist (H + BB + HBP)/(AB + BB + HBP + SF). Die Basis für einen Fehler wird in dieser Definition nicht verwendet. Eine Auflistung der in diesem Papier verwendeten Abkürzungen finden Sie im Anhang. was bedeutet, dass in etwa 1?3 von platte auftritte, die teig erreicht basis. Um jedoch ein perfektes Spiel aufschlagen zu können, muss ein Startkrug die 27 aufeinanderfolgenden Schläger, denen er gegenübersteht, in den Ruhestand versetzen., Die Wahrscheinlichkeit, ein Out zu pitchen, ist (1-OBP), und so ist die Wahrscheinlichkeit, ein perfektes Spiel zu pitchen, (1-OBP)27.
Im Allgemeinen ist daher nach dieser Analyse die Anzahl der perfekten Spiele zu erwarten:
Der Grund für die „2“ ist, dass jedes Team in einem Spiel ein perfektes Spiel aufschlagen kann. 195.177 reguläre Saisonspiele wurden von 1876-2009 gespielt, so dass die Anzahl der perfekten Spiele von 1876-2009 zu erwarten ist 195.177 * 2 * (1-.3279)27 = 8.55, nur die Hälfte der 17 beobachtet.,
Man kann diese Angelegenheit auf die entgegengesetzte Weise angehen und den erforderlichen OBP berechnen, um das Ergebnis von 17 perfekten Spielen zu erhalten. Lösen der Gleichung (1) für OBP haben wir
Dies führt zu einem 0.3106 OBP. Aus der Sicht des OBP, eine Differenz von 0,0173 (das heißt,.3279 – .3106) oder etwa 5% des OBP-Werts ausmachen, kann die Differenz zwischen der beobachteten Anzahl perfekter Spiele (17) und der von diesem einfachen Modell erwarteten Anzahl (8.55) ausmachen., Dies zeigt die Empfindlichkeit der erwarteten Anzahl perfekter Spiele gegenüber Variationen des OBP. Wir präsentieren in Grafik 1 die Beziehung zwischen OBP und der erwarteten Anzahl perfekter Spiele. Wenn OBP zunimmt, erhalten mehr Teig auf Basis und die Wahrscheinlichkeit eines perfekten Spiels schrumpft.
Wir stellen fest, dass OBP von einem Tief von 0.267 im Jahr 1880 bis zu einem Hoch von 0.379 im Jahr 1894 reichte. Wenn diese Werte in den 134 untersuchten Jahren anhalten würden, wäre die erwartete Anzahl perfekter Spiele 89 bzw. eins gewesen. Die Jahr für Jahr spielgewichtete Standardabweichung von OBP ist 0.,0150, so dass ein Standardabweichungsbereich für OBP einen Bereich von 0,3129 bis 0,3429 ergibt (das heißt,.3279 ± 0.0150. Dies führt dazu, dass die erwartete Anzahl perfekter Spiele zwischen 4.6 und 15.5 liegt, was der beobachteten Anzahl von 17 perfekten Spielen nahe kommt, aber nicht erreicht. Dies zeigt weiter die Empfindlichkeit der erwarteten perfekten Spiele auf kleine Änderungen in OBP. Es zeigt auch an, dass dieses einfache Modell zwar nicht sehr zufriedenstellend ist, aber nicht vollständig mit der beobachteten Anzahl perfekter Spiele unvereinbar ist.,
JAHR FÜR JAHR MODELL
Die Ergebnisse des einfachen Modells veranlassten uns, ein überarbeitetes Modell in Betracht zu ziehen, in dem derselbe Ansatz verwendet wird, in dem jedoch jedes Jahr separat betrachtet wird. Offensichtlich waren nicht alle Jahre im Baseball gleich, wie oben durch den Bereich der beobachteten OBP-Werte im Laufe der Jahre angezeigt. Wenn wir jedes Jahr separat betrachten, mit seinem eigenen OBP, wie würde sich die erwartete Anzahl perfekter Spiele ändern?,
Wenn wir die Gleichung (1) auf jedes Jahr einzeln anwenden und die Anzahl der gespielten regulären Saisonspiele berücksichtigen, haben wir die erwartete Anzahl perfekter Spiele für jedes Jahr berechnet. Nach der Zusammenfassung dieser Spiele stellten wir fest, dass die erwartete Anzahl perfekter Spiele in 1876-2009 10.6 war. Das Jahr mit der niedrigsten erwarteten Anzahl perfekter Spiele war 1894, mit 0.004 erwarteten perfekten Spielen; Die Anzahl der gespielten Spiele (799) war klein und der OBP (0.379) hoch.
Die größte Anzahl perfekter Spiele (0.451) wurde 1884 erwartet, als der OBP niedrig war .,Die Zahl der Spiele, die vor 1960 ausgetragen wurden, war die vierthöchste in einer Saison. Dass 10.6 perfekte Spiele von diesem Modell und nicht von den tatsächlichen 17 erwartet wurden, zeigt, dass ein verbesserter Ansatz erforderlich ist, um ein realistischeres Ergebnis zu erzielen. Noch beunruhigender ist, dass der Standard-OBP die Basis auf Fehler (ROE) weglässt, was tatsächlich zu einem Out im At-Bat-Term zählt, den OBP senkt und ein einzelner Spieler, der die Basis auf einem Fehler erreicht, ein ansonsten perfektes Spiel vereitelt., Mindestens fünf nahezu perfekte Spiele, die nur durch einen einzigen Fehler unterbrochen wurden, sind in der Baseballgeschichte aufgetreten.Wir danken einem anonymen Schiedsrichter, der vorgeschlagen hat, ROE in unsere Analyse aufzunehmen.
UNTER EINBEZIEHUNG DER FEHLERBASIS
Vollständige Daten für Fehler, die Fehlerbasis erreichen, sind nur für 40 der Jahre von 1960 bis heute verfügbar.Ruiz, William. „Nahezu perfekte Spiele.“The Baseball Research Journal 20 (1991): 46-51. Druck. Die Gesamtzahl der Fehler pro Jahr für alle Jahre von 1876 bis heute kann jedoch leicht lokalisiert werden., Interessanterweise ist für die 40 Jahre vollständiger Daten das Verhältnis der Teig, die auf einem Fehler basieren, zur Gesamtzahl der Fehler nahezu konstant und beträgt durchschnittlich 63,4% bei einer Standardabweichung von 1,1%. Somit können wir vernünftigerweise 63.4% der Gesamtzahl der Fehler in der Baseball-Geschichte oder Jahr für Jahr für die Jahre, für die unvollständige oder keine ROE-Daten vorliegen, als Schätzung für die Anzahl der Batter nehmen, die auf einem Fehler basieren., Der OBP, der so eingestellt ist, dass er die Basis eines Fehlers einbezieht, wird so:
Beachten Sie, dass die Plattenauftritte derjenigen Teig, die die Basis eines Fehlers erreichen, bereits in den Nenner (als outs) in AB aufgenommen wurden. Die Durchführung der gleichen Analyse wie für das einfachste Modell (OBPROE = 0.3490 mit Standardabweichung 0.0165) führt zu der erwarteten Anzahl perfekter Spiele von 1876 bis 2009 von 3.6; Ein Bereich mit einer Standardabweichung ergibt 1.8 bis 7.1 erwartete perfekte Spiele., Diese Ergebnisse werden in Grafik 2 dargestellt, wobei klar ist, dass der eine Standardabweichungsbereich von OBPROE bei weitem nicht die wahre Anzahl perfekter Spiele enthält. Die Anwendung des OBPROE auf das Jahr-für-Jahr-Modell führt zu der geringfügig realistischeren Erwartung der perfekten Spiele von 1876-2009. Wir sehen jedoch, dass die Anpassung von OBP an die ROE den Fehler verschlimmert und die Notwendigkeit eines sorgfältigeren Blicks auf das Auftreten perfekter Spiele unterstreicht.,
PITCHER-BY-PITCHER-MODELL
Bei den Vorgängermodellen wurde angenommen, dass alle Schläger und Krüge im Laufe der Baseballgeschichte (im einfachsten Modell) oder für jedes Jahr einzeln (im Jahr-für-Jahr-Modell) die gleiche Fähigkeit haben. Dies führt zu der Erwartung von weniger als einem Drittel der tatsächlichen Anzahl perfekter Spiele, wenn ROE berücksichtigt wird. Da die Annahme der Gleichberechtigung unrealistisch ist, haben wir ein ausgefeilteres Modell untersucht., Da der Verlauf eines Spiels und sicherlich eines No-Hitter mehr von der Leistung eines Pitchers abhängen würde als von der eines einzelnen Hitter (siehe zum Beispiel Frohlichs Papier über No-Hitter), haben wir als nächsten Schritt ein Modell in Betracht gezogen, in dem Pitcher unterschiedliche Fähigkeiten haben. Insbesondere haben wir die Leistung jedes einzelnen Pitchers betrachtet. Wie oft erzeugt ein bestimmter Krug Outs? Wird diese Variation der Pitching-Fähigkeit zu Ergebnissen führen, die mehr mit denen übereinstimmen, die in der Baseball-Geschichte aufgetreten sind?,
Um diese Fragen zu beantworten, haben wir die Daten (die OBPROE) für jeden Krug in jedem Jahr seiner Karriere zusammengestellt (dh wenn ein Krug zehn Jahre aufgeschlagen hat, hat er zehn separate Datensätze).Sean Lahman das Baseball-Archiv. Web. Juni-Juli 2010. http://www.baseball1.com. Da ROE-Daten für jeden Krug nicht verfügbar sind, gingen wir davon aus, dass jeder Krug der gleichen Wahrscheinlichkeit ausgesetzt war, dass ein Teig die Basis eines Fehlers erreichte wie alle anderen Krüge in jedem bestimmten Jahr.
Dieser Wert ist die Differenz zwischen dem Jahr für Jahr OBP mit und ohne ROE, die wir mit ROE_diff bezeichnen., In den frühen Jahren des Baseballs, in denen durchschnittlich etwa zehn Fehler pro Spiel begangen wurden, ist dieser Wert so hoch wie 0,097, was bedeutet, dass ungefähr 10% aller Schläge die Basis eines Fehlers erreichten. In den letzten Jahren liegt der Wert bei etwa 0,01, was bedeutet, dass etwa 1% aller Teig die Basis eines Fehlers erreichen. Natürlich führt dies zu einem großen Handicap für Pitcher in den frühen Jahren des Baseballs in Bezug auf die Leichtigkeit des Pitching ein perfektes Spiel., Für einen Krug wird die Wahrscheinlichkeit, einen Teig herauszuholen (siehe Anhang für die Ableitung):
Wir haben dann überlegt, wie viele Spiele jeder Krug jedes Jahr gestartet hat (da ein Krug kein perfektes Spiel aufschlagen kann, wenn er nicht startet). Wir haben weiterhin nur Pitcher in Betracht gezogen, die mindestens 54 Outs in einer Saison aufgeschlagen haben, um Fälle von sehr niedrigen Daten zu eliminieren (Wir stellen fest, dass die Entspannung dieser Bedingung auf das Minimum 27 Outs, die erforderlich sind, um ein perfektes Spiel zu pitchen, zu einem Unterschied von weniger als der Hälfte führt ein perfektes Spiel über die betrachteten 134 Jahre)., Die Wahrscheinlichkeit, dass der Pitcher ein perfektes Spiel pitcht, ist nach wie vor die Wahrscheinlichkeit, dass ein Out auf die 27.
Wir haben dann einen Computer verwendet, um zu simulieren, ob ein bestimmtes Spiel „perfekt“ wäre, indem wir einen Zufallszahlengenerator verwendeten, der ein perfektes Spiel markiert, wenn der (gleichmäßig verteilte ) Zufallswert kleiner als P war(Aus)27. Dies wurde für jedes Spiel durchgeführt, das von jedem Krug in jedem Jahr gestartet wurde—insgesamt mehr als 39,000 Fälle.Zum Beispiel, seit Roger Clemens 23 Jahre geworfen hat, 23 der 39,000 + Fälle sind die Jahre, die Clemens geworfen hat., Diese Simulationsmethode ist sehr ähnlich zu der, die von Arbesman und Strogatz in ihrer Studie von Joe Dimaggios 56-Spiel Hitting Streak verwendet wurde.Arbesman, S., und S. H. Strogatz. „Ein Monte-Carlo-Ansatz für Joe DiMaggio und Streifen im Baseball.“arXiv: 0807. 5082v2. 1. August 2008. Eine solche Berechnung ergibt ein Baseball – „Universum“, eine Simulation der Baseballgeschichte von 1876-2009 unter Verwendung von Pitcher-OBP-Werten aus den Spielen dieser Jahre. Wir haben die Simulation für 2.000 Universen durchgeführt und die Ausgabe auf die durchschnittliche Anzahl perfekter Spiele und deren Verteilung analysiert., Darüber hinaus haben wir Ergebnisse zusammengestellt, für die Pitcher am ehesten perfekte Spiele hätten pitchen sollen.
In unseren Universen reichte die geschätzte Anzahl perfekter Spiele in den 134 Jahren von 3 bis 35, wobei der Durchschnitt 15,9 betrug (siehe Grafik 3) mit einer Standardabweichung von 4.1, was bedeutet, dass der wahre Wert von 17 deutlich innerhalb einer Standardabweichung des berechneten Werts liegt.,
Natürlich kann man mehr Aspekte des Baseballspiels einbeziehen, z. B. Variation der Schlagfähigkeit zwischen den Aufstellungen der verschiedenen Teams oder Variation der Schlagfähigkeit innerhalb einer einzigen Aufstellung. In seiner Studie von No-Hitters, Frohlichretro Blatt ML Batting und Pitching Splits für jedes Jahr. Dies ist für die Saison 1996, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. diskutierte dieses Problem mit Variationen und fand den Effekt klein. Wir haben einige andere Baseball-Events wie Strikeouts, Doppel-und Dreifachspiele ausgeschlossen, und die Basis auf Interferenzen aus unserer Zeitung erreichen., Diese und andere Ereignisse können schwierig in die Modellierung einzubeziehen sein, können problematisch sein, zuverlässige Daten zu erhalten, treten selten auf oder haben wahrscheinlich keinen großen Einfluss auf die Ergebnisse.
Als Überprüfung der Berechenbarkeit der Berechnungen haben wir uns angesehen, wie es den Pitchern, die tatsächlich perfekte Spiele aufgeschlagen haben, in den Simulationen sowie den Pitchern, die in diesen Simulationen am häufigsten perfekte Spiele aufgeschlagen haben, ergangen ist. Wir ordneten die Krüge in der Reihenfolge der Anzahl der perfekten Spiele, die von jedem Krug in den 2.000 Universen „geworfen“ wurden, und untersuchten, wo sich die tatsächlichen 17 perfekten Spielkrüge befanden., Acht der 17 waren in den Top 1% (in den Top 84 der über 8.300 Pitcher, die in den großen Ligen geworfen haben) in unserem Ranking, während sechs andere in den Top 5% (85.–420.), eine weitere in den Top 10%, und die andere
zwei in den Top 25%. Diese Ergebnisse erscheinen in Tabelle 2. Die Top 10 Pitcher mit der größten Anzahl perfekter Spiele in den Simulationen sind in Tabelle 3 dargestellt. Alle sind unter Baseballfans bekannt, obwohl nur einer von ihnen (Sandy Koufax) tatsächlich ein perfektes Spiel aufgeschlagen hat. Einer der anderen (Walter Johnson) warf ein „nahezu perfektes Spiel.,“
Wir stellen fest, dass nur etwa 2,700 der mehr als 8,300 Pitcher in der Baseball-Geschichte jemals ein perfektes Spiel in der Simulation von 2,000 Baseball-Universen aufgeschlagen haben. Den anderen fehlte entweder das nötige Können oder sie starteten nie ein Spiel. Die Standardabweichung für die in Tabelle 3 aufgeführten Ergebnisse beträgt etwa 16 Spiele.
NO-HITTERS
Alle perfekten Spiele sind No-Hitters, aber No-Hitters sind häufiger als perfekte Spiele, da sie nicht durch einen Spaziergang, Hit-by-Pitch oder Fehler aufgelöst werden. Dennoch ist es eine ziemliche Leistung, einen No-Hitter zu schlagen., In einem perfekten Spiel sind die einzigen Wahrscheinlichkeiten, die involviert sind, auf die Basis zu kommen und aus. Im Gegensatz dazu muss man sich bei der Modellierung von No-Hitters auch mit den Wahrscheinlichkeiten eines Spaziergangs, eines Treffers und einer Basis für einen Fehler befassen. Es gab 250 Single-Pitcher No-Hitters während der regulären Saison 1876-2009.
FrolichRetrosheet ML batting-und pitching-splits für jedes Jahr. Dies ist für die Saison 1996, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. näherte sich der allgemeineren Frage, wie oft eine bestimmte Anzahl von Treffern in einem Baseballspiel erhalten werden sollte., Er überlegte Hits und Outs, während er alle anderen Ereignisse ignorierte, und entwickelte eine negative Binomialformel für die Verteilung der Anzahl der Treffer, die in einem Spiel angesichts der Gesamtwahrscheinlichkeit eines Treffers in jedem von ihm untersuchten Jahr erwartet werden können. Er baute dann auf diesem Modell auf, Zuerst variierte er die Fähigkeiten der durchschnittlichen Pitcher und dann die Fähigkeiten der durchschnittlichen Batter. Er fand eine gute Übereinstimmung mit der Vorhersage der Anzahl der Drei-Treffer-Spiele durch Zehn-Treffer-Spiele für den Fünfjahreszeitraum von 1989 bis 1993. Seine Ergebnisse außerhalb dieser Reichweite von Treffern waren jedoch weniger zufriedenstellend., Sein Modell prognostizierte nur etwa zwei Drittel der tatsächlichen Anzahl von No-Hitters für den Zeitraum von 1900 bis 1993.
Unsere Bemühungen konzentrieren sich auf verbesserte Ergebnisse bei der Modellierung von No-Hitters. Wir modellierten mathematisch die Anzahl der No-Hitter in 1876-2009 und verglichen dann unser Ergebnis mit dem wahren Wert.
EINFACHES NO-HITTER-MODELL
Wir haben unser Computermodell überarbeitet, um unsere Universen der Baseballgeschichte neu zu erstellen, indem wir drei Arten von Ereignissen einbeziehen, die in einem Baseballspiel auftreten können: (1) Treffer; (2) Spaziergänge, Hit-by-Pitches und Erreichen der Basis auf einem Fehler; und (3) Outs., Um das No-Hitter-Problem zu untersuchen, mussten wir in jedem Spiel nacheinander Aufstellungen durchlaufen (wobei davon ausgegangen wird, dass alle Batter die gleichen Fähigkeiten haben). Eine Zufallszahl wurde gleichmäßig verteilt gewählt, um festzustellen, ob ein Teig aus war, bekam einen Treffer, oder erreichte Basis durch einen Spaziergang, Hit-by-Pitch oder Erreichen auf einen Fehler. Wenn ein Treffer erzielt wurde, bevor 27 Outs aufgezeichnet wurden, war das Spiel kein No-Hitter. Auf der anderen Seite, wenn 27 Outs aufgezeichnet wurden, ohne dass Treffer erzielt wurden, Das Spiel wurde als No-Hitter angesehen., Dies wurde wiederholt, um 2.000 Universen mit jeweils 195.177 Spielen zu simulieren.
Zunächst haben wir, wie bei der Modellierung perfekter Spiele, die Wahrscheinlichkeiten von Outs, Hits und BB+HBP +ROE (wie zuvor beschrieben) für die 134-Jahre von 1876 bis 2009 verwendet. Die Wahrscheinlichkeit eines out war 0,6510; die Wahrscheinlichkeit eines Treffers war 0,2374; und die Wahrscheinlichkeit eines BB, HBP oder ROE war 0,1116. Diese erste Simulation projizierte eine unbefriedigende 123 No-Hitters in einem durchschnittlichen Universum mit einer Standardabweichung von 14.5 No-Hitters. (Die Zielzahl der No-Hitters war 250).,
JAHR FÜR JAHR NO-HITTER MODELL
Wir liefen die simulation wieder, aber jetzt wir berechnet die wahrscheinlichkeiten von outs, hits, und BB+HBP+ROE separat für jede saison. Die Wahrscheinlichkeiten wurden zusammen mit der Anzahl der Spiele, die jedes Jahr stattfinden, in das Programm eingegeben. Wieder einmal haben wir 2.000 Baseball-Universen simuliert. Diese Ergebnisse waren etwas besser, aber immer noch unbefriedigend. Diese Simulation ergab durchschnittlich 135,4 No-Hitters mit einer Standardabweichung von 14,8. Dies zeigte, wie bei unserer perfekten Spielanalyse, dass wir besser dran sein könnten, unseren Pitcher-by-Pitcher-Ansatz zu wiederholen.,
PITCHER-BY-PITCHER NO-HITTER MODEL
Wir haben unseren Pitcher-by-Pitcher-Ansatz für die perfekte Spielmodellierung überarbeitet, um No-Hitter auf die gleiche Weise zu untersuchen, wie wir es mit den einfachsten No-Hitter-und Jahr-für-Jahr-No-Hitter-Modellen getan haben; Das heißt, wir haben den Fall in Betracht gezogen, ohne Treffer zusätzlich zum Fall von Treffern und dem Fall von Outs an die Basis zu kommen. Wir haben uns die Wahrscheinlichkeiten der verschiedenen Vorkommen für jeden Pitcher angesehen, der für jedes Jahr ein Spiel gestartet hat, und sind wie im obigen Abschnitt „Perfektes Spiel“ beschrieben vorgegangen., Wieder einmal haben wir nur Krüge betrachtet, die mindestens ein Spiel begonnen und mindestens 54 Outs in dieser Saison geworfen haben. Die Ergebnisse waren Auffällig. In den 2.000 Universen, die wir liefen, fanden wir durchschnittlich 243 No-Hitter, weniger als 4% von den 250 Single Pitcher No-Hitter, die tatsächlich in 1876-2009 aufgetreten. Die Standardabweichung Betrug 15,7 no-hitters. Somit bietet dieses letzte Modell, das individuelle Pitcherdaten verwendet, erneut eine enorme Verbesserung gegenüber den Vorgängermodellen., Die Ergebnisse der Simulationen der drei Methoden zur Untersuchung von No-Hittern sind in Schaubild 4 dargestellt.
DISKUSSION UND SCHLUSSFOLGERUNG
Die Modellierung seltener Ereignisse ist anfällig für signifikante relative Fehler, unabhängig davon, ob man extremes Verhalten an Finanzmärkten oder seltene Wetterereignisse modelliert. Gleiches gilt für die Modellierung seltener Vorkommen im Baseball. Unsere Analysen und Simulationen zeigen, dass die Verwendung mehrjähriger kombinierter Daten zu ungenauen Vorhersagen für das Auftreten seltener Ereignisse (wie perfekte Spiele und No-Hitters) führt., Die Verwendung von Jahresdaten verbesserte die Ergebnisse ein wenig, während die Einbeziehung von Pitcher-by-Pitcher-Daten in jedes Jahr seiner Karriere die Ergebnisse sowohl für das perfekte Spiel als auch für die No-Hitter-Studien erheblich verbesserte. Dies zeigt, dass diejenigen, die No-Hitters und perfekte Spiele aufgeschlagen haben, im Allgemeinen weit überlegene Pitching-Fähigkeiten hatten als der durchschnittliche Pitcher in der Baseballgeschichte.
Um die Berechnungen durchzuführen, mussten wir uns auf die unvollständigen Daten einstellen, die über Batter verfügbar sind, die die Basis über Fehler erreichen., Trotz des Mangels an Daten in den Anfangsjahren der Major League Baseball sind die erzielten Ergebnisse ziemlich realistisch. Da wir die Analyse während der Saison 2010 durchgeführt haben, haben wir nur komplette Jahreszeiten berücksichtigt. Mit der Fülle perfekter Spiele (und einem perfekten Spiel, das durch einen schlechten Anruf eines Schiedsrichters unterbrochen wurde) und No-Hitters im Jahr 2010 scheint es, dass 2010 eine besondere Saison der Art war, die nicht sehr oft mitkommen sollte, zumindest für perfekte Spiele und No-Hitters., Während die Fähigkeit eines Pitchers, ein perfektes Spiel zu werfen, sicherlich durch die viel geringere Fehlerrate im modernen Spiel verbessert wird, könnten wir uns glücklich schätzen, eine so besondere Saison erlebt zu haben.
Man könnte fragen, ob die in den perfekten Spielen besiegten Teams weniger Offensivfähigkeiten hatten als der Ligadurchschnitt und ob dieser Aspekt die Anzahl der perfekten Spiele beeinflussen sollte. Es stellt sich heraus, dass das besiegte Team in den 17 Perfect Games der regulären Saison siebenmal einen besseren Standard-OBP als der Ligadurchschnitt und zehnmal einen schlechteren OBP hatte., Im Durchschnitt war der Standard-OBP des besiegten Teams 0.0046 weniger als der Ligadurchschnitt. Details sind in Tabelle 4 dargestellt. Daraus schließen wir, genau wie Fröhlich im No-Hitter-Fall, dass die Variation der Teigfähigkeit einen geringen Effekt auf perfekte Spiele hat.
Tabelle 1 zeigt eine 42-jährige Lücke zwischen dem perfekten Spiel der regulären Saison, das Charlie Robertson 1922 aufstellte, und dem von Jim Bunning 1964. Dies ließ uns fragen, ob ein ähnlich großes Spaltphänomen in den Simulationen auftritt., Wir haben uns die längste Lücke in jeder unserer 2.000 perfekten Spielkrug-für-Krug-Simulationen angesehen. Unsere längste Lücke zwischen perfekten Spielen betrug durchschnittlich 24,1 Jahre mit einer Standardabweichung von 12,4 Jahren, wobei die minimale längste Lücke drei Jahre und die maximale längste Lücke 86 Jahre in unseren 2.000 Universen betrug. Wir haben in diesem Artikel gezeigt, wie man mathematische Methoden anwenden kann, um auch seltene Aspekte des Baseballs zu modellieren. Wir hoffen, dass diese Arbeit zu weiteren mathematischen Untersuchungen zu Fragen führen wird, die Amerikas größtes Spiel betreffen.,
Anhang
Die folgenden Abkürzungen wurden in diesem Beitrag verwendet.
AB – At-Bats
BB – Basen auf Kugeln
BF – Batters Konfrontiert
H – Hits
HBP – Hit von Pitches
OBP – On-Base Prozentsatz
ROE – Erreicht Basis auf Fehler
SF – Opfer Fliegen
Ableitung der Wahrscheinlichkeit von Out, Hit, und Erreichen Basis ohne Treffer für einzelne Pitcher aus verfügbaren Daten