Através da Major League Baseball primeiro 134 anos, 1876-2009, alguns de seus mais interessante e incomum eventos foram 260 no-hitters (das quais 18 foram jogos perfeitos. Em 2010, arremessadores lançaram seis sem rebatedores, dois dos quais (e quase um terço) eram perfeitos. Neste artigo, investigamos se modelos matemáticos simples podem explicar a frequência de jogos perfeitos e sem rebatedores ao longo dos anos., Nós também investigamos se os arremessadores que realmente arremessaram os jogos perfeitos foram aqueles que “deveriam ter sido esperados” para fazê-lo.através dos primeiros 134 anos da Major League Baseball, 1876-2009, alguns dos seus eventos mais interessantes e incomuns foram os 260 sem rebatedores (18 dos quais foram jogos perfeitos”no-Hitter – BR Bullpen.”Baseball-Reference.com -Estatísticas da Liga Principal de basebol e História. Site. Junho-Julho De 2010. http://www.baseball-reference.com/bullpen/No_hitter., “PerfectGame.”Baseball-Reference.com -Estatísticas da Liga Principal de basebol e História. Site. Junho-Julho De 2010. http://www.baseball-reference.com/bullpen/Perfect_game.)., Em 2010, arremessadores lançaram seis sem rebatedores, dois dos quais (e quase um terço) eram perfeitos. Neste artigo, investigamos se modelos matemáticos simples podem explicar a frequência de jogos perfeitos e sem rebatedores ao longo dos anos. Nós também investigamos se os arremessadores que realmente arremessaram os jogos perfeitos foram aqueles que “deveriam ter sido esperados” para fazê-lo.

jogos perfeitos

de 1876 a 2009, arremessadores jogaram 18 jogos perfeitos., Cada um foi alcançado por um arremessador diferente e apenas uma vez antes de 2010 (caminho de volta em 1880) dois jogos perfeitos ocorreram no mesmo ano (Ver Tabela 1). Destes jogos perfeitos, 17 vieram durante a temporada regular. Neste artigo, consideramos apenas eventos de temporada regular.

modelo mais simples

possivelmente a abordagem mais simples para modelar a ocorrência de jogos perfeitos é tratar todas as estações, todos os arremessadores, e todos os batedores da mesma forma. Dada esta suposição aparentemente irrealista, pode-se perguntar, quantos jogos perfeitos deveriam ter sido arremessados?,

ao longo dos primeiros 134 anos da história da Major League Baseball, a porcentagem global na base (OBP) tem sido de aproximadamente 0.3279,a definição padrão de OBP é (H + BB + HBP)/(AB + BB + HBP + SF). Alcançar a base em um erro não é usado nesta definição. Para uma lista de abreviaturas utilizadas neste documento, ver o apêndice. isso quer dizer que em cerca de 1?3 de aparições em placas, o batedor chegou à base. No entanto, a fim de lançar um jogo perfeito, um arremessador inicial deve retirar os 27 rebatedores consecutivos que ele enfrenta., A probabilidade de lançar um fora é (1-OBP), e assim a probabilidade de lançar um jogo perfeito é (1-OBP)27.

Em geral, portanto, o número de jogos perfeitos para ser esperado de acordo com esta análise é:

a razão para O “2” é que qualquer equipe em um jogo pode arremesso de um jogo perfeito. 195.177 jogos da temporada regular foram jogados a partir de 1876-2009, então o número de jogos perfeitos a serem esperados a partir de 1876-2009 é 195.177 * 2 * (1-.3279) 27 = 8,55, apenas metade dos 17 observados.,

pode-se abordar este assunto da maneira oposta e calcular o OBP necessário para obter o resultado de 17 jogos perfeitos. Resolução da equação (1) para OBP, temos

isto leva a um 0,3106 OBP. Do ponto de vista do OBP, uma diferença de 0,0173 (ou seja, .3279 – .3106), ou cerca de 5% do valor OBP, pode explicar a diferença entre o número observado de jogos perfeitos (17) e o número esperado deste modelo simples (8.55)., Isto demonstra a sensibilidade do número esperado de jogos perfeitos para variações no OBP. Apresentamos no gráfico 1 a relação entre a OBP e o número esperado de jogos perfeitos. À medida que a OBP aumenta, mais batedores ficam na base e a probabilidade de um jogo perfeito encolhe.

notamos que OBP variou de um baixo de 0.267 em 1880 a um alto de 0.379 em 1894. Se estes valores persistissem ao longo dos 134 anos estudados, o número esperado de jogos perfeitos teria sido de 89 e um, respectivamente. O desvio-padrão da OBP ponderado ano a ano é 0.,0150, então um intervalo de desvio padrão para OBP dá um intervalo de 0,3129 a 0,3429 (ou seja, .3279 ± 0.0150. Isso resulta no número esperado de jogos perfeitos para variar de 4.6 a 15.5, que se aproxima mas não atinge o número observado de 17 jogos perfeitos. Isto demonstra ainda a sensibilidade dos jogos perfeitos esperados para pequenas mudanças na OBP. Também indica que, embora este modelo simples não seja muito satisfatório, não é totalmente incompatível com o número observado de jogos perfeitos.,

modelo anual

os resultados do modelo simples levaram-nos a considerar um modelo revisto no qual é utilizada a mesma abordagem, mas no qual cada ano é considerado separadamente. Claramente, nem todos os anos no beisebol têm sido iguais, como indicado acima pela gama de valores OBP observados ao longo dos anos. Se considerarmos cada ano separadamente, com seu próprio OBP, como o número esperado de jogos perfeitos mudaria?,aplicando a equação (1) a cada ano individualmente e tendo em conta o número de jogos de temporada regular jogados, calculamos o número esperado de jogos perfeitos para cada ano. Depois de somar estes jogos, descobrimos que o número esperado de jogos perfeitos em 1876-2009 foi de 10,6. O ano com o menor número esperado de jogos perfeitos foi 1894, com 0.004 jogos perfeitos esperados; o número de jogos jogados (799) foi pequeno e o OBP (0.379) alto.

O maior número de jogos perfeitos (0,451) era esperado em 1884, quando o OBP era baixo .,279 e o número de jogos jogou um alto 1.544, o quarto maior número de jogos em uma temporada anterior a 1960. Que 10.6 jogos perfeitos eram esperados por este modelo, em vez dos 17 reais indica que uma abordagem melhorada é necessária para obter um resultado mais realista. Ainda mais preocupante é que o OBP padrão omite alcançar a base no erro (ROE), que na verdade conta para uma saída no Termo de bat, baixando o OBP, e um único jogador alcançando a base em um erro frustra um jogo de outra forma perfeito., Pelo menos cinco jogos quase perfeitos, quebrados por um único erro, ocorreram na história do beisebol.Agradecemos a um árbitro anônimo por sugerir incorporar ROE em nossa análise.dados completos para os batedores que atingem a base sobre um erro só estão disponíveis durante 40 dos anos de 1960 até ao presente.Ruiz, William. “Jogos Quase Perfeitos.”The Baseball Research Journal 20 (1991): 46-51. Imprimir. O número total de erros por ano para todos os anos de 1876 até o presente, no entanto, pode facilmente ser localizado., Curiosamente, para os 40 anos de dados completos, a proporção de batedores que atingem a base em um erro para o número total de erros é quase constante, com uma média de 63,4% com um desvio padrão de 1,1%. Assim, podemos razoavelmente tomar 63,4% do número total de erros ao longo da história do beisebol, ou ano a ano, para aqueles anos para os quais há dados incompletos ou sem ROE, como uma estimativa para o número de rebatedores que atingem a base em um erro., O OBP ajustados para incorporar chegar base em um erro, portanto, torna-se:

Note que a placa de aparências por aqueles batedores de chegar base em um erro já foram incluídos no denominador (como outs) na AB. A realização da mesma análise feita para o modelo mais simples (OBPROE = 0,3490 com desvio padrão 0,0165) leva ao número esperado de jogos perfeitos de 1876 a 2009 de 3,6; uma faixa de desvio padrão produz 1,8 a 7,1 jogos perfeitos esperados., estes resultados são apresentados no gráfico 2, onde é claro que a faixa de desvio padrão de OBPROE não chega nem perto, incluindo o verdadeiro número de jogos perfeitos. A aplicação do OBPROE ao modelo ano-a-ano leva à expectativa marginalmente mais realista de 4.3 jogos perfeitos de 1876-2009. Vemos, no entanto, que ajustar OBP para incorporar ROE agrava o erro e destaca ainda mais a necessidade de um olhar mais cuidadoso sobre a ocorrência de jogos perfeitos.,

modelo PITCHER-by-PITCHER

para os modelos anteriores, todos os batedores e pitchers foram presumidos como tendo a mesma capacidade ao longo da história do beisebol (no modelo mais simples) ou para cada ano individualmente (no modelo ano-ano). Isso leva à expectativa de menos de um terço do número real de jogos perfeitos quando ROE é levado em conta. Como a suposição de igualdade de habilidade é irrealista, exploramos um modelo mais sofisticado., Uma vez que o curso de um jogo, e certamente de um sem rebatedor, parece depender mais do desempenho de um arremessador do que do de qualquer rebatedor (veja, por exemplo, o artigo de Frohlich sobre sem rebatedores), como um próximo passo, nós consideramos um modelo em que os arremessadores têm habilidades diferentes. Especificamente, consideramos o desempenho de cada arremessador individual. Com que frequência um jarro em particular gera Saídas? Esta variação na capacidade de arremesso levará a resultados mais em linha com aqueles que ocorreram na história do beisebol?,

Para responder a estas perguntas, nós compilamos os dados (o OBPROE) para cada jarro em cada ano de sua carreira (i.e. se um jarro acamparam-se dez anos, ele tem dez conjuntos de dados).O arquivo de basebol do Sean Lahman. Site. Junho-Julho De 2010. http://www.baseball1.com. Uma vez que os dados de ROE para cada arremessador não estão disponíveis, nós assumimos que cada arremessador estava sujeito à mesma probabilidade de um batedor alcançar a base em um erro como todos os outros arremessadores em cada ano particular.

esse valor é a diferença entre o OBP ano-a-ano, com e sem ROE, que denotamos por ROE_diff., Para os primeiros anos do beisebol, quando em média cerca de dez erros por jogo foram cometidos, este valor é tão alto quanto 0,097, o que significa que aproximadamente 10% de todos os rebatedores atingiu a base em um erro. Nos últimos anos, o valor é de cerca de 0,01, o que significa que cerca de 1% de todos os batedores atingem a base em um erro. Naturalmente, isso resulta em um grande handicap para arremessadores nos primeiros anos do beisebol com respeito à facilidade de lançar um jogo perfeito., Para um arremessador, a probabilidade de obter um batedor para fora torna-se (ver apêndice para a derivação):

então consideramos quantos jogos cada arremessador começou a cada ano (uma vez que um arremessador não pode lançar um jogo perfeito se ele não começar). Nós mais considerado apenas jarros que acamparam pelo menos 54 outs em uma temporada para eliminar os casos de muito baixo de dados (observação, o relaxante esta condição para o mínimo de 27 outs necessários para lançar um jogo perfeito leva a uma diferença de menos da metade de um jogo perfeito de mais de 134 anos considerados)., A probabilidade de o arremessador lançar um jogo perfeito é, como antes, a probabilidade de um out elevado ao 27º poder, P(Out)27.

usámos então um computador para simular se um determinado jogo seria “perfeito” usando um gerador de números aleatórios que marcaria um jogo perfeito quando o valor aleatório (uniformemente distribuído ) era inferior a p(fora)27. Isto foi feito para cada jogo iniciado por cada arremessador em cada ano—mais de 39.000 casos no total.Por exemplo, desde que Roger Clemens apresentou 23 anos, 23 dos 39.000 casos são os anos apresentados por Clemens., Este método de simulação é muito semelhante ao que foi usado por Arbesman e Strogatz em seu estudo da série de 56 jogos de Joe DiMaggio.Arbesman, S., and S. H. Strogatz. “A Monte Carlo Approach to Joe DiMaggio and Streaks in Baseball.”arXiv: 0807. 5082v2. 1 de agosto de 2008. Uma dessas computação produz um “universo” de beisebol, uma simulação da história do beisebol de 1876-2009 usando valores OBP do arremessador destes jogos de anos. Executamos a simulação para 2.000 universos e analisamos a saída para o número médio de jogos perfeitos e sua distribuição., Além disso, compilamos resultados para os quais arremessadores deveriam ter sido mais propensos a lançar jogos perfeitos.

Em nossos universos, o número estimado de jogos perfeitos variou de 3 a 35 mais de 134 anos, com uma média de 15.9 (ver Gráfico 3), com um desvio padrão de 4,1, o que significa que o verdadeiro valor de 17 cai bem dentro de um desvio padrão do valor calculado.,

é claro, pode-se incluir mais aspectos do jogo de beisebol, tais como a variação na capacidade de rebater entre as linhas das diferentes equipes ou a variação na capacidade de rebater dentro de uma única linha. Em seu estudo de no-hitters, Frohlichretrocheet ML batendo e lançando splits para cada ano. Esta é para a temporada de 1996, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. discutiu esta questão da variação hitting e encontrou o efeito para ser pequeno. Excluímos alguns outros eventos de beisebol, como strikeouts, jogos duplos e triplos, e alcançando a base em interferência de nosso jornal., Estes eventos e outros podem ser difíceis de incluir na modelagem, podem ser problemáticos para obter dados confiáveis para, ocorrer raramente, ou são improváveis de ter uma grande influência sobre os resultados.

Como verificar a razoabilidade dos cálculos, observamos como os cântaros que, na verdade, acamparam jogos perfeitos se saíram nas simulações, bem como os cântaros que mais frequentemente se acamparam jogos perfeitos nessas simulações. Nós classificamos os arremessadores em ordem de número de jogos perfeitos “arremessados” por cada arremessador nos 2.000 universos e investigamos onde os 17 arremessadores de jogo perfeitos colocaram., Oito dos 17 estavam no topo 1% (no topo 84 de mais de 8,300 jarros que acamparam-se nas Principais Ligas) em nosso ranking, enquanto outros seis ficaram no top 5% (85–420th), mais de 10% superior, e a outra
dois no top 25%. estes resultados aparecem na Tabela 2. Os 10 melhores arremessadores com o maior número de jogos perfeitos nas simulações são apresentados na Tabela 3. Todos são bem conhecidos entre os fãs de beisebol, embora apenas um deles (Sandy Koufax) realmente arremessou um jogo perfeito. Um dos outros (Walter Johnson) lançou um “jogo quase perfeito”.,”

notamos que apenas cerca de 2.700 dos mais de 8.300 arremessadores na história do beisebol já arremessaram um jogo perfeito na simulação de 2.000 universos de beisebol. Os outros ou não tinham o nível de habilidade necessário ou nunca começaram um jogo. O desvio padrão para os resultados listados na Tabela 3 é de cerca de 16 jogos.

O-HITTERS

Todos os jogos perfeitos são não-hitters, mas não-hitters são mais comuns do que jogos perfeitos, uma vez que eles não são quebrados por uma caminhada, passo-a-passo, ou erro. Ainda assim, lançar um no-hitter é uma grande conquista., Em um jogo perfeito, As únicas probabilidades envolvidas são de chegar na base e de uma saída. Em contraste, na modelagem sem rebatedores, é preciso também lidar com as probabilidades de uma caminhada, um hit-by-pitch e alcançar a base em um erro. Houve 250 arremessadores sem rebatedores durante as temporadas regulares de 1876-2009.Frolichretrocheet ML batting and pitching splits for each year. Esta é para a temporada de 1996, http://www.retrosheet.org/boxesetc/1996/YS_1996.htm. abordou a questão mais geral de quantas vezes qualquer número dado de hits deve ser obtido em um jogo de beisebol., Ele considerou acessos e saídas, ignorando todos os outros eventos, e desenvolveu uma binomial negativa fórmula para a distribuição do número de acertos que pode ser esperado em um jogo, dada a probabilidade global de uma batida, a cada ano ele estudou. Ele então construiu esse modelo, primeiro variando as habilidades dos arremessadores médios e, em seguida, variando as habilidades dos rebatedores médios. Ele encontrou um bom acordo com a previsão do número de três jogos de sucesso através de dez jogos de sucesso para o período de cinco anos de 1989 a 1993. Seus resultados fora desta gama de sucessos, no entanto, foram menos satisfatórios., Seu modelo previu apenas cerca de dois terços do número real de sem rebatedores para o período 1900-93.nossos esforços estão focados na obtenção de melhores resultados na modelagem de sem rebatedores. Nós modelamos matematicamente o número de não-rebatedores em 1876-2009 e então comparamos nosso resultado com o valor verdadeiro.

mais SIMPLES NO-HITTER MODELO

revisamos o nosso modelo de computador para recriar nossos universos da história do beisebol, incorporando três tipos de eventos que podem ocorrer em um jogo de beisebol: (1) de acertos; (2) caminha, atingido-por-arremessos e alcançar a base de um erro; e (3) saídas., Para investigar a questão do no-hitter, precisamos passar por lineups um batedor de cada vez através de cada jogo (onde todos os batedores são assumidos para ter a mesma capacidade). Um número aleatório foi escolhido uniformemente distribuído para determinar se um batedor estava fora, teve um hit, ou atingiu a base por uma caminhada, hit-by-pitch ou alcançar um erro. Se um hit foi obtido antes de 27 outs serem gravados, o jogo falhou em ser um no-hitter. Por outro lado, se 27 outs foram gravados sem quaisquer hits serem obtidos, o jogo foi considerado um não-hitter., Isto foi repetido para simular 2.000 universos com 195.177 jogos em cada um.

primeiro, como fizemos para modelagem de jogos perfeitos, nós usamos as probabilidades de outs, hits, e BB+HBP +ROE (como descrito anteriormente) para os 134 anos de 1876 até 2009. A probabilidade de um hit foi 0,6510; a probabilidade de um hit foi 0,2374; e a probabilidade de um BB, HBP, ou ROE foi 0,1116. Esta simulação inicial projetou um insatisfatório 123 sem rebatedores em um universo médio com um desvio padrão de 14,5 sem rebatedores. (O número alvo de não-rebatedores foi de 250).,

no-HITTER MODEL

executamos a simulação novamente, mas agora computamos as probabilidades de outs, hits e BB+HBP+ROE separadamente para cada temporada. As probabilidades foram introduzidas no programa juntamente com o número de jogos que ocorrem a cada ano. Mais uma vez simulámos 2.000 universos de basebol. Estes resultados foram ligeiramente melhores, mas ainda insatisfatórios. Esta simulação produziu 135,4 no-hitters em média com um desvio padrão de 14,8. Isto indicava, tal como com a nossa análise perfeita do jogo, que talvez fosse melhor repetirmos a nossa abordagem pitcher-by-pitcher.,

PITCHER-by-PITCHER no-HITTER MODEL

Nós revisamos nossa abordagem pitcher-by-pitcher para modelagem de jogo perfeito para investigar sem rebatedores da mesma maneira que nós fizemos usando os modelos mais simples no-Hitter e no-Hitter ano-a-ano; isto é, nós consideramos o caso de chegar na base sem um hit, além do caso de hits e o caso de outs. Nós olhamos para as probabilidades das várias ocorrências para cada arremessador que começou um jogo para cada ano e prosseguiu como descrito na seção “Jogo Perfeito” acima., Mais uma vez, só considerávamos arremessadores que começaram pelo menos um jogo e arremessaram pelo menos 54 outs nessa temporada. os resultados foram impressionantes. Nos 2.000 universos que corremos, encontramos uma média de 243 sem rebatedores, em menos de 4% dos 250 arremessadores sem rebatedores que realmente ocorreram em 1876-2009. O desvio padrão foi de 15,7 no-hitters. Assim, este último modelo, que usa dados individuais do jarro, mais uma vez fornece uma vasta melhoria em relação aos modelos anteriores., Os resultados das simulações dos três métodos de investigação dos sem-rebatedores são apresentados no gráfico 4.

discussão e conclusão

Modelagem de eventos raros é propenso a um erro relativo significativo se se está modelando um comportamento extremo nos mercados financeiros ou eventos meteorológicos raros. O mesmo é verdade na modelagem de ocorrências raras no beisebol. Nossas análises e simulações demonstram que o uso de dados combinados de vários anos leva a previsões imprecisas para a ocorrência de eventos raros (tais como jogos perfeitos e sem rebatedores)., Usando dados ano-a-ano melhorou um pouco os resultados, enquanto incluindo dados de arremessador-a-arremessador em cada ano de sua carreira melhorou muito os resultados tanto para o jogo perfeito e os estudos no-hitter. Isto indica que aqueles que arremessaram no-hitters e jogos perfeitos tinham, em geral, uma capacidade de arremesso muito superior à média do arremessador na história do beisebol.

A fim de realizar os cálculos, precisávamos ajustar para os dados incompletos disponíveis sobre batedores atingindo a base por erro., Apesar da falta de dados nos primeiros anos da Major League Baseball, os resultados obtidos são bastante realistas. Desde que realizamos a análise durante a temporada de 2010, incluímos apenas estações completas. Com a infinidade de jogos perfeitos (e um jogo perfeito quebrado por um pobre chamada por um juiz) e não-rebatedores em 2010, parece que 2010 foi uma época especial, do tipo que não deveria vir junto, muitas vezes, pelo menos para jogos perfeitos e sem pesos., Enquanto a capacidade de um arremessador jogar um jogo perfeito é certamente melhorada pela taxa muito mais baixa de erros no jogo moderno, nós podemos considerar-nos afortunados de ter testemunhado uma temporada tão especial.

pode-se perguntar se as equipes derrotadas nos jogos perfeitos tinham menos capacidade ofensiva do que a média da liga e se este aspecto deve influenciar o número de jogos perfeitos. Acontece que nos 17 jogos perfeitos da temporada regular, a equipe derrotada tinha um OBP melhor padrão do que a média da liga sete vezes e um OBP pior dez vezes., Em média, o OBP padrão da equipe derrotada foi 0,0046 menos do que a média da liga. Os pormenores são apresentados no quadro 4. Concluímos a partir disso, assim como Frohlich fez no caso no-hitter, que a variação na capacidade de batedor tem um pequeno efeito nos jogos perfeitos.

A Tabela 1 indica uma diferença de 42 anos entre o jogo perfeito da temporada regular arremessado por Charlie Robertson em 1922 e o arremessado por Jim Bunning em 1964. Isso nos fez pensar se um fenômeno semelhante de grande lacuna ocorre nas simulações., Nós olhamos para a maior lacuna em cada uma das nossas 2.000 simulações de jogos perfeitos de arremessador a arremessador do universo. Nossa maior diferença entre jogos perfeitos teve uma média de 24,1 anos com um desvio padrão de 12,4 anos, com a diferença mínima mais longa sendo de três anos e a diferença máxima mais longa sendo de 86 anos em nossos 2.000 universos. Nós demonstramos neste artigo como se pode aplicar métodos matemáticos para modelar até mesmo aspectos raros do beisebol. Esperamos que este trabalho conduza a mais investigações matemáticas sobre questões relacionadas com o maior jogo da América.,

Appendix

the following abbreviations have been used in this paper.

AB – Em-Morcegos
BB – Bases em Bolas
BF – Batedeiras Enfrentou
H – Hits
HBP – Atingido por Arremessos
OBP – No-Base Porcentagem
ROE Alcançados Base em Erro
SF – Sacrifício Voar

Derivação da Probabilidade de Fora, Bateu, e Atingindo Base, sem um Bater para o Indivíduo Cântaros a partir dos Dados Disponíveis