Etiquetas

,

Hace pocos días escribí sobre nuestra incapacidad de gestionar la aleatoriedad, hoy Cavalleto me dejó el balón botando frente a portería. En su blog escribe sobre el «patrón curioso» de que haya tantos corredores de Fórmula 1 con letras seguidas repetidas en sus apellidos. Comenta que hubo 12 en los últimos dos años, miré en la página de la F1 y veo que este año hay 9 que cumplen esa condición.

Cavalleto sospecha que la probabilidad es de 1 en 100 millones, desde el principió sospeché que sería muchísimo menor, así que me puse a estudiar un poco los números.

Antes de continuar leyendo haz unos cálculos rápidos. ¿Cuál es la probabilidad que una persona tenga un apellido con letras consecutivas repetidas? (pista: el castellano no es el único idioma, ni el predominante en F1, en todo caso el italiano y el inglés) ¿Cuál es la probabilidad que haya un corredor con esas características? ¿y cinco? (pista, la segunda es mucho más probable)

—-

Lo primero que hay que averiguar era el porcentaje de apellidos con letras consecutivas repetidas. Para simplificar mucho el trabajo sólo busqué los más comunes en los países con más representantes en la F1. Aunque no es completa y tiene desvíos importantes serviría para hacer una aproximación, que aunque basta puede confirmar lo malo que somos para evaluar las probabilidades.

[*] Por ejemplo los apellidos italianos de la brasileros es mucho más alto que la media brasilera, supongo que influye mucho la ciudad de orígen, o que sean los de familia italiana los más aficionados a los coches (al menos mucho más que los de apellidos originarios de Portugal)

Las listas de los apellidos más comunes las obtuve de la Wikipedia, Familypedia, y Behindthename. El resumen de las probabilidades de algunos países es el siguiente:

  • España: 10% (4 de 40)
  • Alemania: 20% (2 de 10)
  • Italia: 35% (7 de 20)
  • Brasil: 15% (25 de 168)
  • Finlandia: 10% (1 de 10)

Se puede ver que varía entre Italia que es el más alto a España o Finlandia que son los más bajos. Para aproximar asumí que los valores razonables estarían entre el 20 y el 30%. Estas son las probabilidades para cada una de ellas, la columna de la izquierda representa el número de corredores con el «apellido raro» y la segunda la probabilidad porcentual):

Para el 20%:

0 0.5%
1 2.8%
2 8.1%
3 14.9%
4 19.6%
5 19.6%
6 15.6%
7 10.0%
8 5.3%
9 2.3%
10 0.9%
11 0.3%
12 0.1%
13 0.0%
14 0.0%
15 0.0%
17 0.0%

Para el 30%

0 0.0%
1 0.1%
2 0.4%
3 1.5%
4 3.9%
5 7.9%
6 12.5%
7 16.1%
8 17.1%
9 15.1%
10 11.4%
11 7.2%
12 4.0%
13 1.8%
14 0.7%
15 0.2%
16 0.1%
17 0.0%
18 0.0%
19 0.0%

Nota: los «0.0%» no son ceros, es cuestión de precisión y redondeo, por ejemplo el último (19) de la última tabla es 0.0006%.

Es decir, las probabilidades de tener 9 corredores de 24 con apellidos con letras consecutivas repetidas está entre el 2.3 y el 15.1% (partiendo de probabilidades entre 20 y 30%). Ya se ve, muchísimas más bajas que 1 en 100 millones.

Por otro lado también es interesante analizar cada cuantos años se debe dar esta coincidencia en la F1. También es muy fácil de comprobarlo: varía entre 6.44 años de media (con 6 de desviación estándar [**]) en el caso del 30% y en 40.44 años (con desviación estándar de 42 años [**]) en el caso del 20%. Dado que la F1 se corre desde hace 60 años, en el peor de los casos analizados (con el 20%) había el 68% de probabilidades que se presentase este «patrón raro» de 9 corredores.

Pues eso, que de raro en realidad no tiene nada (aunque no miré el historial de años anteriores).

[**] En mis simulaciones, ver el Teorema del Límite Central.