• Del autor
  • Principios y algoritmos de concurrencia

Ricardo Galli, de software

~ De software libre, internet, legales

Ricardo Galli, de software

Archivos de etiqueta: fórmula 1

Ejemplo de lo mal que interpretamos la aleatoriedad

25 domingo Abr 2010

Posted by gallir in ciencia, pijadas

≈ 9 comentarios

Etiquetas

estadísticas, fórmula 1

Hace pocos días escribí sobre nuestra incapacidad de gestionar la aleatoriedad, hoy Cavalleto me dejó el balón botando frente a portería. En su blog escribe sobre el «patrón curioso» de que haya tantos corredores de Fórmula 1 con letras seguidas repetidas en sus apellidos. Comenta que hubo 12 en los últimos dos años, miré en la página de la F1 y veo que este año hay 9 que cumplen esa condición.

Cavalleto sospecha que la probabilidad es de 1 en 100 millones, desde el principió sospeché que sería muchísimo menor, así que me puse a estudiar un poco los números.

Antes de continuar leyendo haz unos cálculos rápidos. ¿Cuál es la probabilidad que una persona tenga un apellido con letras consecutivas repetidas? (pista: el castellano no es el único idioma, ni el predominante en F1, en todo caso el italiano y el inglés) ¿Cuál es la probabilidad que haya un corredor con esas características? ¿y cinco? (pista, la segunda es mucho más probable)

—-

Lo primero que hay que averiguar era el porcentaje de apellidos con letras consecutivas repetidas. Para simplificar mucho el trabajo sólo busqué los más comunes en los países con más representantes en la F1. Aunque no es completa y tiene desvíos importantes serviría para hacer una aproximación, que aunque basta puede confirmar lo malo que somos para evaluar las probabilidades.

[*] Por ejemplo los apellidos italianos de la brasileros es mucho más alto que la media brasilera, supongo que influye mucho la ciudad de orígen, o que sean los de familia italiana los más aficionados a los coches (al menos mucho más que los de apellidos originarios de Portugal)

Las listas de los apellidos más comunes las obtuve de la Wikipedia, Familypedia, y Behindthename. El resumen de las probabilidades de algunos países es el siguiente:

  • España: 10% (4 de 40)
  • Alemania: 20% (2 de 10)
  • Italia: 35% (7 de 20)
  • Brasil: 15% (25 de 168)
  • Finlandia: 10% (1 de 10)

Se puede ver que varía entre Italia que es el más alto a España o Finlandia que son los más bajos. Para aproximar asumí que los valores razonables estarían entre el 20 y el 30%. Estas son las probabilidades para cada una de ellas, la columna de la izquierda representa el número de corredores con el «apellido raro» y la segunda la probabilidad porcentual):

Para el 20%:

0 0.5%
1 2.8%
2 8.1%
3 14.9%
4 19.6%
5 19.6%
6 15.6%
7 10.0%
8 5.3%
9 2.3%
10 0.9%
11 0.3%
12 0.1%
13 0.0%
14 0.0%
15 0.0%
17 0.0%

Para el 30%

0 0.0%
1 0.1%
2 0.4%
3 1.5%
4 3.9%
5 7.9%
6 12.5%
7 16.1%
8 17.1%
9 15.1%
10 11.4%
11 7.2%
12 4.0%
13 1.8%
14 0.7%
15 0.2%
16 0.1%
17 0.0%
18 0.0%
19 0.0%

Nota: los «0.0%» no son ceros, es cuestión de precisión y redondeo, por ejemplo el último (19) de la última tabla es 0.0006%.

Es decir, las probabilidades de tener 9 corredores de 24 con apellidos con letras consecutivas repetidas está entre el 2.3 y el 15.1% (partiendo de probabilidades entre 20 y 30%). Ya se ve, muchísimas más bajas que 1 en 100 millones.

Por otro lado también es interesante analizar cada cuantos años se debe dar esta coincidencia en la F1. También es muy fácil de comprobarlo: varía entre 6.44 años de media (con 6 de desviación estándar [**]) en el caso del 30% y en 40.44 años (con desviación estándar de 42 años [**]) en el caso del 20%. Dado que la F1 se corre desde hace 60 años, en el peor de los casos analizados (con el 20%) había el 68% de probabilidades que se presentase este «patrón raro» de 9 corredores.

Pues eso, que de raro en realidad no tiene nada (aunque no miré el historial de años anteriores).

[**] En mis simulaciones, ver el Teorema del Límite Central.

Comprar el libro

Principios y algoritmos de concurrencia

gallir@twitter

  • La izquierda dándose de hostias. Es hora de crear Izquierda Unida. twitter.com/PabloIglesias/… 1 day ago
  • Recordatorio de que el Ministerio de Consumo todavía existe. 2 days ago
  • Tarde para avisar, ya no se puede apuntar, pero en fin :( Estaré aquí, …y-consumer-tech-talent.splashthat.com 3 days ago
  • RT @eduardosuarez: Está bien recordar (una vez más) la podredumbre moral de Evo Morales, capaz de llamar hermano al carnicero de Mariúpol y… 4 days ago
Follow @gallir

RSS Notas recientes

  • Se ha producido un error; es probable que la fuente esté fuera de servicio. Vuelve a intentarlo más tarde.

Archivos

Comentarios recientes

PM en Cuidado con las «clever soluti…
Me matan si no traba… en Cuando el periodismo cede el c…
surco en Cuando el periodismo cede el c…
pancho pérez (@lonch… en Cuando el periodismo cede el c…
Fernando en Cuando el periodismo cede el c…
@beoxman en Cuando el periodismo cede el c…
gallir en Cuando el periodismo cede el c…
Jan Smite en Cuando el periodismo cede el c…
Alejandro en Cuando el periodismo cede el c…
Galletor en Cuando el periodismo cede el c…

Meta

  • Registro
  • Acceder
  • Feed de entradas
  • Feed de comentarios
  • WordPress.com

Licencia

Creative Commons License
Esta obra está bajo una licencia de Creative Commons.

Crea un blog o un sitio web gratuitos con WordPress.com.

  • Seguir Siguiendo
    • Ricardo Galli, de software
    • Únete a 667 seguidores más
    • ¿Ya tienes una cuenta de WordPress.com? Accede ahora.
    • Ricardo Galli, de software
    • Personalizar
    • Seguir Siguiendo
    • Regístrate
    • Acceder
    • Denunciar este contenido
    • Ver sitio web en el Lector
    • Gestionar las suscripciones
    • Contraer esta barra