• Del autor
  • Principios y algoritmos de concurrencia

Ricardo Galli, de software

~ De software libre, internet, legales

Ricardo Galli, de software

Archivos de etiqueta: probabilidades

Las probabilidades del empate de la CUP

28 Lunes Dic 2015

Posted by gallir in ciencia, pijadas

≈ 51 comentarios

Etiquetas

CUP, empate, probabilidades

Actualización: un segundo artículo donde respondo a las cuestiones y errores más frecuentes sobre este tema: Más de CUP, el mal uso de probabilidades y un bayesiano.

En Twitter preguntan cuál era la probabilidad de empate:

.@franlesg864 @cultrun la probabilidad con 3030 es aproximadamente 1.44%

— Ricardo Galli (@gallir) December 27, 2015

Dado que había ya respuestas erróneas respondí, luego expliqué cuál es la forma de calcular la probabilidad de que 3030 personas cuyos votos son independientes (se supone) y que tienen dos opciones (no contamos abstenciones, varía poco). Pero no hubo caso, seguían insistiendo que estaba mal. Unos con fórmulas equivocadas, otros asegurando que hubo tongo y conspiraciones varias. Y otros que si hubiese sido impar el nḿero de votantes el empate es imposible (¡gran observación! :roll:).

Por supuesto que cuando calculas probabilidades te ciñes a unos supuestos, en este caso son muy simples:

  • Son 3030 votos contabilizados, cada uno puede ser sí o no (o 0 y 1).
  • Un empate se da cuando hay igual número de síes (1) que de noes (0).

Sigue leyendo →

El DNI de la Infanta y el mal uso de las estadísticas

19 Miércoles Jun 2013

Posted by gallir in administración, ciencia, política, prensa

≈ 46 comentarios

Etiquetas

dni infanta, estadísticas, probabilidades

Hoy publican en Las probabilidades matemáticas de que lo de la infanta sea “un error”, donde se explica que la probabilidad que cuatro notarios se equivoquen y pongan el DNI de la Infanta es 10 seguido de 30 ceros (pequeño detalle, en realidad debería haber dicho 10 seguido de 31 ceros, ya que es 100.000.000⁴ = 1×10³²). El artículo lo escribió con un doctor en matemáticas, y es un excelente ejemplo de mal uso de las probabilidades, incluso por expertos. Son casos conocidos lo de la Ley de Meadow (en UK se encarcelaron a 258 personas inocentes por la mala interpretación de las probabilidades) y la Falacia del acusador.

El problema en este caso es que se analizaron las probabilidades equivocadas. Poner mal un DNI no es la probabilidad perfecta que vemos en los juegos de una entre todas las posibilidades (en este caso 1 entre los 100 millones de números posibles), sino que depende de otros factores. Lo que se tendría que haber analizado es la probabilidad de que se hayan introducido [mal] números de dos dígitos en los sistemas informáticos que se usan. Esto es mucho más complicado. Pregunté a personas y abogados con experiencia y me dicen que el error es muy habitual, que muchas veces los programas son confusos y hacen que la persona que pica de al ENTER o se pase a otro campo de entrada después de introducir sólo unos pocos dígitos (sumado a que muchos programas autocompletan la letra). Así, la probabilidad de fallo ya es muy superior a la teórica de 1/100.000.000.

Eso ya invalida toda “acusación” basada en esa probabilidad teórica, simplemente porque depende de muchos otros factores. A lo que hay que tener en cuenta la teoría de grandes números, si la probabilidad de poner mal un DNI es del 1%, y se hacen unas 500.000 transacciones inmobiliarias (aproximada, unas 250.000 son de compra-venta de hogares) al año, ya podemos estar seguro que hay unas 5.000 que tienen mal el DNI. ¿Cuál es la probabilidad de que esos DNI mal cargados sean de dos cifras o de un miembro de la casa real? Eso es mucho más complicado, pero tomo dos ejemplos de dos tuits:

Ciudadano de Murcia con el mismo DNI que la Infanta. 00000014Z. pic.twitter.com/2GbICXsqZe

— Antonio Maestre (@AntonioMaestre) June 18, 2013

En este vemos que de 50 DNI que hay en la página mostrada, uno corresponde a la Infanta. Si nos basamos en esta pequeña muestra, la probabilidad es de 1/50, o 2%. Eso nos da que de las 500.000 transacciones anuales, unas 10.000 (al año) tendrán el DNI de la Infanta.

El otro tweet tiene todavía es más extraño:

Ciudadano de Lugo con el NIF del Principe Felipe 00000015S pic.twitter.com/ZkvCnEffjL

— Antonio Maestre (@AntonioMaestre) June 18, 2013

Si las cuentas y la vista no me fallaron, en esa captura hay sólo 18 números de DNI diferentes, de los cuales 4 son de dos cifras (y una del DNI de Felipe). Si esta muestra fuese válida, hay una probabilidad de 22% de que se introduzca un DNI de dos cifras, y un 5.5% de que el DNI sea de un miembro de la casa real. Extrapolando, hay unas 27.500 transacciones anuales con el DNI de un miembro de la Casa Real, o unos 110.000 con el DNI mal puesto con dos cifras.

Por supuesto, estas dos muestras no son válidas para inferir probabilidades, porque esas capturas fueron seleccionadas por tener errores, debe haber muchas otras sin error. Pero son un claro indicativo de que las tasas de error son mucho más elevadas -en varios órdenes de magnitud- que 1/100.000.000 y que por lo tanto esa “acusación” es una falacia estadística: la probabilidad de error no depende de la teórica, sino de otros muchos factores, humanos e informáticos.

Y todo esto sin contar que podría haber existido mala fe de los que vendieron esas propiedades, o blanqueo, u otros delitos. Pero ya no me quiero meter en ese tema que desconozco profundamente. En todo caso, es triste que se publique en portada un artículo firmado por un matemático con semejante error de fondo relatado en casi todos los libros de “malas estadísticas” en temas legales y judiciales.

Moraleja: No es lo mismo analizar probabilidades de juegos perfectos como tirar dados o jugar a la ruleta que la compleja realidad de la burocracia.

Actualización: En El Mundo también hablan de chapuzas informáticas (vía @malaprensa).

Actualización 2: Un análisis más técnico de los problemas del artículo, P-valores, infantas y tests de hipótesis.

Comprar el libro

Principios y algoritmos de concurrencia

gallir@twitter

  • Todavía me duele la espalda de la recuperación en V. 42 minutes ago
  • El Rubius dice que apoya y vota a Podemos y Más Madrid. El Rubius se larga a Andorra para pagar menos impuestos. A… twitter.com/i/web/status/1… 2 hours ago
  • RT @lew1sy: #COVID in Israel, thread with some possible explanations. Within the last 4wks: 1. Massive vaccination campaign, with ~80% of t… 18 hours ago
  • Casi sin tráfico ni aviones, pero tenéis la contaminación a tope. Tanto prohibir los coches y diesel y será la cale… twitter.com/i/web/status/1… 1 day ago
Follow @gallir

RSS Notas recientes

  • gallir: @Pafman @antiboise Lo siento. No...
  • gallir: Hole, me avisaron hace unos minutos: ...
  • gallir: @Carme @jorso Mierda, mierda, se...
  • gallir: Hola, estoy vivo, muy liado en...
  • gallir: @Xtrem3 @Ragnarokk Además de los...

Archivos

Comentarios recientes

PM en Cuidado con las “clever…
Me matan si no traba… en Cuando el periodismo cede el c…
surco en Cuando el periodismo cede el c…
pancho pérez (@lonch… en Cuando el periodismo cede el c…
Fernando en Cuando el periodismo cede el c…
@beoxman en Cuando el periodismo cede el c…
gallir en Cuando el periodismo cede el c…
Jan Smite en Cuando el periodismo cede el c…
Alejandro en Cuando el periodismo cede el c…
Galletor en Cuando el periodismo cede el c…

Meta

  • Registrarse
  • Acceder
  • Feed de entradas
  • Feed de comentarios
  • WordPress.com

Licencia

Creative Commons License
Esta obra está bajo una licencia de Creative Commons.

Blog de WordPress.com.

Privacidad & Cookies: este sitio usa cookies. Al continuar usando este sitio, estás de acuerdo con su uso. Para saber más, incluyendo como controlar las cookies, mira aquí: Política de Cookies.