ley de los números pequeños

Me parece gracioso que ésta sea mi primera entrada en el blog, tanto por el título de la entrada como por el título del blog, pero tiene sentido. La ley de los números pequeños tiene sentido gracias a la ley de los grandes números; la ley de los números pequeños no es más que la mala interpretación y aplicación de la ley de los grandes números.

Entremos un poco en materia. La ley de los grandes números viene a decir que con alto número de sucesos, el valor medio de la esperanza del suceso tiende a su valor teórico. Ésta no es una definición formal -para eso mejor un libro-, pero es mas intuitiva. Básicamente si tenemos una moneda (y cuando hablo de ella me refiero a una moneda con cara y cruz) y se lanza sin hacer trampa, es decir ambos resultados son equiprobales, la probabilidad de obtener cara es de 0,5 y la de cruz 0,5 (coloquialmente, el 50% o lo que viene siendo la mitad). Pues bien, si lanzáramos esa moneda un número infinito de veces, exactamente la mitad de las tiradas saldría cara y la mitad, cruz… el detalle reside en infinitas tiradas, que además de imposible es aburrido. Ese es el problema, que el concepto de infinito es realmente poco/nada intuitivo, a las personas nos cuesta imaginar el infinito. La ley de los números pequeños tiene más que ver con la psicología que con las matemáticas (como me he enfrentado a ella en varias ocasiones, me sirve también a mí de recordatorio -memento mori-).

Según esta ley si tiras una moneda y te sale cara; la vuelves a tirar y te vuelve a salir cara; repites la tirada y, de nuevo, otra cara… Es decir, imagina que has sacado tres caras seguidas. Ante una cuarta tirada, yo te pregunto: ¿qué va a salir ahora? Lo normal es que digas cruz; ya han salido tres caras… Bien, pues ese es el error. Los sucesos son independientes; cada tirada es independiente. La probabilidad de sacar otra cara es del 0,5 (50% para los amigos o la mitad en términos de bar), pero la probabilidad de sacar tres caras (esto se llama probabilidad básica) sería la probabilidad de sacar cara, que hemos dicho corresponde a un valor de 0.5, aunque como los tres sucesos son independientes e equiprobables esto se traduce en (0,5)3=0,125 . Solo en el infinito la probabilidad de sacar siempre la cara es 0, esta es otra forma de verlo, la probabilidad de sacar cara en las primeras n tiradas se puede expresar:

$$P(c_{n})= \left(\frac{1}{2}\right)^n$$

$$\lim_{n \to \infty}{P(c_{n})= \left(\frac{1}{2}\right)^n}=0$$

Por tanto un suceso imposible (probabilidad 0) que si lanzas una moneda infitas veces siempre sea cara. Pero eso no quiere decir que en muestras pequeñas (frente a infinito) tenga que existir una compensación, son sucesos independientes. La cosa cambia si te pregunto: ¿cuál es la probabilidad de sacar 3 caras en las tres primeras tiradas y una cruz en la cuarta? Bueno pues es sencillo: la probabilidad de las 3 caras es 0,125 y de sacar una cruz en la cuarta es 0,5; luego la probabilidad es de 0,125∗0,5=0,625 … Sin embargo, -y aquí es donde las matemáticas matan la ley de los números pequeños-, ¿qué probabilidad hay de sacar cuatro caras? Supongo que ya lo habéis pillado, porque es la misma. En el fondo esa cuarta moneda puede ser cara o puede ser cruz… La ley de los grandes números sólo se aplica para grandes números. Es decir, que de forma “intuitiva” tratamos sucesos independientes como dependientes. Es como si pensaramos que el universo debe compensar rapidamente esa anomalia.

Eso nos lleva a algo que está muy de moda: el big data. Porque ¡hagámoslo al revés! Supongamos que me dais un dado de un número indeterminado de caras (de esos de las partidas de rol). Cada una de ellas numerada e identificada de forma única. Si lanzáramos ese de dado un número infinito de veces, podríamos saber cuántas caras salen y si todas son iguales (probabilidad por cara). Es decir, podríamos conocer la realidad o lo que es lo mismo el dado a partir de los resultados (inferencia estadística o método de Montecarlo). Es lo que ocurre con los ordenadores: gracias a ellos podemos acceder a un número lo suficientemente alto de datos como para inferir resultados. Además, gracias a los ordenadores, no hace falta que usemos una muestra. Podemos usar todos el espacio muestral. Otro error típico de la ley de los pequeños números es la extrapolación de la muestra; partiendo de una muestra de individuos, se deduce que la población entera se comporta como dicha muestra. De ahí que existan los términos “muestra representativa” y “sesgo estadístico”. Este error es muy típico, por ejemplo, en las encuestas electorales (tema que merece una entrada a parte, incluso un libro). Cuando se dice eso de que las encuestas no han acertado o que han “cocinado la encuesta”, es porque esto es tan fácil como realizar un mal muestreo. A partir de él puedes obtener casi el resultado que quieras; generalmente afín a los intereses del que paga la encuesta… Y con esta reflexión me he vuelto a salir del tema de los pequeños números.

Google Plus
{{ message }}

{{ 'Comments are closed.' | trans }}