Archivo de la categoría: Estadística

Estadistica

Medida de errores

estoy cansado de tanta tontería quiero un poquito de normalidad.
Dani Martin El Canto del loco, cancion zapatillas

\[  \frac{1}{\sigma  \sqrt{2 \pi} } e ^{-\frac{(x-\mu) ²} {2 \sigma ²}    } \]

Todo el mundo cree en la ley normal de los errores: los matemáticos, porque piensan que es un hecho experimental; y los experimentadores, porque suponen que es un teorema matemático.

Gabriel Lippmann

Homenaje a Sixto Rios

Este fin de semana (8-7-2017) hizo 9 años de la muerte de Sixto Ríos, conocido por ser el padre de la estadística española, no le conocí personalmente, pero lo conocí por sus libros, algunos de los cuales considero sencillamente imprescindibles (Métodos estadísticos McGraw Hill 1967, aunque figure como ediciones del castillo es ya la 3ª edición que es la que yo tengo) es para mi el libro de estadística fundamental, ademas tengo varios mas suyos. Cuando tenia que aprender o usar algún libro de referencia siempre buscaba alguno de los suyos, que afortunadamente no fueron pocos. Explicados con gran sencillez y claridad, siempre me han parecido didácticos y rigurosos y completos.

 

 

Como homenaje me gustaría citar de su libro:

La ley del azar o de estabilidad de las frecuencias, también denominada ley empírica de los grandes números, afirma que la frecuencia de un suceso al realizar n repeticiones independientes de un experimento aleatorio se aproxima a la probabilidad cuando n crece. Esta propiedad experimental ha sido la base de la inducción de la noción de probabilidad por método axiomático. Vamos a exponer ahora la que llamaremos ley matemática de los grandes números o teorema de Bernoulli, que es la imagen teórica de la ley del azar y que viene a precisar el uso de la palabra aproximación en la misma.

 Sixto Ríos
Métodos estadísticos
Cap 15 -Teorema del límite

 

Se puede encontrar mas información en : sixtorios.org

ley de los pequeños números

Me parece gracioso que ésta sea mi primera entrada en el blog, tanto por el título de la entrada como por el título del blog, pero tiene sentido. La ley de los números pequeños tiene sentido gracias a la ley de los grandes números; la ley de los números pequeños no es más que la mala interpretación y aplicación de la ley de los grandes números. Entremos un poco en materia.
La ley de los grandes números viene a decir que con alto número de sucesos, el valor medio de la esperanza del suceso tiende a su valor teórico. Ésta no es una definición formal -para eso mejor un libro-, pero es mas intuitiva. Básicamente si tenemos una moneda (y cuando hablo de ella me refiero a una moneda con cara y cruz) y se lanza sin hacer trampa, es decir ambos resultados son equiprobales, la probabilidad de obtener cara es de 0,5 y la de cruz 0,5 (coloquialmente, el 50% o lo que viene siendo la mitad). Pues bien, si lanzáramos esa moneda un número infinito de veces, exactamente la mitad de las tiradas saldría cara y la mitad, cruz… el detalle reside en infinitas tiradas, que además de imposible es aburrido. Ese es el problema, que el concepto de infinito es realmente poco/nada intuitivo, a las personas nos cuesta imaginar el infinito.

 

La ley de los números pequeños tiene más que ver con la psicología que con las matemáticas (como me he enfrentado a ella en varias ocasiones, me sirve también a mí de recordatorio -memento mori-). Según esta ley si tiras una moneda y te sale cara; la vuelves a tirar y te vuelve a salir cara; repites la tirada y, de nuevo, otra cara… Es decir, imagina que has sacado tres caras seguidas. Ante una cuarta tirada, yo te pregunto: ¿qué va a salir ahora? Lo normal es que digas cruz; ya han salido tres caras… Bien, pues ese es el error. Los sucesos son independientes; cada tirada es independiente. La probabilidad de sacar otra cara es del 0,5 (50% para los amigos o la mitad en términos de bar), pero la probabilidad de sacar tres caras (esto se llama probabilidad básica) sería la probabilidad de sacar cara, que hemos dicho corresponde a un valor de 0.5, aunque como los tres sucesos son independientes e equiprobables esto se traduce en \( (0,5)^3=0,125. \) Solo en el infinito la probabilidad de sacar siempre la cara es 0, esta es otra forma de verlo, la probabilidad de sacar cara en las primeras n tiradas se puede expresar:

\[ P(c_{n})= \left(\frac{1}{2}\right)^n\]
\[ \lim_{n \to \infty}{P(c_{n})= \left(\frac{1}{2}\right)^n}=0\]

Por tanto un suceso imposible (probabilidad 0) que si lanzas una moneda infitas veces siempre sea cara. Pero eso no quiere decir que en muestras pequeñas (frente a infinito) tenga que existir una compensación, son sucesos independientes.

La cosa cambia si te pregunto: ¿cuál es la probabilidad de sacar 3 caras en las tres primeras tiradas y una cruz en la cuarta? Bueno pues es sencillo: la probabilidad de las 3 caras es 0,125 y de sacar una cruz en la cuarta es 0,5; luego la probabilidad es de \(0,125∗0,5=0,625\) … Sin embargo, -y aquí es donde las matemáticas matan la ley de los números pequeños-, ¿qué probabilidad hay de sacar cuatro caras? Supongo que ya lo habéis pillado, porque es la misma. En el fondo esa cuarta moneda puede ser cara o puede ser cruz… La ley de los grandes números sólo se aplica para grandes números. Es decir, que de forma “intuitiva” tratamos sucesos independientes como dependientes.

 

Eso nos lleva a algo que está muy de moda: el big data. Porque ¡hagámoslo al revés! Supongamos que me dais un dado de un número indeterminado de caras (de esos de las partidas de rol). Cada una de ellas numerada e identificada de forma única. Si lanzáramos ese de dado un número infinito de veces, podríamos saber cuántas caras salen y si todas son iguales (probabilidad por cara). Es decir, podríamos conocer la realidad o lo que es lo mismo el dado a partir de los resultados (inferencia estadística o método de Montecarlo). Es lo que ocurre con los ordenadores: gracias a ellos podemos acceder a un número lo suficientemente alto de datos como para inferir resultados. Además, gracias a los ordenadores, no hace falta que usemos una muestra. Podemos usar todos el espacio muestral.

 
Otro error típico de la ley de los pequeños números es la extrapolación de la muestra; partiendo de una muestra de individuos, se deduce que la población entera se comporta como dicha muestra. De ahí que existan los términos “muestra representativa” y “sesgo estadístico”. Este error es muy típico, por ejemplo, en las encuestas electorales (tema que merece una entrada a parte, incluso un libro). Cuando se dice eso de que las encuestas no han acertado o que han “cocinado la encuesta”, es porque esto es tan fácil como realizar un mal muestreo. A partir de él puedes obtener casi el resultado que quieras; generalmente afín a los intereses del que paga la encuesta… Y con esta reflexión me he vuelto a salir del tema de los pequeños números.