viernes, 27 de marzo de 2020

Distribucion normal

En estadística y probabilidad se llama distribución normal, distribución de Gauss, distribución gaussiana o distribución de Laplace-Gauss, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en estadística y en la teoría de probabilidades.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. ​Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.

De hecho, la estadística descriptiva sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.

La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.

Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:

-caracteres morfológicos de individuos como la estatura;
-caracteres fisiológicos como el efecto de un fármaco;
-caracteres sociológicos como el consumo de cierto producto por un mismo grupo de -individuos;
-caracteres psicológicos como el cociente intelectual;
-nivel de ruido en telecomunicaciones;
-errores cometidos al medir ciertas magnitudes;
-etc.
La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal, cuando la distribución de la población de la cual se extrae la muestra no es normal.Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una "normalidad" más o menos justificada de la variable aleatoria bajo estudio.

En probabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidad continuas y discretas.

Distribución binomial y distribución hipergeometrica y sus diferencias

Distribucion binomial

En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, solo dos resultados son posibles. A uno de estos se denomina «éxito» y tiene una probabilidad de ocurrencia p y al otro, «fracaso», con una probabilidad2​ q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.


Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p, se escribe:

 X-B(n,p)
La distribución binomial es la base del test binomial de significación estadística.



Distribución hipergeometrica


La distribución hipergeométrica es una distribución discreta que modela el número de eventos en una muestra de tamaño fijo cuando usted conoce el número total de elementos en la población de la cual proviene la muestra. Cada elemento de la muestra tiene dos resultados posibles (es un evento o un no evento). Las muestras no tienen reemplazo, por lo que cada elemento de la muestra es diferente. Cuando se elige un elemento de la población, no se puede volver a elegir. Por lo tanto, la probabilidad de que un elemento sea seleccionado aumenta con cada ensayo, presuponiendo que aún no haya sido seleccionado.

Utilice la distribución hipergeométrica para muestras obtenidas de poblaciones relativamente pequeñas, sin reemplazo. Por ejemplo, la distribución hipergeométrica se utiliza en la prueba exacta de Fisher para probar la diferencia entre dos proporciones y en muestreos de aceptación por atributos cuando se toman muestras de un lote aislado de tamaño finito.


La diferencia entre las distribuciones hipergeométrica y binomial

Tanto la distribución hipergeométrica como la distribución binomial describen el número de veces que un evento ocurre en un número fijo de ensayos. Para la distribución binomial, la probabilidad es igual para cada ensayo. Para la distribución hipergeométrica, cada ensayo cambia la probabilidad de cada ensayo subsiguiente porque no hay reemplazo.

Utilice la distribución binomial con poblaciones tan grandes que el resultado de una prueba prácticamente no tiene efecto sobre la probabilidad de que el próximo resultado sea un evento o un no evento. Por ejemplo, en una población de 100,000 personas, 53,000 tienen sangre O+. La probabilidad de que la primera persona seleccionada aleatoriamente en una muestra tenga sangre O+ es 0.530000. Si la primera persona en una muestra tiene sangre O+, entonces la probabilidad de que la segunda persona tenga sangre O+ es 0.529995. La diferencia entre estas probabilidades es lo suficientemente pequeña como para ignorarla en la mayoría de las aplicaciones.

Utilice la distribución hipergeométrica con poblaciones que sean tan pequeñas que el resultado de un ensayo tiene un gran efecto en la probabilidad de que el próximo resultado sea un evento o un no evento. Por ejemplo, en una población de 10 personas, 7 personas tienen sangre O+. La probabilidad de que la primera persona seleccionada aleatoriamente en una muestra tenga sangre O+ es 0.7000. Si la primera persona en la muestra tiene sangre O+, entonces la probabilidad de que la segunda persona tenga sangre O+ es 0.66667. La diferencia puede aumentar a medida que aumenta el tamaño de la muestra. La diferencia entre estas probabilidades es demasiado grande como para ignorarla en muchas aplicaciones.


Cuadro comparativo

DISTRIBUCION BINOMIAL

DISTRIBUCIÓN HIPERGEOMÉTRICA

·         En los experimentos que tienen este tipo de distribución, siempre se esperan dos tipos de resultados, ejem. Defectuoso, no defectuoso, pasa, no pasa, etc, etc., denominados arbitrariamente “éxito” (que es lo que se espera que ocurra) o “fracaso” (lo contrario del éxito).

·         Las probabilidades asociadas a cada uno de estos resultados son constantes, es decir no cambian.

·         Cada uno de los ensayos o repeticiones del experimento son independientes entre sí.

·         El número de ensayos o repeticiones del experimento (n) es constante.

·         Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.

·         Las probabilidades asociadas a cada uno de los resultados no son constantes.

·         Cada ensayo o repetición del experimento no es independiente de los demás.

·         El número de repeticiones del experimento (n) es constante.











Distribuciones de probabilidad continuas y discretas y su representacion en la grafica

CONTINUAS

Una distribución continua describe las probabilidades de los posibles valores de una variable aleatoria continua. Una variable aleatoria continua es una variable aleatoria con un conjunto de valores posibles (conocido como el rango) que es infinito y no se puede contar.
Las probabilidades de las variables aleatorias continuas (X) se definen como el área por debajo de la curva de su PDF. Por lo tanto, solo los rangos de valores pueden tener una probabilidad diferente de cero. La probabilidad de que una variable aleatoria continua equivalga a algún valor siempre es cero.
Ejemplo de la distribución de pesos
La distribución normal continua puede describir la distribución del peso de hombres adultos. Por ejemplo, usted puede calcular la probabilidad de que un hombre pese entre 160 y 170 libras.
Gráfica de distribución del peso de hombres adultos


Sin embargo, la probabilidad de que X sea exactamente igual a algún valor siempre es cero, porque el área por debajo de la curva en un punto individual, que no tiene anchura, es cero. Por ejemplo, la probabilidad de que un hombre pese exactamente 190 libras es cero. Podría calcular una probabilidad diferente de cero de que un hombre pese más de 190 libras, menos de 190 libras o entre 189.9 y 190.1 libras, pero la probabilidad de que pese exactamente 190 libras es cero.

Discretas

Una distribución discreta describe la probabilidad de ocurrencia de cada valor de una variable aleatoria discreta. Una variable aleatoria discreta es una variable aleatoria que tiene valores contables, tales como una lista de enteros no negativos.
Con una distribución de probabilidad discreta, cada valor posible de la variable aleatoria discreta puede estar asociado con una probabilidad distinta de cero. Por lo tanto, una distribución de probabilidad discreta suele representarse en forma tabular.

Ejemplo del número de quejas de clientes

Con una distribución discreta, a diferencia de una distribución continua, usted puede calcular la probabilidad de que X sea exactamente igual a algún valor. Por ejemplo, puede utilizar la distribución discreta de Poisson para describir el número de quejas de clientes en un día. Supongamos que el número promedio de quejas por día es 10 y usted desea saber la probabilidad de recibir 5, 10 y 15 quejas de clientes en un día.
xP (X = x)
50.037833
100.12511
150.034718
Usted también puede visualizar una distribución discreta en una gráfica de distribución para ver las probabilidades entre los rangos.
Mapa cognitivo
 Mapa Conceptual Variables Aleatorias
Mapa cognitivo de las formas de representación de las distribuciones 


Distribuciones de probabilidad con Python 
 Gráfica de distribución del número de quejas de clientes

Esperanza Matematica

La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso aleatorio. O, dicho de otra forma, el valor medio de un conjunto de datos. Teniendo en cuenta, eso sí, que el término esperanza matemática está acuñado por la teoría de la probabilidad. Mientras que en matemáticas, se denomina media matemática al valor promedio de un suceso que ha ocurrido. En distribuciones discretas con la misma probabilidad en cada suceso la media aritmética es igual que la esperanza matemática.
La esperanza matemática de una variable aleatoria X es el número que expresa el valor medio del fenómeno que representa dicha variable.


Calculo de la esperanza matemática 

La esperanza matemática se calcula utilizando la probabilidad de cada suceso. La fórmula que formaliza este cálculo se enuncia como sigue:
Dónde x es el valor del suceso, P la probabilidad de que ocurra, i el periodo en el que se da dicho suceso y N el número total de periodos u observaciones.
No siempre la probabilidad de que ocurra un suceso es la misma, como con las monedas. Existen infinidad de casos en que un suceso tiene más probabilidad de salir que otro. Por eso utilizamos en la fórmula la P. Además, al calcular número matemáticos debemos multiplicar por el valor del suceso. Abajo vemos un ejemplo.