Caracteristicas DE LA Distribucion Norma PDF

Title Caracteristicas DE LA Distribucion Norma
Author Anonymous User
Course Cálculo diferencial e integral 2
Institution Universidad de Sonora
Pages 8
File Size 283.4 KB
File Type PDF
Total Downloads 54
Total Views 150

Summary

se presenta una descripción de las propiedades dela distribución normal...


Description

Página 1 de 8

CARACTERÍSTICAS DE LA DISTRIBUCIÓN NORMAL 1. ¿Qué es una distribución normal? La distribución normal (en ocasiones llamada distribución gaussiana) es la distribución continua que se utiliza más comúnmente en estadística. La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta, como la distribución binomial y la distribución de Poisson. La distribución normal es una distribución con forma de campana donde las desviaciones estándar sucesivas con respecto a la media establecen valores de referencia para estimar el porcentaje de observaciones de los datos. Estos valores de referencia son la base de muchas pruebas de hipótesis, como las pruebas Z y t.

Histograma de una distribución normal hipotética Puesto que la distribución de estos datos es normal, usted puede determinar exactamente qué porcentaje de los valores está dentro de cualquier rango específico. Por ejemplo: 



Alrededor del 95% de las observaciones está dentro de 2 desviaciones estándar de la media, indicado por el área sombreada en azul. El 95% de los valores se ubicará dentro de 1.96 desviaciones estándar con respecto a la media (entre −1.96 y +1.96). Por lo tanto, menos del 5% (0.05) de las observaciones estará fuera de este rango. Este rango es la base del nivel de significancia de 0.05 que se utiliza para muchas pruebas de hipótesis. Aproximadamente el 68% de las observaciones está dentro de una 1 desviación estándar de la media (-1 a +1), y alrededor del 99.7% de las observaciones estarían dentro de 3 desviaciones estándar con respecto a la media (-3 a +3). Ejemplo de una distribución normal

La estatura de todos los adultos masculinos que residen en el estado de Pennsylvania sigue aproximadamente una distribución normal. Por lo tanto, la estatura de la mayoría de los hombres estará cerca de la estatura media de 69 pulgadas. Un número similar de hombres serán un poco más altos y un poco más

Página 2 de 8

bajos que 69 pulgadas. Solo unos pocos serán mucho más altos o mucho más bajos. La desviación estándar es de 2.5 pulgadas.

Aproximadamente, el 68% de los hombres de Pennsylvania tiene una estatura de entre 66.5 (μ - 1σ) y 71.5 (μ + 1σ) pulgadas.

Aproximadamente, el 95% de los hombres de Pennsylvania tiene una estatura de entre 64 (μ - 2σ) y 74 (μ + 2σ) pulgadas.

Aproximadamente, el 99.7% de los hombres de Pennsylvania tiene una estatura entre 61.5 (μ - 3σ) y 76.5 (μ + 3σ) pulgadas. Prueba de normalidad Realizar una prueba de normalidad Elija Estadísticas > Estadísticas básicas > Prueba de normalidad. Los resultados de la prueba indican si usted debe rechazar o no puede rechazar la hipótesis nula de que los datos provienen de una población distribuida normalmente. Puede realizar una prueba de normalidad y producir una gráfica de

Página 3 de 8

probabilidad normal en el mismo análisis. La prueba de normalidad y la gráfica de probabilidad suelen ser las mejores herramientas para evaluar la normalidad. Tipos de pruebas de normalidad Los siguientes son tipos de pruebas de normalidad que puede utilizar para evaluar la normalidad. Prueba de Anderson-Darling Esta prueba compara la función de distribución acumulada empírica (ECDF) de los datos de la muestra con la distribución esperada si los datos fueran normales. Si la diferencia observada es adecuadamente grande, usted rechazará la hipótesis nula de normalidad de la población. Prueba de normalidad de Ryan-Joiner Esta prueba evalúa la normalidad calculando la correlación entre los datos y las puntuaciones normales de los datos. Si el coeficiente de correlación se encuentra cerca de 1, es probable que la población sea normal. El estadístico de Ryan-Joiner evalúa la fuerza de esta correlación; si se encuentra por debajo del valor crítico apropiado, usted rechazará la hipótesis nula de normalidad de la población. Esta prueba es similar a la prueba de normalidad de Shapiro-Wilk. Prueba de normalidad de Kolmogorov-Smirnov Esta prueba compara la función de distribución acumulada empírica (ECDF) de los datos de la muestra con la distribución esperada si los datos fueran normales. Si esta diferencia observada es adecuadamente grande, la prueba rechazará la hipótesis nula de normalidad de la población. Si el valor p de esta prueba es menor que el nivel de significancia (α) elegido, usted puede rechazar la hipótesis nula y concluir que se trata de una población no normal. Comparación de las pruebas de normalidad de Anderson-Darling, KolmogorovSmirnov y Ryan-Joiner Las pruebas de Anderson-Darling y Kolmogorov-Smirnov se basan en la función de distribución empírica. La prueba de Ryan-Joiner (similar a la prueba de Shapiro-Wilk) se basa en regresión y correlación. Las tres pruebas tienden a ser adecuadas para identificar una distribución no normal cuando la distribución es asimétrica. Las tres pruebas distinguen menos cuando la distribución subyacente es una distribución t y la no normalidad se debe a la curtosis. Por lo general, entre las pruebas que se basan en la función de distribución empírica, la prueba de Anderson-Darling tiende a ser más efectiva para detectar desviaciones en las colas de la distribución. Generalmente, si la desviación de la normalidad en las colas es el problema principal, muchos profesionales de la estadística usarían una prueba de Anderson-Darling como primera opción. NOTA Si está verificando la normalidad como preparación para un análisis de capacidad normal, las colas son la parte más crítica de la distribución. El estadístico de Anderson-Darling

Página 4 de 8

¿Qué es el estadístico de Anderson-Darling? El estadístico Anderson-Darling mide qué tan bien siguen los datos una distribución específica. Para un conjunto de datos y distribución en particular, mientras mejor se ajuste la distribución a los datos, menor será este estadístico. Por ejemplo, usted puede utilizar el estadístico de Anderson-Darling para determinar si los datos cumplen el supuesto de normalidad para una prueba t. Las hipótesis para la prueba de Anderson-Darling son:  

H0: Los datos siguen una distribución especificada H1: Los datos no siguen una distribución especificada

Utilice el valor p correspondiente (si está disponible) para probar si los datos provienen de la distribución elegida. Si el valor p es menor que un nivel de significancia elegido (por lo general 0.05 o 0.10), entonces rechace la hipótesis nula de que los datos provienen de esa distribución. Minitab no siempre muestra un valor p para la prueba de Anderson-Darling, porque este no existe matemáticamente para ciertos casos. También puede utilizar el estadístico de Anderson-Darling para comparar el ajuste de varias distribuciones con el fin de determinar cuál es la mejor. Sin embargo, para concluir que una distribución es la mejor, el estadístico de Anderson-Darling debe ser sustancialmente menor que los demás. Cuando los estadísticos están cercanos entre sí, se deben usar criterios adicionales, como las gráficas de probabilidad, para elegir entre ellos. Distribución

AndersonDarling

Valor p

Exponencial

9.599

p < 0.003

Normal

0.641

p < 0.089

Weibull de 3 parámetros

0.376

p < 0.432

Exponencial Normal Weibull de 3 parámetros Ejemplo de comparación de distribuciones Estas gráficas de probabilidad son para los mismos datos. Tanto la distribución normal como la distribución de Weibull de 3 parámetros ofrecen un ajuste adecuado a los datos.

Página 5 de 8

Minitab calcula el estadístico de Anderson-Darling usando la distancia al cuadrado ponderada entre la línea ajustada de la gráfica de probabilidad (con base en la distribución elegida y usando el método de estimación de máxima verosimilitud o las estimaciones de mínimos cuadrados) y la función de paso no paramétrica. El cálculo tiene mayor ponderación en las colas de la distribución. Mostrar el estadístico de Anderson-Darling en una gráfica de probabilidad normal Para ver una leyenda que muestre el estadístico de la prueba de Anderson-Darling y el valor p cada vez que usted cree una gráfica de probabilidad normal de los residuos: 1. Choose Herramientas > Opciones > Gráficas individuales > Gráficas de residuos para series de tiempo and Herramientas > Opciones > Modelos lineales > Gráficas de residuo 2. Marque Incluir prueba de Anderson-Darling con gráfica normal. Haga clic en Aceptar. Minitab no muestra la prueba cuando hay menos de 3 grados de libertad para el error. Gráficas de probabilidad normal y la "prueba del lápiz grueso" Una aproximación informal de una prueba de normalidad, denominada "prueba del lápiz grueso", se aplica con frecuencia a una gráfica de probabilidad. Imagine un "lápiz grueso" colocado sobre la línea ajustada:  Si este cubre todos los puntos de los datos en la gráfica, probablemente los datos son normales.  Si los puntos están lo suficientemente distantes de la línea ajustada como para verse más allá de los bordes del lápiz grueso, es probable que se trate de datos no normales. Este enfoque informal no es un sustituto de la inferencia estadística de la prueba de normalidad propiamente dicha, pero es útil como una rápida herramienta de evaluación visual. La prueba del lápiz grueso se aplica a las siguientes gráficas de probabilidad. Las bandas representan un lápiz grueso colocado sobre la línea ajustada.

La "prueba del lápiz grueso" con datos normales

La "prueba del lápiz grueso" con datos no normales

Página 6 de 8

2. ¿Cuántas desviaciones estándar tiene la distribución normal? Alrededor del 68% de los valores de una distribución normal están a una distancia σ < 1 (desviación típica) de la media, μ; alrededor del 95% de los valores están a dos desviaciones típicas de la media y alrededor del 99,7% están a tres desviaciones típicas de la media. Qué hacer con datos no normales Tiene varias opciones si desea realizar una prueba de hipótesis con datos no normales. Continuar con el análisis si la muestra es lo suficientemente grande Aunque formalmente muchas pruebas de hipótesis se basan en el supuesto de normalidad, de todos modos, se pueden obtener resultados adecuados con datos no normales si la muestra es lo suficientemente grande. La cantidad de datos que se necesita depende del grado de no normalidad de los datos, pero un tamaño de muestra de 20 suele ser adecuado. La relación entre la robustez ante la normalidad y el tamaño de la muestra se basa en el teorema del límite central. Este teorema demuestra que la distribución de la media de los datos de cualquier distribución se acerca a la distribución normal a medida que aumenta el tamaño de la muestra. Por lo tanto, si usted está interesado en hacer inferencias sobre una media de población, el supuesto de normalidad no es fundamental siempre y cuando la muestra sea lo suficientemente grande. Usar una prueba no paramétrica Las pruebas no paramétricas no presuponen una distribución específica para la población. Minitab ofrece varias pruebas no paramétricas que se pueden usar en lugar de las pruebas que parten del supuesto normalidad. Estas pruebas pueden ser particularmente útiles cuando se tiene una muestra pequeña que es asimétrica o una muestra que contiene varios valores atípicos. Prueba que parte del supuesto de normalidad

Pruebas no equivalentes

paramétricas

Z de 1 muestra, t de 1 muestra

Signos de 1 muestra, Wilcoxon de 1 muestra

t de 2 muestras

Mann-Whitney

ANOVA

Kruskal-Wallis, mediana de Mood, Friedman

Las pruebas no paramétricas no están completamente libres de supuestos acerca de los datos: por ejemplo, sí requieren que los datos sean una muestra aleatoria independiente. Transformar los datos

Página 7 de 8

A veces es posible transformar los datos mediante la aplicación de una función para que los datos se ajusten a una distribución normal, para poder terminar el análisis. Transformar datos no normales Usted puede transformar los datos usando muchas funciones, tales como la raíz cuadrada, el logaritmo, la potencia, la recíproca o el arcoseno. 

Para aplicar estas transformaciones directamente a los datos en la hoja de trabajo, utilice la Calculadora de Minitab.



Para realizar una transformación de Box-Cox, elija Estadísticas > Gráficas de control > Transformación Box-Cox. Minitab determina una transformación óptima de potencia. La transformación de Box-Cox es fácil de entender, pero es limitada y, con frecuencia, no determina una transformación adecuada. Además, está disponible solo para datos que son positivos.



Para realizar la transformación de Johnson, elija Estadísticas > Herramientas de calidad > Transformación de Johnson. Si el algoritmo de Box-Cox no determina una transformación adecuada, pruebe con la transformación de Johnson. La función de transformación de Johnson es más complicada, pero es muy efectiva para determinar una transformación adecuada.

Los datos normales de muestras pequeñas pueden no parecer normales Para evaluar una gráfica, suele ser útil generar varios conjuntos de datos que no tengan problemas con la normalidad para entrenar la vista. Los siguientes son nueve conjuntos de datos tomados de una distribución normal. Estos ejemplos no tienen problemas; sin embargo, la mayoría de estos histogramas probablemente no parezcan tener forma de campana para un observador no entrenado.

Página 8 de 8

3. ¿Qué es la distribución de Poisson en estadística? En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo. 4. ¿Qué mide la campaña de Gauss? Campana de Gauss, es una representación gráfica de la distribución normal de un grupo de datos. Éstos se reparten en valores bajos, medios y altos, creando un gráfico de forma acampanada y simétrica con respecto a un determinado parámetro. Se conoce como curva o campana de Gauss o distribución Normal. 5. ¿Qué es una distribución discreta? Distribuciones probabilidad discreta. Una distribución de probabilidades para una variable aleatoria discreta es un listado mutuamente excluyente de todos los resultados numéricos posibles para esa variable aleatoria tal que una probabilidad específica de ocurrencia se asocia con cada resultado. 6. ¿Qué es la distribución muestral en estadística? En estadística, la distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población. 7. ¿Cuál es el valor de z? El valor Z es un estadístico de prueba para las pruebas Z que mide la diferencia entre un estadístico observado y su parámetro hipotético de población en unidades de la desviación estándar. Por ejemplo, un conjunto de moldes de fábrica tiene una profundidad media de 10 cm y una desviación estándar de 1 cm. 8. ¿Qué significa 2 desviaciones estándar? La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra....


Similar Free PDFs