Title | Apuntes Distribución Normal |
---|---|
Course | Análisis de Datos |
Institution | Universitat Pompeu Fabra |
Pages | 7 |
File Size | 277.5 KB |
File Type | |
Total Downloads | 26 |
Total Views | 141 |
Download Apuntes Distribución Normal PDF
16/10/19 Anàlisi de dades
DISTRIBUCIÓN NORMAL I.
CURVA DE DENSIDAD
Curva de densidad: modelo de distribución → Describe de forma compacta el aspecto general de los datos. → Ignora pequeñas irregularidades y las observaciones atípicas. A. Características → El área por debajo de la curva total es igual a 1, representa la totalidad de las observaciones, el 100% → ES MAS FACIL TRABAJAR CON LA CURVA QUE CON EL HISTOGRAMA, pues el histograma depende de la elección que hacemos de las clases, pero la curva no depende de elecciones nuestras… B. Formas: ● Simetría ● Asimetría positiva (media > mediana) ● Asimetría negativa (media < mediana) C. Descripciones numéricas: 1. Mediana y cuartiles ● Mediana de una curva de densidad: punto del eje de las x que divide la curva en dos áreas iguales. ● Cuartiles: dividen el área por debajo de la curva en 4 partes iguales, 1/4 parte del área por debajo de la curva queda a la izquierda del primer cuartil y 3/4 partes quedan a la izquierda del tercer cuartil. ↳ Se localizan a simple vista ↳ Si no es simétrica es un poco mas costoso pero existen métodos 2. Media ● Simétrica → media = mediana ● Asimétrica a la derecha → media > mediana ● Asimétrica a la izquierda → media < mediana En una distribución asimétrica, la media se desplaza hacia la cola larga ↳ Se localiza a simple vista
1
3. Desviación estándar ↳ No se puede ver a simple vista, se calcula con métodos matemáticos. 4. Notación ● Cuando trabajamos con datos: - media → x -
desviación estándar → s
●
Cuando trabajamos con curva de densidad: - media → μ - desviación estándar → σ
II.
DISTRIBUCIÓN NORMAL
Curvas de densidad: - Simétricas - Con un solo pico - Forma de campana ↳ Curvas normales o campana de gauss A. Propiedades ● Simétrica ● Unimodal ↳ Debido a estas propiedades, se puede describir simplemente utilizando la media ( μ ) y la desviación estándar ( σ ): Su forma viene definida por éstos dos parámetros: ● μ indica la posición en el eje horizontal ●
σ el grado de apuntamiento de la curva
2
B. Regla 68- 95 – 99,7
Aunque existen muchas curvas normales todas cumplen esta regla - El 68% de las observaciones se encuentran en el intervalo ( μ - σ ; μ + σ ) -
El 95% de las observaciones se encuentran en el intervalo ( μ - 2σ ; μ + 2σ ) El 99.7% de las observaciones se encuentran en el intervalo ( μ - 3σ ; μ + 3σ )
Ejemplo: La distribución de la altura de los hombres adultos es aproximadamente normal N~(1,75; 0,06) ↳ μ = 1,75 ↳ σ = 0,06 Aplicamos la fórmula ( μ - 2σ ; μ + 2σ ) → 1,75 - (2x0,06) = 1,63 → 1,75 + (2x0,06) = 1 ,87 ● Esto implica que el 95% de los chicos miden (1,63 ; 1,87) ● El 5% restante tiene alturas situadas fuera del intervalo (1,63;1,87). Como la distribución es simétrica, 2,5% estarán en la cola baja y el 2,5% restante en la cola alta. Aplicamos la fórmula ( μ - 3σ ; μ + 3σ ) → 1,75 - (3x0,06) = 1,57 → 1,75 + (3x0,06) = 1 ,93 ● Prácticamente todos los chicos, el 99,7 tiene una altura entre (1,57; 1,93)
3
C. Normal estandarizada Si x es una observación de una distribución de media μ y desviación estándar σ , el valor estandarizado de x es:
z=
x−μ σ
De todas las distribuciones normales, la más utilizada es la distribución normal estandarizada: N(0,1) Se les llama valores → Z Los valores Z dicen en cuántas desviaciones típicas se encuentra la observación original de la media y en qué dirección. ● Las observaciones mayores que la media son positivas ● Las observaciones menores que la media son negativas Ejemplo: Si la altura de un chico es 1,80 con N~(1,75; 0,06):
z=
x−μ σ
→
z=
altura−μ → σ
z=
180−1,75 → 0,06
z = 0, 83
La altura estandarizada es el número de desviaciones estándar que su altura difiere (le separa) de la media de las alturas de todos las chicos. ↳ El chico de 1,80 m tiene una altura 0,83 desviaciones típicas mayor que la media. ● La “estandarización” nos da una medida común para todas las variables que se distribuyen normalmente. ● Esta transformación es útil ya que podemos saber la probabilidad de observar un dato con valor menor a Z. III. CÁLCULOS CON LA DISTRIBUCIÓN NORMAL Cualquier pregunta sobre qué proporción de observaciones se encuentra en algún intervalo de valores se puede responder hallando el área por debajo de la curva de ese intervalo. Como todas las distribuciones normales son la misma cuando las estandarizamos podemos hallar las áreas por debajo de cualquier curva normal utilizando una única tabla. → La tabla que informa sobre las áreas por debajo de la curva normal estandarizada A. Pasos - PASO 1: Plantea el problema en términos de la variable observada x - PASO 2: Estandariza x y plantea el problema en términos de la variable normal estandarizada. Sitúa el área de interés en la curva normal estandarizada - PASO 3: Halla el área buscada por debajo del a curva normal estandarizada, utilizando la TABLA A y recordando que el área debajo dela curva es 1.
4
Ejemplo: Que proporción de todos los chicos mide menos de 1,80 metros? Esta proporción es el área debajo de la curva de la N(1,75;0,06) situado a la izquierda de 1,80. PASO 1: x < 1,80 x−μ
PASO 2: σ
<
1,80−μ σ
PASO 3:
z=
1,80−1,75 0,06
= 0, 83
→ Fila 0,8 → Columna 0,03 → 0,7967 ↳ Casi el 80% de los hombre mide menos de 1,81 B. Tabla normal estándar La tabla solamente contiene información para valores de z= –3.49 a 3.49 ● ¿Qué hacemos cuando nos pidan el % para z3.49? ↳ Como el valor es cercano a la unidad, podemos decir que es del 100 % C. Cómo hallar un valor dada una proporción Nos dan un % y nos piden el valor de x correspondiente. PASO 1: Halla la proporción dada en la tabla PASO 2: Lee la z correspondiente PASO 3: Efectúa la operación contraria a la realizada al estandarizar para obtener el valor observado:
x = μ + zσ
5
Ejemplo: Las notas de Lengua de la prueba de acceso a la universidad de los estudiantes de secundaria tiene aproximadamente una distribución N(505,110) ↳ μ = 505 ↳ σ = 110 ¿Cuál debe ser la nota de un alumno para pertenecer al 10% de estudiantes de las mejores notas?
1. Queremos hallar x con un área a su derecha de 0,1% por debajo de una curva normal de media 505 y desviación estándar 110. O lo que es lo mismo hallar la nota x con un área de 0,9 a su izquierda 2. Buscamos en la tabla el valor más cercano a 0,9. Es 0,8997. Se corresponde con z=1,28. Esto indica que el valor de x se encuentra a 1,28 desviaciones típicas de la media de la distribución normal 3. Desestandarizar: ↳ μ = 505 ↳ σ = 110 ↳ z = 1,28
x = μ + zσ → x = 505 + 1, 28 × 110 → x = 645, 8 D. Valoración de la normalidad ¿Cómo saber que una distribución es normal para poder aplicar esta metodología? ● Diagnóstico visual: ○ Observaciones atípicas ○ Asimetrías ● Diagnóstico numérico: ○ Coeficientes de simetría y curtosis ○ Comprobar que la regla 68-95-99.7 se cumple
6
7...