Apuntes Distribución Normal PDF

Title Apuntes Distribución Normal
Course Análisis de Datos
Institution Universitat Pompeu Fabra
Pages 7
File Size 277.5 KB
File Type PDF
Total Downloads 26
Total Views 141

Summary

Download Apuntes Distribución Normal PDF


Description

16/10/19 Anàlisi de dades

DISTRIBUCIÓN NORMAL  I.

CURVA DE DENSIDAD

 Curva de densidad: modelo de distribución → Describe de forma compacta el aspecto general de los datos. → Ignora pequeñas irregularidades y las observaciones atípicas.  A. Características → El área por debajo de la curva total es igual a 1, representa la totalidad de las observaciones, el 100%  → ES MAS FACIL TRABAJAR CON LA CURVA QUE CON EL HISTOGRAMA, pues el histograma depende de la elección que hacemos de las clases, pero la curva no depende de elecciones nuestras…  B. Formas: ● Simetría ● Asimetría positiva (media > mediana) ● Asimetría negativa (media < mediana)  C. Descripciones numéricas:  1. Mediana y cuartiles  ● Mediana de una curva de densidad: punto del eje de las x que divide la curva en dos áreas iguales.  ● Cuartiles: dividen el área por debajo de la curva en 4 partes iguales, 1/4 parte del área por debajo de la curva queda a la izquierda del primer cuartil y 3/4 partes quedan a la izquierda del tercer cuartil.  ↳ Se localizan a simple vista ↳ Si no es simétrica es un poco mas costoso pero existen métodos  2. Media  ● Simétrica → media = mediana ● Asimétrica a la derecha → media > mediana ● Asimétrica a la izquierda → media < mediana En una distribución asimétrica, la media se desplaza hacia la cola larga  ↳ Se localiza a simple vista   

1

3. Desviación estándar  ↳ No se puede ver a simple vista, se calcula con métodos matemáticos.  4. Notación  ● Cuando trabajamos con datos: - media → x  -

desviación estándar → s

 ●

Cuando trabajamos con curva de densidad: - media → μ  - desviación estándar → σ 

 II.

DISTRIBUCIÓN NORMAL

 Curvas de densidad: - Simétricas - Con un solo pico - Forma de campana  ↳ Curvas normales o campana de gauss  A. Propiedades  ● Simétrica ● Unimodal  ↳ Debido a estas propiedades, se puede describir simplemente utilizando la media ( μ ) y la desviación estándar ( σ ):  Su forma viene definida por éstos dos parámetros: ● μ indica la posición en el eje horizontal ●

σ el grado de apuntamiento de la curva





2

B. Regla 68- 95 – 99,7 

  Aunque existen muchas curvas normales todas cumplen esta regla - El 68% de las observaciones se encuentran en el intervalo ( μ - σ ; μ + σ )  -

El 95% de las observaciones se encuentran en el intervalo ( μ - 2σ ; μ + 2σ )  El 99.7% de las observaciones se encuentran en el intervalo ( μ - 3σ ; μ + 3σ ) 

 Ejemplo: La distribución de la altura de los hombres adultos es aproximadamente normal N~(1,75; 0,06) ↳ μ = 1,75 ↳ σ = 0,06 Aplicamos la fórmula ( μ - 2σ ; μ + 2σ )  → 1,75 - (2x0,06) = 1,63 → 1,75 + (2x0,06) = 1  ,87 ● Esto implica que el 95% de los chicos miden (1,63 ; 1,87)  ● El 5% restante tiene alturas situadas fuera del intervalo (1,63;1,87). Como la distribución es simétrica, 2,5% estarán en la cola baja y el 2,5% restante en la cola alta. Aplicamos la fórmula ( μ - 3σ ; μ + 3σ )  → 1,75 - (3x0,06) = 1,57 → 1,75 + (3x0,06) = 1  ,93 ● Prácticamente todos los chicos, el 99,7 tiene una altura entre (1,57; 1,93)     

3

C. Normal estandarizada  Si x es una observación de una distribución de media μ y desviación estándar σ , el valor estandarizado de x es:

z=

x−μ σ



 De todas las distribuciones normales, la más utilizada es la distribución normal estandarizada: N(0,1) Se les llama valores → Z  Los valores Z dicen en cuántas desviaciones típicas se encuentra la observación original de la media y en qué dirección. ● Las observaciones mayores que la media son positivas ● Las observaciones menores que la media son negativas  Ejemplo: Si la altura de un chico es 1,80 con N~(1,75; 0,06):

 z=

x−μ σ

  →

z=

altura−μ →   σ

z=

180−1,75 →  0,06

z = 0, 83 

 La altura estandarizada es el número de desviaciones estándar que su altura difiere (le separa) de la media de las alturas de todos las chicos. ↳ El chico de 1,80 m tiene una altura 0,83 desviaciones típicas mayor que la media.  ● La “estandarización” nos da una medida común para todas las variables que se distribuyen normalmente. ● Esta transformación es útil ya que podemos saber la probabilidad de observar un dato con valor menor a Z.  III. CÁLCULOS CON LA DISTRIBUCIÓN NORMAL  Cualquier pregunta sobre qué proporción de observaciones se encuentra en algún intervalo de valores se puede responder hallando el área por debajo de la curva de ese intervalo.  Como todas las distribuciones normales son la misma cuando las estandarizamos podemos hallar las áreas por debajo de cualquier curva normal utilizando una única tabla. → La tabla que informa sobre las áreas por debajo de la curva normal estandarizada  A. Pasos  - PASO 1: Plantea el problema en términos de la variable observada x - PASO 2: Estandariza x y plantea el problema en términos de la variable normal estandarizada. Sitúa el área de interés en la curva normal estandarizada - PASO 3: Halla el área buscada por debajo del a curva normal estandarizada, utilizando la TABLA A y recordando que el área debajo dela curva es 1.

4

Ejemplo: Que proporción de todos los chicos mide menos de 1,80 metros? Esta proporción es el área debajo de la curva de la N(1,75;0,06) situado a la izquierda  de 1,80.  PASO 1: x < 1,80  x−μ

PASO 2: σ

<

1,80−μ  σ

  PASO 3:

z=

1,80−1,75 0,06

= 0, 83

→ Fila 0,8 → Columna 0,03 → 0,7967  ↳ Casi el 80%  de los hombre mide menos de 1,81  B. Tabla normal estándar  La tabla solamente contiene información para valores de z= –3.49 a 3.49  ● ¿Qué hacemos cuando nos pidan el % para z3.49? ↳ Como el valor es cercano a la unidad, podemos decir que es del 100 %  C. Cómo hallar un valor dada una proporción  Nos dan un % y nos piden el valor de x correspondiente.  PASO 1: Halla la proporción dada en la tabla PASO 2: Lee la z correspondiente PASO 3: Efectúa la operación contraria a la realizada al estandarizar para obtener el valor observado:

x = μ + zσ      

5

Ejemplo:  Las notas de Lengua de la prueba de acceso a la universidad de los estudiantes de secundaria tiene aproximadamente una distribución N(505,110) ↳ μ = 505  ↳ σ = 110 ¿Cuál debe ser la nota de un alumno para pertenecer al 10% de estudiantes de las mejores notas? 

  1. Queremos hallar x con un área a su derecha de 0,1% por debajo de una curva normal de media 505 y desviación estándar 110. O lo que es lo mismo hallar la nota x con un área de 0,9 a su izquierda 2. Buscamos en la tabla el valor más cercano a 0,9. Es 0,8997. Se corresponde con z=1,28. Esto indica que el valor de x se encuentra a 1,28 desviaciones típicas de la media de la distribución normal 3. Desestandarizar: ↳ μ = 505  ↳ σ = 110 ↳ z = 1,28

x = μ + zσ →  x = 505 + 1, 28 × 110 → x = 645, 8   D. Valoración de la normalidad  ¿Cómo saber que una distribución es normal para poder aplicar esta metodología?  ● Diagnóstico visual: ○ Observaciones atípicas ○ Asimetrías  ● Diagnóstico numérico: ○ Coeficientes de simetría y curtosis ○ Comprobar que la regla 68-95-99.7 se cumple 

6

7...


Similar Free PDFs