Title | V0.3 Estadística CASI-TODO- apuntes para examen |
---|---|
Author | Jesus Maria Villena Martin |
Course | Estadistica |
Institution | Universitat Oberta de Catalunya |
Pages | 152 |
File Size | 4.5 MB |
File Type | |
Total Downloads | 507 |
Total Views | 661 |
v 0 – 04/01/Este documento solo pertenece a la voluntad de ser compartido. Sócrates se equivocaba: el conocimiento no es lo único que crece al compartirse. ¡La alegría también! : )ESTADÍSTICAUOC – Ingeniería informática / curso 20 20 -A Unai, por la lucidez del @bucle_infinito y por sus magníficas c...
ESTADÍSTICA UOC – Ingeniería informática / curso 2020-21
v 0.3 – 04/01/21 Este documento solo pertenece a la voluntad de ser compartido. Sócrates se equivocaba: el conocimiento no es lo único que crece al compartirse. ¡La alegría también! : )
A Unai, por la lucidez del @bucle_infinito y por sus magníficas clases (¡apuntáos ya!), al cibergrupo, por su amistad : D al tHash_group, por su camaradería y a todxs quienes dicen “pero quiero” cuando sienten “no puedo”.
1
ESTO ESTÁ POR TERMINAR. FALTA: - Formulario - Teoría Muestreo - Teoría del TLC - Falta refinar formato - Pintar de azul solución ejemplos Corrección errores
2
ÍNDICE I.
ESTADÍSTICA DESCRIPTIVA................................................................................ 7 1.1.
Variables .............................................................................................................7
1.2.
Representaciones de datos ..................................................................................7
1.3.
Estadísticos .........................................................................................................7
1.3.1. 1.3.2. 1.3.3. 1.3.4. 1.3.5. 1.3.6. 1.3.7. 1.3.8.
Concepto y clasificación ........................................................................................................ 7 Media aritmética: .................................................................................................................. 7 Mediana ................................................................................................................................ 8 Varianza................................................................................................................................. 8 Desviación típica ................................................................................................................... 8 Coeficiente de variación ....................................................................................................... 8 Cuartiles ................................................................................................................................ 9 Moda ..................................................................................................................................... 9
1.4.
Cambios de escala y de origen..............................................................................9
1.5.
Construcción de tabla de frecuencias ................................................................. 10
PEC 1 – Cuestionario ...............................................................................................15 II.
Medidas de forma*** .....................................................................................23
PEC 1 – Práctica de R...............................................................................................25 III.
PROBABILIDAD ............................................................................................31 Cálculo de probabilidades .................................................................................. 31
3.1.
3.1.1. 3.1.2. 3.1.3. 3.1.4. 3.1.5. 3.1.6. 3.1.7. 3.1.8. 3.1.9. 3.1.10. 3.1.11. 3.1.12. 3.1.13. 3.1.14.
Regla de LaPlace.................................................................................................................. 31 Sucesos seguro .................................................................................................................... 31 Suceso imposible................................................................................................................. 31 Suceso opuesto ................................................................................................................... 31 Sucesos incompatibles ........................................................................................................ 31 Sucesos independientes ..................................................................................................... 32 Unión de sucesos COMPATIBLES ........................................................................................ 32 Unión de sucesos INCOMPATBILES..................................................................................... 32 Probabilidad condicionada ................................................................................................. 32 Intersección de sucesos DEPENDIENTES........................................................................ 33 Diferencia de sucesos..................................................................................................... 33 Leyes de Morgan ............................................................................................................ 33 Teorema de la probabilidad total: ................................................................................. 34 Teorema de Bayes: ......................................................................................................... 34
PEC 2 – CUESTIONARIO ...........................................................................................35 PEC 2 – Práctica de R...............................................................................................41 IV.
VARIABLES ALEATORIAS ..............................................................................45
4.1. 4.1.1. 4.1.2.
4.2. 4.2.1. 4.2.2. 4.2.3. 4.2.4. 4.2.5.
Tipos des de variables aleatorias ........................................................................ 45 Variables aleatorias DISCRETAS .......................................................................................... 45 Variables aleatorias CONTINUAS ........................................................................................ 45
Variables aleatorias discretas ............................................................................. 45 Concepto ............................................................................................................................. 45 Función de probabilidad de una variable aleatoria discreta .............................................. 46 Función de distribución de una variable aleatoria discreta................................................ 47 Esperanza matemática (E(x)) o media de una distribución discreta .................................. 48 Varianza (σ2) de una distribución discreta.......................................................................... 48
3
4.2.6. 4.2.7. 4.2.8.
Desviación típica (𝜎) de una distribución discreta.............................................................. 48 Distribución de Bernoulli .................................................................................................... 49 Distribución binomial .......................................................................................................... 49
Modelos de distribución discreta .......................................................................54
4.3. 4.3.1. 4.3.2. 4.3.3. 4.3.4. 4.3.5.
Distribución Uniforme Discreta .......................................................................................... 54 Distribución de Bernoulli .................................................................................................... 55 Distribución Binomial .......................................................................................................... 56 Distribución Geométrica ..................................................................................................... 57 Distribución de Poisson....................................................................................................... 58
Variables aleatorias continuas ...........................................................................59
4.4. 4.4.1. 4.4.2. 4.4.3. 4.4.4. 4.4.5. 4.4.6. 4.4.7. 4.4.8. 4.4.9.
Concepto ............................................................................................................................. 59 Distribución normal ............................................................................................................ 61 Uso de la tabla de la Distribución Normal (estadístico z) ................................................... 62 Cálculo de 𝑷𝒛 ≤ 𝒙𝟎 ............................................................................................................ 63 Cálculo de 𝑷𝒛 ≥ 𝒙𝟎 ............................................................................................................ 63 Cálculo de 𝑷𝒛 ≤ 𝒙𝟎 con x0 < 0 ........................................................................................... 64 Cálculo de 𝑷𝒂 ≤ 𝒛 ≤ 𝒙𝟎 en un intervalo ........................................................................... 64 Tipificación de variables normales ...................................................................................... 65 Aproximación de variables binomiales a Normal ............................................................... 66
Modelos de distribución continua ......................................................................67
4.5. 4.5.1. 4.5.2. 4.5.3.
Distribución Uniforme continua ......................................................................................... 67 Distribución Exponencial .................................................................................................... 69 Distribución Normal ............................................................................................................ 72
PEC 3 – Cuestionario ...............................................................................................73 PEC 3 – Práctica de R...............................................................................................80 V.
INTERVALOS DE CONFIANZA ............................................................................86 Conceptos previos .............................................................................................86
5.1. 5.1.1. 5.1.2. 5.1.3.
Intervalo de confianza......................................................................................................... 86 Nivel de confianza y nivel de significación .......................................................................... 86 Valor crítico ......................................................................................................................... 87
5.2.1. Intervalo de confianza para la media μ de una variable 𝑁𝜇, 𝜎 con VARIANZA POBLACIONAL CONOCIDA ................................................................................................................. 89 5.2.2. Intervalo de confianza para la media μ de una variable 𝑁𝜇, 𝜎 con VARIANZA POBLACIONAL DESCONOCIDA........................................................................................................... 89 5.2.3. Intervalo de confianza para la varianza 𝜎2 de una variable 𝑁𝜇, 𝜎..................................... 90 5.2.4. Intervalo de confianza para la diferencia de medias entre 2 poblaciones 𝑁𝜇1, 𝜎1 y 𝑁𝜇2, 𝜎2 90 5.2.5. Intervalo de confianza para la proporción poblacional en 𝐵𝑛, 𝑝 ....................................... 90 5.2.6. Intervalo de confianza para la diferencia de proporciones entre 𝐵𝑛1, 𝑝1 y 𝐵𝑛2, 𝑝2 ....... 90
5.2.
Expresión de un intervalo de confianza .............................................................. 89
PEC 4 – Cuestionario ...............................................................................................94 PEC 4 – Práctica de R............................................................................................. 101 VI.
CONTRASTE DE HIPÓTESIS .........................................................................105
6.1.
Conceptos previos ...........................................................................................105
6.2.
Tipos de contrastes paramétricos ..................................................................... 106
6.3.
Método para la resolución de un contraste de hipótesis ...................................107
6.4.
Error en el contraste de hipótesis ..................................................................... 107
4
Contrastes de hipótesis de 1 población.............................................................108
6.5. 6.5.1. 6.5.2. 6.5.3. 6.5.4. 6.5.5.
Contraste de hipótesis para la media μ con varianza σ conocida .................................... 108 Contraste de hipótesis para la media μ con varianza σ desconocida .............................. 108 Contraste de hipótesis para la proporción p .................................................................... 108 Contraste de hipótesis para la varianza σ 2 con media μ conocida................................... 108 Contraste de hipótesis para la varianza σ 2 con media μ desconocida ............................. 108
Contrastes de hipótesis de 2 poblaciones ......................................................... 109
6.6.
6.6.1. Contraste de hipótesis para la diferencia de medias μ1 – μ2 con varianzas poblacionales conocidas σ1 y σ2 ............................................................................................................................. 109 6.6.2. Contraste de hipótesis para la diferencia de medias μ1 – μ2 con varianzas poblacionales DESCONOCIDAS pero IGUALES σ1 = σ2............................................................................................ 109 6.6.3. Contraste de hipótesis para datos apareados .................................................................. 109 6.6.4. Otros contrastes de 2 poblaciones*** ............................................................................. 109
Ejemplos de contrastes de hipótesis para la media ........................................... 110
6.7. 6.7.1. 6.7.2. 6.7.3.
EJEMPLO 1: contraste para la media con varianza conocida BILATERAL ......................... 110 EJEMPLO 2: contraste para la media con varianza conocida UNIL. DERECHA ................. 111 EJEMPLO 3: contraste para la media con varianza conocida UNIL. IZQUIERDA ............... 112
Ejemplos de contrastes de hipótesis para la proporción .................................... 113
6.8. 6.8.1. 6.8.2. 6.8.3.
EJEMPLO 1: contraste para la proporción BILATERAL ...................................................... 113 EJEMPLO 2: contraste para la proporción UNILATERAL hacia la IZQUIERDA ................... 114 EJEMPLO 3: contraste para la proporción UNILATERAL hacia la DERECHA...................... 115
P-valor o nivel crítico ....................................................................................... 116
6.9. 6.9.1. 6.9.2. 6.7.4.
Concepto de p-valor .......................................................................................................... 116 Cálculo del p-valor ............................................................................................................ 116 Interpretación del p-valor y toma de decisión ................................................................. 116
PEC5 – Cuestionario .............................................................................................. 117 PEC 5 – Práctica de R............................................................................................. 125 VII.
CORRELACIÓN Y REGRESIÓN LINEAL ........................................................... 130
7.1.
Concepto de correlación .................................................................................. 130
7.2.
Diagrama de dispersión ................................................................................... 130
7.3.
Coeficiente de correlación LINEAL de Pearson ..................................................130
7.4.
Covarianza....................................................................................................... 131
7.5.
Recta de regresión ........................................................................................... 132
7.6.
Regresión lineal SIMPLE ................................................................................... 133
7.7.
Residuo ........................................................................................................... 133
7.8.
Método de los mínimos cuadrados...................................................................135
7.9.
Cálculo de la recta de regresión ........................................................................ 135
7.10.
Coeficiente de DETERMINACIÓN R2 .............................................................. 135
PEC 6 – Cuestionario .............................................................................................141 PEC 6 – Práctica de R............................................................................................. 146
5
6
ESTADÍSTICA / Estadística Descriptiva
ESTADÍSTICA DESCRIPTIVA
I. 1.1. -
Tipos de variables según lo que representan: Cualitativas Representan variedades o categorías. Cuantitativas Representan cantidades. Discretas No adopta todos los valores del conjunto. Continuas Pueden adoptar valores intermedios. Unidimensionales Representan una única propiedad de un individuo (sea o no una persona). Bidimensionales (x,y) en que x mide una propiedad e y otra.
1.2. -
Variables
Representaciones de datos
Tablas Gráficos: o Pictogramas o Diagramas de barras o Histogramas
1.3.
Estadísticos
1.3.1. Concepto y clasificación -
Valores calculables que proporcionan información sobre los datos estudiados. Se distinguen: o Medidas de centralización. o Medidas de dispersión. o Medidas de posicionamiento.
1.3.2. Media aritmética: Devuelve el valor promedio de una distribución de datos. Se define como: ∑𝑛𝑖=1 𝑥𝑖 · 𝑛 𝑖 𝑥 = 𝑛 Donde xi = valor de cada dato ni = frecuencia absoluta de cada dato (número de veces que aparece en la muestra) n = tamaño de la muestra 𝑛
Es decir, se cumple:
𝑖=1
∑ ni 7= 𝑛
ESTADÍSTICA / Estadística Descriptiva
1.3.3. Mediana Devuelve el valor central de la muestra una vez ordenados todos sus valores. -
Si se tiene una colección IMPAR de datos, corresponde al valor central. 5,7,4,6,2
-
2,4,5,6,7
La mediana es 5 (deja 2 valores a cada lado).
Si se tiene una colección PAR de datos, corresponde a la media aritmética de los 2 valores centrales: 5,7,4,6,2,9 2,4,5,6,7,9 La mediana es 5.5 (es la media de los valores 5 y 6 que dejan 2 valores a cada lado).
1.3.4. Varianza Informa sobre la dispersión de los datos en torno a la media aritmética. Es el cuadrado de la desviación típica. Se define como: ∑𝑛𝑖=1 𝑥𝑖2 · 𝑛 𝑖 − 𝑥 2 𝜎 = 𝑛 2
Ejemplo: 3,5,7,3
18 2 𝜎 2 = 32 · 2 + 52 · 1 + 72 · 1 − 𝑥 2 = 18 + 25 + 49 − ( ) = 71.75 4
1.3.5. Desviación típica
Informa sobre la dispersión de los datos en torno a la media aritmética. Es el cuadrado de la varianza: 𝜎 = √𝜎 2
1.3.6. Coeficiente de variación
Informa sobre la representatividad de la media de los datos. Se calcula como: Se cumple que 𝐶𝑉 ≥ 0. Según el valor de CV se puede inferir: 0 < 𝐶𝑉 < 0.5 { 𝐶𝑉 > ...