Title | ejercicios resueltos estadística descriptiva |
---|---|
Author | Isabel Millan Diaz |
Course | Estadística |
Institution | Universidad de Huelva |
Pages | 6 |
File Size | 319.7 KB |
File Type | |
Total Downloads | 18 |
Total Views | 163 |
ejericcios resueltos estadística descriptiva. ambientales primer año ...
Relación de problemas de ESTADÍSTICA. Grado en Ciencias Ambientales - Geología.
Bloque 1. ESTADÍSTICA DESCRIPTIVA
1. Tras tomar una muestra de técnicos y analistas se les pide que hagan una predicción sobre los gastos necesarios para recuperar ciertos terrenos contaminados para el próximo año. Los resultados aparecen resumidos en la siguiente tabla: Predicción (miles de €) Nº de analistas
90-100 5
100-110 2
110-120 3
120-130 6
130-140 4
a. Calcular la predicción media de los analistas, así como la desviación típica asociada. b. Teniendo en cuenta que las predicciones ofrecidas por otro grupo de analistas tenían asociada un coeficiente de variación igual a 0.95. ¿Qué predicciones son más representativas? Justifica tu respuesta. c. Calcula la predicción máxima para el 50% de los analistas que indican los gastos más bajos.
2.
En un estudio sobre contaminación sonora, se localizan dos zonas (A y B) en las que se dan niveles de ruido alto y sobre las que se toman mediciones en 100 puntos de observación aleatorios en cada zona, obteniéndose los siguientes resultados (medidas en decibelios) Zona A Nivel de ruido Observaciones (dB) 70 10 80 15 90 40 100 25 110 10
Zona B Nivel de ruido Observaciones (dB) 90 10 100 15 110 40 120 25 130 10
a. Calcular los valores medios y desviaciones típicas para cada zona. ¿Cuál de los dos conjuntos de datos es más homogéneo? b. ¿Cuál es la medición que obtenemos cuando contabilizamos el primer 40% de los datos de cada zona? c. A partir de 90 dB los ruidos se consideran muy molestos, pudiendo provocar daños y dolor, ¿qué porcentaje de observaciones igualan o superan los 90 dB en cada caso? d. ¿Entre qué dos mediciones se sitúa el 20% de los niveles de ruido más altos en cada zona?
Estadística Grado CCAA - Geología
3. Con el fin de controlar la contaminación de un río, todas las semanas se hace una medición del nivel de ácido úrico. a) Las mediciones durante 10 semanas fueron: 13, 10, 7, 5, 12, 7, 9, 8, 5, 5 Hallar el nivel de ácido úrico mediano. b) En un estudio más completo, las mediciones durante 30 semanas de ácido úrico se resumieron de la siguiente forma: Percentil 20 40 70 100 Nivel de ácido úrico 6 8 12 18 Hallar el nivel medio de ácido úrico y dibujar el histograma (indicando previamente las clases, marcas de clase y frecuencias proporcionadas por la información muestral) c)
¿En qué intervalo estaría la medición que se da con más frecuencias de ácido úrico? ¿Cuál es su valor?
4. La siguiente gráfica muestra el histograma correspondiente a un conjunto de 50 mediciones del porcentaje del gasto en sanidad sobre el gasto total mensual en familias del mismo tamaño: Se pide: a. Determinar la tabla estadística (intervalos de valores, marcas de clase, frecuencias absolutas, absolutas acumuladas, frecuencias relativas y densidades de frecuencias). b. Sabiendo que ∑xini=157.3 y ∑xi2ni =497.225, calcular el porcentaje medio del gasto y su desviación típica. ¿Qué puedes decir de la representatividad de este porcentaje medio?
5. A partir de una muestra de 100 vehículos sobre la variable X="gramos dióxido de carbono (CO2) emitidos por kilómetro en coche" se ha obtenido el siguiente polígono de frecuencias absolutas acumuladas. a.
Señala la respuesta correcta. El 48% de los vehículos que más emiten tienen como valor mínimo de emisión 250g/km. Sólo 14 vehículos tienen una emisión superior a 240g/km. El valor máximo de emisión para el primer 74% de los vehículos es de 260g/km Sólo 3 vehículos tienen una emisión igual a 220g/km.
b.
Calcula el valor medio de las emisiones y su desviación típica.
Estadística Grado CCAA - Geología
RESULTADOS Ejercicio 1-Solución: a. Predicción media de los analistas y desviación típica asociada. Intervalos
Marca Clase xi 95 105 115 125 135
90 – 100 100 – 110 110 -120 120 – 130 130 -140
ni
x ini
xi ni
2
Ni
5 2 3 6 4 20
475 210 345 750 540 2320
45125 22050 39675 93750 72900 273500
5 7 10 16 20
2320 116 20 2
∑
2 2
273500 1162 20
219
219 14 '80 b.
Teniendo en cuenta que las predicciones del año anterior tenían asociada un coeficiente de variación igual a 0.95. ¿Qué predicciones son más representativas? Justifica tu respuesta. Son más representativas las predicciones de este año, ya que el coeficiente de variación es menor
0 '1275 (=14,8/116) c.
Calcula la predicción máxima para el 50% de los analistas que indican los gastos más bajos. Nos piden calcular la mediana Recuerda que la mediana pertenece al intervalo cuya primera frecuencia absoluta acumulada ascendente supere a N/2. N/2=20/2=10 Intervalo mediano: 120 -130
1
2
1
120
10 10 10 120 6
Estadística Grado CCAA - Geología
Ejercicio 2-Solución: a. ¿En cuál de las dos zonas los niveles de ruido son más homogéneos? Zona A xi 70 80 90 100 110
ni 10 15 40 25 10 100
Ni 10 25 65 90 100
9100 100 2
∑
xini 700 1200 3600 2500 1100 9100
2
xi ni 49000 96000 324000 250000 121000 840000
91 2 2
840000 100
8281 119
119 10'908 10 '908 0'119 91 Zona B xi 90 100 110 120 130
ni 10 15 40 25 10 100
Ni 10 25 65 90 100
Completa los cálculos y comprueba que:
xini 900 1500 4400 3000 1300 11.100
xi2 ni 81000 150000 484000 360000 169000 1.244.000
10 '908 0 '098 111
Los datos de la zona B son más homogéneos, porque el Coeficiente de Variación es menor. b. ¿Cuál es la medición que obtenemos cuando contabilizamos el primer 40% de los datos de cada zona? El percentil 40 para la zona A es 90 dB, mientras que para la zona B es 110 dB. c. A partir de 90 dB los ruidos se consideran muy molestos, pudiendo provocar daños y dolor, ¿qué porcentaje de observaciones igualan o superan los 90 dB en cada caso? El 75% de las mediciones en la zona A y el 100% de las observaciones de la zona B d. ¿Entre qué dos mediciones se sitúa el 20% de los niveles de ruido más altos en cada zona? Entre 100 y 110 dB para la zona A y entre 120 y 130 dB para la zona B
Estadística Grado CCAA - Geología
Ejercicio 3-Solución: a) Las mediciones durante 10 semanas fueron: 13, 10, 7, 5, 12, 7, 9, 8, 5, 5 Hallar el nivel de ácido úrico mediano. Datos ordenados
ni
5 7
3
3
2
5 = N/2
8
1
6
Ni
9
1
7
10
1
8
12
1
9
13
1
10
10
N/2=5 Mediana = 7,5 Valor medio entre los dos datos centrales b) Estudio más completo, las mediciones durante 30 semanas de ácido úrico: Percentil 20 40 70 100 Nivel de ácido úrico 6 8 12 18 Hallar el nivel medio de ácido úrico y dibujar el histograma (indicando previamente las clases, marcas de clase y frecuencias proporcionadas por la información muestral) Las dos primeras columnas se obtienen a partir de la información que nos da el enunciado (El porcentaje asociado al percentil indica el porcentaje total de observaciones que se contabilizan hasta llegar a un valor – es decir la frecuencia relativa acumulada): Intervalos
Fi
fi
ni
ai
xi
xini
di
[0 , 6]
20%
20%
6
6
3
18
1
(6 , 8]
40%
20%
6
2
7
42
3
(8 , 12]
70%
30%
9
4
10
90
2,25
(12 , 18]
100%
30%
9
6
15
135
1,5
100%
30
285
Medición media = 285/30=9,5 Histograma (las alturas asociadas a los intervalos vienen dadas por las densidades de frecuencias):
c)
¿En qué intervalo estaría la medición que se da con más frecuencias de ácido úrico? ¿Cuál es su valor?
Intervalos [0 , 6] (6 , 8] (8 , 12] (12 , 18]
ai 6 2 4 6
di 1 3 2,25 1,5
La medición más frecuente es un valor entre 6 y 8 = Intervalo modal Densidad mayor
1
1 1
6 1
2,25 2 7,38 2,25 1
Estadística Grado CCAA - Geología
Ejercicio 4-Solución: a) Tabla de valores
Intervalos 2,76 2,84 2,84 3,16 3,16 3,34 3,34 3,46 3,46 3,54
di 112,5 37,5 100 75 25
ai 0,08 0,32 0,18 0,12 0,08
ni 9 12 18 9 2 50
xi 2,8 3 3,25 3,4 3,5
fi 18,00% 24,00% 36,00% 18,00% 4,00%
Ni 9 21 39 48 50
Fi 18,00% 42,00% 78,00% 96,00% 100,00%
b) Comprueba los siguientes resultados: Media 3,146 Varianza
0,047184
Dev. Típica
0,2172188
Representatividad C.V. Pearson
6,90%
Ejercicio 5-Solución:
Polígono de frecuencias absolutas acumuladas. a. Señala la respuesta correcta: El 48% de los vehículos que más emiten tienen como valor mínimo de emisión 250g/km. Sólo 14 vehículos tienen una emisión superior a 240g/km. El valor máximo de emisión para el primer 74% de los vehículos es de 260g/km - Verdadera Sólo 3 vehículos tienen una emisión igual a 220g/km. Averigua porqué el resto son falsas b.
Calcula el valor medio de las emisiones y su desviación típica (las 2 primeras columnas de la tabla se obtienen del gráfico). xini
Xi2 ni
Valores (xi)
Ni
Fi
ni
220
0
0%
0
0
0
230
3
3%
3
690
158700
240
14
14%
11
2640
633600
250
48
48%
34
8500
2125000
260
74
74%
26
6760
1757600
270
97
97%
23
6210
1676700
280
N=100
100%
3
840
235200
100
25640
6586800
Comprueba que: Media = 256,4 Desviación típica = 11,27...