Problemas Inferencia Estadística 2018-2019 PDF

Title Problemas Inferencia Estadística 2018-2019
Author Natalia Romero Lustres
Course Estadística
Institution Universidade da Coruña
Pages 6
File Size 252.2 KB
File Type PDF
Total Downloads 66
Total Views 140

Summary

DEPARTAMENTO DE MATEMÁTI CASFACULTAD DE CI ENCI AS, GRADO EN BI OLOGÍ AESTADÍ STI CA, curso 20 18- 201 9BOLETÍN DE PROBLEMAS DE INFERENCIA ESTADÍSTICATEMA 3 INTRODUCCIÓN INFERENCIA ESTADÍSTICA. Estimación Puntual1.- Los investigadores que estudian el fotoperiodo utilizan como planta experimental el ...


Description

DEPARTAMENTO DE MATEMÁTI CAS FACULTAD DE CI ENCI AS, GRADO EN BI OLOGÍ A ESTADÍ STI CA, curso 2018-2019

BOLETÍN DE PROBLEMAS DE INFERENCIA ESTADÍSTICA TEMA 3.1 INTRODUCCIÓN INFERENCIA ESTADÍSTICA. Estimación Puntual 1.- Los investigadores que estudian el fotoperiodo utilizan como planta experimental el cardillo. La variable observada es X=”número de horas de oscuridad ininterrumpida por día, necesarias para producir floración”. Se han obtenido los siguientes datos: 15.0, 13.0, 15.1, 15.0, 13.5, 15.5, 13.2, 14.9, 14.7. Encontrar estimaciones insesgadas para la media de X y su desviación típica. sol.: x = 14.4333 horas; sˆ = 0.9327 horas. 2.- El herpes simple, un virus muy común, produce una de las formas más molestas de enfermedad venérea. Un estudio reciente probó un ungüento que contenía el azúcar 2 -dexi-D-glucosa, sobre 36 mujeres con infecciones genitales de herpes. En el transcurso de cuatro días, los síntomas disminuyeron en 32 de los 36 casos. Encontrar una estimación puntual para p, proporción de mujeres para las que este tratamiento será eficaz. sol.: pˆ = 0.89 3.- Para estudiar la proporción p de caballos afectados por la peste equina se les va a someter a una prueba. Se sabe que la prueba será positiva si el animal está enfermo; pero si está sano, hay una probabilidad 0.04 de que la prueba resulte también positiva. a) Hallar la relación entre la probabilidad p de estar enfermo y la probabilidad q de dar positivo en la prueba. b) Obtener una estimación puntual de la proporción p de caballos afectados por la peste equina sabiendo que 500 ejemplares son sometidos a la prueba y resulta positiva en 95 casos. c) Si realmente hay un 20% de caballos afectados por la epidemia, ¿cuál es la probabilidad de que la prueba resulte positiva en, al menos, 95 ejemplares de los 500? sol.: a) q=p+0.04(1-p); b) 0.1562; c) 0.9850

TEMA 3.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA (Escribir la variable de interés y su distribución)

1.- Considerar dos intervalos de confianza del 95% para una media µ, construidos a partir de muestras de tamaños n1 y

n2 extraídas de la misma población. Si n1 > n2 , ¿qué intervalo de confianza tendrá mayor longitud? sol.: El basado en la muestra de tamaño n2 . 2.- Considerar 200 muestras de tamaño n=25 extraídas de una población de media µ desconocida. Suponiendo que las 200 muestras se utilizan para construir 200 intervalos de confianza del 90% para µ, ¿cuántos de estos intervalos esperarías que no contuvieran a µ? sol.: Aproximadamente 20 intervalos. 3.- Supongamos que la variable X=”número de microgramos de partículas en suspensión por metro cúbico de aire” está normalmente distribuida con media y varianza desconocidas. Hallar un intervalo de confianza del 99% para la media µ de X, en base a los valores de la siguiente muestra aleatoria simple: 58, 70, 57, 61, 59. ¿Cuál es la estimación puntual de la 2 varianza σ ? sol.: [50.203, 71.797], estimación Sˆ 2 = 27.5 . 4.- El calibre de un árbol es el diámetro medido 6 pulgadas por encima del suelo. Se ha obtenido una muestra de 16 árboles de entre 12 y 14 pies de altura cultivados en un vivero particular y se ha determinado el calibre de cada uno de ellos. Se obtuvieron los siguientes datos: 2.3 1.9 1.7 2.1 1.5 1.8 1.8 1.1 2.1 1.5 2.0 1.6 1.3 1.6 1.5 1.3 Hallar un intervalo de confianza del 95% para el calibre medio de los árboles cultivados en el vivero, suponiendo que la distribución de la variable calibre es normal. ¿Cuál es el error de estimación cometido? sol.: [1.517, 1.87], error=0.1765.

5.- En una población se desea conocer el porcentaje de individuos alérgicos al polen de las acacias. En 100 individuos tomados al azar se observaron 10 alérgicos. Hallar el intervalo de confianza al 95% para dicho porcentaje. sol.: [0.0412, 0.1588]. 6.- Al realizar un recuento de leucocitos se extiende una gota de sangre fina y uniformemente, sobre un soporte de vidrio, se tiñe con tintura de Wrigth, y se examina al microscopio. De los 200 leucocitos contabilizados, 125 fueron neutrófilos, unos leucocitos que se producen en la médula ósea y cuya función, en parte, es la de eliminar agentes infecciosos de la sangre. a) Encontrar un intervalo de confianza del 90% para p, la proporción de neutrófilos entre los leucocitos del individuo. b) En un individuo de salud normal, el porcentaje de neutrófilos entre los leucocitos es del 60% al 70%. Basándose en el intervalo obtenido en el apartado anterior, ¿hay evidencia clara de un desequilibrio de neutrófilos en el individuo? Razonar la respuesta. sol.: a) [0.569, 0.681]; b) No.

TEMA 3.3 CONTRASTES DE HIPÓTESIS 1.- Un contraste de hipótesis mide el nivel de “desacuerdo” entre la muestra y la hipótesis (nula/alternativa). 2.- Un contraste de hipótesis se dice “estadísticamente significativo” si se (acepta/rechaza) la hipótesis nula. 3.- La hipótesis nula H0 es rechazada a un nivel de significación del 5%. ¿Verdadero o falso? a) El p-valor es mayor que 0.05 (V/F) b) El p-valor es menor o igual que 0.05 (V/F) c) El resultado es estadísticamente significativo a un nivel del 5% (V/F) d) El resultado es estadísticamente significativo a un nivel del 10% (V/F) 4.- Si queremos disminuir simultáneamente la probabilidad de error tipo I y la probabilidad de error tipo II a) aumentamos el tamaño de la muestra. (V/F) b) disminuimos el nivel de confianza. (V/F) c) nunca se puede conseguir disminuir ambas probabilidades de error a la vez. (V/F) 5.- Se acepta la hipótesis nula H0 si a) el estadístico está dentro de la región crítica (V/F) b) el estadístico es menor que el nivel de significación α (V/F)

TEMAS 3.5 Y 3.6 CONTRASTES DE HIPÓTESIS PARA UNA Y DOS MUESTRAS En los ejercicios tiene que figurar claramente cuáles son la hipótesis nula y la alternativa, la explicación de por qué se usa un contraste paramétrico o no paramétrico, el estadístico de contraste, su valor bajo H0 para la muestra dada y el p-valor. (Realizar un estudio previo de la normalidad de la/s variable/s de interés).

1.- Uno de los efectos del DDT sobre los pájaros es la inhibición de la producción de enzima anhidrasa carbónica. Esta enzima controla el metabolismo del calcio. Se cree que, como resultado final, las cáscaras de los huevos son mucho más finas y débiles de lo normal. Para comprobar esta teoría, se realizó un estudio alimentando a los gavilanes con una mezcla de 3 partes por millón (ppm) de dieldrina y 15 ppm de DDT. Se comparó el espesor de las cáscaras con el espesor medio conocido para pájaros no afectados por el DDT y se anotó el porcentaje de disminución de espesor en las cáscaras. Una muestra aleatoria de 16 gavilanes dio lugar a los siguientes porcentajes de disminución: 4.364 14.258 4.822 5.618 16.389 7.765 6.678 17.255 7.578 -1.799 1.569 14.571 9.618 1.254 9.016 7.656 a) ¿Qué porcentaje, de media, ha disminuido el espesor de las cáscaras de los 16 gavilanes? b) ¿Crees que la teoría ha sido estadísticamente corroborada? Explicar la respuesta en base al p-valor. sol.: Ha disminuido una media muestral de 7.924% Aceptamos que disminuye el espesor con un p-valor=1.918×10-5 2.- Los murciélagos al volar localizan un objeto sólido emitiendo agudos chillidos y escuchando el eco. Se piensa que el alcance medio efectivo máximo para este sistema de localización por eco es de más de 6 metros. Para confirmar esta hipótesis, se seleccionó una muestra aleatoria de 16 murciélagos. Cada murciélago fue soltado en un área grande y cercada, que contenía un único obstáculo. Se anotó la distancia del objeto a la que se observó que viraba el murciélago. Se repitió el experimento varias veces para cada murciélago, y se determinó la distancia media de viraje para cada uno de ellos:

6.2 5.9

6.8 6.3

6.1 6.4

5.7 6.0

6.1 6.3

6.3 6.2

5.8 5.9

6.3 6.1

a) ¿Es la media observada de las distancias de viraje de los murciélagos de la muestra mayor que 6 m? b) ¿Hay evidencias estadísticas de que el alcance medio efectivo máximo para este sistema de localización por eco es de más de 6 metros? Hallar el p-valor del contraste que consideres oportuno. ¿Qué tipo de error se puede estar cometiendo? sol.: Sí ( x = 6.15 y sˆ = 0.2658). Se confirma la hipótesis (p-valor=0.01968). El posible error es el tipo I. 3.- Se ha recibido un envío de latas de conserva de las que se afirma que el peso medio es de 1000 gramos. Se examina una muestra de 5 latas y se obtienen los siguientes pesos: 1007.784 995.046 1000.105 963.729 1010.364 a) ¿Es el peso medio de las 5 latas igual a 1000 gramos? b) ¿Hay evidencias de que el peso medio de las latas no sea igual a 1000 gramos con un nivel de significaciónα=0.05? Sol.: No, (peso medio muestral=995.4056 gr, cuasi-desviación típica muestral=18.726 gr). b) No, p-valor=0.6124.

4.- El calcio se presenta normalmente en la sangre de los mamíferos en concentraciones de alrededor de 6 mg/100mL. Una serie de 9 pruebas realizadas sobre un paciente dieron las siguientes concentraciones: 5.299 5.121 6.208 8.951 7.739 5.848 9.058 8.191 3.165 a) ¿Cuál es la concentración media de las 9 pruebas? b) ¿Hay evidencias de que el nivel medio de calcio para este paciente sea más alto de lo normal? sol.: a) x = 6.62 y sˆ = 1.993 b) No, el p-valor es 0.189 aproximadamente; 5.- Los terrenos de pasto bien desarrollados contienen micorrizas que estimulan el crecimiento de tréboles y césped. El número de esporas por gramo de tierra en buenos terrenos de pastos es aproximadamente 9. Se piensa que en áreas erosionadas, la presencia de micorrizas está altamente reducida. ¿Apoyan este argumento los siguientes datos, extraídos de 20 áreas erosionadas? 0.01 0.02 0.06 0.08 0.12

Número de esporas por gramo de tierra 0.15 0.32 0.16 0.48 0.24 0.54 0.28 0.92 0.30 1.52

1.64 2.7 2.7 8.24 9.3

sol.: Sí, p-valor < 0.0001 6.- Para estudiar el efecto del ejercicio físico sobre el nivel de triglicérido s, se ha realizado el siguiente experimento con 11 individuos: previo al ejercicio, se tomaron muestras de sangre para determinar el nivel de triglicéridos por 100 ml de sangre, de cada sujeto. Después, los individuos fueron sometidos a un programa de ejercicios que se centraba diariamente en carreras y marchas. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de triglicéridos: Sujeto 1 Previo 68 Posterior 95

2 77 90

3 94 86

4 73 58

5 37 47

6 131 121

7 77 136

8 24 65

9 99 131

10 62 64

11 116 104

a) Hallar un intervalo de confianza del 95% para la media del cambio en el nivel de triglicéridos. b) ¿Hay pruebas suficientes para afirmar que el ejercicio físico produce cambios en el nivel de triglicéridos? sol.: a) [-3.7708, 29.0435]; b) No, p-valor=0.1169

7.- Se ha realizado un estudio para comparar el contenido de sodio en el plasma de la piel de las focas australes jóvenes, con el nivel de sodio de la leche de las focas. Los resultados obtenidos, sobre el contenido de sodio en la piel y en la leche de 10 focas aleatoriamente seleccionadas son: Foca Leche Plasma

1 93 147

2 104 147

3 95 142

4 81.5 141

5 95 142

6 95 147

7 76.5 148

8 80.5 144

9 79.5 144

10 87 146

Hallar un intervalo de confianza del 95% para la diferencia media de niveles de sodio en los dos fluidos corporales. ¿Hay pruebas suficientes para afirmar que existe alguna diferencia? sol.: [-62.59, -49.61]; Sí, p-valor= 1.108×10-8

8.- Se realiza un estudio sobre el comportamiento del cortejo de pinzones cebra domesticados para determinar el efecto del color del pico de la hembra sobre el número de tipos de canto utilizados por el macho durante el cortejo. Se cree que el pico rojo, signo de madurez, irá unido a más tipos de canto que el pico negro. Diez machos se presentan por separado a una hembra en celo de pico rojo y a otra de pico negro y se mide el número medio de tipos de canto con cada hembra durante tres periodos de observación de 10 minutos: Pájaro macho Pico rojo Pico negro

1 5.24 1.19

2 2.21 1.69

3 1.7 2.84

4 1.09 1.98

5 5.7 2.66

6 16.9 7.9

7 17.08 14.78

8 11.17 15.66

9 15.18 11.06

10 14.72 20.08

Contrastar, con α=0.10, si el pico rojo, signo de madurez, irá unido a más tipos de canto que el pico negro. sol.: No, p-valor= 0.3125 9.- Se lleva a cabo un estudio para comparar algunos de los atributos físicos de las nadadoras olímpicas con los de las corredoras olímpicas. Una variable de interés es la grasa corporal total en kilogramos. Se han obtenido muestras de 12 corredoras y 10 nadadoras: corredoras 11.2 nadadoras 14.1

10.1 15.1

9.4 11.4

9.2 14.3

8.3 9.2

8.2 12.7

7.6 13.7

7.3 11.9

6.9 10.7

5.5 8.7

5.0

3.7

a) Hallar un intervalo de confianza del 95% para la diferencia de grasa corporal total media entre corredoras y nadadoras olímpicas. b) ¿Existe diferencia significativa entre la cantidad media de grasa total de corredoras y nadadoras olímpicas? Razonar la respuesta en base a este intervalo y calculando el correspondiente p-valor. sol.: a) [-6.435, -2.525]. b) El intervalo indica, claramente, que las corredoras tienen distinta cantidad media de grasa corporal que las nadadoras (p-valor= 0.0001144) 10.- Se tienen muestras de dos especies de ninfas de un ácaro a las que se ha medido la longitud de la base del quilícero en unidades micrométricas: Muestra A Muestra B

104 100

129 105

122 107

114 107

116 108

118 111

118 117

119 120

122 121

123 124

125

126

126

128

128

128

¿Hay diferencias significativas en la longitud de la base del quilícero entre ambas especies? sol.: Sí, p-valor=0.002816 11.- Se desea comparar un nuevo tratamiento posquirúrgico con el tratamiento usual. Para ello, siete personas recibieron el nuevo tratamiento, mientras que otras siete recibieron el usual. Los tiempos de recuperación, en días, fueron los siguientes: Tratamiento nuevo Tratamiento usual

2 8

3 13

5 14

2 30

20 32

21 35

27 40

¿Puede concluirse que el tiempo de recuperación es diferente según el tratamiento que se aplique? ¿Y que el tiempo de recuperación es menor con el tratamiento nuevo? sol.: Sí es diferente (p-valor= 0.0474); el tiempo de recuperación es menor (p-valor= 0.0237)

12.- Para estudiar la bondad de la adaptación al espacio europeo, en una asignatura se dividió a los alumnos en dos grupos: uno de ellos recibiría clases de manera tradicional, mientras que para el otro se adaptaría la asignatura al EEES. Las calificaciones finales fueron las siguientes: Tradicional Adaptada al EEES

6.6 8

7.6 8.2

7.4 6.4

6.4 8.1

6.8 7.5

6.7 8.0

7.3 8.6

9.1 8.1

6.2 5.1

9.9 8.4

7.7 5.9

6.3 8.5

8.4

7.8

¿Puede concluirse la calificación final es diferente según el método de enseñanza que se aplique? ¿Y que es mejor con la adaptación al EEES? sol.: No: p-valor= 0.1726 y p-valor= 0.08629 respectivamente.

13.- Con el fin de estudiar el efecto de los rayos X sobre la viabilidad huevo-larva en "tribolium castaneum" se irradiaron 100 huevos, de los que solamente resultaron 57 larvas. Sabiendo que la viabilidad normal de esta especie es del 63%, ¿hay evidencias estadísticas, al nivel de significación α=0.05, de que la radiación ha tenido efecto sobre la viabilidad? sol.: No podemos afirmar que la radiación haya disminuido la viabilidad normal de esta especie (p-valor=0.107)

14.- Entre los pacientes con cáncer de pulmón, generalmente el 90% muere en el espacio de tres años. Como resultado de unas nuevas formas de tratamiento se cree que esta tasa se ha reducido. En un reciente estudio sobre 150 pacientes diagnosticados con cáncer de pulmón, 128 murieron en el espacio de tres años. ¿Hay pruebas suficientes para asegurar que los nuevos métodos de tratamiento son más eficaces que los antiguos, con un nivel de significaciónα =0.05? sol: Sí, el p-valor es 0.0284

15.- Se efectúa un estudio sobre el color de los escarabajos tigre para conseguir pruebas que apoyen el argumento de que la proporción de escarabajos negros puede variar de un lugar a otro. En una muestra de 500 escarabajos capturados en una extensión próxima a Providence, Rhode Island, 95 eran negros. Una captura de 112 escarabajos en Aqueduct, Nueva York, contenía 17 individuos negros. a) Hallar una estimación puntual para la diferencia entre las proporciones de escarabajos negros en las dos regiones. En base a esa estimación, ¿crees que hay diferencia entre las proporciones poblacionales? b) Responder a la pregunta efectuando un contraste de hipótesis. ¿Cuál es su p-valor? sol.: a) 0.0382 b) A un nivel de significación de 0.05 no podemos afirmar que exista diferencia entre las proporciones de escarabajos negros en las regiones estudiadas (p-valor=0.3445)

16.- Se han realizado diversos estudios analizando la incidencia de la malaria en niños africanos heterocigóticos respecto al gen asociado a la anemia falciforme, y en niños homocigóticos normales. En un estudio realizado por ALLC se obtuvieron los siguientes datos: de 136 niños heterocigóticos, 36 sufrieron la malaria, mientras que de 407 homocigóticos, la sufrieron 152. ¿Hay evidencia estadística (al nivel α=0.05) de que los heterocigóticos están mejor protegidos frente a la malaria que los homocigóticos normales? sol.: Sí, p-valor=0.0105

17.- En una granja experimental se intenta comparar la virulencia de dos organismos patógenos causantes de epidemias en los pollos. De 200 pollos inoculados con el organismo A, 137 manifestaron síntomas durante los 14 primeros días. De 150 pollos inoculados con el organismo B, 98 manifestaron síntomas durante los 14 primeros días. ¿Existe diferencia entre la virulencia de los dos organismos? Razonar en base al p-valor. sol.: No, p-valor= 0.5352

18.- (Mayo 2013) Para evaluar la influencia de la acidosis metabólica (codificado por 1="controles"; 2="acidosis metabólica") del recién nacido sobre los niveles de glucemia medidos en el cordón umbilical del mismo, se han obtenido los datos que figuran en el fichero AcidosisMetabólica.rda. a) En base a esta muestra y con un 2.5% de significación, ¿podría afirmarse que el porcentaje de bebés con nivel de glucemia superior a 60 mg/dL es mayor que el 75%? b) En base a esta muestra y con un 5% de significación, ¿puede afirmarse que la mediana del nivel de glucemia en bebés con acidosis metabólica es inferior a 80 mg/dL? Contestar mediante el test de los signos, sin estudiar previamente la normalidad de la variable de interés. sol.: a) No, p-valor= 0.4148; b) No, p-valor= 0.3770

19.- (Julio 2013) Se ha realizado un estudio para determinar si se puede predecir la estatura que tendrá una persona adulta en la actualidad a partir de su altura a los dos años de edad. En el fichero DatosAlturas.rda figuran las alturas de doce personas adultas en la actualidad y cuando tenían dos años. a) A partir de los individuos de la muestra, calcula un intervalo de confianza para la altura media de una persona adulta en la actualidad con un nivel de confianza del 95%. b) Se sabe que la altura media de una persona adulta en esta población hace 25 años era 170 cm. ¿Avalan los datos de la muestra, con un 5% de significación, que la altura media de una persona adulta ha aumentado con respecto a su valor de hace 25 años? sol.: a) [167.86, 176.32] b) ...


Similar Free PDFs