Cuadernillo ejercicios estadística apununed PDF

Title Cuadernillo ejercicios estadística apununed
Course Diseños de investigacion y analisis de datos
Institution Universidad a Distancia de Madrid
Pages 215
File Size 14.3 MB
File Type PDF
Total Downloads 65
Total Views 347

Summary

·:xio estudiante debe conocer, la Psicología es una disciplina académica, on y una ciencia que estudia la conducta y los procesos mentales de los Como ciencia utiliza el Método Científico en la investigación para cons- ra�e<os explicativos y teorías de la conducta susceptibles de comprobación IIJ...


Description

·:xio estudiante debe conocer, la Psicología es una disciplina académica, on y una ciencia que estudia la conducta y los procesos mentales de los Como ciencia utiliza el Método Científico en la investigación para consra�eas y gráficos y analizarlos, con los índices descriptivos, para obtener IX



Ejercicios y problemas resueltos y comenta!'-os. Diseftos de Investigación y análisis de datos

información que nos permita, en un segundo paso, formular hipótesis sustentada: en aquellos resultados. En segundo curso se cursa la asignatura de DISEÑOS DE INVESTIGACIÓN Y AN.tLISIS DE DATOS que dedica sus contenidos a la Estadística Inferencia! como herrcmienta aplicada en la que, dependiendo de la naturaleza de los datos muestrale:: recogidos en la investigación y, por supuesto, del diseño utilizado, tendrá que se· leccionar la técnica estadística más apropiada que se aplicará para la contrastació r empírica de la hipótesis formulada sobre la población. Con este motivo, en este texto se presenta una colección de situaciones, muchas de ellas inspiradas o extraídas de articulas publicados en revistas profesionales \ científicas, para que el estudiante lea la situación, la comprenda y vea los pasos que se siguen para contrastar la hipótesis que se formula. Para ello, se propone seguí' los siguientes pasos. l . CONDICIONES Y SUPUESTOS En todo análisis inferencia! el estudiante debe identificar la hipótesis de la investigación (resultado de la derivación de una teoría) así como, las variables (independientes y dependientes) implicadas en estas hipótesis y su naturaleza. Un aspecto esencial de este apartado son los supuestos que deben verificarse para que podamos confiar en los resultados obtenidos. Estos supuestos son condiciones que deben cumplirse para que el análisis tenga sentido. Además, cada análisis tiene sus propios supuestos. En la medida de lo posible estos también debe ponerse a prueba. Si no es posible hacerlo, deben hacerse explícitos. De alguna forma, son como los cimientos de un edificio. El edificio puede estar bien construido pero si los cimientos son de arena, el edificio no podrá sostenerse. Las condiciones hacen referencia a diversos aspectos del diseño. Por ejemplo, si los datos objeto de análisis provienen de una, dos o más de dos muestras, las cuales a su vez pueden ser independientes o relacionadas, de la escala de las variables, etc. Los contrastes a utilizar dependerán de estos factores. 2. FORMULACIÓN DE LAS HIPÓTESIS NULA Y ALTERNATIVA Una hipótesis es una conjetura que se formula sobre uno o más parámetros de la población (dependiendo del diseño) y que puede someterse a contrastación empírica a partir de los datos proporcionados por la o las muestras utilizadas en la investigación. Como se indica en el manual de la asignatura (Pág. 33): «En general, siempre se porte de algún interrogante que se planteo en el ámbito de uno investigación, o lo luz de un determinado morco teórico, y debería formularse de uno manera sencillo X

_ - " las mujeres en mayor proporción a partidos de centro izquierda que a derecha?; En el proceso de trabajo manual ¿es más eficaz verba/izar =..Jante la tarea que hacerlas en silencio?; ¿Es más eficaz una terapia •Nl'o :: = =,era el tratamiento de la fobia de los niños a montar en ascensores?; :;e hombres y mujeres son iguales por un mismo trabajo?».

---:es

--

Ea: = 2:,teada la pregunta se formulan las hipótesis nula, H a , y su comple.... a - 3Ótesis alternativa o H 1 que son exhaustivas y mutuamente excluyen-sg-r-;ica que el rechazo de una implica la aceptación de la otra. · nula es la hipótesis que provisionalmente se acepta como verdadera a que se somete a contrastación empírica con los datos obtenidos en ::.., (similar a la presunción de inocencia en un estado de derecho). To::ac_ -0s estadísticos se realizan asumiendo que Ha es correcta de tal forma ""EC"azamos, lo estaremos haciendo con un alto nivel de confianza. «En .. ::;ótesis nula afirma que no existe diferencia entre el valor del estadísen la muestra y el que formulamos como parámetro poblacional o, en , que la diferencia observada entre estos dos valores es nula. Como la :; .., e estos valores casi nunca van a coincidir, Jo que estamos afirmando _-=.-encia observada puede explicarse como resultado del azar» (Pág. 34). E-do de cómo se formulen la hipótesis nula y alternativa tendremos un -· ateral o bilateral pero, en todo caso, la hipótesis nula añadirá a la dife- e sentido de la diferencia y la hipótesis alternativa el sentido contrario, .a diferencia nula. Por ejemplo, ante la pregunta ¿Votan las mujeres en -,,x,cr-ción a partidos de centro izquierda que a los de centro derecha?, las se.,an: ..2S '"'1Ujeres votan en la misma o menor proporción a partidos de centro erda que de centro derecha . ..,ujeres votan en mayor proporción a partidos de centro izquierda que OE=:e11tro derecha . ...3S

.e ;enero/ la hipótesis científica, dirigida a encontrar resultados significati.. -oótesis alternativa que se aceptará como verdadera si la investigación e-J encías contra la hipótesis nula que es la que se somete a contrastación Pag. 37). Por lo general, pero no siempre, porque como se puede com--- 1arios de los ejemplos desarrollados en el libro de la asignatura y en los . . . , .se presentan es perfectamente legítimo, dependiendo del contexto y de e . defender que hombres y mujeres tienen el mismo salario, que niños 11os tienen el mismo rendimiento en tareas de compresión lectora, que ,. diferencias en la reacción de celos de hombres y mujeres ante la infideXI

'= = z-. :: encias entre la nota media obtenida en las prue=sae::::::.::ta.:s esrudiantes de la enseñanza pública y privada, etc. Per: a::.:::: - ::a --:ente como verdadera y sobre cuya asunción se realizan _ a:: ,'.'"C; es .a -2• ,a evidencia de los datos obtenidos en la investigación dirás - - - = - E o se rechaza esta afirmación de igualdad (la hipótesis nula) que puedes:: = -_:;e-.o para el que se ha desarrollado la investigación. 3. ESTADÍSTICO DE CONTRASTE «Representa una medida de la discrepancia entre la información proporciono:.; por los datos empíricos recogidos en la muestra y la proposición teórica planteo:.; en la hipótesis nula. Esta medida es una variable aleatoria con una determinoc: distribución de probabilidad (normal, t, chi-cuadrado, etc.) que va a aportar infc· moción empírica sobre la afirmación formulada en la H0 » (Pág. 37 y que se puec= ampliar en el epígrafe 1.4.3). Un estadístico no es más que una función numériG. dependiente de los valores muestra les, de la hipótesis nula supuesta verdadera y C= los supuestos. Es por ello que el cálculo que se realiza para computar el estadístic: de contraste se ha elegido para que nos proporcione una distribución estadístic: conocida que nos permite calcular las probabilidades de sus valores. El estadístico de contraste se reduce, pues, a una fórmula que se recoge en e formulario y que el estudiante no debe memorizar pero sí aplicarla correctamente para, una vez obtenido su valor, interpretarlo de cara a tomar una decisión respecte a la H0 : su rechazo o no con una determinada probabilidad. En definitiva, el contraste de hipótesis no es más que la combinación de la teoría de la probabilidad\ la teoría de la decisión. 4. REGLA DE DECISIÓN Para tomar una decisión hay que calcular el nivel crítico p o los valores críticos de la distribución de probabilidad del estadístico de contraste aplicado (distribución normal, t, F, chi-cuadrado, etc). «Según Fisher, el nivel de significación, a, representa el máximo riesgo que el investigador está dispuesto a cometer al tomar lo decisión errónea de rechazar una hipótesis nula verdadera. Por tanto, a la luz de sus resultados y del estadístico de contraste, el investigador calcula la probabilidad de obtener unos resultados como los observados en la muestra o más extremos. Esta probabilidad recibe el nombre de nivel crítico p. Si el nivel crítico p es muy pequeño en comparación con el nivel de significación, "alfa'; rechazamos la H0 y en caso contrario la mantenemos» (Pág. 38). «Otra alternativa a la hora de tomar la decisión de rechazar o no la hipótesis XII

Presentación



-'"siste en fijar el nivel de significación a, por lo que automáticamente se fija o ,afores críticos de la distribución muestra/ que marcarán la máxima dife=Je podemos admitir, por simple azar, entre el valor teórico planteado en H0 ,.obtenido en la muestra. Este valor, o valores críticos, definen -en la distri- Jestral del estadístico de contraste- los límites entre la zona de rechazo o - ..:0» (Pág. 38).

=

5i: :---

O, 975t

= 2,021

Probabilidad

1

2 3 4 28 29 JO 40 50 liO

0,5SO

0,600

0,650

0,700

0,750

0,800

0,850

0,900

0,950

0,975

0,990

0,995

0,158 0,142 0,137 0,134

0,325 0,289 0,277 0,271

0,510 0,445 0,424 0,414

0,727 0,617 0,584 0,569

1,000 0,816 0,765 0,741

1,376 1,061 0,978 0,941

1,963 1,386 1,250 1,190

3,078 1,886 1,638 1,533

6,314 2,920

2,706 4,303 3,182 2,776

31,821 6,965 4,541 3,747

63,657 9,925 5,841 4,604

0,127 0,127 0,127 0,126 0,126 0,126

0,256 0,256 0,256 0,255 0,255 0,254

0,389 0,389 0,389 0,388 0,388 0,387

0,530 0,530 0,530 0,529 0,528 0,527

0,683 0,683 0,683 0,681 0,679 0,679

0,855 0,854 0,854 0,851 0,849 0,848

1,056 1,055 1,055 1,0SO 1,047 1,045

1,313 1,311 1,310 1,303 1,299 1,296

1,701 1,699 1,697 1,684 1,676

2,048

2,467 2,462 2,457 2.423 2,403 2,390

2,763 2,756 2,750 2,704 2,678

2,353 2,132

1,671

2,009 2,000

2,660

abla 5: Reproducción parcial de la tabla de la distribución t y su representación gráfica con los va/o_ críticos para el cálculo del intervalo de confianza.

Y el intervalo de confianza, es:

Y±fmax -+15,2±0,35---+

{14,84 15,55

6.3. Para comprobar si la edad media del inicio en el consumo de cocaína en los hombres de su municipio ha disminuido respecto a los datos generales del 2004, formularemos un contraste de hipótesis, siguiendo los siguientes pasos: CONDICIONES Y SUPUESTOS: Partimos de la información proporcionada por una ""'1Uestra de 37 hombres con una edad media de 15,4 años. Desconocemos la forma :€ la distribución poblacional de la edad de inicio en el consumo y su varianza. Por 23



:éi r.tittli;í y problemas resueltos y comentadqs,.Dlsiiirlp ·de investigación y análisis de date

tanto, la distribución muestra! de la media es una distribución t de Student con r = 4 0 grados de libertad. HIPÓTESIS: El investigador sospecha que la edad media del inicio en el consL de cocaína en los hombres de su municipio ha disminuido respecto a los datos =-nerales del 200 4 que era de 15, 9 para los hombres, por lo que plantea un contr unilateral izquierdo H1 : µ�biljdád

g.l. 0,005

0,010

0,02S

0,050

0,100

0,900

0,0000 0,0100 0,0717 0,2070

0,0002 0,0201 0,1148 0,2971

0,0010 0,0506 0,2158 0,4844

0,0039 0,1026 0,3518 0,7107

0,0158 0,2107 0,5844 1,0636

2.7055 4,6052 6,2514 7,7794

13,1211 30 13,7867 --20,7065 so 27,9907 60 35,5345

14,2565 14,9535 22,1643 29,7067 37,4849

16,0471 16,7908 24,4330 32,3574 40,4817

17,7084 18,4927 26,5093 34,7643 43,1880

19,7677 20,5992 29,0505 37,6886 46,4589

39,0875 40,2560 51,8051 63,1671 74,3970

1 2

3 4 29

0,975

0,990

0,995

1 3,8415 1 5,9915 7,8147 9,4877

5,0239 7,3778 9,3484 11,1433

6,6349 9,2103 11,3449 13,2767

7,8794 10,5966 12,8382 14,8603

42,5570 43,7730

45,7223 49,5879 46,9792 50,8922 59,3417 63,6907 71,4202 76,1539 83,2977 88,3794

52,3356 53,6720 66,7660 79,4900 91,9517

lill.ili1

67,5048 79,0819

Tabla 7: Tabla de la distribución chi-cuadrado.

INTERPRETACIÓN: La varianza poblacional de la edad de inicio del consumo de cocaína en los hombres es significativamente mayor que el de las mujeres (x. 2 = 57,26; p < 0,05).

Figura 10: Representación gráfica de la distribución chi-cuadrado, el estadístico de contraste y el nivel crítica. 26

Soluciones a los ejercicios de los capítulos 1 y 2



' S I T U A C I Ó N 7. El Centro de Investigaciones Sociológicas {CIS} realiza constantes estudios sobre la ideología e intención de voto de los españoles. Uno de los ítems que incluye en sus cuestionarios es el de la «identificación ideológica», para lo que se le pide al entrevistado que se ubique ideológicamente en una escala de 1 a 10 donde 1 significa extrema izquierda y 10 extrema derecha}. En su última encuesta a la población española la media aritmética obtenida para la variable identificación deológica fue de u_n 4,86. Un psicólogo social interesado en estudiar esta temática, sospecha que en su localidad la intención de voto es significativamente 57,76

ESTADÍSTICO DE CONTRASTE:

x2

=ns;= 100·8, 6 2 = 2

cro

57, 7 6

739 6 =128 05 57, 7 6

RfGLA DE DECISIÓN: Consultamos en la distribución chi-cuadrado con n - 1 grade ibertad (100 - 1 = 99 gl) el valor más próximo al estadístico de contraste do. En la tabla y para 100 gl, los valores más próximos son 124, 34 y 129,5 6 oejan por encima probabilidades de 0,05 y 0,025 respectivamente y entre los • • � se encuentra el estadístico de contraste obtenido 128,05. Por tanto el nivel r - ......... :; es un valor menor de 0,05 y mayor de 0,025.

tlilr" �

37



Ejercicios y problemas resueltos y co ntados. Diseños de investigación y análisis de

Probabilidad

g.l.

0,005

0,010

0,025

0,050

0,100

0,0000 0,0100 0,0717 0,2070 0,4117 0,6757

0,0002 0,0201 0,1148 0,2971 0,5543 0,8721

0,0010 0,0506 0,2158 0,4844 0,8312 1,2373

0,0039 0,1026 0,3518 0,7107 1,1455 1,6354

0,0158 0,2107 0,5844 1,0636 1,6103 2,2041

70

43,2752

45,4417

80 90 100

51,1719 59,1963 67,3276

53,5401 61,7541 70,0649

48,7576 57,1532 65,6466 74,2219

60,3915 69,1260 77,9295

1 2

3 4 5 6

51,7393

0,900

2,7055 4,6052 6,2514 7,7794 9,2364 10,6446

0,950 1

0,975

3,8415 5,9915 7,8147

5,0239 7,3778 9,3484

9,4877 11,0705 12,5916

11,1433 12,8325 14,4494

1

0,990

0,9!1!i

6,6349 9,2103 11,3449 13,2767 15,0863 16,8119

7: 10.:;.;. 12.$3... 14,&:,_ 16,- ;. 18,:,.!-º

55,3289 85,5270 90,5312 95,0232 100,4252 104,2: - ; 64,2778 96,5782 101,8795 106,6286 112,3288 116,32:_ 73,2911 107,5650 113,1453 118,1359 124,1163 128,29:'.: 82,3581 118,4980 124,34211 129,56121 135,8067 140,16;, t

Figura 15: Representación gráfica del nivel crí i ca p en una distribución t can 100 gl reproduce : parcial de la tabla can la localización de las valares más próximos al estadístico de contraste.

CONCLUSIÓN: Para este contraste no se ha establecido un nivel de confianZ= previo, pero al ser el nivel crítico p menor de 0,05 podremos rechazar la hipótes s nula con un nivel de confianza del 95%, pero al ser mayor de 0,025 no podríamos tomar la misma decisión con un nivel de confianza del 99% ni tampoco del 98%. INTERPRETACIÓN: Se comprueba la hipótesis del investigador de que la desviación típica de la edad de las personas en situación de paro es mayor de 7,6 años (o su varianza mayor de 57,76) con un nivel de confianza del 95% (X2 = 128,05; p < 0,05).

SITUACIÓN 10.

Un psicólogo que investiga la percepción del tiempo, considera que dicha habilidad se encuentra deteriorada en los fumadores durante la retirada

38

Soluciones a los ejercicios de loscapítulos 1 y 2



aco-na. Para comprobarlo selecciona una m estra aleatoria de 41 fumadores a somete a una abstinencia de tabaco con una duración de 24 horas, pidiénque estimen el tiempo en segundos que había transcurrido en un periodo ::,ojetivamente, fue de 45 segundos. La media aritmética de la muestra fue a 51 segundos con una cuasivarianza igual a 164. El psicólogo desea deters la abstinencia tiene un impacto negativo sobre la percepción temporal, ••x::ando que el tiempo se sobre-estime y establece un nivel de significación de como regla de decisión para su hipótesis. ::ma IÓN: CONDICIONES Y SUPUESTOS. El estudio corresponde a un diseño de una muestra el que la variable de estudio «la estimación del tiempo}) es una variable contimedida con escala de razón, de la que se desconoce la forma de su distribución ;:ioo acional y la varianza. HIPÓTESIS: Dado que el psicólogo desea comprobar si el tiempo se sobre-estihemos de plantear un contraste unilateral derecho, cuyas hipótesis son: H0 : µ$45 H1: µ > 45 ESTADÍSTICO DE CONTRASTE: Dado que se desconoce la varianza poblacional, el estadístico de contraste es: T = Y-µ0 sn-1

=51-45 = 3 2

c r =s n---l = .J164 ---2 F,i .[tu REGLA DE DECISIÓN: Buscando en las tablas T de Student con 40 grados de liber:ad y un nivel de confianza del 95%, el valor critico es 1,684 que deja por debajo una :Y"obabilidad de 0,95 correspondiente a un contraste unilateral derecho.

39



Ejercicios y problemas resueltos y comentados. Oiseflos oe Investigación y ariali�is de (jatos

Probabilidad

g.l.

0,550

0,600

0,650

0,700

0,750

0,800

0,850

0,900

0,975

0,990

0,995

1 2 3 4

0,158 0,142 0,137 0,134

0,325 0,289 0,277 0,271

0,510 0,445 0,424 0,414

0,727 0,617 0,584 0,569

1,000 0,816 0,765 0,741

1,376 1,061 0,978 0,941

1,963 1,386 1,250 1,190

3,078 1,886 1,638 1,533

6,314 2,920 2,353 2,132

12,706 4,303 3,182 2,776

31,821 6,965 4,541 3,747

63,6,9,9:..: 5,S.:_ 4,&::-

28

0,127 0,127 0,127 0,126 0,126

0,256

0,389 0,389 0,389 0,388 0,388

0,530 0,530 0,530 0,529 0,528

0,683 0,683 0,683 0,681 0,679

0,855 0,854 0,854 0,851 0,849

1,056 1,055 1,055 1,050 1,047

1,313 1,311 1,310 1,303 1,299

1,701 1,699 1,697 1,684 1,676

2,048 2,045 2,042 2,021 2,009

2,467 2,462 2,457 2,423 2,403

2,7E: 2,7;: 2,75-: 2,7C-

29 30 40

so

0,256 0,256 0,255 0,255

2,6-,

Tabla 9: Reproducción parcial de la tabla de la distribución t de Student.

Por otra parte, en la distribución t de Studente con 40 gl, el valor más alto qL:: podemos ver en la tabla es 2,704 que deja por encima una probabilidad de 0,005. CONCLUSIÓN: El estadístico de contraste (T = 3) supera el valor crítico con univel de confianza del 95% (3 > 1,684), pero también el nivel crítico p < 0,005 e.: menor que el nivel de significación a = 0,05. Por tanto, rechazamos H0 .

Figura 16: Representación gráfica del niv...


Similar Free PDFs