Title | proyecto integrador etapa 1 estadistica inferencial |
---|---|
Course | Estadistica inferencial |
Institution | Universidad del Valle de México |
Pages | 12 |
File Size | 632.9 KB |
File Type | |
Total Downloads | 300 |
Total Views | 1,045 |
PROYECTO INTEGRADORESTADÍSTICA INFERENCIALDANIEL SERVÍN MORENO15 DE DICIEMBRE DE 2021Etapa 1Introducción.En este documento observaremos algunas aplicaciones de la estadística para abordar datos sobre la sociedad en este casouna lista de la base de datos de la GSS.La Encuesta Social General (GSS) es ...
15 DE DICIEMBRE DE 2021
PROYECTO INTEGRADOR ESTADÍSTICA INFERENCIAL
DANIEL SERVÍN MORENO
Etapa 1 Introducción. En este documento observaremos algunas aplicaciones de la estadística para abordar datos sobre la sociedad en este caso una lista de la base de datos de la GSS. La Encuesta Social General (GSS) es una encuesta representativa a nivel nacional de adultos en los Estados Unidos realizada desde 1972. El GSS recopila datos sobre la sociedad estadounidense contemporánea con el fin de monitorear y explicar las tendencias en opiniones, actitudes y comportamientos. El GSS ha adaptado preguntas de encuestas anteriores, lo que permite a los investigadores realizar comparaciones durante un máximo de 80 años. Variables GSS. Cualitativas
Cuantitativas
Sex
Year
Race Hispanic Uscitzn Degree
Age
Vetyears Sei Wrkstat Wrkslf
Educ
Marital Spwrksta
Paeduc
agekdbrn incom06
maeduc
Región partyid
Sibs
polviews relig
Childs
attend natspac natenvir natheal natcity natcrime natdrug nateduc Natrace natarms nataid natfare natroad natsoc natmass natpark confinan conbus conclerg coneduc confed conlabor conpress conmedic contv conjudge consci conlegis conarmy joblose
jobfind satjob richwork jobinc
El GSS tiene como objetivo hacer que los datos de alta calidad sean fácilmente accesibles para académicos, estudiantes, responsables políticos y otros, con un costo y espera mínimos. El GSS y sus IP han recibido premios de la Asociación Americana para la Investigación de la Opinión Pública, la Asociación Americana de Sociología, la Sociedad Sociológica del Este, la Asociación Mundial para la Investigación de la Opinión Pública y las revistas American Demographics and Science.
Preguntas de investigación. • • •
Contar caseid
¿Cuál es la edad máxima de los encuestados? ¿Cuál es la edad promedio? ¿Máximo grado de estudios?
Conteo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
year 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1972 1973 1974 1975 1976 1977 1978 1980 1982 1983 1984 1985 1986 1987 1988
Conteo age 1613 1504 1484 1490 1499 1530 1532 1468 1860 1599 1473 1534 1470 1819 1481
Conteo 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Variable
N
N
age educ paeduc childs
56859 56897 40173 56880
202 164 16888 181
sex 206 Female 777 Male 818 N= 930 970 1130 1109 1231 1216 1253 1314 1177 1289 1200 1291
Error estándar de la media 0.0733 0.0133 0.0217 0.00751
Conteo 31915 25146 57061
Desviación estándar
Varizanza
17.472 3.182 4.349 1.7915
305.275 10.123 18.915 3.2096
race Black Other White N=
Conteo 7926 2785 46350 57061
Variable age educ paeduc childs
Mediana q 43.000 12.000 12.000 2.000
59.000 13.000 13.000 3.000
Máximo Rango 89.000 71.000 20.000 20.000 20.000 20.000 8.000 8.000
Etapa 2
Análisis exploratorio y aplicación de técnicas inferenciales e interpretación de resultados. a) Intervalos de confianza de 90 %, 95 % y 99 %
N
Media Desv. Est. 56897 12.7536 3.1816
N 56897
Media 12.7536
Desv. Est. 3.1816
Error est. de la 90 % para media µ 0.021 12.7805
Error est. De la media 0.021
95 % para µ 12.7881
N 56897
Media 12.7536
Desv. Est. 3.1816
Error est. De la media 0.021
99 % para µ 12.8024
b) Intervalos de confianza de 90 %, 95 % y 99% de muestra grande de una proporción poblacional.
N
Límite Muestra p superior de 90 % par p
Evento 245
12
N
0.04898
Límite Muestra p superior de 95 % par p
Evento 245
12
N
0.04898
0.07166
Límite Muestra p superior de 99 % par p
Evento 245
0.06665
12
0.04898
0.081057
c) Intervalo de confianza de 95 % de muestra grane para una diferencia entre dos medias poblacionales.
Muestra
N
Media
Desv. Est.
educ paeduc
56897 40173
12.75 10.55
3.18 4.35
Error estándar en la media 0.013 0.022
Estimación de la diferencia IC de 95 % para la diferencia 2.1497, 2.2495
Diferencia 2.1996
Prueba Diferencia
Hipótesis nula Hipótesis alterna
Valor T
IC de 95 % para la diferencia 1 = 1 − 2 = 0
2 = 1 − 2 ≠ 0
Gl
Valor p
86.36
69282
0
d) Intervalo de confianza de 95 % de muestra grande para una diferencia entre dos proporciones poblacionales.
Muestra Muestra 1 Muestra 2
N 246 246
Evento 12 12
Muestra p 0.048878 0.04878
Estimación de la diferencia Diferencia
Límite superior de 95 % para la diferencia
0
0.031948
Prueba Hipótesis nula Hipótesis alterna
1 = 1 − 2 = 0 1 = 1 − 2 < 0
e) Límite de confianza superior de 98 % para una media poblacional (elija una variable distinta a la utilizada en el inciso 1).
N 56897
Media 12.7536
Desv. Est. 3.1816
Error estándar en la media 0.021
IC de 98 % para µ 12.7048,12.8024
f)
Límite de confianza inferior del 98 % para una proporción poblacional (elija una variable distinta en el inciso 2).
N
Evento
245
12
Límite superior de Muestra p 98 % para p 0.04898 0.077298
g) Una prueba de hipótesis de muestra grande acerca de una media poblacional (en este punto se requiere una prueba bilateral y una prueba unilateral, utilice la misma variable que en el inciso 1). Prueba de normalidad de Anderson- Darling A-cuadrado 1010.59 Valor p >0.005 Media 12.754 Desv. Est. 3.182 Varianza 10.123 Asimetría -0.38142 Curtosis 1.06093 N 56897 Mínimo 0 1er cuartil 12 Mediana 12 3er cuartil 15 Máximo 20 Intervalo de confianza de 95 % para la media 12.727 12.78 Intervalo de confianza de 95 % para la mediana 12 12
Intervalo de confianza de 95 % para la desv. Est. 3.163 3.2
Prueba Hipótesis nula
1 = = 12.754
Hipótesis alterna
2 = ≠ 12.754
Valor z Valor p -0.03 0.975 h) Una prueba de hipótesis de muestra grande para una proporción poblacional (en este punto se requiere una prueba bilateral y una prueba unilateral, utilice la misma variable que en el inciso 2). Prueba de normalidad de Anderson- Darling A-cuadrado 537.16 Valor p >0.005 Media 10.554 Desv. Est. 4.349 Varianza 18.915 Asimetría -0.241312 Curtosis -0.11746 N 40173 Mínimo 0 1er cuartil 8 Mediana 12 3er cuartil 13 Máximo 20 Intervalo de confianza de 95 % para la media 10.511 10.597 Intervalo de confianza de 95 % para la mediana 12 12 Intervalo de confianza de 95 % para la desv. Est. 4.319 4.379
N
Media
Desv. Est.
56859
45.698
17.4721
Error estándar de la media 0.0443
IC de 98 % para µ 45.5950, 458009
Prueba Hipótesis nula
1 = = 4.349
Hipótesis alterna
2 = ≠ 4.349
Valor z Valor p 934.22
i)
0
Una prueba de hipótesis de muestras grandes para la diferencia entre dos medias poblacionales (utilice las mismas variables que en el inciso 3).
N
Media
Desv. Est.
56859
45.698
17.4721
Error estándar de la media 0.0167
IC de 98 % para µ 45.6592, 457368
Prueba 1 = = 8.65663
Hipótesis nula
2 = ≠ 8.65663
Hipótesis alterna Valor z Valor p 2220.8 j)
0
Una prueba de hipótesis de muestras grandes para la diferencia entre dos proporciones poblacionales (utilice las mismas variables que en el inciso 4).
N
Media
Desv. Est.
56880
1.95285
1.79154
Error estándar de la media 0.00927
IC de 98 % para µ 1.93128, 1.97441
Prueba Hipótesis nula
1 = = 2.922
Hipótesis alterna
2 = ≠ 2.9221
Valor z Valor p -104.56
Referencias [Sitio web] Acerca del | GSS NORC [Sitio web] GSS 2021 Codebook R1.pdf (norc.org)
0...