P1 - Practicas Ana Salome PDF

Title P1 - Practicas Ana Salome
Course Introducción a la Estadística
Institution Universidad de Oviedo
Pages 9
File Size 469.4 KB
File Type PDF
Total Downloads 7
Total Views 120

Summary

Practicas Ana Salome...


Description

Facultad de Economía y Empresa Universidad de Oviedo

Introducción a la Estadística Económica Cuaderno de Prácticas

Tema 1: Organización y presentación de datos. Fuentes estadísticas Ejercicio 1.- Población y muestra. Variables y atributos. Ejercicio 2.- Tabla datos no agrupados. Gráficos de barras y en escalera. Ejercicio 3.- Tabla de datos agrupados. Histograma. Ejercicio 4.- Cuestión Encuesta de Población Activa. Tasas de actividad y paro. Ejercicio 5.- Cuestión Censo de Población. Polígono de frecuencias acumuladas. Ejercicio 6.-Tabla de atributos. Gráfico de sectores. Ejercicio 7.- Tablas de atributos y datos agrupados. Histograma y polígono de frecuencias acumuladas. Ejercicio 8.- Cuestión Encuesta de Presupuestos Familiares. Hoja de cálculo de datos P1.ods

Ejercicio 1.

Una universidad está interesada en realizar una encuesta sobre los desplazamientos de los alumnos a su centro de estudios. a) Determinar el universo de la encuesta. b) Se ha optado por realizar una encuesta muestral. ¿Cuáles son sus ventajas? ¿Cómo podría efectuarse la selección de una muestra de estudiantes? c) En el cuestionario se incluyen las siguientes preguntas en relación a los desplazamientos de casa al centro de estudios: c1) ¿Cuántos viajes semanales realizas por término medio? c2) ¿Qué medio de transporte utilizas normalmente? c3) ¿Cuánto tiempo sueles tardar en el desplazamiento de ida al centro? Indicar el tipo de carácter (variable o atributo) asociado a cada una de las preguntas.

Solución: a) El universo de la encuesta está formado por los estudiantes matriculados en los distintos centros universitarios en el curso actual. b) Las encuestas muestrales requieren menor tiempo para su realización y por consiguiente tienen la ventaja del ahorro económico y mayor rapidez en la presentación de los resultados. Al trabajar con menor volumen de información puede afinarse en la calidad de los datos y garantizar mayor fiabilidad de los resultados. Por supuesto, para que estas ventajas sean ciertas es esencial que la muestra sea realmente representativa de la población, por lo que debe prestarse especial atención al método de selección muestral. Los métodos estadísticos se basan en muestras seleccionadas al azar, lo que garantiza la imparcialidad en el proceso de selección. Así, en una universidad con 25.000 estudiantes matriculados podríamos seleccionar al azar una muestra de 1.000 estudiantes a partir de listado proporcionado por los servicios administrativos.

© Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

1

Facultad de Economía y Empresa Universidad de Oviedo

Introducción a la Estadística Económica Cuaderno de Prácticas

Como los temas relativos a los desplazamientos guardan relación con la ubicación del centro de estudios, si la universidad tiene campus en varios emplazamientos, tendría interés agrupar los estudiantes por campus y seleccionar una parte de la muestra en cada campus. Por ejemplo, si la universidad tiene 3 campus: A con el 50% de estudiantes, B con el 35% y C con el 15% restante, la muestra de 1.000 estudiantes se elegiría de modo que 500 fueran del campus A, 350 del B y 150 del campus C. c) Los caracteres asociados a cada pregunta son: - Número de viajes semanales: Variable discreta que puede tomar los valores 0, 1, 2, … - Medio de transporte: Atributo con modalidades coche, autobús urbano, autobús interurbano, tren, moto, bicicleta, a pie. - Tiempo desplazamiento de ida: Variable continua que toma valores reales mayores que 0.

Ejercicio 2.

Respecto a la pregunta sobre número de viajes semanales realizados por término medio al centro se ha obtenido la siguiente tabla de resultados: Nº viajes Nº estudiantes 0 10 1 15 2 15 3 20 4 50 5 65 6 20 7 5 a) Completar la tabla con los distintos tipos de frecuencias. b) ¿Qué porcentaje de estudiantes acuden al centro más de 5 veces semanales? c) Completar la siguiente frase: “Un ____% de los estudiantes acuden al centro un máximo de 2 veces a la semana”. d) [PROPUESTO] Representar gráficamente las distribuciones de frecuencias absolutas mediante un gráfico de barras y un diagrama en escalera.

Solución: a) Dada la variable X: “Número de viajes semanales realizados por término medio” con xi valores donde i=1,…,8, la tabla siguiente recoge los distintos tipos de frecuencias asociados a cada valor xi: frecuencia absoluta (ni), frecuencia relativa (fi), frecuencia absoluta acumulada (Ni) y frecuencia relativa acumulada (Fi). xi 0 1 2 3 4 5 6 7 TOTAL

ni 10 15 15 20 50 65 20 5 200

fi 5,0% 7,5% 7,5% 10,0% 25,0% 32,5% 10,0% 2,5% 100

Ni 10 25 40 60 110 175 195 200

Fi 5,0% 12,5% 20,0% 30,0% 55,0% 87,5% 97,5% 100,0%

donde © Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

2

Facultad de Economía y Empresa Universidad de Oviedo

Introducción a la Estadística Económica Cuaderno de Prácticas 𝑓𝑖 =

𝑛𝑖 𝑁

𝑖

𝑁𝑖 = ∑ 𝑛𝑗 𝑗=1

𝑁𝑖 𝑁 cumpliéndose las propiedades de las frecuencias: 𝐹𝑖 =

𝑘

0 ≤ 𝑛𝑖 ≤ 𝑁; ∑ 𝑛𝑖 = 𝑁 𝑖=1 𝑘

0 ≤ 𝑓𝑖 ≤ 1; ∑ 𝑓𝑖 = 1 𝑖=1

0 ≤ 𝑁𝑖 ≤ 𝑁; 𝑁𝑘 = 𝑁

Fórmula de recurrencia: 𝑁1 = 𝑛1 , 𝑁𝑖 = 𝑁𝑖−1 + 𝑛𝑖 , 𝑖 = 2, … 𝑘 𝑖

0 ≤ 𝐹𝑖 ≤ 1; 𝐹𝑘 = 1; 𝐹𝑖 = ∑ 𝑓𝑗 𝑗=1

b) Observando la columna de frecuencias relativas, se deduce que el porcentaje de estudiantes que acuden al centro más de 5 veces semanales es: 10%+2,5%= 12,5% c) A partir de la columna de frecuencias relativas acumuladas, se puede afirmar que un 20% de los estudiantes acuden al centro un máximo de 2 veces a la semana d) El diagrama de barras es una representación gráfica de la distribución de frecuencias (absolutas o relativas) de una tabla de datos no agrupados. La representación gráfica siguiente ha tomado como referencia las frecuencias absolutas. En un plano de coordenadas, se representan en el eje de abscisas los distintos valores de la variable y en el eje de ordenadas las frecuencias correspondientes, obteniéndose los puntos (xi,ni); para realzar la representación se traza el segmento vertical que une cada punto con su abscisa. De esta manera, el dibujo consiste en una serie de barras verticales cuya altura refleja la importancia del valor al que están asociadas. ni

xi El diagrama en escalera es una representación gráfica de la distribución de frecuencias acumuladas (absolutas o relativas) de una tabla de datos no agrupados. La representación © Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

3

Facultad de Economía y Empresa Universidad de Oviedo

Introducción a la Estadística Económica Cuaderno de Prácticas

gráfica realizada en este ejercicio ha tomado como referencia las frecuencias absolutas acumuladas. Para su elaboración, en un plano de coordenadas se asigna a cada observación xi una altura igual a su frecuencia acumulada Ni, punto que se une mediante un trazo horizontal a la ordenada del valor siguiente. El gráfico se completa asignando el valor 0 hasta llegar al primer valor de la variable (x1) y el valor N a partir del último valor (xk). Ni

xi El gráfico obtenido toma, por tanto, el valor 0 a la izquierda del valor mínimo de X (0) y 200 a partir del valor máximo (7). En cada uno de los valores el gráfico presenta un salto que coincide con la frecuencia absoluta de dicho valor, ya que por la fórmula de recurrencia: Ni=Ni-1+ni.

Ejercicio 3.

La información correspondiente a la pregunta sobre el tiempo de desplazamiento al centro se ha agrupado en intervalos: Tiempo 10 minutos o menos Entre 10 y 20 minutos Entre 20 y 30 minutos Entre 30 y 45 minutos Entre 45 minutos y 1 hora Entre 1 hora y 1 hora y media Más de hora y media

Nº estudiantes 20 35 60 50 25 8 2

a) Completar la tabla con los distintos tipos de frecuencias b) ¿Qué porcentaje de estudiantes tardan como máximo 20 minutos en su desplazamiento al centro? c) Completar la siguiente frase: “El 95% de los estudiantes tardan como máximo____ minutos en su desplazamiento al centro” d) ¿Qué porcentaje de estudiantes tardan como máximo 25 minutos en su desplazamiento diario? e) Representar gráficamente la distribución de frecuencias absolutas mediante un histograma.

Solución: RESOLVER CON HOJA DE CÁLCULO

© Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

4

Facultad de Economía y Empresa Universidad de Oviedo

Introducción a la Estadística Económica Cuaderno de Prácticas

a) La tabla pedida para los distintos tipos de frecuencias es la siguiente, en la que se han añadido, además, la columna de marca de clase (xi), las amplitudes de los intervalos (ai) y la columna de las alturas correspondientes (hi) para su posterior uso en el ejercicio. Para el cálculo de la marca de clase, es preciso delimitar el primer y el último intervalo. Se asume que los tiempos son superiores a 0, por lo que L0=0. En cuanto al límite superior del último intervalo, se trata de fijar un valor razonable según la definición de la variable, que en este caso podría ser 2 horas, es decir, Lk=120. Tiempo 0-10 10-20 20-30 30-45 45-60 60-90 90-120

Nº estudiantes 20 35 60 50 25 8 2

xi

fi

Ni

Fi

ai

hi

5 15 25 37,5 52,5 75 105

10,0% 17,5% 30,0% 25,0% 12,5% 4,0% 1,0%

20 55 115 165 190 198 200

10,0% 27,5% 57,5% 82,5% 95,0% 99,0% 100,0%

10 10 10 15 15 30 30

2 3,5 6 3,33 1,67 0,27 0,07

b) El porcentaje de estudiantes que tardan un máximo de 20 minutos es 27,5%. c) El 95% de los estudiantes tardan como máximo 60 minutos en su desplazamiento al centro. d) El porcentaje de estudiantes que tardan como máximo 20 minutos es 27,5%. Como un 30% tarda entre 20 y 30 minutos, asumiendo una distribución uniforme, la mitad de ellos tardará entre 20 y 25 minutos, por lo que el porcentaje que tarda como máximo 25 minutos será: 27,5%+30%/2=42,5%. e) El histograma es una representación gráfica de la distribución de frecuencias absolutas (o relativas) para tablas de datos agrupados en intervalos. Se obtiene construyendo sobre cada intervalo, representado en el eje de abscisas, un rectángulo cuya base es igual a la amplitud del intervalo ai y cuya altura hi se determina de forma que el área del rectángulo sea proporcional a su frecuencia ni. hi

© Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

5

Facultad de Economía y Empresa Universidad de Oviedo

Introducción a la Estadística Económica Cuaderno de Prácticas

Ejercicio 4. a) Indicar cómo se clasificarían en la Encuesta de Población Activa (EPA) los cinco miembros de un hogar con las siguientes características:     

El padre es funcionario de la Administración Autonómica La madre quedó sin empleo el mes pasado y la semana pasada fue a una entrevista de trabajo El hijo mayor ha empezado a estudiar el grado en ADE El hijo pequeño está en 5º de primaria La abuela recibe una pensión de viudedad

b) A partir de los datos de la EPA del año 2019 (medias anuales) recogidos en la tabla: Varones Mujeres Total

ACTIVOS 12.273,4 10.753,7 23.027,1

INACTIVOS 6.821,0 9.421,1 16.242,2

OCUPADOS 10.745,6 9.033,7 19.779,3

b1) Determinar las tasas de actividad y de paro para el total de la población. b2) Determinar las tasas de actividad y paro para varones y mujeres.

Solución: a) El padre es funcionario de la Administración Autonómica La madre quedó sin empleo el mes pasado y la semana pasada fue a una entrevista de trabajo El hijo mayor ha empezado a estudiar el grado en ADE El hijo pequeño está en 5º de primaria

La abuela recibe una pensión de viudedad

Clasificación Ocupado Parado Inactivo No forma parte de la encuesta por ser menor de 16 años Inactivo

b) Las tasas de actividad y paro se calculan como: Tasa actividad = nºactivos/población de 16 años y más Tasa de paro = nº parados/nº activos A partir de los datos iniciales sobre activos, inactivos y ocupados, se pueden obtener las cifras correspondientes a la población de 16 o más años y al número de parados: Población de 16 o más años= nº activos+ nº inactivos Parados= Activos-Ocupados

© Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

6

Facultad de Economía y Empresa Universidad de Oviedo

Varones Mujeres Total

POBLACIÓN >=16 AÑOS 19.094,4 20.174,8 39.269,3

Introducción a la Estadística Económica Cuaderno de Prácticas

PARADOS

TASA ACTIVIDAD 64,28% 53,30% 58,64%

1.527,8 1720 3.247,8

TASA PARO 12,45% 15,99% 14,10%

Ejercicio 5. a) Clasificar los siguientes caracteres como atributos o variables (discretas o continuas):     

Primer apellido del responsable del hogar Comunidad autónoma de residencia Ingresos mensuales del hogar Estado civil Tipo de estudios completado

b) Señalar cuáles de las variables anteriores figuran entre la información publicada del Censo de Población y Viviendas. c) La tabla adjunta recoge información procedente del Censo de 2011 sobre la edad de los residentes en el Principado de Asturias: Edad 0-20 20-40 40-60 60-80 80 ó más

Nº personas 154.425 276.867 329.390 231.505 82.997

Obtener el polígono de frecuencias acumuladas.

Solución: a) Tipo carácter Primer apellido del responsable del hogar Comunidad autónoma de residencia Ingresos mensuales del hogar Estado civil Tipo de estudios completado

Atributo Atributo Variable continua Atributo Atributo

¿Está en el Censo? NO SÍ NO SÍ SÍ

c) El polígono de frecuencias acumuladas es una representación gráfica de la distribución de frecuencias acumuladas en tablas de datos agrupados en intervalos. Este gráfico muestra cómo se van acumulando paulatinamente las observaciones, para lo cual se asocia al extremo superior de cada intervalo su frecuencia acumulada (absoluta o relativa) y se unen todos estos puntos mediante una línea poligonal, teniendo en cuenta además que la frecuencia acumulada correspondiente a cualquier valor anterior al extremo inferior del primer intervalo (L0) es nula y que la correspondiente a valores superiores al extremo superior del último intervalo (Lk) es N (o 1 si se trata de frecuencias relativas). Calculadas las frecuencias absolutas acumuladas para cada uno de los intervalos:

© Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

7

Facultad de Economía y Empresa Universidad de Oviedo

Edad 0-20 20-40 40-60 60-80 80 ó más

Introducción a la Estadística Económica Cuaderno de Prácticas

Nº personas 154.425 276.867 329.390 231.505 82.997

Ni 154.425 431.292 760.682 992.187 1.075.184

se obtiene el siguiente polígono de frecuencias acumuladas: Ni

Ejercicio 6. Tras realizar una encuesta a una muestra de 200 estudiantes universitarios se han obtenido los siguientes resultados sobre el medio de desplazamiento al centro: Medio Andando Coche particular Autobús urbano Autobús interurbano Tren Moto Bicicleta

Nº estudiantes 40 30 35 60 20 5 10

Representar gráficamente la distribución de frecuencias relativas mediante un gráfico de sectores.

© Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

8

Facultad de Economía y Empresa Universidad de Oviedo

Introducción a la Estadística Económica Cuaderno de Prácticas

Ejercicio 7.

El Centro de Investigaciones Sociológicas (CIS) realizó en el año 2009 una Encuesta de satisfacción de usuarios de servicios de telecomunicación (Estudio nº 2797). a) Consultar la ficha técnica de la encuesta e identificar el universo de la encuesta. ¿Se trata de una encuesta censal o muestral? b) La tabla adjunta recoge las respuestas a la pregunta ¿Con cuál de los siguientes operadores tiene contratado el teléfono móvil? Representar gráficamente la distribución de frecuencias relativas. Compañía Movistar Vodafone Orange Yoigo Otras c)

Nº clientes 2.020 1.276 786 71 53

Las respuestas a la pregunta Aproximadamente, ¿cuánto paga al mes a su compañía de telefonía móvil? Se resumen en la siguiente tabla de datos agrupados: Gasto mensual Hasta 25 euros De 25 a 50 euros De 50 a 75 euros De 75 a 100 euros De 100 a 150 euros Igual o más a 150 euros

Nº clientes 1.977 1.227 294 213 94 53

c1) ¿Qué porcentaje de encuestados gastan menos de 50 euros mensuales? ¿Y más de 125€? c2) Construir el histograma y el polígono de frecuencias acumuladas

Ejercicio 8. a) Clasificar los siguientes caracteres de la Encuesta de Presupuestos Familiares como atributos o variables (discretas o continuas), indicando una representación gráfica adecuada en cada caso:   

Número de miembros del hogar Gasto mensual en alimentación Principal fuente de ingresos del hogar

b) A partir de la distribución de frecuencias relativas del nº de miembros del hogar según los datos de la EPF 2017: Nº miembros 1 2 3 4 5 o más

Nº hogares 25,60% 30,40% 20,90% 17,50% 5,60%

Efectuar la representación gráfica de la distribución de frecuencias relativas acumuladas.

© Covadonga Caso, Esteban Fernández, Paula Fernández, Ana Salomé García, Matías Mayor, Mª Jesús Río y Mª Rosalía Vicente

9...


Similar Free PDFs