Clase 5 Estadística v - ejercicios PDF

Title Clase 5 Estadística v - ejercicios
Author Juan Ernesto Mata Muñiz
Course Mecánica De Materiales
Institution Universidad Veracruzana
Pages 25
File Size 900.3 KB
File Type PDF
Total Downloads 73
Total Views 147

Summary

ejercicios ...


Description

Matemáticas Clase 5: Probabilidad y Estadística. Temas: 1.- Interpretar tablas y gráficas. 2.- Medidas de tendencia central para datos no agrupados. 3.- Medidas de tendencia central para datos en tabla de frecuencias simples. 4.- Medidas de tendencia central para datos agrupados en intervalos de clase. 5.- Cuartiles, Deciles y Percentiles. 6.- Concepto de Probabilidad.

1. Interpretar tablas y gráficas. Conceptos básicos. Estadística Es un conjunto de procedimientos que sirven para organizar y resumir dato, hacer inferencias a partir de ellos y transmitir los resultados de manera clara, concisa y significante. Estadística descriptiva. Es un conjunto de procedimientos que sirven para organizar, describir y sintetizar datos, sin que las conclusiones que se extraigan de estos rebasen su ámbito específico. Estadística inferencial Es un conjunto de procedimientos que se emplean para hacer inferencias y generalizaciones respecto a una totalidad, partiendo del estudio de un número limitado de casos tomados de esta última. Población. También llamada universo, es todo conjunto de personas, cosas u objetos con ciertas características en común. Cada uno de los componentes de una población recibe el nombre de elemento o unidad esencial. Definida una población cualquiera, se llama muestra a toda porción de elementos sacada de ella.

1

Inferencia estadística. Es el proceso mediante el cual se estiman características de una población a partir de las observaciones hechas en una muestra sacada de esa población. Variable. Es toda propiedad o característica que admite variaciones dentro de un conjunto de objetos. Gráfico estadístico. Es la representación de datos estadísticos por medio de figuras geométricas (puntos, líneas, rectángulos, etc.), cuyas dimensiones son proporcionales al valor numérico de los datos. Tipos de variables. Variables Nominales. Son las más simples y abundantes y su única función es clasificar. Su variable operacional correspondiente es una escala nominal que sirve para clasificar las observaciones en un conjunto de categorías mutuamente excluyentes, cuyo orden de colocación es indistinto. A éstas se les puede asignar cifras u otros símbolos arbitrarios con el fin de distinguirlas; si son cifras, no tienen ningún valor intrínseco ni propiedades numéricas como en la aritmética. Ejemplo. DISTRITO DE RIEGO 1 2 3 4

HECTÁREAS SEMBRADAS 680 1200 300 500

2

Para elaborar un gráfico de pastel, debemos hacer equivaler cada uno de los valores dados en la tabla, con su equivalente en los grados de un circulo, el total de nuestra tabla debe corresponder a 360° que corresponde a la vuelta completa. Distrito de Riego Hectáreas operación Correspondiente en Sembradas Grados 680 680 91.34° 1 × 360° 2680 1200 161.19° 2 1200 × 360° 2680 300 300 40.29° 3 × 360° 2680 500 500 67.16° 4 × 360° 2680 Total de la tabla: 2680 Total de Grados: 359.98° ≈ 360° Observe que el total de los grados debe de ser muy aproximado al del giro completo de la circunferencia. Ahora para finalizar nuestro gráfico de pastel, con un compás dibujamos un circulo de nuestra elección y con el transportador vamos midiendo los grados correspondientes a cada una de las variables.

Variables ordinales. Clasifican las observaciones en categorías mutuamente excluyentes que exigen ordenación, ya que guardan entres sí relaciones de “mayor que”. Su variable operacional es una escala ordinal que va desde la categoría más baja a la más alta o viceversa, de modo que las observaciones queden en el orden apropiado. Estas categorías tampoco tienen propiedades numéricas, aunque se las represente por cifras.

3

Ejemplo. GRADO DE LAS QUEMADURAS 1 2 3

NO. DE CASOS 70 40 10

Para elaborar un gráfico de barras horizontales, solo hay que trazar un eje horizontal, graduarlo según convenga a nuestros datos, y dibujar cada uno de nuestras variables según la escala graduada, el grafico debe de quedar como se muestra a continuación.

Variables cardinales. Son las más complejas. Su variable es una escala cardinal que se caracteriza porque las diferencias iguales entre dos de sus puntos son iguales entre sí. Las cifras asociadas a las categorías son efectivamente cuantitativas y, en consecuencia, se pueden efectuar con ellas operaciones aritméticas. Las variables cardinales se dividen en discretas y continuas. Discretas: Son las que toman sólo algunos valores dentro de un intervalo (hijos por familia, número de huelgas anuales, producción mensual de automóviles, etc) Ejemplo.

4

EDADES DE LOS NIÑOS 8 9 10 11

NÚMERO DE NIÑOS 12 14 18 11

Se gradúa un eje, similar al gráfico de barras horizontales, solamente que esta ocasión la graduación será sobre un eje vertical, y se colocan las barras según corresponda su valor numérico.

Continuas: Son las que pueden tomar cualquier valor dentro de un intervalo (edad, salarios, estatura, producción anual de azúcar, etc) Ejemplo. NÚMERO DE EMPLEADOS EN LA COMPAÑÍA. 10 12 15 9 6

SALARIO QUE RECIBEN. 4550.30 6000.50 8050.23 10000.80 15545.70

5

Para elaborar un gráfico de ojiva de frecuencia, se comienza por graduar dos escalas, una pasaría a ser el salario, en este caso sería el eje vertical, mientras que en el horizontal irían los valores del número de trabajadores, y solo se trazaría una línea que pasaría por los puntos que corresponderían a los puntos de intersección de los salarios y el número de trabajadores.

En las siguientes tablas elabora un gráfico según se pida en cada caso

a)

Gráfico Circular ESPECIALIDAD C. SOCIALES ESPAÑOL C. NATURALES MATEMÁTICAS INGLÉS

NO. DE ESTUDIANTES 73 53 49 38 30

b) Gráfico de Barras Horizontales ENTIDAD CAMPECHE JALISCO MICHOACÁN VERACRUZ

c)

PRODUCCIÓN 30,013,100 356,217,400 131,218,800 1,018,439,850

Gráfico de Histograma de frecuencias. AÑO 1970

TOTAL 619 6

1971 1972 1973

654 716 674

d) Gráfico de Ojiva de frecuencia. TIPO DE MATERIAL

NÚMERO DE VIVIENDAS EN MILLONES 2.49 3.66 2.13

ADOBE LADRILLO MADERA U OTRO

2. Medidas de tendencia central para datos no agrupados. Conceptos básicos. Las medidas de tendencias central son categorías o puntos dentro del recorrido de una variable. Media aritmética. Se le define como la suma de un conjunto de cantidades divididas entre el número de ellas. Mediana. Llamada también valor mediano, es el punto dentro del recorrido de una variable que supera a no más de la mitad de los datos y es superado por no más de la otra mitad. Moda. También llamada modo o valor modal, es el dato de variable que aparece más veces en una distribución. Desviación estándar. Es la desviación promedio de los datos de una distribución respecto a su media. Coeficiente de variabilidad. Es la razón de la desviación estándar a la media de una variable.

Calculo de las medidas de tendencia central para datos no agrupados. Ejemplo 1: calcule las media, mediana, moda, varianza, Desviación estándar y coeficiente de variabilidad, de los siguientes datos sin agrupar.

5 6

5 6

5 6

5 6

8 6

8 6 7

7 8

7 8

7 8

6 9

9 9 8

9 6 7

7 6 6

7 6 6

7 7 7

7 10 8

9 8 7

10 7 10

9 7 8

9 8 9

6 7 7 8 9

6 7 7 8 10

6 7 7 8 10

6 7 8 9 10

Solución: Comenzamos por ordenar los datos del menor al mayor. 5 6 7 8 9

5 6 7 8 9

5 6 7 8 9

5 6 7 8 9

6 6 7 8 9

6 6 7 8 9

Media. Ahora utilizamos la fórmula para calcular la media aritmética o también conocida como el promedio de los datos. 𝑥 =

∑𝑥 𝑛

En la formula el símbolo Σ es la letra griega sigma y quiere decir suma, ∑ 𝑥 se refiere a la suma de los datos, mientras que 𝑛 es número de datos. Realizamos la operación de la siguiente manera: 𝑥 =

4 × 5 + 12 × 6 + 13 × 7 + 10 × 8 + 8 × 9 + 3 × 10 50

Observe que colocamos 4 × 5 debido a que el número 5 se repite 4 veces, y de esa forma podemos realizar la operación más rápido que sumando termino por termino. Y el valor de 𝑛 = 50 ya que son 50 números los que tenemos en nuestro recuadro. De esta forma el resultado será:

Por lo tanto la media será 𝑥 = 7.3~7.

𝑥 =

365 73 = 7.3 = 10 50

Mediana.

Para calcular el valor de la mediana vamos a tomar nuestros datos ordenados y vamos a numerarlos. 1 5 11 6 21 7 31

2 5 12 6 22 7 32

3 5 13 6 23 7 33

4 5 14 6 24 7 34

5 6 15 6 25 7 35

6 6 16 6 26 7 36 8

7 6 17 7 27 7 37

8 6 18 7 28 7 38

9 6 19 7 29 7 39

10 6 20 7 30 8 40

8 41 9

8 42 9

8 43 9

8 44 9

8 45 9

8 46 9

8 47 9

8 48 10

8 49 10

9 50 10

Dependiendo el número de datos es la manera en que obtendremos la mediana.

𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 ℎ𝑢𝑏𝑖𝑐𝑎𝑚𝑜𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑐𝑒𝑛𝑡𝑟𝑎𝑙 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟 ℎ𝑢𝑏𝑖𝑐𝑎𝑚𝑜𝑠 𝑙𝑜𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑐𝑒𝑛𝑡𝑟𝑎𝑙𝑒𝑠 𝑦 𝑑𝑖𝑣𝑖𝑑𝑖𝑚𝑜𝑠 𝑒𝑛𝑡𝑟𝑒 2

En este caso 𝑛 = 50 y 50 es par, por lo tanto ubicamos los dos valores centrales y los dividimos entre dos. No cuesta trabajo darse cuenta que los valores centrales son el 25 y 26, ya que ambos valores tienen la misma cantidad de datos contando hacia atrás y hacia adelante respectivamente. Ubicamos en el recuadro anterior la posición 25 y 26 los sumamos y dividimos entre 2, estos dos valores son ambos 7 (verificar en el recuadro). 𝑀𝑒 =

7+7

Y de esta manera obtenemos la mediana 𝑀𝑒 = 7.

2

=7

Moda.

Para el cálculo de la moda, solo se verifica en la tabla el valor que más se repite. Observando la tabla podemos darnos cuenta que el valor que más se repite es el 7, se repite 13 veces, mientras que el 6 se repite 12 veces y el 8, 10 veces.

Sesgo de los datos.

𝑀𝑜 = 7

Según el cálculo de la media, mediana y moda, podemos conocer la forma en cómo se comportarían nuestros datos si los graficáramos, esto lo podemos saber con la tabla siguiente: Sesgo positivo

𝑀𝑜 < 𝑀𝑒 < 𝑥 𝑀𝑜 = 𝑀𝑒 < 𝑥

Relación entre los valores numéricos Simetría Unimodal 𝑀𝑜 = 𝑀𝑒 = 𝑥

Sesgo negativo 𝑥 < 𝑀𝑒 < 𝑀𝑜 𝑥 < 𝑀𝑒 = 𝑀𝑜

Simetría Bimodal 𝑀𝑜 < 𝑀𝑒 = 𝑥 𝑀𝑜 > 𝑀𝑒 = 𝑥

9

Según la información obtenida de la media, la mediana y la moda: 𝑥 = 7

𝑀𝑒 = 7

𝑀𝑜 = 7

Comparando estos valores con los del recuadro anterior, podemos observar que nuestros valores son iguales, por lo tanto cumple con la forma 𝑀𝑜 = 𝑀𝑒 = 𝑥 mostrando un tipo de sesgo simétrico unimodal. Más adelante realizaremos el grafico de este conjunto de datos para corroborarlo. Varianza. Para el cálculo de la varianza en datos no agrupado utilizaremos la siguiente formula: 𝑆2 =

∑(𝑥 − 𝑥 )2 𝑛

En la formula ∑(𝑥 se refiere a la suma de cada dato menos la media elevando esta suma al cuadrado y esto con cada uno de los datos, lo desarrollaremos de la siguiente manera: 𝑆2 =

− 𝑥 )2

4(5 − 7)2 + 12(6 − 7)2 + 13(7 − 7)2 + 10(8 − 7)2 + 8(9 − 7)2 + 3(10 − 7)2 97 = 50 50 𝑆 2 = 1.94

Observe que se realizo 4(5 − 7)2 ya que tenemos 4 veces el 5 y para no hacer (5 − 7)2 + (5 − 7)2 + (5 − 7)2 + (5 − 7)2 , lo simplificamos.

Desviación estándar.

Para calcular la desviación estándar utilizaremos la fórmula: 𝑆 = √𝑆 2

Esto es la raíz cuadrada de la varianza, realizamos la operación:

Coeficiente de variabilidad.

𝑆 = √1.94 = 1.39

Por ultimo realizamos el cálculo de coeficiente de variabilidad con la fórmula: 𝐶𝑉 =

𝑆 𝑥

Solamente tenemos que dividir la desviación estándar entre la media. 𝐶𝑉 =

1.39 = 0.198 7

Al multiplicar este valor por 100% obtendremos:

𝐶𝑉 = 19.8% 10

Esto nos indica que los valores de nuestra distribución varían con respecto a la media 19.8%. Para los siguientes datos no agrupados calcular: Media, Mediana, Moda, tipo de sesgo, Varianza, Desviación estándar y Coeficiente de variabilidad. 1. 1 3 3

2 1 3

3 3 1

4 5 4

5 5 5

4 4 6

6 5 4

6 8 7

8 8 4

9 4 9

60 69 67 72

75 66 74 79

82 72 80 69

77 66 75 70

65 68 70 74

70 74 66 72

67 61 76 66

65 66 78 72

78 74 79 69

73 79 75

29 57 34 45 36

30 28 27 54 55

26 46 52 33 39

32 35 44 35 31

44 26 46 37 36

37 37 54 39 43

27 42 35 42 49

40 59 36 59 29

40 61 41 60 38

51 60 31 37 40

3 11 9 6 4 10

2 4 20 17 2 17

5 3 4 5 15 8

8 15 3 2 6 2

2 4 12 13 4 1

5 16 1 8 5 6

11 6 12 1 12 16

21 13 23 10 10

7 10 11 3 5

1 8 22 7 2

178 144 178 160 140 156 164

122 192 141 141 141 172 204

161 155 112 152 170 180 135

137 172 157 153 101 136 157

166 152 149 150 124 136 149

136 208 172 155 182 173

147 168 177 149 138 146

163 170 147 150 148 138

142 156 158 177 146 139

151 142 136 116 124 177

2.

3.

4.

5.

11

3. Medidas de tendencia central para datos en tabla de frecuencias simples. Ejemplo 2. Partiendo de los datos no agrupados del ejemplo 1, construya una tabla de frecuencias y calcule las medidas de tendencia central, elabore un histograma de frecuencias y calcule su desviación estándar. Solución. Comenzaremos a partir del recuadro de los datos ordenados del ejemplo 1. 5 6 7 8 9

5 6 7 8 9

5 6 7 8 9

5 6 7 8 9

6 6 7 8 9

6 6 7 8 9

6 7 7 8 9

6 7 7 8 10

6 7 7 8 10

6 7 8 9 10

Contando el número de veces que se repite cada valor podemos elaborar la siguiente tabla que se conoce como tabla de datos agrupados en frecuencias:

Dato (𝑥) 5 6 7 8 9 10

Frecuencia (𝑓) 4 12 13 10 8 3

En la tabla, la columna de los datos se designa con una 𝑥 mientras que la de frecuencias con una 𝑓 minúscula. Media. La fórmula para el cálculo de la media en tabla de datos agrupados en frecuencias es la siguiente: 𝑥 =

∑ 𝑥𝑓 ∑𝑓

Para el cálculo de la media tenemos que encontrar los valores de ∑ 𝑥𝑓 y ∑ 𝑓 según la nueva fórmula, estos se obtienen directamente de la tabla realizando una nueva columna donde se efectué la operación 𝑥𝑓 y posteriormente se sume como indica el signo de sigma y sumando los valores de la columna 𝑓 se obtiene el segundo término: Dato (𝑥) 5

Frecuencia (𝑓) 4

Operación

12

5×4

Columna 𝑥𝑓 20

6 7 8 9 10

6 × 12 7 × 13 8 × 10 9×8 10 × 3

12 13 10 8 3

∑ 𝑓 = 50

72 91 80 72 30

∑ 𝑥𝑓 = 365

Observe que ∑ 𝑓 es igual a 𝑛 en el ejemplo 1, realizamos la operación con la fórmula de la media y obtenemos: 𝑥 =

Esto es 𝑥 = 7.3~7

∑ 𝑥𝑓 365 73 = = = 7.3 ∑𝑓 50 10

Mediana.

Para encontrar la mediana tenemos que realizar una columna de frecuencias acumuladas, esta se realizara a partir del primer número de las frecuencias al cual se le sumara el siguiente número y así sucesivamente de la manera que sigue.

Dato (𝑥)

Frecuencia (𝑓)

Operación

5 6 7 8 9 10

4 12 13 10 8 3

4 4+12 16+13 29+10 39+8 47+3

∑ 𝑓 = 50

Columna de frecuencias acumuladas. 𝑓+ 4 16 29 39 47 50

Ahora buscaremos una posición en la tabla donde ubicaremos nuestra mediana utilizando la fórmula:

Realizando la operación tenemos: 𝑁𝑜 =

𝑁𝑜 =

∑𝑓+1 2

∑ 𝑓 + 1 50 + 1 = 25.5 = 2 2 13

Ahora comparamos este resultado en la columna de frecuencias acumuladas, observamos que en la primera fila nuestro valor es mayor a 4, en la segunda nuestro valor es mayor a 16, pero en la tercera nuestro valor es menor a 29, por lo tanto la mediana esta en esa fila, buscamos en la posición de los datos (𝑥) de la fila seleccionada y veremos que el número que está ahí es el 7 ese será nuestra mediana.

Moda.

𝑀𝑒 = 7

Para conseguir el valor de la moda, basta con observar en la tabla el valor de la columna de los datos (𝑥) que tenga una mayor frecuencia (𝑓), este valor será la moda, no es difícil notar que ese valor es el 7. 𝑀𝑜 = 7

Obsérvese que pudimos llegar a los mismos resultados que en el ejemplo 1, ya que, aunque agrupamos los datos de manera diferente seguimos trabajando con los mismos datos. Por lo tanto:

𝑥 = 7

𝑀𝑒 = 7

Grafico estadístico.

𝑀𝑜 = 7

Para la elaboración del estadístico nos apoyaremos en la tabla de frecuencias simples que se obtuvo al inicio del ejemplo, y el grafico quedara:

Observe la semejanza con el grafico estimado según el sesgo en el ejemplo 1, el 25.7% obtenido como el coeficiente de variabilidad nos indica el porcentaje que difiere de una distribución unimodal perfecta. Varianza. 14

Para calcular la varianza se utiliza la fórmula: 𝑆2 =

∑ 𝑓(𝑥 − 𝑥 )2 ∑𝑓

A partir de la tabla de frecuencias aremos otra columna para realizar el cálculo de ∑ 𝑓(𝑥 − 𝑥 )2 , en esta columna debemos elevar al cuadrado la diferencia de cada dato menos la media y multiplicar este resultado por la frecuencia de la siguiente manera:

Dato (𝑥) 5 6 7 8 9 10

Frecuencia (𝑓) 4 12 13 10 8 3 ∑ 𝑓 = 50

Aplicamos la fórmula: 𝑆2 =

Desviación estándar.

Operación

4(5 − 7)2 12(6 − 7)2 13(7 − 7)2 10(8 − 7)2 8(9 − 7)2 3(10 − 7)2

Columna 𝑓(𝑥 − 𝑥 )2 16 12 0 10 32 27

∑ 𝑓(𝑥 − 𝑥 )2 = 97

∑ 𝑓(𝑥 − 𝑥 )2 97 = = 1.94 ∑𝑓 50

La desviación estándar se calcula de la misma manera que en el ejemplo 1, dando como resultado: 𝑆 = √𝑆 2 = √1.94 = 1.39

En base a los Ejercicios 2, acomode todos los datos en una respectiva tabla de frecuencias y calcule nuevamente: la media, mediana y moda para corroborar sus resultados obtenidos con los primeros, realice un gráfico para cada nueva tabla y calcule la desviación estándar para corroborarla con el primer ejercicio.

4. Medidas de tendencia central para datos agrupados en intervalos de clase. Ejemplo 3. En base al siguiente conjunto de datos, acomode la información en una tabla de intervalos de clase. Posteriormente calcule las medidas de dispersión. 32 41 32 34

20 37 32 34

20 37 29 30

24 37 40 30

24 26 40 30

18 26 44 28 15

18 26 44 28

18 27 18 28

25 27 18 35

26 32 45 28

42 28 28

42 20 44

30 22 35

22 28 45

30 35 26

24 22 32

30 28 40

22 35 20

24 26 26

20 26 32

Solución. Comenzamos por utilizar una técnica de conteo para organizar los datos directamente en una tabla de frecue...


Similar Free PDFs