Fase 2 -Identificación de variables estadísticas PDF

Title Fase 2 -Identificación de variables estadísticas
Author Edwin Avella
Course quimica inorganica
Institution Universidad Nacional Abierta y a Distancia
Pages 40
File Size 694.3 KB
File Type PDF
Total Downloads 2
Total Views 120

Summary

quimica inorganica...


Description

ESTADISTICA DESCRIPTIVA Unidad 1: – Fase 2 - Identificación de variables estadísticas

Tutor: Luis Alberto Cáceres

Presentado por: Edwin Avella Aguilar Melina Camila Murillo Carolay Stefanny Garcia Angie Yulieth Duran Grupo: 300046_111

Universidad Abierta Y A Distancia (UNAD) Bogotá 12-03-2021

INTRODUCCION La estadística agrupa un conjunto de técnicas mediante las que se recopilan, agrupan, estructuran y posteriormente se analizan conjuntos de datos, el propósito de la estadística es darles sentido o carácter a estos datos es decir que nos den una ida a la que se asimila o refleja una información sobre la cual tomar una decisión, a continuación, veremos algunos ejemplos establecidos en el área de la estadística descriptiva de la universidad nacional abierta y a distancia UNAD

OBJETIVOS Analizar situaciones representadas en los gráficos Adquirir habilidades para conseguir una tabla de frecuencias, un diagrama de barras y algunos índices descriptivos en programa R Saber interpretar tabla de frecuencias, diagrama de barras y de disposición de la información original Conocer y trabajar conceptos básicos de la estadística descriptiva Interpretar los fundamentos de los tipos de variables estadísticas cuantitativas y cualitativas y su forma de procesamiento; adquiere desarrollo de competencias para realizar recomendaciones de uso y manejo de las variables estadísticas.

1. Explica con tus propias palabras A Qué es una variable cuantitativa continua. Son las que pueden asumir un numero incontable de valores que puedo dar números decimales o fraccionarios B Qué es una variable cuantitativa discreta. Es una variable que puede contar el número de valores en lo cual pueden ser números enteros o en números naturales C Qué es una variable cualitativa nominal.

Son las que no pueden ser contadas con un número y que no admiten ningún orden D Qué es una variable cualitativa categórica. También conocidos como datos brutos hay que procesar la idea sea en una tabla Son las que se clasifican según su orden determinado, como lo puede ser por edad, por sexo los cuales pueden tener o no tener un orden lógico E Cuál es la diferencia entre media poblacional y media muestral. Indique las fórmulas de cada una. Medida poblacional son las que tienen un total de elementos que tienen características en común, lo cual pueden tener resultado exacto, requieren tiempo Muestra: Es una parte de la población donde se realizan algunos análisis pero que no son exactos pero que requieren menos tiempo Formula F. Que es la varianza de una población: la varianza es la media aritmética, la cual representa lo que varía o se desvía ciertos valores con respecto a la media. Se calcula como una suma de los datos elevados al cuadrado dividido en el total de vistas. Se elevan al cuadrado dichos datos, para que la varianza no salga negativa. Se simboliza: S = si los datos corresponden a una muestra Formula: 2

´ X Xi−¿ ¿ ¿2 ¿ ¿ N

S 2 =∑ ¿ 1

σ 2 = si los datos corresponden a una población Formula: ´ X Xi−¿ ¿ ¿2 ¿ ¿ N

σ 2 =∑ ¿ 1

G. Que es desviación estándar: La desviación estándar es una medida del grado de dispersión o separación de los valores con respecto al valor promedio. Se Calcula sacando la raíz cuadrada de la varianza. Se simboliza de la siguiente manera: S = si los datos corresponden a una muestra Formula: ´X Xi−¿ ¿ ¿2 ¿ ¿ ¿ N

∑¿ 1

S= √ ¿ σ = si los datos corresponden a una población Formula:

´X Xi−¿ ¿ ¿2 ¿ ¿ ¿ N

∑¿ 1

σ =√ ¿

H. Que es la Regla de Sturges ¿para qué sirve? La regla de sturges se utiliza cuando se pretende representar gráficamente una cantidad de valores o datos, ya que con esta se calcula o se determina el número de intervalos o clases que son fundamental para graficar en especial los histogramas de frecuencia, básicamente en esta regla se determina el ancho de estos. Formula: k =1+ log 2(N ) Donde: k es elnúmero de clases

log es ellogaritmo comun de base 10 N es el número total de observaciones de la muestra

I.Que es frecuencia absoluta: La frecuencia absoluta es una medida, la cual nos brinda información sobre la cantidad de veces que se repite un dato o el número de veces que se encuentra. La suma de la frecuencia absoluta nos debe de dar el número de datos de la población o muestra. Cabe resaltar que esta medida se puede realizar con variables cuantitativas o cualitativas siempre y cuando estas puedan ordenarse. Se denota: Fi

j. Que es frecuencia relativa: La frecuencia relativa es una medida, la cual se calcula el F cociente de la frecuencia absoluta de algún dato de una muestra o población (¿¿ i) ¿ dividido entre el total de los datos que componen dicha muestra o población (N) Se denota: hi 

Es decir, para hallar la frecuencia relativa es obligatorio calcula la frecuencia absoluta

Formula:

hi=

Fi N

Cabe concluir que la suma de frecuencia relativa va a ser 1 o 100 si se mide en porcentaje

K. Qué es frecuencia relativa acumulada. La frecuencia relativa acumulada es el resultado de ir sumando las frecuencias relativas de las observaciones o valores de una población o muestra. Esta se representa por las siglas Hi. l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas de una variable continua y de una discreta? Variable discreta: si toma un número finito o infinito numerable de valores. Variable continua: si toma un número infinito no numerable de valores. Variable unidimensional: si se estudia sólo un carácter cuantitativo en cada individuo. M. Qué es un Boxplot o diagrama de cajas, para qué sirve.

El Diagrama de Caja y bigotes (box and whisker plot en inglés ) es un tipo de gráfico que muestra un resumen de una gran cantidad de datos en cinco medidas descriptivas, además de intuir su morfología y simetría. N. En qué tipo de variables se usa el histograma. Un histograma es una gráfica adecuada para representar variables continuas, aunque también se puede usar para variables discretas. Es decir, mediante un histograma se puede mostrar gráficamente la distribución de una variable cuantitativa o numérica. O. En qué tipo de variables se usa el gráfico de barras. Los gráficos de barras se componen de un eje x y un eje y. El eje x representa categorías discretas que corresponden a una o varias barras. La altura de cada barra corresponde a un valor numérico que se mide en el eje y. 2. Se le pregunto a 20 estudiantes del curso de estadística descriptiva su edad (es una variable cuantitativa continua) los meses se pasaron a números decimales.

18.4 20.4 17 20

19.2 19.4 22 21.5

19.6 21.4 15 20

23 18 22 22.7

20 24 25 19.2

a) MEDIA MUESTRAL

=

∑ xi

= 18.4 N +19.2+19.6+23+20+20.4+19.4+21.4+18+24+17+22+15+22+25+20+21.5+20+22.7+19.2 N =

407.8 =20.39 20

 = 20.39 años

b) MEDIANA MUESTRAL (Me) Ordenamos los datos

15, 17, 18, 18.4, 19.2, 19.2, 25

19.4, 19.6, 20, 20, 20, 20.4, 21,4, 21,5 22, 22, 22.7, 23, 24,

X

Como los datos el total es par hallamos el promedio de los dos centrales

20 + 20 40 = =20 2 2 Me = 20 c) VARIANZA x− ¿ ¿2 ¿ ∑¿ σ 2 =¿

2

25+20.39 ¿ 2 24+20.39 ¿ +¿ 2 23+20.39 ¿ +¿ 2 22.7+20.39 ¿ ++¿ 2 22+20.39 ¿ +¿ 2 22+20.39 ¿ +¿ 2 21.5+20.39 ¿ +¿ 21.4+20.39 ¿2 +¿ 2 20.4+20.39 ¿ +¿ 2 20+20.39 ¿ +¿ 2 20+20.39 ¿ +¿ 2 20+20.39 ¿ +¿ 2 19.6+20.39 ¿ +¿ 2 19.4+20.39 ¿ +¿ 19.2+20.39 ¿2 +¿ 2 19.2+20.39 ¿ +¿ 2 18.4+20.39 ¿ +¿ 2 18+20.39 ¿ +¿ 2 17+20.39 ¿ +¿ 2 15+20.39 ¿ +¿ σ 2=¿

20

2 σ =29.05+11.4 + 5.71 + 3.96 + 1.41+ 1.41 +0.98 + 0.62 + 0.15 + 0.15 + 0.15 + 0.00 + 1.02 + 1.23 + 2.59 + 2.59 + 5.33 + 6.81 +13.03 + 21.25 20

σ2 =

108.83 =¿ 20

2

σ =5.4415

d) DESVIACIÓN ESTÁNDAR ( σ ¿

2

σ =5.4415

σ =√ 5.4415 σ =2.33 años

e) RANGO DE DATOS 15, 17, 18, 18.4, 19.2, 19.2, 25

19.4, 19.6, 20, 20, 20, 20.4, 21.4, 21.5 22, 22, 22.7, 23, 24,

Min Max R = x Max – x Min R = 25 – 15 R= 10 f) VALOR DE LOS CUARTILES Q

K .n 4

Con esta fórmula buscamos la posición 15, 17, 18, 18.4, 19.2, 19.2, 25

19.4, 19.6, 20, 20, 20, 20.4, 21.4, 21.5 22, 22, 22.7, 23, 24,

Posición

Q1

1.20 =5=19.2 4

Q2

2.20 =10 =20 4

Q3

3.20 =15 =22 4

Q4

4.20 =20 =25 4

g) GRÁFICO DE FRECUENCIA ABSOLUTA USANDO LA REGLA STURGES

K=1+3,3. logn K=1+3,3. log 20 K=5.29 =lo aproximamos a 6

R= 10 A=

R 10 = =1.6 K 6 EDADES

Fi 1 2 5 4 5 3

15 hasta 16.6 16.6 hasta 18.2 18.2 hasta 19.8 19.8 hasta 21.4 21.4 hasta 23 23 hasta 25

3. A los mismos estudiantes se les preguntó cuántos hermanos tenían (variable cuantitativa discreta): 0 3 0 3

1 2 5 2

4 3 4 2

1 1 3 0

2 2 2 1

A continuación, calcularemos el número de intervalos, el rango y la amplitud con los cuales construiremos nuestra tabla de distribución de datos: K

N° de intervalos

K= 1 + 3,322 Log n ; siendo n el número total de datos (20) K= 1 + 3,322 Log 20 K = 5,32 ≈ 6 ( tomamos el número próximo) R

Rango

R= XMax – XMin R= 5 – 0 R= 5 A

Amplitud

A=

R K

A=

5 6

A= 0,83 A≈1

Hermanos

X

f

fr

F

Xf

(x-)2

(x-)2 * f

[0 - 1)

0,5

3

0,15

3

1,5

4,20

12,6

[1 - 2)

1,5

4

0,2

7

6

1,10

4,4

[2 – 3)

2,5

6

0,3

13

15

0,0025

0,015

[3 – 4)

3,5

4

0,2

17

14

0,90

3,6

[4 – 5)

4,5

2

0,1

19

9

3,80

7,6

[5 – 6)

5,5

1

0,05

20

5,5

8,70

8,70



20

1

51

18,70

36,915

Hallar: a. Media muestral. 

Media muestral

= =

∑ X∗f n

51 20

 = 2,55 b. Mediana muestral.

Posición

Me= Li +

n 20 = 2 2

= 10

N −Fi−1 2 ∗Ai fi

; siendo: Li=2 fi= 6 Fi – 1=7 Ai = Ls – Li = 1

Me = 2 +

Me= 2 +

20 −7 2 ∗1 6 3 ∗1 6

Me= 2 + 0,5 Me= 2,5

c. Moda. fi −fi −1 ∗Ai ; siendo: Li=2 fi=6 fi – 1=4 fi + 1 = 4 Ai = 1 (fi −fi −1 ) +( fi−fi+1)

Mo = Li + Mo = 2 +

6−4 ∗1 (6−4 ) +(6−4)

Mo = 2 +

2 ∗1 2+2

Mo = 2 +

2 4

Mo = 2 + 0,5 Mo = 2,5

d. Varianza. S2 Varianza muestral

∑ (x-)2 * f S = ; siendo n= 20 n–1 2

36,915 S2 = 19

S2 = 1,94 Hermanos2 e. Desviación estándar.

S

Desviación estándar muestral

S=

√S

S=

√ 1,94 Hermanos

2 2

S= 1,39 Hermanos

f. Rango de datos. R

Rango

R= XMax – XMin R= 5 – 0 R= 5

g. Indicar el valor de los cuatro cuartiles.

Qk =

k∗ n 4

Q1 =

1∗20 4

Q1 = 5

posición en Fi

Qk = Li + A

(

kn −Fi−1 4 Fi − Fi−1

Q1 = 1+ 1

5−3 ( 7−3 )

Q1 = 1 + 1

( 24 )

)

; siendo: Li=1 Fi=7 Fi – 1=3 Ai =1

Q1 = 1 +

( 24 )

Q1 = 1,5

Primer cuartil

Qk =

k∗ n 4

Q2 =

2∗20 4

Q2 = 10

posición en Fi

(

Qk = Li + A

Q2 = 2+ Q2 = 2,5

Segundo cuartil

k∗ n 4

Q3 =

3∗20 4 posición en Fi

Qk = Li + A

Q3 = 3+ 1 Q3 = 3+ 1

; siendo: Li=2 Fi=13 Fi – 1=7 Ai =1

( 36 ) ( 36 )

Qk =

Q3 = 15

)

( 1013−−77 )

Q2 = 2+ 1 Q2 = 2 + 1

kn −Fi−1 4 Fi − Fi−1

(

kn −Fi−1 4 Fi − Fi −1

( 1517−−1313 ) ( 24 )

)

; siendo: Li=3 Fi=17 Fi – 1=13 Ai =1

Q3 = 3 +

( 24 )

Q3 = 3,5

Tercer cuartil

Qk =

k∗ n 4

Q4 =

4∗20 4

Q4 = 20

posición en Fi

Q4 = Ls Q4 = 6

Cuarto cuartil

a. Gráficos de variable cuantitativa continua i. Histograma con Regla de Sturges variable edad

4 0

2

Frequency

6

8

PERIODO 951 - Histograma con Regla de Sturges variable e

16

18

20

22

24

edad La regla de Sturges es un método empírico muy utilizado en la estadística descriptiva para determinar el número de clases que deben existir en un histograma de frecuencias, para así poder clasificar un conjunto de datos que representan una muestra o población.

ii. Histograma de la variable continua Edad

4 0

2

Frecuencia

6

8

PERIODO 951 - Histograma de la variable continua Edad

14

16

18

20

22

24

26

edad

En este histograma de la variable continua de edad se observa que el intervalo o la edad media es de 20años

iii. Boxplot o diagrama de cajas variable continua

20 16

18

Edad (años)

22

24

PERIODO 951 - Boxplot o diagrama de cajas variable con

El Diagrama de Caja y bigotes es un tipo de gráfico que muestra un resumen de una gran cantidad de datos en cinco medidas descriptivas, además de intuir su morfología y simetría. Este tipo de gráficos nos permite identificar valores atípicos y comparar distribuciones

3 2 0

1

número de hermanos

4

5

PERIODO 951 - Boxplot o diagrama de cajas variable discre

Boxplot o diagrama de cajas variable discreta El diagrama de cajas es un gráfico utilizado para representar una variable cuantitativa (variable numérica). El gráfico es una herramienta que permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la median Esta representación proporciona una visión rápida de la distribución, apreciando una asimetría en el centro, este caso es porque en la variable discreta el número intermedio de hermanos es 2

4 3 2 0

1

Frecuencias absolutas

5

6

PERIODO 951 - Diagrama de barras Frecuencia Absoluta

0

1

2

3

4

5

Número de hermanos

Diagrama de barras Frecuencia Absoluta Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas En este caso representa el número total de hermanos

0.20 0.15 0.10 0.00

0.05

Frecuencias relativas

0.25

0.30

PERIODO 951 - Diagrama de barras Frecuencia relativa

0

1

2

3

4

5

Número de hermanos

Diagrama de barras Frecuencia relativa Un diagrama de barras es un gráfico usado para representar datos cualitativos o datos cuantitativos discretos tomando en cuenta la frecuencia absoluta, relativa o porcentual. Un polígono de frecuencias es un gráfico que se forma uniendo los extremos de las barras (de un gráfico de barras) mediante segmentos en este caso representa el valor de la frecuencia relativa frente al número de hermanos

0.6 0.4 0.0

0.2

Frecuencias relativas

0.8

1.0

RIODO 951 - Diagrama de barras Frecuencias relativas acum

0

1

2

3

4

5

Número de hermanos

Diagrama de barras Frecuencias relativas acumuladas La frecuencia acumulada es aquella que acumula frecuencias absolutas (simples y/o relativas) hasta un determinado valor de la variable. Sumando las frecuencias de todos los valores inferiores a un límite fijado, obtenemos la frecuencia relativa acumulada hasta ese valor. En este caso podemos observar que va de tal manera como se anuncia anteriormente que va de valores inferiores de hermanos hasta un límite fijo

PERIODO 951 - Gráfico de tarta de Hermanos

1

0

2 5

4

3

Gráfico de tarta de Hermanos Este método gráfico es un instrumento auxiliar de análisis y presentación de la información, que resulta muy valioso para el investigador. Éste, como un diagrama en forma de círculo, es particularmente útil para visualizar las diferencias de frecuencia entre la edad de hermanos

3 2 0

1

Frecuencias absolutas

4

5

951 - Diagrama de barras frecuencias absolutas nivel de est

Sin estudios

Estudios Secundarios Nivel de estudio

Diagrama de barras frecuencias absolutas nivel de estudio agricultor Es la cantidad de datos que integran cada una de las clases o categorías. ya sea que son las repeticiones que encontramos dentro de una misma clase en este caso es según su nivel de estudio que infiere en las frecuencias absolutas al dar el dato real del nivel de estudio

0.25 0.20 0.15 0.10 0.00

0.05

Frecuencias relativas

0.30

0.35

51 - Diagrama de barras frecuencias relativas nivel de estudio

Sin estudios

Estudios Secundarios Nivel de estudio

Diagrama de barras frecuencias relativas nivel de estudio de agricultores Es la cantidad de repeticiones obtenidas para cada clase o categoría, en relación al total de las observaciones. Resulta de dividir la cantidad de elementos de cada clase (frecuencia absoluta) por el tamaño de la muestra. La notación es fr o h, según la bibliografía, es decir que en este diagrama de barras de frecuencia relativas expresa nuevamente el nivel de estudio de los agricultores, pero con una frecuencia relativa menor

RESULTADOS “R CONSOLÉ”

R version 4.0.2 (2020-06-22) -- "Taking Off Again" Copyright (C) 2020 The R Foundation for Statistical Computing Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA. Usted puede redistribuirlo bajo ciertas circunstancias. Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes. Escriba 'contributors()' para obtener...


Similar Free PDFs