Title | Fase 2 -Identificación de variables estadísticas |
---|---|
Author | Edwin Avella |
Course | quimica inorganica |
Institution | Universidad Nacional Abierta y a Distancia |
Pages | 40 |
File Size | 694.3 KB |
File Type | |
Total Downloads | 2 |
Total Views | 120 |
quimica inorganica...
ESTADISTICA DESCRIPTIVA Unidad 1: – Fase 2 - Identificación de variables estadísticas
Tutor: Luis Alberto Cáceres
Presentado por: Edwin Avella Aguilar Melina Camila Murillo Carolay Stefanny Garcia Angie Yulieth Duran Grupo: 300046_111
Universidad Abierta Y A Distancia (UNAD) Bogotá 12-03-2021
INTRODUCCION La estadística agrupa un conjunto de técnicas mediante las que se recopilan, agrupan, estructuran y posteriormente se analizan conjuntos de datos, el propósito de la estadística es darles sentido o carácter a estos datos es decir que nos den una ida a la que se asimila o refleja una información sobre la cual tomar una decisión, a continuación, veremos algunos ejemplos establecidos en el área de la estadística descriptiva de la universidad nacional abierta y a distancia UNAD
OBJETIVOS Analizar situaciones representadas en los gráficos Adquirir habilidades para conseguir una tabla de frecuencias, un diagrama de barras y algunos índices descriptivos en programa R Saber interpretar tabla de frecuencias, diagrama de barras y de disposición de la información original Conocer y trabajar conceptos básicos de la estadística descriptiva Interpretar los fundamentos de los tipos de variables estadísticas cuantitativas y cualitativas y su forma de procesamiento; adquiere desarrollo de competencias para realizar recomendaciones de uso y manejo de las variables estadísticas.
1. Explica con tus propias palabras A Qué es una variable cuantitativa continua. Son las que pueden asumir un numero incontable de valores que puedo dar números decimales o fraccionarios B Qué es una variable cuantitativa discreta. Es una variable que puede contar el número de valores en lo cual pueden ser números enteros o en números naturales C Qué es una variable cualitativa nominal.
Son las que no pueden ser contadas con un número y que no admiten ningún orden D Qué es una variable cualitativa categórica. También conocidos como datos brutos hay que procesar la idea sea en una tabla Son las que se clasifican según su orden determinado, como lo puede ser por edad, por sexo los cuales pueden tener o no tener un orden lógico E Cuál es la diferencia entre media poblacional y media muestral. Indique las fórmulas de cada una. Medida poblacional son las que tienen un total de elementos que tienen características en común, lo cual pueden tener resultado exacto, requieren tiempo Muestra: Es una parte de la población donde se realizan algunos análisis pero que no son exactos pero que requieren menos tiempo Formula F. Que es la varianza de una población: la varianza es la media aritmética, la cual representa lo que varía o se desvía ciertos valores con respecto a la media. Se calcula como una suma de los datos elevados al cuadrado dividido en el total de vistas. Se elevan al cuadrado dichos datos, para que la varianza no salga negativa. Se simboliza: S = si los datos corresponden a una muestra Formula: 2
´ X Xi−¿ ¿ ¿2 ¿ ¿ N
S 2 =∑ ¿ 1
σ 2 = si los datos corresponden a una población Formula: ´ X Xi−¿ ¿ ¿2 ¿ ¿ N
σ 2 =∑ ¿ 1
G. Que es desviación estándar: La desviación estándar es una medida del grado de dispersión o separación de los valores con respecto al valor promedio. Se Calcula sacando la raíz cuadrada de la varianza. Se simboliza de la siguiente manera: S = si los datos corresponden a una muestra Formula: ´X Xi−¿ ¿ ¿2 ¿ ¿ ¿ N
∑¿ 1
S= √ ¿ σ = si los datos corresponden a una población Formula:
´X Xi−¿ ¿ ¿2 ¿ ¿ ¿ N
∑¿ 1
σ =√ ¿
H. Que es la Regla de Sturges ¿para qué sirve? La regla de sturges se utiliza cuando se pretende representar gráficamente una cantidad de valores o datos, ya que con esta se calcula o se determina el número de intervalos o clases que son fundamental para graficar en especial los histogramas de frecuencia, básicamente en esta regla se determina el ancho de estos. Formula: k =1+ log 2(N ) Donde: k es elnúmero de clases
log es ellogaritmo comun de base 10 N es el número total de observaciones de la muestra
I.Que es frecuencia absoluta: La frecuencia absoluta es una medida, la cual nos brinda información sobre la cantidad de veces que se repite un dato o el número de veces que se encuentra. La suma de la frecuencia absoluta nos debe de dar el número de datos de la población o muestra. Cabe resaltar que esta medida se puede realizar con variables cuantitativas o cualitativas siempre y cuando estas puedan ordenarse. Se denota: Fi
j. Que es frecuencia relativa: La frecuencia relativa es una medida, la cual se calcula el F cociente de la frecuencia absoluta de algún dato de una muestra o población (¿¿ i) ¿ dividido entre el total de los datos que componen dicha muestra o población (N) Se denota: hi
Es decir, para hallar la frecuencia relativa es obligatorio calcula la frecuencia absoluta
Formula:
hi=
Fi N
Cabe concluir que la suma de frecuencia relativa va a ser 1 o 100 si se mide en porcentaje
K. Qué es frecuencia relativa acumulada. La frecuencia relativa acumulada es el resultado de ir sumando las frecuencias relativas de las observaciones o valores de una población o muestra. Esta se representa por las siglas Hi. l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas de una variable continua y de una discreta? Variable discreta: si toma un número finito o infinito numerable de valores. Variable continua: si toma un número infinito no numerable de valores. Variable unidimensional: si se estudia sólo un carácter cuantitativo en cada individuo. M. Qué es un Boxplot o diagrama de cajas, para qué sirve.
El Diagrama de Caja y bigotes (box and whisker plot en inglés ) es un tipo de gráfico que muestra un resumen de una gran cantidad de datos en cinco medidas descriptivas, además de intuir su morfología y simetría. N. En qué tipo de variables se usa el histograma. Un histograma es una gráfica adecuada para representar variables continuas, aunque también se puede usar para variables discretas. Es decir, mediante un histograma se puede mostrar gráficamente la distribución de una variable cuantitativa o numérica. O. En qué tipo de variables se usa el gráfico de barras. Los gráficos de barras se componen de un eje x y un eje y. El eje x representa categorías discretas que corresponden a una o varias barras. La altura de cada barra corresponde a un valor numérico que se mide en el eje y. 2. Se le pregunto a 20 estudiantes del curso de estadística descriptiva su edad (es una variable cuantitativa continua) los meses se pasaron a números decimales.
18.4 20.4 17 20
19.2 19.4 22 21.5
19.6 21.4 15 20
23 18 22 22.7
20 24 25 19.2
a) MEDIA MUESTRAL
=
∑ xi
= 18.4 N +19.2+19.6+23+20+20.4+19.4+21.4+18+24+17+22+15+22+25+20+21.5+20+22.7+19.2 N =
407.8 =20.39 20
= 20.39 años
b) MEDIANA MUESTRAL (Me) Ordenamos los datos
15, 17, 18, 18.4, 19.2, 19.2, 25
19.4, 19.6, 20, 20, 20, 20.4, 21,4, 21,5 22, 22, 22.7, 23, 24,
X
Como los datos el total es par hallamos el promedio de los dos centrales
20 + 20 40 = =20 2 2 Me = 20 c) VARIANZA x− ¿ ¿2 ¿ ∑¿ σ 2 =¿
2
25+20.39 ¿ 2 24+20.39 ¿ +¿ 2 23+20.39 ¿ +¿ 2 22.7+20.39 ¿ ++¿ 2 22+20.39 ¿ +¿ 2 22+20.39 ¿ +¿ 2 21.5+20.39 ¿ +¿ 21.4+20.39 ¿2 +¿ 2 20.4+20.39 ¿ +¿ 2 20+20.39 ¿ +¿ 2 20+20.39 ¿ +¿ 2 20+20.39 ¿ +¿ 2 19.6+20.39 ¿ +¿ 2 19.4+20.39 ¿ +¿ 19.2+20.39 ¿2 +¿ 2 19.2+20.39 ¿ +¿ 2 18.4+20.39 ¿ +¿ 2 18+20.39 ¿ +¿ 2 17+20.39 ¿ +¿ 2 15+20.39 ¿ +¿ σ 2=¿
20
2 σ =29.05+11.4 + 5.71 + 3.96 + 1.41+ 1.41 +0.98 + 0.62 + 0.15 + 0.15 + 0.15 + 0.00 + 1.02 + 1.23 + 2.59 + 2.59 + 5.33 + 6.81 +13.03 + 21.25 20
σ2 =
108.83 =¿ 20
2
σ =5.4415
d) DESVIACIÓN ESTÁNDAR ( σ ¿
2
σ =5.4415
σ =√ 5.4415 σ =2.33 años
e) RANGO DE DATOS 15, 17, 18, 18.4, 19.2, 19.2, 25
19.4, 19.6, 20, 20, 20, 20.4, 21.4, 21.5 22, 22, 22.7, 23, 24,
Min Max R = x Max – x Min R = 25 – 15 R= 10 f) VALOR DE LOS CUARTILES Q
K .n 4
Con esta fórmula buscamos la posición 15, 17, 18, 18.4, 19.2, 19.2, 25
19.4, 19.6, 20, 20, 20, 20.4, 21.4, 21.5 22, 22, 22.7, 23, 24,
Posición
Q1
1.20 =5=19.2 4
Q2
2.20 =10 =20 4
Q3
3.20 =15 =22 4
Q4
4.20 =20 =25 4
g) GRÁFICO DE FRECUENCIA ABSOLUTA USANDO LA REGLA STURGES
K=1+3,3. logn K=1+3,3. log 20 K=5.29 =lo aproximamos a 6
R= 10 A=
R 10 = =1.6 K 6 EDADES
Fi 1 2 5 4 5 3
15 hasta 16.6 16.6 hasta 18.2 18.2 hasta 19.8 19.8 hasta 21.4 21.4 hasta 23 23 hasta 25
3. A los mismos estudiantes se les preguntó cuántos hermanos tenían (variable cuantitativa discreta): 0 3 0 3
1 2 5 2
4 3 4 2
1 1 3 0
2 2 2 1
A continuación, calcularemos el número de intervalos, el rango y la amplitud con los cuales construiremos nuestra tabla de distribución de datos: K
N° de intervalos
K= 1 + 3,322 Log n ; siendo n el número total de datos (20) K= 1 + 3,322 Log 20 K = 5,32 ≈ 6 ( tomamos el número próximo) R
Rango
R= XMax – XMin R= 5 – 0 R= 5 A
Amplitud
A=
R K
A=
5 6
A= 0,83 A≈1
Hermanos
X
f
fr
F
Xf
(x-)2
(x-)2 * f
[0 - 1)
0,5
3
0,15
3
1,5
4,20
12,6
[1 - 2)
1,5
4
0,2
7
6
1,10
4,4
[2 – 3)
2,5
6
0,3
13
15
0,0025
0,015
[3 – 4)
3,5
4
0,2
17
14
0,90
3,6
[4 – 5)
4,5
2
0,1
19
9
3,80
7,6
[5 – 6)
5,5
1
0,05
20
5,5
8,70
8,70
∑
20
1
51
18,70
36,915
Hallar: a. Media muestral.
Media muestral
= =
∑ X∗f n
51 20
= 2,55 b. Mediana muestral.
Posición
Me= Li +
n 20 = 2 2
= 10
N −Fi−1 2 ∗Ai fi
; siendo: Li=2 fi= 6 Fi – 1=7 Ai = Ls – Li = 1
Me = 2 +
Me= 2 +
20 −7 2 ∗1 6 3 ∗1 6
Me= 2 + 0,5 Me= 2,5
c. Moda. fi −fi −1 ∗Ai ; siendo: Li=2 fi=6 fi – 1=4 fi + 1 = 4 Ai = 1 (fi −fi −1 ) +( fi−fi+1)
Mo = Li + Mo = 2 +
6−4 ∗1 (6−4 ) +(6−4)
Mo = 2 +
2 ∗1 2+2
Mo = 2 +
2 4
Mo = 2 + 0,5 Mo = 2,5
d. Varianza. S2 Varianza muestral
∑ (x-)2 * f S = ; siendo n= 20 n–1 2
36,915 S2 = 19
S2 = 1,94 Hermanos2 e. Desviación estándar.
S
Desviación estándar muestral
S=
√S
S=
√ 1,94 Hermanos
2 2
S= 1,39 Hermanos
f. Rango de datos. R
Rango
R= XMax – XMin R= 5 – 0 R= 5
g. Indicar el valor de los cuatro cuartiles.
Qk =
k∗ n 4
Q1 =
1∗20 4
Q1 = 5
posición en Fi
Qk = Li + A
(
kn −Fi−1 4 Fi − Fi−1
Q1 = 1+ 1
5−3 ( 7−3 )
Q1 = 1 + 1
( 24 )
)
; siendo: Li=1 Fi=7 Fi – 1=3 Ai =1
Q1 = 1 +
( 24 )
Q1 = 1,5
Primer cuartil
Qk =
k∗ n 4
Q2 =
2∗20 4
Q2 = 10
posición en Fi
(
Qk = Li + A
Q2 = 2+ Q2 = 2,5
Segundo cuartil
k∗ n 4
Q3 =
3∗20 4 posición en Fi
Qk = Li + A
Q3 = 3+ 1 Q3 = 3+ 1
; siendo: Li=2 Fi=13 Fi – 1=7 Ai =1
( 36 ) ( 36 )
Qk =
Q3 = 15
)
( 1013−−77 )
Q2 = 2+ 1 Q2 = 2 + 1
kn −Fi−1 4 Fi − Fi−1
(
kn −Fi−1 4 Fi − Fi −1
( 1517−−1313 ) ( 24 )
)
; siendo: Li=3 Fi=17 Fi – 1=13 Ai =1
Q3 = 3 +
( 24 )
Q3 = 3,5
Tercer cuartil
Qk =
k∗ n 4
Q4 =
4∗20 4
Q4 = 20
posición en Fi
Q4 = Ls Q4 = 6
Cuarto cuartil
a. Gráficos de variable cuantitativa continua i. Histograma con Regla de Sturges variable edad
4 0
2
Frequency
6
8
PERIODO 951 - Histograma con Regla de Sturges variable e
16
18
20
22
24
edad La regla de Sturges es un método empírico muy utilizado en la estadística descriptiva para determinar el número de clases que deben existir en un histograma de frecuencias, para así poder clasificar un conjunto de datos que representan una muestra o población.
ii. Histograma de la variable continua Edad
4 0
2
Frecuencia
6
8
PERIODO 951 - Histograma de la variable continua Edad
14
16
18
20
22
24
26
edad
En este histograma de la variable continua de edad se observa que el intervalo o la edad media es de 20años
iii. Boxplot o diagrama de cajas variable continua
20 16
18
Edad (años)
22
24
PERIODO 951 - Boxplot o diagrama de cajas variable con
El Diagrama de Caja y bigotes es un tipo de gráfico que muestra un resumen de una gran cantidad de datos en cinco medidas descriptivas, además de intuir su morfología y simetría. Este tipo de gráficos nos permite identificar valores atípicos y comparar distribuciones
3 2 0
1
número de hermanos
4
5
PERIODO 951 - Boxplot o diagrama de cajas variable discre
Boxplot o diagrama de cajas variable discreta El diagrama de cajas es un gráfico utilizado para representar una variable cuantitativa (variable numérica). El gráfico es una herramienta que permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la median Esta representación proporciona una visión rápida de la distribución, apreciando una asimetría en el centro, este caso es porque en la variable discreta el número intermedio de hermanos es 2
4 3 2 0
1
Frecuencias absolutas
5
6
PERIODO 951 - Diagrama de barras Frecuencia Absoluta
0
1
2
3
4
5
Número de hermanos
Diagrama de barras Frecuencia Absoluta Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas En este caso representa el número total de hermanos
0.20 0.15 0.10 0.00
0.05
Frecuencias relativas
0.25
0.30
PERIODO 951 - Diagrama de barras Frecuencia relativa
0
1
2
3
4
5
Número de hermanos
Diagrama de barras Frecuencia relativa Un diagrama de barras es un gráfico usado para representar datos cualitativos o datos cuantitativos discretos tomando en cuenta la frecuencia absoluta, relativa o porcentual. Un polígono de frecuencias es un gráfico que se forma uniendo los extremos de las barras (de un gráfico de barras) mediante segmentos en este caso representa el valor de la frecuencia relativa frente al número de hermanos
0.6 0.4 0.0
0.2
Frecuencias relativas
0.8
1.0
RIODO 951 - Diagrama de barras Frecuencias relativas acum
0
1
2
3
4
5
Número de hermanos
Diagrama de barras Frecuencias relativas acumuladas La frecuencia acumulada es aquella que acumula frecuencias absolutas (simples y/o relativas) hasta un determinado valor de la variable. Sumando las frecuencias de todos los valores inferiores a un límite fijado, obtenemos la frecuencia relativa acumulada hasta ese valor. En este caso podemos observar que va de tal manera como se anuncia anteriormente que va de valores inferiores de hermanos hasta un límite fijo
PERIODO 951 - Gráfico de tarta de Hermanos
1
0
2 5
4
3
Gráfico de tarta de Hermanos Este método gráfico es un instrumento auxiliar de análisis y presentación de la información, que resulta muy valioso para el investigador. Éste, como un diagrama en forma de círculo, es particularmente útil para visualizar las diferencias de frecuencia entre la edad de hermanos
3 2 0
1
Frecuencias absolutas
4
5
951 - Diagrama de barras frecuencias absolutas nivel de est
Sin estudios
Estudios Secundarios Nivel de estudio
Diagrama de barras frecuencias absolutas nivel de estudio agricultor Es la cantidad de datos que integran cada una de las clases o categorías. ya sea que son las repeticiones que encontramos dentro de una misma clase en este caso es según su nivel de estudio que infiere en las frecuencias absolutas al dar el dato real del nivel de estudio
0.25 0.20 0.15 0.10 0.00
0.05
Frecuencias relativas
0.30
0.35
51 - Diagrama de barras frecuencias relativas nivel de estudio
Sin estudios
Estudios Secundarios Nivel de estudio
Diagrama de barras frecuencias relativas nivel de estudio de agricultores Es la cantidad de repeticiones obtenidas para cada clase o categoría, en relación al total de las observaciones. Resulta de dividir la cantidad de elementos de cada clase (frecuencia absoluta) por el tamaño de la muestra. La notación es fr o h, según la bibliografía, es decir que en este diagrama de barras de frecuencia relativas expresa nuevamente el nivel de estudio de los agricultores, pero con una frecuencia relativa menor
RESULTADOS “R CONSOLÉ”
R version 4.0.2 (2020-06-22) -- "Taking Off Again" Copyright (C) 2020 The R Foundation for Statistical Computing Platform: x86_64-w64-mingw32/x64 (64-bit)
R es un software libre y viene sin GARANTIA ALGUNA. Usted puede redistribuirlo bajo ciertas circunstancias. Escriba 'license()' o 'licence()' para detalles de distribucion.
R es un proyecto colaborativo con muchos contribuyentes. Escriba 'contributors()' para obtener...