Title | Estadistica Descriptiva |
---|---|
Author | Marìa Ponce Jimènez |
Course | Farmacología |
Institution | Universidad de Sevilla |
Pages | 5 |
File Size | 194.4 KB |
File Type | |
Total Views | 191 |
Download Estadistica Descriptiva PDF
MEDIDAS NUMERICAS
-variables cuantitativas -> intenta describir como se distingue con los valores que toma una variable numerica en un grupo de poblacion
MEDIA, PROMEDIO O MEDIA ARITMETICA
MEDIA Representante del grupo (no smp) La media debe estar cerca de los valores individulaes que la formas, pero se deja influir x valores extremos (valores que se alejan del grupo de numeros q forman la media alterando esta) Al sumar el resultado de cada numero--media da 0
-N (arriba) SUMATORIO Xi (en medio) i=1 (abajo) = sumar todos los pesos (Xi) desde qie i=1 (X1) hasta Xn
-SUMATORIO de Xi x Ni / N = mult cada valor x las veces q se repite y sumarlos (2x2)+(3x4)...
MODA El numero que mas se repite (el xi que mayor ni (frecuencia absoluta) tienen) Unimodal, multimodal
MEDIANA Cuando no nos interesa la media xq se ve influenciada x valores extremos. El valor que tiene aquella observacion que divide las cantidades de observaciones en dos mitades iguales Cojo todas las observaciones, las ordeno de menor a mayor y cojo el valor del centro (que deje el mismo numero de valores a suderecha y a su izq)
Ej: 2 5 7 9 11
mediana= 7
Si el num de observaciones fuera par se hace la media entre los 2 de en medio
Ej: 1 2 3 4 5 6 7 8
mediana= 4+5 / 2 = 4,5
Si nos dan los datos en una tabla (tabulados) se divide el total /2 y se busca un Ni igual, si no hay, la mdiana sera el siguiente mayor
Ej diap: total =15 -> 15/2=7,5 En la tabla no hay 7,5, el inmediatamente mayor es 10, asiq la mediana es su dato (ME=53)
Si hay una frec absoluta (Ni) = total/2 -> cojo el Ni=total/d2 y hago la media de su valor (Xi) y el siguiente
Ej: total 14, 14/2=7 ME
existe Ni=7 su Xi es 48 y el siguiente 53
48+53 / 2 =
CUANTILES Como la mediana pero en vez de dejar 2 partes igual deja mas (4=cuartiles (Q) 2 cuartiles = mediana, terciles, deciles, percentiles…)
Media, mediana y moda son procesos de distribución central. Cuando hablamos dr una distribución Normal, la media, la moda y la media (si es unimodal) son el mismo valor; y la forma en la que se distribuye hacia ambos lados es la misma.
MEDIDAS DE DISPERSION Como se organizan los datos respecto a esa media (lo que se extienden los valores a ambos lados de la media) El diap: rojo, azul y verde misma media. Azul el mas disperso (laxo) (la media no es muy representativa), rojo el menos disperso (media representativa)
RANGO Diferencia entre máximo y minimo (mayor y menor) Ej: 2,4,8,10,12
Rango: 12-2= 10
Ej: 2,8,0,12,32
Rango: 32-2= 30
Cuanto mayor sea el rango mayor será la dispersión. Si dos resultados tienen un rango igual o muy parecido o es representativo, elegimos los centrales, eliminando los extremos Ej: 140, 165, 175, 180, 185
165,175,180,185, 190
4 de 5 son iguales
Cuando estamos en una grafica, se coge el rango intercuartílico (de Q1 a Q3)
VARIANZA Mide como se aglutinan los valores entorno a un valor central (los seguidores del 2º capitan america de la diap están mas dispersos xq sumando las distancias da un numero mayor que si sumamos las distancias del 1º capitan america).
Vari= Sumatoriario (Xi – X) ^2 / n
Xi: cada dato // X: media // n: numero d datos
Pero: la varianza (Xi-X) tendrá valores positivos y negativos que se anularan, para que el resultado no sea cero elevamos los valores al cuadrado VARIANZA -> DESVIACION TIPICA Ej: (Distancia en m) 5m
o
+- 2m^2 -> +- (raíz)2
7m
+- 1,5m^2 -> +- (raíz)1,5
9m
+- 3 m^2 -> +- (raíz)3
10m
+-5m^2 -> +- (raíz)5
LA DESVIACION TIPICA(σ) ES LA RAIZ CUADRADA DE LA VARIANZA (σ^2)
COMPARAR LA DISPERSION ENTRE DISTINTAS UNIDADES Coeficiente de variación (CV) = σ/ |X| -> se anulan las unidades de la desv típica y de la media, obteniendo el CV
GRAFICA -Variables cualitativas -> diagrama de barras y sectores -Variables numéricas -> diagrama de puntos (para numero reducido de datos, permite identificar la localización de los datos y la dispersión o variabilidad
HISTOGRAMA La superficie de cada barra es proporcional a la frecuencia de los valores representados. La base de cada barra es la amplitud (puede ser iguales entre barras o distintas)
Piramide de población -> diferencia de población de edad x tramos de edad (mujeres a la izquierda y hombres a la derecha)
El polígono de frecuencia mide la altura de la marca de clase (punto medio del intervalo)
BOX-PLOT – DIAGRAMA DE CAJAS Y BIGOTES Se contruye mediante cuartiles La caja va del Q1 al Q3, con el Q2 dentro (representado con una línea vertical que es la mediana). Si la línea dela mediana está en el centro la gafica será simétrica (la media coincide con la mediana) , si no será asimétrica. Q1 = 25 / Q2=50 / Q3= 75 / Q4=100 Si va de Q1 a Q3 ( 25 a 75) dentro hay 50, es decir la mitad En la caja esta el 50% de los sujetos y vemos como se comportan sin tener en cuenta los extremos
Los bigotes: Las vallas las construyo multuplicando el rango intercuartílico (la base de la caja) x 1,5 y x 3 y veo el ultimo sujeto que esta dentro de ese valor
Los bigotes terminan en el valor maximo En cada bigote esta el 25% restante, ahí podemos encontrar los valores extremos (fuera de ellos, pasando el valor maximo) 2 2 4 4 6 7 8 8 10 10 11 12 14 27 -> me= 8
COMPARACION DE CUANTILES O QQ PLOT Para saber si los valores de una variable adquieren una distribución normal
DIAGRAMAS DE DISPERSION: DOS VARIABLES En función de como es la nube de putos nos dice si existe una relación directa o no entre las 2 variables...