Distribucion DE Frecuencias PDF

Title Distribucion DE Frecuencias
Author Lucia Mn
Course Estadística 1
Institution Universidad Latinoamericana
Pages 20
File Size 598.2 KB
File Type PDF
Total Downloads 94
Total Views 171

Summary

Estadística 1 y 2 conceptos y ejercicios detallados...


Description

DISTRIBUCIÓN DE FRECUENCIAS 1. INTRODUCCIÓN Los datos obtenidos mediante la aplicación de las técnicas de recolección conocidas deben ser tabulados y luego organizados siguiendo un criterio determinado a fin de presentarlos en cuadros de distribución de frecuencias, de acuerdo a la característica de la población que está siendo investigada, con el propósito de analizar la información, interpretarla y con base en ella tomar mejores decisiones.

2. FORMAS Y TIPOS DE DISTRIBUCIONES DE FRECUENCIAS La distribución de frecuencias para atributos se presenta como dos tipos: para atributo nominal y para atributo ordinal. La distribución de frecuencias para variables, según el número de observaciones y valores diferentes que adopta la variable, puede presentarse como: a) Distribución de frecuencias tipo I. Si la distribución de frecuencias corresponde a pocas observaciones y pocos valores diferentes de la variable. Su presentación no exige una técnica determinada, ya que, casi no son susceptibles de tratamiento estadístico, puesto que, para que éste exista, es necesario un volumen masivo de observaciones. b) Distribución de frecuencias tipo II. Cuando son muchas las observaciones y pocos los valores diferentes que adopta la variable. c) Distribución de frecuencias tipo IIII. Cuando el número de observaciones es grande y también los valores diferentes que toma la variable observada. Para un mejor entendimiento de las formas y tipos de distribución de frecuencias, se desarrolla un diagrama mostrado en la figura 3.2.1. Figura 3.2.1. Formas y tipos de distribuciones de frecuencias Nominales (Sin ordenación)

Atributos (cualitativos)

Ordinales (Se pueden ordenar)

Distribuciones de Frecuencias

Tipo I Tipo II Tipo III

Variables (cuantificables)

Número de observaciones Pequeño Grande Grande

Fuente: Elaboración Propia

36

Número de valores diferentes Pequeño Pequeño Grande

3. DISTRIBUCIÓN DE FRECUENCIAS DE ATRIBUTOS 3.1. Distribución de frecuencias de atributo nominal Las modalidades obtenidas para un atributo nominal se organizan teniendo en cuenta las propiedades de una escala de medición nominal. Se designa con “A” el atributo. Sus diferentes modalidades se denotan con el símbolo: “a i”, para i=1, 2, 3,..., n. En lugar de un nombre o un símbolo para el atributo pueden utilizarse números que permiten distinguir el orden de posición, categoría o clase, pero sin tener en cuenta la diferencia entre valores. Ejemplo 1 Los datos recogidos por una encuesta aplicada a jóvenes que son votantes para las elecciones generales de 1997 sobre el candidato por el cual van a votar, se clasificaron de la siguiente manera: P V U K

= = = =

Paz Jaime Velis Alejo Urioste Miguel Kuljis Ivo

B P G D

= = = =

Bánzer Hugo Palenque Carlos Galindo Eudoro Duran Juan Carlos

B D P P B

P D U K B

Se obtuvo la siguiente información: D B V U U

D B B B D

D B B D D

B D K K B

D K P V B

D D U P B

B B P V K

B U P U B

a) Organizar y presentar los datos en una distribución de frecuencias b) Representar gráficamente c) Interpretar los resultados Resolución. Los datos “sin procesar” no brindan ninguna información útil evidente. Para obtener provecho de ellos, se seguirá el siguiente procedimiento:  ¿Qué característica de la población se quiere investigar y de qué tipo es?: Atributo nominal: A = Candidatos a la presidencia  Se fijan las modalidades: Las modalidades son candidatos: Paz, Bánzer, Duran, Kuljis, Palenque, Urioste, Velis y Galindo. Representan los diferentes grupos, modalidades, clases o categorías.  Para la distribución de datos recogidos en las distintas clases o categorías se usa el 37

principio de exhaustividad (todos los datos deben estar contenidos en la tabla) y el de mutuamente excluyentes (un dato no puede estar contenido en dos modalidades al mismo tiempo).  Luego se tabulan los datos en una distribución de frecuencias adecuada, mediante el conteo (ver tabla 3.3.1). Tabla 3.3.1 Distribución de frecuencias sobre candidatos a la presidencia Atributo Ai

Frecuenci a absoluta ni

Frecuencia relativa(%) hi =

ni (100) n

Tasa de crecimiento(%) Ci =

ni  n * .100 n*





a1 = P a2 = B

n1 = 7 n2 = 17

h1 = 7/50*100 = 14% h2 = 17/50*100 = 34%

C1 = (7-5)/5 = 40 C2 =(17-5)/5.100 = 240

*a3 = K

n3 = 5

h3 = 5/50*100 = 10%

C3 = (5-5)/5.100 = 0

a4 = V

n4 = 3

h4 = 3/50*100 = 6%

c4 = (3-5)/5.100 = - 40

a5 = Pa

n5 = 0

h5 = 0/50*100 = 0%

c5 = (0-5)/5.100 = - 100

a6 = D

n6 = 12

h6 = 12/50*100 = 24%

c6 = (12-5)/5.100 = 140

a7 = U

n7 = 6

h7 = 6/50*100 = 12%

c7 = (6-5)/5.100 = 20

a8 = G

n8 = 0

h8 = 0/50*100 = 0%

c8 = (0-5)/5.100 = - 100

n=ni = 50

hi %001 =

Fuente: Elaboración propia. (Nota: Se toma como modalidad de comparación, el candidato Kuljis.)  La explicación del contenido de la tabla es la siguiente:  La primera columna contiene las diferentes modalidades del atributo.  La segunda columna contiene los conteos, es decir el número de veces que las distintas personas han votado por los distintos candidatos. A estos valores se los llama frecuencias absolutas, y se los abrevia con n i. La suma de los ni es el total de los encuestados, y se la denomina con la letra n.  La tercera columna es la expresión de la frecuencia absoluta en porcentaje, con respecto al total de los encuestados, y a estos valores se los denomina frecuencia relativa, cuyo símbolo es hi.  Por último la cuarta columna contiene la razón de comparación, r i, tomando como base 38

de comparación el candidato o la modalidad objeto de la investigación, r *.  Se procede a la lectura de datos (realizaremos la interpretación tomando sólo como ejemplo un valor de cada columna):  n6 = 12; expresa: “Existen 12 estudiantes que prefieren a Durán como presidente”.  h6 = 24; expresa: “El 24% de los estudiantes consultados apoyarán a Duran como presidente”.  C6 = 140%; expresa: “La tasa de crecimiento de los que prefieren a Duran es 140% mas que los que prefieren a Kuljis””. Nota: La frecuencia relativa puede ser expresada en porcentaje o fracción. La modalidad de comparación puede ser elegida de acuerdo al criterio y objetivo del investigador.

Presentación gráfica Los paquetes de computación brindan muchos formatos de gráficos. El papel del investigador es elegir el gráfico que mejor se ajuste a sus objetivos o que muestre de manera adecuada la información. Las gráficas bien diseñadas son más sencillas y poderosas en mostrar los datos comparadas a las tablas de distribución de frecuencias. Por desgracia, la naturaleza impropia e inadecuada de muchas presentaciones gráficas, más bien ha perjudicado la comprensión y análisis de las mismas. Tufte, establece cinco principios para lograr la excelencia gráfica:  Una presentación bien diseñada de los datos, que proporciona sustancia, estadísticas y diseño.  Una gráfica que comunica ideas complejas con claridad, precisión y eficiencia.  Una que proporciona al observador el mayor número de ideas en el menor tiempo y con el mínimo de tinta.  Una gráfica que casi siempre involucra varias dimensiones.  Una que dice la verdad acerca de los datos. La información contenida en la presentación de los datos organizados, correspondientes a las modalidades de un atributo nominal, puede ser presentada en forma gráfica, generalmente utilizando diagrama de barras, diagrama rectangular y/o diagrama circular. Diagrama de barras Es un diagrama formado por barras, cuyo tamaño está de acuerdo al valor de la frecuencia absoluta o relativa de cada modalidad y cuyo ancho no interesa (ver gráfico 3.3.1).

39

Gráfico 3.3.1 Diagrama de barras sobre candidatos a la presidencia

Fuente: Elaboración propia

40

Su lectura: Barra 3: n3 = 5; expresa: “Existen 5 personas que prefieren a Kuljis para presidente del país”. h3 = 10; expresa: “El 10% de los estudiantes consultados prefieren a Kuljis como presidente del país". Barra 2: n2 = 17; expresa: “Existen 17 personas que prefieren a Bánzer para presidente del país”. h2 = 34; expresa: “El 34% de los estudiantes consultados prefieren a Bánzer como presidente del país". Diagrama rectangular En una base cualquiera, la altura del rectángulo debe ser una dimensión igual al universo. En ese cuadrilátero, las distintas modalidades se representan por segmentos rectangulares cuya altura corresponde al valor de la frecuencia absoluta o relativa (ver gráfico 3.3.2). Gráfico 3.3.2 Diagrama rectangular sobre candidatos a la presidencia

Fuente: Elaboración propia Lectura: El sexto rectángulo representa: n6 = 12; expresa: “Existen 12 ciudadanos que prefieren a Durán como presidente boliviano”. h6 = 24; expresa: “El 24% de las personas encuestadas prefieren a Durán como presidente boliviano". 41

El primer rectángulo: n1 = 7; expresa: “Existen 7 ciudadanos que prefieren a Paz como presidente boliviano”. h1 = 14; expresa: “El 14% de las personas encuestadas prefieren a Paz como presidente boliviano". Diagrama circular Para obtener esta representación gráfica, se procede de la siguiente manera:  Se determina el número de grados de la circunferencia por unidad del universo, es decir se divide (usando datos del ejemplo anterior) 360 o entre n = 50, que es igual a 7.2 o para la frecuencia absoluta; y 360 o entre 100 que es igual a 3.6 o para la frecuencia relativa. En términos más generales, tenemos: o o G C = Número de grados del círculo = 360 n Universo n

(Para la frecuencia absoluta)

o o G C = Número de grados del círculo = 360 h Cien porciento 100

(Para la frecuencia relativa)

El segmento circular correspondiente a cada modalidad, se obtiene multiplicando los grados por unidad del universo, por la frecuencia correspondiente (no es necesario diferenciar frecuencia absoluta de la relativa). Ejemplo: Segmento circular para las modalidades (tabla 3.3.2): Tabla 3.3.2 Valor del segmento circular para candidatos a la presidencia Atributo P B K V Pa D U G

Absoluto Relativo (7.2°) * 7 (3.6°) * 14 (7.2°) * 17 (3.6°) * 34 (7.2°) * 5 (3.6°) * 10 (7.2°) * 3 (3.6°) * 6 (7.2°) * 0 (3.6°) * 0 (7.2°) * 12 (3.6°) * 24 (7.2°) * 6 (3.6°) * 12 (7.2°) * 0 (3.6°) * 0

Valor 50.4° 122.4° 36° 21.6° 0° 86.4° 43.2° 0°

Fuente: Elaboración propia Todos deben dar un total de 360 o, y si se realiza la suma °P+°B+°K+°V+°Pa+°D+°U+°G se constata que efectivamente suman los 360 o que debe tener un círculo. A continuación se muestra en el gráfico 3.3.3 el diagrama circular. 42

Gráfico 3.3.3 Diagrama circular de candidatos a la presidencia

Fuente: Elaboración propia Lectura: n7 = 6; expresa:

“Existen 6 estudiantes que afirman su preferencia en Urioste para presidente”. h7 = 12; expresa: “El 12% de los estudiantes prefieren a Urioste como presidente del país”. Conclusión: Con toda esta información, podemos afirmar que la encuesta de opinión a 50 estudiantes, da como resultado que los candidatos más votados en las elecciones de 1997 para la presidencia de Bolivia serán Bánzer, Durán y Paz.

3.2. Distribución de frecuencias de atributo ordinal Un atributo ordinal es una característica de la población que puede ser clasificada en grupos, categorías o estratos, además permite establecer posiciones relativas de mayor, menor o igual sin reflejar distancias entre ellos. Ejemplo, si consideramos las autoridades de las universidades como atributo nominal A i, sus modalidades ai pueden permitirnos diferenciar grupos de autoridades como: Rectores, Vicerectores, Decanos, etc., donde evidentemente, ser Rector es mayor que ser Vice-rector o ser Decano es menor que ser Vice-rector, pero sin limitar la magnitud de la distancia en esa jerarquía de orden. Ejemplo 1 Los datos recogidos sobre la ocupación en una planta de producción, son los siguientes: T A I O

I O O T

O G A A

A I T O

T O O T

G T O I 43

A O G O

O T O T

O A I A

A O A A

a) Organizar y presentar los datos en una distribución de frecuencias b) Representar gráficamente c) Interpretar los resultados Nota: Tomar como punto de referencia o comparación T=Tecnico de Produccion Se procede de la siguiente manera.  Los datos corresponden a una distribución de carácter ordinal. Ai = Funciones que cumplen los trabajadores en una planta de producción.  Las modalidades correspondientes son: a1 a2 a3 a4 a5

= = = = =

Gerente = G Ingeniero = I Técnico de producción = T Operario = O Ayudante = A

Las modalidades permiten agrupar los datos en grupos o categorías, que expresan relación de mayor, igual o menor, pero sin expresar distancias entre los grupos. La presentación de los datos del atributo considerado, utilizando la escala ordinal, se la presenta de la siguiente manera, donde existen dos nuevas columnas con respecto a la distribución de atributo nominal:  En la columna 5 se tiene la frecuencia absoluta acumulada, que puede ser de forma ascendente o descendente, según la conveniencia del investigador y se calcula acumulando o sumando las frecuencias absolutas.  En la columna 6 se presenta la frecuencia relativa acumulada, que se calcula sumando las frecuencias relativas. A continuación se muestra en la tabla 3.3.4, la distribución de frecuencias apropiada. Tabla 3.3.4 Atributo Ai

Distribución de frecuencias de la ocupación en una planta de producción Frec. absoluta Frec. relativa Frecuenci Frecuencia Tasa de acumulada a relativa(%) crecimiento(%) acumulada(%)

absoluta hi =

 ai = G

ni (100) n

Ci =

ni  n * .100 n*

ni n1 = 3

h1 = 7.5

C1 = (3-8)/8.100 = -

N1 = 3

H1 = 7.5

N2 = 8

H2 = 20

N3 = 16 N4 = 30 N5 = 40

H3 = 40 H4 = 75 H5 = 100

62,5

a2 = I

n2 = 5

h2 = 12.5

C2 = (5-8)/8.100 = 37,5

a3 = T* a4 = O a5 = A

n3 = 8 h3 = 20 n4 = 14 h4 = 35 n5 = 10 h5 = 25  ni04=n=  hi001=h=

C3 = (8-8/)8.100 = 0 C4 = (14-8)/8.100 = 75 C5 = (10-8)/8 = 25 44

Fuente: Elaboración propia

Lectura de datos: n3 = 8; expresa: h5 = 25; expresa: c1 = 62.5 ; expresa: N3 = 16; expresa: H4 = 75; expresa:

“Existen 8 trabajadores que cumplen la función de técnicos de planta”. “El 25% de los trabajadores cumplen la función de ayudantes de operarios”. “La tasa de crecimiento de los gerentes es - 62.5% que los técnicos de producción”. “Existen 16 trabajadores que son a lo menos técnicos superiores”. “El 75% de los empleados son al menos operarios”.

Representación gráfica La representación gráfica de este tipo de distribución de frecuencias, de manera que contenga la misma información, puede efectuarse de 2 maneras:  Mediante un diagrama de barras, diagrama rectangular o diagrama circular, siguiendo el procedimiento señalado para el caso de una distribución de frecuencias de atributo nominal.  Mediante la ojiva. Este gráfico corresponde a usar la información de la frecuencia absoluta acumulada o de su correspondiente relativo acumulado (ver gráfico 3.3.5). Gráfico 3.3.5 Ojiva de la ocupación en una planta de producción

Fuente: Elaboración propia Lectura: N3 = 16; expresa:

“Existen 16 trabajadores que son técnicos o de grado 45

n4 = N 4 - N3 = 14; expresa: h4 = H 4 - H3 = 35; expresa:

superior”. “Existen 14 trabajadores que son operarios”. “El 35% de los trabajadores son operarios”.

4. DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLES Los datos que corresponden a caracteres cuantitativos o variables de una población se agrupan en tipos de distribución teniendo en cuenta el número de observaciones y los valores diferentes de la variable (ver figura 3.2.1).

4.1. Tipo I Las distribuciones de variable son de tipo I cuando el número de observaciones y los valores diferentes de la variable son pocos. La organización de estos datos exige disponerlos en forma ascendente o descendente. La presentación de los datos se registra en una columna o en una línea, según necesidades de su publicación. Ejemplo El dinero en efectivo que llevan consigo 5 estudiantes de la carrera de Ingeniería Industrial, es como sigue. Organice y presente los datos. 5

20

37

3

10

Resolución    

Se trata de una variable continua Se trata de una variable Tipo I Donde Xi= Cantidad de dinero en efectivo. Se dispone los datos en forma ascendente o descendente.

La presentación de los datos anteriores se efectúa en forma de una columna, como lo muestra la tabla 3.4.1. Tabla 3.4.1 Distribución de frecuencias del dinero en efectivo de 5 estudiantes Variable xi x1 = 3 x2 = 5 x3 = 10 x4 = 20 x5 = 37 46

Fuente: Elaboración propia La distribución tipo I de una variable se denomina también distribución de frecuencia unitaria. Representación gráfica Las distribuciones tipo I no tienen representación gráfica, puesto que su frecuencia absoluta es unitaria.

4.2. Tipo II La distribución de una variable, cuando son muchas las observaciones y pocos los valores diferentes de la variable, forman la distribución tipo II. La organización de los datos requiere de la utilización de una escala de mediciones de intervalos o razón. Ejemplo 1 Mediante una encuesta aplicada a los estudiantes de Ingeniería Industrial se pudo determinar el número de animales domésticos que poseen cada uno. Con la información dada, se pide organizar y presentar los datos. 3 2 7 3 0 2 3 2 0 1 3 2 a) Organizar y presentar los datos b) Representar gráficamente c) Interpretar los resultados

4 4 4 2 5 2 6 3 en una

1 2 1 3 4 4 2 1 3 2 0 1 4 2 3 5 4 3 2 0 distribución de frecuencias

Resolución  Se trata de una variable discreta  Donde Xi = Número de animales domésticos, que es discreta.  Los grupos o categorías están dados por los valores diferentes de la variable. Forman 8 grupos, desde 0 hasta 7, así que cumplen los requisitos de una distribución tipo II. La presentación de datos se efectúa de la siguiente manera (ver tabla 3.4.2): Tabla 3.4.2 Distribución de frecuencias del número de mascotas Variable

Frecuencia absoluta

x1 = 0 x2 = 1 x3 = 2

n1 = 4 n2 = 5 n3 = 11

Frecuencia relativa h1 = 10.0 h2 = 12.5 h3 = 27.5

Frec. absoluta Frec. relativa acumulada acumulada N1 = 4 N2 = 9 N3 = 20

47

H1 = 10.0 H2 = 22.5 H3 = 50.0

x4 = 3 x5 = 4 x6 = 5 x7 = 6 x8 = 7

n4 = 9 n5 = 7 n6 = 2 n7 = 1 n8 = 1 n = 40

h4 = 22.5 h5 = 17.5 h6 = 5.0 h7 = 2.5 h8 = 2.5 h = 100

N4 = 29 N5 = 36 N6 = 38 N7 = 39 N8 = 40 = n

Fuente: Elaboración propia

48

H4 = 72.5 H5 = 90.0 H6 = 95.0 H7 = 97.5 H8 = 100 = h

Lectura: n3 = 11; expresa: h5 = 17.5; expresa: N4 = 29; expresa: H6 = 95; expresa:

“Existen 11 viviendas donde hay 2 animales domésticos”. “El 17.5 % de los hogares tienen 4 animales domésticos”. “Existen 29 viviendas donde hay 3 animales domésticos o menos”. “El 95% de los hogares tienen a lo más 5 animales domésticos”.

Nota: En esta distribución también se puede determinar la razón de comparación. Representación gráfica La representación gráfica...


Similar Free PDFs