Histogramas PDF

Title Histogramas
Course Estadistica Y Probabilidad
Institution Universidad Tecnológica de Panamá
Pages 28
File Size 1.6 MB
File Type PDF
Total Downloads 32
Total Views 118

Summary

resumen de como sacar los resúmenes de histogramas...


Description

Histogramas En estadística, un histograma es una representación de líneas verticales sin ningún sentido en lo absoluto gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua (como la longitud o el peso). De esta manera ofrece una visión de grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de la característica que toma la característica de interés, evidentemente, cuando este espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés. Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas discretas las barras se dibujan separadas y el gráfico se llama diagrama de frecuencias, porque la variable representada en el eje horizontal ya no representa un espectro continuo de valores, sino valores cuantitativos específicos, igual que ocurre en un diagrama de barras, usado para representar una característica cualitativa o categórica. Su utilidad se hace más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado en intervalos de clase.

Ejemplos de su uso es la representación de edades o estaturas de una población. Por comodidad, sus valores se agrupan en clases, es decir, en intervalos continuos. En los casos en los que los datos son cualitativos (no numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Etimología El término "histograma" fue acuñado en 1891 por el matemático estadístico inglés Karl Pearson. Tipos de gráficos relacionados con el histograma Histograma de frecuencias absolutas Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho en educación no universitaria por su sencillez, pero sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las alturas y las superficies son proporcionales. En esos niveles educativos se introduce una estadística elemental y todavía no se puede profundizar en estos detalles.

• Histograma de frecuencias relativas Representa la frecuencia relativa mediante la altura de las barras. Igual que en el caso anterior se usa mucho en educación no universitaria. La elaboración del gráfico es más complicada pues los números ya no son enteros. Como en el caso anterior sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las alturas y las superficies son proporcionales.

Representa la frecuencia relativa mediante la superficie de las barras. Aunque esto sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos desiguales hay que atender a la superficie de las barras, que no se corresponderá con la altura como ocurría en los casos anteriores. Es el que se suele usar en educación universitaria. Para su elaboración debe introducirse el concepto de altura de histograma, que es un concepto equivalente al de densidad de probabilidad, y que se calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas esas superficies (de todas las barras) será 1, o sea el 100%.

• Función densidad Representa la probabilidad mediante la superficie de las barras. Es un gráfico idéntico al histograma, pero aplicado a distribuciones teóricas. El concepto de frecuencia relativa se cambia por el de probabilidad, pero también se representa por superficies y la suma de todas esas superficies (de todas las barras) será 1, como en el histograma, o sea el 100% de probabilidad.

• Curva acumulativa u ojiva Es un gráfico acumulativo que representa la frecuencia relativa acumulada hasta cada valor de la variable. Si el rango es finito el primer valor del rango tiene frecuencia acumulada (anterior) cero y el último tiene frecuencia acumulada 1 (100%). Así el eje vertical siempre toma valores de cero a uno y representa frecuencias relativas (o probabilidades si se trata de distribuciones teóricas). Se utiliza para introducir el concepto y el cálculo de

la mediana, los cuartiles, los deciles y en general los parámetros llamados de posición. Si el rango es infinito, como suele ocurrir en las distribuciones teóricas (Normal, student, chi-cuadrado, etc,) el cero puede no alcanzarse y será el valor asintótico por la izquierda, si tampoco se alcanza el uno también será el valor asintótico derecho, y en muchos casos no se alcanza ni uno ni otro, teniendo dos asintotas. Este gráfico es la integral del histograma (cuando trabajamos con distribuciones reales) o de la función densidad (cuando trabajamos con distribuciones teóricas).

• Curva acumulativa de frecuencias absolutas Es un gráfico acumulativo que representa la frecuencia absoluta acumulada hasta cada valor de la variable. Realmente no es un gráfico relacionado con el histograma, pero es muy parecido a la curva acumulativa y a la función de distribución. Se usa mucho en enseñanza no universitaria por su sencillez, ya que permite trabajar con números enteros (frecuencias absolutas) y, como la anterior, permite introducir y calcular mediana, cuartiles, etc. Esta curva no irá entre cero y uno sino entre cero y el total de individuos de la muestra.

Construcción de un histograma

✓ Paso 1 Determinar el rango de los datos. Rango es igual al dato de proporción menos el dato de desigualdad.

✓ Paso 2 Obtener todos los números de grupos, existen 4 criterios para determinar el número de clases (o barras) –por ejemplo, la regla de Sturges etc.

✓ Paso 3 Establecer la anchura de clase. Si queremos intervalos iguales tomaremos el rango dividido por el número de clases y comparar con los resultados obtenidos de la dispersión.

✓ Paso 4 Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en segmentos iguales usando la anchura de clase obtenida en el PASO 2.

✓ Paso 5 Graficar el histograma: Como todas las clases tienen la misma amplitud las bases de las barras son los intervalos de clases y la altura es la frecuencia de las clases.

Otros tipos de representaciones gráficas… Los histogramas se aplican a variables continuas, aquellas en las que la variable observada (estatura, peso, edad...) pueden tomar cualquier valor real, a veces entre dos valores fijos que determinan su rango. Otros gráficos similares al histograma son los diagramas de barras, que se suelen aplicar a variables discretas y a las cualitativas. A diferencia de las variables continuas aquí los valores intermedios entre dos barras consecutivas no tienen sentido (un dado puede salir 1,2,3,4,5 o 6 pero no 3.7 ni 5/3) o no pueden

observarse (si estudiamos documentos que sólo registran edades enteras deberemos tratarla como variable discreta), por eso las barras se dibujan separadas. La distinción entre discreta y continua no siempre es clara. La variable edad se puede considerar continua pues el tiempo es una variable continua, pero frecuentemente se considera como un número entero (la administración no suele considerar edades fraccionarias) y entonces es una variable discreta. Los gráficos estadísticos presentarán el mismo problema, y los mismos datos se podrán representar en diagramas de barras (separadas) si se considera una variable discreta o en histograma (barras unidas) si se considera continua. Incluso la distinción entre cualitativa y cuantitativa puede ser arbitraria, pues muchas cualidades se pueden representar de forma numérica, como hacen los ordenadores. El ejemplo más evidente es el color (ver el ejemplo anterior: histograma de grises), variable claramente cualitativa que los ordenadores traducen a números (por ejemplo, usando el código RGB). En las variables cuantitativas y en las cualitativas ordinales es frecuente representar polígonos de frecuencia en lugar de histogramas.

Como crear un Histograma en Excel

Cuando se utiliza la herramienta Histograma, Excel cuenta el número de puntos de datos de cada clase de datos. Se incluye un punto de datos en una clase de datos concreta si el número es más alto que el límite inferior e igual o más bajo que el límite superior de la clase de datos. Si omite el rango de clase, Excel creará un conjunto de clases distribuidas uniformemente entre los valores mínimo y máximo de los datos de entrada. Los resultados del análisis del histograma aparecen en una nueva hoja de cálculo (o en un nuevo libro) y muestran una tabla de histograma y un gráfico de columnas que refleja los datos de la tabla de histograma.

Antes de utilizar la herramienta Histograma, debe asegurarse de que el complemento Herramientas para análisis esté instalado.

Asegúrese de que el complemento Herramientas para análisis está instalado Para asegurarse de que el complemento Herramientas para análisis está instalado, siga estos pasos: En el menú Archivo, haga clic en Opciones. Excel 2013:

2.

En

el

panel

de

navegación,

haga

clic

en Complementos.

4En la lista Administrar, seleccione Complementos de Excel y haga clic en Ir. En el cuadro de diálogo Complementos, asegúrese de que la casilla Herramientas para análisis bajo Complementos disponibles está activada y luego haga clic en Aceptar.

Nota: Para que el complemento Herramientas para análisis se muestre en el cuadro de diálogo Complementos, es necesario que dicho complemento esté instalado en el equipo. Si no aparece la opción Herramientas para análisis en el cuadro de diálogo Complementos, ejecute la configuración de Microsoft Excel y agregue este componente a la lista de elementos instalados. Excel 2007 1. Haga clic en el botón de Microsoft Office y luego en Opciones de Excel.

2. En el panel de navegación, haga clic en Complementos.

3. En la lista Administrar, seleccione Complementos de Excel y luego haga clic en Ir. 4. En el cuadro de diálogo Complementos, asegúrese de que la casilla Herramientas para análisis bajo Complementos disponibles está activada y luego haga clic en Aceptar.

Excel 2003 y versiones anteriores de Excel 1. Haga clic en Complementos en el menú Herramientas. 2. En el cuadro de diálogo Complementos, asegúrese de que la casilla Herramientas para análisis bajo Complementos disponibles está activada y luego haga clic en Aceptar.

Nota: Para que el complemento Herramientas para análisis se muestre en el cuadro de diálogo Complementos, es necesario que dicho complemento esté instalado en el equipo. Si no aparece la opción Herramientas para análisis en el cuadro de diálogo Complementos, ejecute la configuración de Microsoft Excel y agregue este componente a la lista de elementos instalados.

Crear una tercera tabla de histograma Para crear una tabla de histograma, siga estos pasos: 1. Copie y pegue los siguientes datos en una hoja de cálculo nueva. 87

20

27

40

45

60

62

80

3 52 20 43 74 61 1. Realice una de las acciones siguientes: •

En Excel 2013, Excel 2010 y Excel 2007, en la pestaña Datos, haga clic en Análisis de datos dentro del grupo Análisis.

En Excel 2003 y en versiones anteriores de Excel, haga clic en Análisis de datos en el menú Herramientas.

2. En el cuadro de diálogo Análisis de datos, haga clic en Histograma y luego en Aceptar.

3. En el cuadro Rango de entrada, escriba A1:A10.

3. En Opciones de salida, haga clic en Libro nuevo, active la casilla Salida de gráficos y, por último, haga clic en Aceptar. Excel generará un libro nuevo con una tabla de histograma y un gráfico incrustado. Según los datos de ejemplo del paso 1, la tabla de histograma será similar a la siguiente: 4. A1: Bin

B1: Frequency

A2: 20

B2:

2

A3: 40

B3:

1

A4: 60

B4:

3

A5: 80

B5:

3

A6: More B6:

1

Su gráfico será una columna de datos que refleja los datos de esta tabla de histograma. En este ejemplo, la clase que corresponde a los valores de datos entre 0 y 20 contiene dos puntos de datos: 3 y 20.

DIAGRAMA DE PARETO

Principio de Pareto El principio o regla de Pareto nos dice que, para diversos casos, el 80% de las consecuencias proviene del 20% de las causas. No son cifras exactas, pues se considera un fundamento empírico observado por Vildredo Pareto y confirmado posteriormente por otros expertos de diversas áreas del conocimiento.

Algunos enunciados clásicos de la ley:

El 80% del éxito proviene del 20% de tu esfuerzo El 80% de tu ingreso proviene del 20% de tu esfuerzo El 80% de los ingresos se generan con 20% de los clientes El 80% de las ventas se genera por el 20% de los productos En una situación problemática:

El 80% de “problema” se genera del 20% de “causas”

DIAGRAMA… El diagrama de Pareto, también llamado curva cerrada o Distribución A-BC, es una gráfica para organizar datos de forma que estos queden en orden descendente, de izquierda a derecha y separados por barras. Permite asignar un orden de prioridades. El diagrama permite mostrar gráficamente el principio de Pareto (pocos vitales, muchos triviales), es decir, que hay muchos problemas sin importancia frente a unos pocos muy importantes. Mediante la gráfica colocamos los "pocos que son vitales" a la izquierda y los "muchos triviales" a la derecha. El diagrama facilita el estudio de las fallas en las industrias o empresas comerciales, así como fenómenos sociales o naturales psicosomáticos, como se puede ver en el ejemplo de la gráfica al principio del artículo.

Hay que tener en cuenta que tanto la distribución de los efectos como sus posibles causas no es un proceso lineal, sino que el 20% de las causas totales hace que sean originados el 80% de los efectos y rebotes internos del pronosticado. El principal uso que tiene el elaborar este tipo de diagrama es para poder establecer un orden de prioridades en la toma de decisiones dentro de una organización. Evaluar todas las fallas, saber si se pueden resolver o mejor evitarla.

Estas gráficas se pueden generar por programas sencillas de hoja de cálculo como Apache OpenOffice/LibreOffice Calc1 y Microsoft Excel,2 o con herramientas de visualización como Tableau Software.3

Por lo general, el eje Y de la izquierda es la frecuencia de ocurrencia, mientras que el eje Y de la derecha es el porcentaje acumulado del número total de ocurrencias. El eje X muestra las categorías de los defectos, quejas, desperdicios, etc.

TIPOS DE DIAGRAMA DE PARETO:

Existen dos tipos de diagramas de Pareto: • Diagramas de fenómenos. Se utilizan para determinar cuál es el principal problema que origina el resultado no deseado. Estos problemas pueden ser de calidad, coste, entrega, seguridad u otros. • Diagramas de causas. Se emplean para, una vez encontrados los problemas importantes, descubrir cuáles son las causas más relevantes que los producen.

¿Qué es un diagrama de Pareto ponderado?

Un diagrama de Pareto ponderado no solamente considera la frecuencia de ocurrencia, sino también su importancia. Un diagrama de Pareto ponderado puede explicar la gravedad de los defectos, o su costo o cualquier elemento al que desee hacer un seguimiento. Por ejemplo, supongamos que usted tiene 5 defectos de revestimiento a los que está haciendo seguimiento: arrugas, manchas, rayas, salpicaduras de sucio y burbujas. Usted recolecta datos acerca de la frecuencia de la ocurrencia de defectos y el costo de reparar las unidades defectuosas. Un diagrama de Pareto ponderado puede cambiar su prioridad con respecto a los proyectos de mejora al considerar los datos basándose tanto en los datos de costo como de frecuencia. Por ejemplo, aun cuando las arrugas sean más frecuentes, son menos costosas de reparar que las salpicaduras de sucio, las cuales son una ocurrencia más rara. Al tener en cuenta tanto el costo como la frecuencia, usted comprenderá mejor el costo de una calidad deficiente (COPQ).

Diagrama de Pareto que considera solamente la frecuencia Los defectos que ocurren con mayor frecuencia son las arrugas y las manchas. Basándose en esta información, probablemente decida desarrollar un proyecto de mejoras para reducir las arrugas y las manchas.

Diagrama de Pareto ponderado que considera el costo y la frecuencia Los defectos más costosos son las rayas y las salpicaduras de sucio. Basándose en estos datos más informativos, usted decide que es mejor desarrollar un proyecto de mejoras orientado a reducir las rayas y las salpicaduras de sucio. Elementos que hay que considerar cuando se utiliza un diagrama de Pareto El diagrama de Pareto es fácil de entender y utilizar; sin embargo, es importante tener en cuenta lo siguiente:



Datos recolectados durante un corto período de tiempo, especialmente de procesos inestables, pueden llevar a conclusiones incorrectas. Debido a que los datos podrían no ser confiables, usted podría obtener una idea incorrecta de la distribución de defectos y causas. Cuando el proceso no está en control, las causas pueden ser inestables y los pocos problemas vitales pueden cambiar de una semana a la siguiente. Los períodos de tiempo cortos podrían no ser representativos de la totalidad de su proceso.



Los datos recopilados durante largos períodos de tiempo pueden incluir cambios. Busque en los datos estratificación o cambios en la distribución del problema en el tiempo.



Elija categorías cuidadosamente. Si su análisis de Pareto inicial no produce resultados útiles, es recomendable que se asegure de que sus categorías sean significativas y de que su categoría "otro" no sea demasiado grande.



Elija criterios de ponderación cuidadosamente. Por ejemplo, el costo podría ser una medida más útil para asignar prioridades en comparación con el número de ocurrencias, especialmente cuando difieren los costos de varios defectos.



Concentrarse en los problemas con la mayor frecuencia debería reducir el número total de elementos que necesitan reparación. Concentrarse en los problemas con el mayor costo debería aumentar los beneficios financieros de la mejora.



La meta de un análisis de Pareto es...


Similar Free PDFs