Comentario de \"Cómo mentir con estadísticas\", Prof: Miguel Caínzos. PDF

Title Comentario de \"Cómo mentir con estadísticas\", Prof: Miguel Caínzos.
Author Gonzalo Arévalo Stoyka
Course Estatística para as Ciencias Sociais (I)
Institution Universidade de Santiago de Compostela
Pages 7
File Size 374.3 KB
File Type PDF
Total Downloads 202
Total Views 555

Summary

“COMO MENTIR CON ESTADÍSTICOS” Darrell Huff & Irvin Geis COMENTARIO Gonzalo Arévalo Iglesias El siguiente escrito es un comentario de texto del ensayo “Cómo mentir con estadísticos”, de Darrel Huff e Irvin Geis. Este ensayo es una compilación de técnicas utilizadas habitualmente ...


Description

“COMO MENTIR CON ESTADÍSTICOS” Darrell Huff & Irvin Geis COMENTARIO

Gonzalo Arévalo Iglesias

El siguiente escrito es un comentario de texto del ensayo “Cómo mentir con estadísticos”, de Darrel Huff e Irvin Geis. Este ensayo es una compilación de técnicas utilizadas habitualmente por empresas, medios de comunicación y otros para exagerar, minimizar o alterar de algún modo los estadísticos que se nos presentan diariamente para producir la impresión conveniente en el lector, sin alterar en ningún momento los datos reales. El libro consta de 10 capítulos. Los nueve primeros abordan, cada uno, una técnica diferente de manipulación de los estadísticos, mientres que el último es una breve guía para intentar distinguir, en tres pasos, qué estadísticos son realmente informativos y cuales han sufrido este tipo de manipulaciones. A la hora de realizar el comentario, haremos primero un breve resumen de cada uno de los capítulos en el que intentaremos sintetizar estas nueve técnicas, capítulo por capítulo, y luego afrontaremos el comentario de un caso real en el que se haya aplicado una de estas técnicas. Comenzamos, pues, por el resumen:

Capítulo 1 “La muestra que presenta un factor de influencia en sí misma” En este primer caso se trata de seleccionar una muestra que no resulta representativa porque el carácter de la propia muestra influye en su elección. En el ejemplo del libro, a partir de una muestra de ex-alumnos de Yale, se infiere que el promedio de los ingresos de los exalumnos de Yale es de 25111$. Sin embargo, esta muestra no es representativa, pues en ella se incluyen sólo los exalumnos con salarios muy elevados, por ser mucho más fáciles de localizar que los que no gozan de esta condición. Además, hay que partir del supuesto de que los encuestados dicen la verdad, cuando es muy probable que exageren sus ingresos. Por lo tanto, para que un informe sobre una muestra tenga valor, debe seleccionarse una muestra que resulte representativa, es decir, que carezca de factores de influencia. La mejor solución a este problema es el uso de muestras aleatorias. Sin embargo, debido a sus elevados costes, se suele optar por “muestras al azar por estratos”, es decir, se divide la población en partes y se toman grupos proporcionales a las mismas. Sin embargo, los criterios de división no siempre son exactos. La conclusión a la que llega el autor es que, en las encuestas de opinión, nunca se consigue un 100% de exactitud, siempre hay factores de influencia. El principal factor de influencai en estas encuestas es el deseo que tiene el entrevistado de dar una respuesta agradable.

Capítulo 2 “El promedio bien escogido” Esta técnica es tan simple como lo siguiente: Se utilizan distintos tipos de promedio (media, mediana o moda) según nos interese ofrecer un resultado u otro, pero nunca se especifica cuál es el tipo de promedio que se está utilizando. En todos los casos las estadísticas son verídicas (no han sido manipuladas), pero los resultados son sensiblemente diferentes. En distribuciones normales, estos 3 promedios tienden a coincidir. Sin embargo, en distribuciones marcadamente asimétricas, estos 3 promedios distan mucho entre sí.

Esta técnica se utiliza mucho a la hora de presentar las cuentas de una empresa, para que el desequilibrio entre beneficios y salario de los trabajadores no resulte tan insultante. Se escoge el estadístico que menor desequilibrio muestra (generalmente la media) y se utiliza para simplificar los datos.

Capítulo 3 “Las pequeñas cifras que no aparecen” Se trata de omitir algún dato numérico clave, alguna pequeña cifra para que los resultados sean visualmente impresionantes al no tener esa referencia. Por ejemplo, utilizar un grupo muestral muy pequeño para conseguir por azar un resultado favorable en alguna de las repeticiones de un experimento (que de utilizar una muestra mayor nunca conseguiría ese resultado) y ofrecer luego el porcentaje sin especificar el tamaño de la muestra. Otro modo de cometer este engaño es la simplificación en estadísticos promedio, que por su propia simplicidad resultan inadecuados y nada informativos en la práctica. En todo los casos, el punto determinante de este engaño se encuentra en la omisión de datos clave, sin los cuales no podemos confíar en la relevancia de estos estadísticos.

Capítulo 4 “Mucho ruído y pocas nueces” La técnica explicada en este cuarto capítulo es una de las más simples que se describen en el libro. Simplemente, consiste en exagerar desmesuradamente diferencias matemáticas que son reales y probables numéricamente, pero que no representan ninguna diferencia palpable en la realidad. Por ejemplo, un individuo con un cociente intelectual de 100 es, según la escala numérica universalmente aceptada, más inteligente que uno con un cociente de 98. Pero en la práctica, no existe ninguna diferencia intelectual significativa entre ambos individuos. Se trata, pues, simplemente, de tomarse los resultados matemáticos como la Biblia, sin utilizar el sentido común a la hora de interpretarlos.

Capítulo 5 “El gráfico exclamativo” Esta técnica, aplicada a la representación gráfica de datos en forma de tabla, es de carácter puramente visual. Consiste en jugar con la forma de representación para exagerar los datos reales y que las diferencias parezcan mucho más significativas. Por ejemplo, un aumento salarial en los empleados de una fábrica “X” puede ser de 800$ a 805$ de un año al siguiente. En la práctica, el aumento no es en absoluto significativo. Sin embargo, si en la gráfica aumentamos sensiblemente la altura de cada uno de los segmentos del eje de abcisas, la inclinación visual (que no real) será mucho mayor, por lo que producirá mayor impacto. Lo mismo ocurre si cortamos la mitad inferior o superior de la gráfica, haciendo que el eje de abcisas empieza en 800$ y acabe en 805$. Lo que se verá es un aumento del extremo inferior de la gráfica al extremo superior de un año para el otro. Aunque los datos sigan siendo los mismos, visualmente, el aumento salarial parece realmente significativo.

Como vemos, esta técnica no requiere en absoluto de conocimientos matemáticos, sino simplemente de habilidad para jugar con la impresión visual. Algo semejante ocurre en la técnica descrita en el capítulo siguiente.

Capítulo 6 “El personaje de la gráfica” Al igual que en el capítulo 5, nos encontramos con una técnica que juega únicamente con la impresión visual que se da al lector a través de una representación gráfica de los datos. En este caso, se trata de la sustitución, en un modelo de gráfico de barras, de las barras por algún objeto o personaje que simbolice visualmente los datos. Tomando el ejemplo más sencillo, diremos que, en la gráfica que utilizamos en el resumen del capítulo anterior, se ha utilizado un gráfico de barras para representar este aumento. En este caso, hemos sustituído las barras por bolsas de dinero, que simbolizan mucho mejor lo que queremos representar. Para facilitar la explicación, diremos que el aumento ha sido de 200$ a 400$. Por lo tanto, utilizaremos dos bolsas de dinero, una que represente los 200$ para un año, y otra el doble de alta que represente los 400$ (el doble) para el año siguiente. Hasta aquí todo parece lógico, pero hemos de tener en cuenta que, al duplicar su altura, la bolsa de dinero también duplicó su anchura para mantenerse proporcionada. Por lo tanto, la impresión que nos da la gráfica no es que la nómica de los trabajadores se haya duplicado (como de hecho ha sido), sino que se ha elevado al cuadrado. Aún más, el cerebro humano, a pesar de que la representación sea en dos dimensiones, tiene en cuenta el volumen total, así que la nómina no se ha elevado al cuadrado, sino al cubo. A pesar de que los datos nos dicen que los trabajadores han pasado de ganar 200$ a ganar 400$, el ojo nos dice que el nuevo salario es de 8000000 de dólares! Esta técnica tan simple no nos llama en absoluto la atención, y estamos acostumbrados a ver este tipo de representación gráfica en cualquier tipo de medio de comunicación. Otro ejemplo de como el ojo puede engañar a pesar de que tengamos los datos delante.

Capítulo 7 “La cifra indirectamente relacionada” Esta técnica es tan simple como lo siguiente: Si no se puede probar con datos algo, pruebe otra cosa parecida y haga ver que ambas están relacionadas. El primer ejemplo que utiliza D. Huff consiste en simplemente probar que un dentífrico mata cierto porcentaje de bacterias en un tubo de ensayo. ¿Significa esto que mate el mismo porcentaje de bacterias en la boca, dónde se dan distintas condiciones? ¿Se especifica qué clases de bacterias mata? No. Sin embargo, para el lector inexperto, una cosa es equivalente a la otra. Este truco se basa, pues, en la omisión de información básica que no interesa ofrecer al lector, y, como todos los descritos en este libro, la ingenuidad del público.

Capítulo 8 “El “post hoc” aparece de nuevo”

Esta técnica consiste en hacer ver que, como dos fenómenos se dan simultáneamente, uno es forzosamente la causa del otro, ignorando la posible existencia de causas comunes o la posibilidad de que el sentido de la relación causal sea el contrario del que se quiere hacer ver. Por ejemplo, la gente que fuma saca peores notas que los no fumadores, por lo tanto, el tabaco es causa de un bajo rendimiento académico. Por supuesto, también podría ser que la gente que saca peores notas tienda a fumar por esto, o que haya causas comunes. Sin embargo, como lo que interesa demostrar es que los fumadores sacan peores notas, es esta la relación que se da. Estas conclusiones proceden de el absoluto desinterés por realizar una investigación exhaustiva y legítima sobre los fenomenos a estudio, sin embargo, tienen un poder de convicción muy fuerte.

Capítulo 9 “Cómo estadistiquear” Huff define como “estadistiquear” o “estadisticulación” el informar mal mediante la estadística o, como él dice, manipulación estadística. Una de las formas más desleales de tergiversar los estadísticos, dice el autor, es utilizando un mapa, donde pueden esconderse los hechos y tergiversarse los datos con gran facilidad, ya hay muchas variables que no se tienen en cuenta al verse sólo representada la espacial. Otro ejemplo de “estadisticulación” que nos da Huff en el noveno capítulo es el de realizar un promedio (Ejemplo: Ingresos por persona) sin tener en cuenta variables importantes. Por ejemplo, realizar el ingreso medio de la familia norteamericana media (4 personas), dividiendo los ingresos totales de los ciudadanos americanos por el número de habitantes y multiplicando por cuatro, sin tener en cuenta que los niños no suelen aportar ingresos. Podemos definir la “estadisticulación”, pues, como la manipulación intencionada de los estadísticos omitiendo deliberadamente alguna variable clave.

Capítulo 10 “Cómo enfrentarse con las estadísticas” Este décimo capítulo no explica ningún método de manipulación estadística, sino que pretende enseñar brevemente al lector cómo enfrentarse con este tipo de técnicas a traves de cinco sencillas preguntas: Quién lo dice, cómo lo sabe, qué falta, si dio alguien cierto giro a la información y si tiene sentido lo que se dice. La primera sirve para descubrir qué interés oculto puede haber detrás de la manipulación de los datos para ofrecer una visión concreta. La segunda alude a la legitimidad de la información obtenida. La tercera va encaminada a descubrir qué información se ha omitido a la hora de presentar los datos para que la estadística no sea del todo legítima. La cuarta busca descubrir la mano oculta detrás del engaño. La última es una pregunta elemental que debemos formularnos a la hora de leer cualquier artículo, ensayo o texto en general, contenga o no estadísticos. Una vez resumido brevemente el libro, procederemos al análisis de un estadístico que presenta uno de los casos de manipulación anteriormente descritos.

Análisis de una estadística

El titular que acompañaba a esta imagen rezaba “Messi marca tantos goles como Cristiano, Benzema e Higuain juntos”. Lo primero que podríamos decir de esta noticia es que, de ceñirnos a los datos que se nos dan, el titular no es del todo cierto, ya que los tres jugadores del Madrid han marcado, entre todos, 4 goles más que Messi. Sin embargo, aunque pasemos por alto esta observación, hay tres cosas que me gustaría comentar al respecto de esta imagen: La primera es que se han omitido datos clave. La noticia especifica cuantos goles ha metido cada jugador y cuantos partidos ha necesitado para meterlos. Sin embargo, no especifica los minutos. Higuain y Benzema, por ser jugadores que ocupan la misma posición, no sen encuentran al mismo tiempo en el campo casi nunca, sino que uno suele suplir al otro. Por lo tanto, aunque si se suma el número partidos jugados por los dos, suponiendo que hayan jugado los 90 minutos, según la estadística, han jugado 3690 minutos, la realidad es que entre los dos han jugado no más de 2430 minutos, ya que ninguno suele jugar los 90 minutos. Messi, por el contrario, sí que juega los 90 minutos en prácticamente todos los partidos, por lo que, si ha jugado 28 partidos, su total de minutos es de 2520. Por lo tanto, a pesar de lo que diga la estadística, Benzema e Higuaín no llegan a jugar, entre los dos, tantos minutos como Messi él solo. La segunda cuestión que me gustaría destacar es la abordada en el capítulo 2 del libro. En esta imagen se nos da el promedio de goles de cada jugador. Sin embargo, no se especifica en ningún

momento qué promedio se nos da: Moda, mediana, media? Haciendo un cálculo rápido, encontramos que lo que nos están dando es la media, sin embargo, de haber sido escogido otro tipo de promedio, como la moda o la mediana, los resultados serían mucho menos impresionantes. De haber sido escogida la moda, el resultado para todos los jugadores sería, probablemente, de un gol por partido como promedio goleador. De haber sido escogida la mediana el resultado sería tambien de 1 o 2 goles por partido. El uso de la media en este caso permite establecer mayor distinción entre unos y otros jugadores. Por último, y por ponernos quisquillosos, se informa del dinero que costó cada uno de los jugadores a su club. Sin embargo, parece se rque la formación de Lionel Messi salió gratuíta al Barcelona, así como los tratamientos médicos a los que fue sometido. De igual forma, parece que ninguno de los cuatro jugadores proporcionó beneficio alguno a su club con la venta de merchandising, a pesar de que se sabe que los fichajes de los tres jugadores del Madrid han sido sobradamente rentabilizados con la publicidad y la venta de camisetas y demás merchandising del club, así como Messi ha proporcionado muchísimos millones la Barça por el mismo motivo. Por estos tres motivos, el tratamiento de los datos aquí presentado no me parece legítimo ni relevante, aunque los datos de por sí sean abrumadoramente favorables al jugador del Barcelona....


Similar Free PDFs