viernes, 27 de marzo de 2020

Guía para interpretar los gráficos que se están publicando sobre el coronavirus

Guía para interpretar los gráficos que se están publicando sobre el coronavirus

La epidemia del coronavirus ha paralizado muchas cosas, pero lo que está claro es que la producción de gráficos no ha sido una de ellas. Casi al contrario, hoy en día resulta casi imposible informarse sin cruzarse con varias docenas de gráficos, tablas y mapas cada día.

Por eso hemos empezado a elaborar esta pequeña guía para ayudarnos a entender qué dicen y qué no dicen todas esas visualizaciones de datos que se están publicando sobre el coronavirus. Es un artículo en permanente actualización. Lo ampliaremos para recoger los nuevos tipos de gráficos que vayan apareciendo, pero también lo completaremos con vuestras sugerencias, dudas y comentarios. La idea es tener un recurso sencillo para orientarse en mitad d ela jungla gráfica actual.

¿Cómo nos enfrentamos a un gráfico periodístico?

Captura De Pantalla 2020 03 27 A Las 9 33 00 Michael Florent van Langren (1644)

Ese que hay ahí arriba, es lo que muchos consideran el primer gráfico de información estadística de la historia. Aparece en 'La Verdadera Longitud por Mar y Tierra' (1644) de Michael van Langren y representa las variaciones en la determinación de la longitud entre Toledo y Roma. Evidentemente, podríamos buscar antecedentes anteriores y es posible que lo encontráramos en el mundo de la cartografía, pero es indiscutible que el gráfico de van Langren marcó un antes y un después.

De hecho, prácticamente todo lo que consideramos propio de la visualización de datos, apareció después. Joseph Priestley inventó las series de tiempo en 1765; William Playfair hizo lo propio con los gráficos de barras y líneas (1786) y los gráficos circulares (1801); Charles Joseph Minard creó "el mejor gráfico estadístico jamás dibujado" en 1869 y Florence Nightingale empezó a usar los diagramas que llevan su nombre en 1857.

Minard "Mapa figurativo de las sucesivas pérdidas de hombres de la Armada Francesa en la campaña de Rusia 1812-1813", de Charles Joseph Minard

Personalmente, acostumbrado a vivir en un mundo lleno de gráficos y visualización de datos, se me hace rara la posibilidad de que representar cosas a nivel visual sea una innovación relativamente reciente en la historia de la humanidad. Sin embargo, preguntarse por qué nacieron este tipo de herramientas es una manera excelente de entender sus puntos fuertes y sus debilidades.

¿Por qué nacen los gráficos? ¿Por qué lo seguimos usando? En esencia, hay dos razones. La primera razón el mero hecho de dibujar un gráfico constituye un análisis (por muy básico que sea) de los datos que tenemos entre manos. Es decir, las decisiones que tomamos durante su elaboración constituyen un procesado de la información y, por ello, el resultado nos permite acceder a insights interesantes de forma sencilla.

La segunda razón es, no tiene sentido ocultarlo, su potencia visual. Al fin y al cabo, vivimos en una cultura visual en la que las tablas son el summun del aburrimiento, mientras que los gráficos aparecen como algo sexy, potente e interesante. Se podría añadir más razones, pero esas dos son más que suficientes para acercarnos a la oleada de gráficos que han aparecido durante la epidemia del coronavirus.

Al final y al cabo, la visualización de datos en periodismo alberga siempre la tensión entre el impacto visual y la necesidad de ilustrar un argumento, hecho o fenómeno de forma sencilla y accesible. Los gráficos, nos guste o no, solo pueden responder a un (relativamente) pequeño número de preguntas de forma clara, por eso frente a los gráficos siempre es bueno ir con dos cosas en la cabeza: ¿Qué me puedes contar? ¿Y cómo extraigo lo que a mí me interesa? Cómo extraer esas dos cosas de los gráficos habituales sobre la crisis es lo que vamos a tratar de explicar con esta guía.

Dos confusiones habituales: "aplanar la curva" y comparar por países

fddfdff

La primera confusión habitual se deriva de la difusión de la gráfica superior y el famoso lema de "aplanar la curva". Estas gráficas representan frecuencias absolutas (número de casos) o relativas (número de casos por 100.000 personas) y, precisamente por eso, esas gráficas pueden subir o bajar. En cambio, a lo largo de la epidemia, los gráficos que más se ven representan frecuencias acumuladas. Gráficas como esta:

fwfsdfdsf

El problema con estas últimas gráficas es que nunca van a bajar. La explicación es sencilla: aquí siempre se suman casos nuevos al total. Por ello, como máximo, podemos aspirar a que la gráfica deje de crecer. La segunda confusión tiene mucho que ver con la comparación de cifras entre países y es algo que, evidentemente, también afecta a nuestros análisis (como siempre hemos explicado en ellos mismos).

Todas las gráficas que comparan países tienen el mismo problema: no está claro hasta qué punto esos países se pueden comparar. No se hacen el mismo número de tests en todos los países, ni a todos los grupos por igual. Ni contagios, ni fallecidos se contabilizan de la misma manera. Por otro lado, cada sistema de notificación tiene los casos nuevos no tardan lo mismo en llegar a las estadísticas oficiales.

Cuando nosotros elaboramos nuestras comparativas por países, hicimos muchas pruebas y tomamos decisiones técnicas basándonos en lo que queríamos analizar en ese momento: el impacto de las medidas sanitarias en la evolución de la epidemia en los distintos países. Por ello, nuestros gráficos toman el "día 0" el día en que los países alcanzan los 100 primeros contagiados. Otros gráficos, como el del Finantial Times del que hablaremos más tarde, fijan el "día cero" la jornada en que se acumulan 20 muertes.

Lo importante es tener en cuenta que las comparaciones son complejas e introducen un nivel de incertidumbre a los análisis que aconsejan no usarlos para llegar a conclusiones demasiado precoces. Hasta que no pase la epidemia y los investigadores puedan ponerse a trabajar desenredando todo, las cifras son siempre provisionales.

Gráficas en escala lineal

Centro de Coordinación de Alertas y Emergencias Sanitarias Centro de Coordinación de Alertas y Emergencias Sanitarias

Este tipo de gráficas son muy accesibles porque estamos acostumbrados a ellas. Sean de frecuencias absolutas (la gráfica superior) o acumuladas (la de evolución de la densidad que mostrábamos más arriba) todas ellas representan el número de casos diarios en el tiempo. Son gráficas muy llamativas porque permiten ver la dimensión del problema de forma muy intuitiva. Por el otro lado, con este tipo de gráficas es difícil hacerse cargo de la evolución futura (o pasada) de la epidemia.

¿Qué preguntas responden? Son gráficas interesantes para ver cómo evoluciona la epidemia y nos permiten hacernos una idea intuitiva de las cifras que estmaos barajando. No obstante, como recogen fenómenos con comportamientos exponenciales (aunque sea en algunos momentos) sobrerepresentan los días con más casos y hacen muy complejo estudiar la evolución de la epidemia.

Hace unos días, el Centro de Coordinación de Alertas y Emergencias trataba de dibujar la tendencia sobre una de estas gráficas y, como se puede ver en el vídeo son fenómenos muy difíciles de ver si no dibujamos las tendencias sobre la gráfica directamente.

¿Cómo sabemos si tienen buenas noticias? En el caso de las gráficas que muestran casos nuevos, veremos que la gráfica empieza a crecer menos y, posteriormente, a bajar. Hay que tener en cuenta que los datos distan mucho de ser perfectos y pueden darse situaciones en las que los casos empiecen a bajar para luego subir.

En las gráficas de frecuencias acumuladas, veremos que las barras se estabilizan pareciéndose a lo que conocemos como 'curva logística'. Dado que es difícil mirar tendencias en ellas, es mejor no usar este tipo de gráficas para analizar el día a día.

Gráficas en escala logarítmica

Con el paso de los días de epidemia, las escalas logarítmicas entraron en nuestras vidas. Se trata de gráficas mucho más adecuadas para ver la tendencia y la evolución de los brotes. Basta con trazar líneas imaginarias con tres o cuatro puntos de un país y compararlos con las distintas líneas que aparecen en el gráfico superior: así podemos ver, rápidamente, si los casos van camino de doblarse cada día, cada días o cada semana.

¿Qué preguntas responden? La escala logarítmica está especialmente diseñada para poder representar fenómenos exponenciales sin los problemas de las escalas lineales. En concreto, nos permite ver cómo ha sido la evolución de la epidemia durante todo el proceso sin que las primeras fases se invisibilicen como en las gráficas anteriores. Por ello, son útiles para saber cómo está progresando la epidemia, pero es menos intuitiva para apreciar las cantidades reales sobre las que estamos hablando.

¿Cómo sabemos si tienen buenas noticias? En este caso, como podemos ver en la gráfica superior, la curva va a ir haciéndose cada vez más paralela al eje de las abscisas. Eso significa que la epidemia va haciéndose cada vez más lenta y el crecimiento exponencial va deteniéndose poco a poco.

Gráficas de evolución

Covid19 Incremento Fallecidos

Este tipo de gráficas que han empezado a verse en los últimos días y tratan de representar las tasas de crecimiento de casos, hospitalizados o fallecidos. Es una gráfica interesante porque permite mirar las tendencias de otra forma y, sobre todo en momentos en los que la epidemia está cerca del pico y las cifras son cada vez más grandes, disocia ese crecimiento de la tendencia real. Sin embargo, si no entendemos bien qué significa ese incremento porcentual diario puede ser engañoso.

¿Qué preguntas responden? Como decía, este tipo de gráficas nos permite analizar la velocidad de crecimiento de la enfermedad. No obstante, en este caso, que la línea se estabilice no es buena señal. Una línea estable nos dice que el crecimiento está siendo exponencial. Evidentemente, viendo la tabla podemos ver que había momentos peores, pero eso no debe hacernos olvidar que al contabilizar porcentajes la cantidad que se suma cada día es mayor que el anterior.

¿Cómo sabemos si tienen buenas noticias? Lo sabremos porque la línea negra, la de incremento porcentual, empezará a bajar de forma sostenida. Algo que, lentamente, parece que ha empezado a ocurrir.

Otras muchas gráficas

dsfsdfsdf

Aunque esos tres tipos de gráficas son las más populares, estos días han surgido (y surgirán) muchas otras. La mayoría deellas, no obstante, tienen un sentido muy concreto y no suelen usarse de manera generalizada. Aún así, iremos actualizando la guía en los próximos días con otras formas de representar gráficamente la epidemia del coronavirus.

Disney+ ya está aquí: pruébalo gratis durante 7 días. Después, 6,99 euros al mes o 69,99 euros la suscripción anual.

Disney+ ya está aquí: pruébalo gratis durante 7 días. Después, 6,99 euros al mes o 69,99 euros la suscripción anual.

-
La noticia Guía para interpretar los gráficos que se están publicando sobre el coronavirus fue publicada originalmente en Xataka por Javier Jiménez .



Gracias a Javier Jiménez

No hay comentarios.:

Publicar un comentario