En este post quería dedicarle unas líneas a la visualización de datos. Es algo a lo que estamos acostumbrados pero a lo que quizá no siempre le damos la importancia que se merece. Los datos por si solos, y sobre todo cuando el volumen de datos es grande, pueden ser difíciles de interpretar. La visualización de datos trata de representar la información más relevante mediante una imagen clara y comprensible a simple vista. En cierta forma, la visualización de datos está muy ligada al mundo de la minería de datos ya que el objetivos es el mismo, extraer información importante de los datos de que disponemos.
El proceso de representar gráficamente la información contenida en los datos no es ni tan directo ni tan simple como pudiera parecer. Es muy importante que los objetivos del problema están perfectamente claros antes de empezar. Posteriormente, podremos comenzar a definir la forma en la que vamos a representar los datos. Este proceso de visualización se puede resumir en 6 pasos que se muestran en el siguiente diagrama:
1 – Definición del problema
Debemos identificar que es lo que estamos buscando y las respuestas que queremos obtener con la representación gráfica de los datos. La visualización no debe estar orientada a los datos sino por los casos de uso específicos que queremos tratar en la resolución de un problema.
2 – Evaluar los datos de los que disponemos
Debemos determinar los datos con los que contamos. Por ejemplo en el caso de la seguridad de los sistemas de información, contamos con infinidad de logs que se recogen de diversos servicios. Deberíamos identificar estas fuentes de información, la relación entre los datos provenientes de diferentes fuentes y la información adicional implícita a esos datos.
3 – Procesar la información
Debemos parsear los datos, filtrarlos y extraer de ellos la información relevante que queramos representar de forma gráfica.
4 – Transformación visual
Debemos determinar qué tipo de representación gráfica representa mejor los datos, el color, la forma, etc.
5 – Transformación de la vista
El gráfico obtenido se puede mirar de diferentes formas. Hay veces en las que las transformaciones de los ejes, las translaciones, el zoom de determinadas partes del gráfico puede ser muy relevante para representar la información de forma correcta.
6 – Interpretación
El resultado final de este proceso debería ser una representación visual, clara y concisa de aquellos datos que nos ayuden a satisfacer los objetivos iniciales que habíamos planteado en la definición del problema.
Esto ha sido simplemente una breve introducción a la metodología de visualización de datos, algo básico, pero en lo que muchas veces merece la pena pararse un poco y reflexionar sobre ello. si estáis interesados en la visualización de datos, en la página web de infovis podréis encontrar multitud de información y referencias bibliográficas sobre el tema.
Guzmán Santafé
S21sec labs