Módulo 2. Visualización de datos

Materiales del curso

View the Project on GitHub DCSCyHD/modulo_2

Módulo II

Escuela Interdisciplinaria de Altos Estudios Sociales
Universidad Nacional de San Martín

Equipo Docente: Florencia Piñeyrúa, Nayla Sol Garcilazo y Santiago Nuñez Rimedio

Visualización de datos

En el proceso de investigación la instancia de generación de visualización de información no es un aspecto meramente estético. La construcción de visualizaciones permite explorar y comprender diversos aspectos de la estructura subyacente en los datos.

La generación de visualizaciones de datos cobra mayor relevancia en las instancias de comunicación de resultados tanto a audiencias técnicas como no técnicas, donde un buen despliegue visual (visualizaciones e infografías) ayuda a transmitir conceptos complejos.

Este seminario es una introducción práctica a la visualización de datos, enfocada en el análisis y presentación de datos reales. Los contenidos del seminario abordan aspectos de la dimensión estética y cognitiva y el flujo de trabajo en el proceso de generación de visualizaciones. Se trabajarán diferentes tipos de datos: categóricos, cuantitativos, georreferenciados y algunas herramientas para generar visualizaciones interactivas.

Objetivos pedagógicos

El seminarios se propone que les asistentes:

  1. desarrollen e incorporen criterios operativos e intuiciones sobre la construcción de visualizaciones;
  2. identifiquen las características de una visualización útil;
  3. adquieran fundamentos sobre la producción de visualización de datos sólida y efectiva utilizando el lenguaje R.

Dinámica de las clases

Una clase sincrónica por semana compuesta por un segmento teórico y otro práctico: - exposición teórica a cargo del docente - práctica guiada realizada en conjunto

Contenidos por clase

Clase 1- Asignando propiedades estéticas a los datos

En el teórico se trabaja con datos de la temperatura promedio para cada día del 2019 en la ciudad de Beirut en Líbano; en el práctico, se trabaja con datos de la campaña #MenstruAcción (Argentina).

Clase 2- Puliendo gráficos para publicar

Tanto en el teórico como en el práctico se trabaja con un data set compilado por Gapminder, una ONG sueca dedicada a explicar el mundo con datos. La base de datos contiene indicadores de desarrollo de países en todo el mundo, con observaciones en intervalos de 5 años.

Clase 3- Visualizando cantidades, proporciones y distribuciones

En el teórico utilizamos datos de la campaña #MenstruAcción (Argentina) abordados previamente en el práctico de la clase 1, el data frame menstru_top contiene los datos de las provincias con la mediana de precios precios de toallitas más caras. En la instancia práctica trabajamos con la Encuesta Permanente de Hogares (EPH) correspondiente a los datos individuales del primer trimestre de 2019. La EPH es una encuesta semestral realizada en 31 aglomerados urbanos de Argentina con representatividad estadística que revela indicadores sobre condiciones de vida y del mercado laboral.

Clase 4- Visualizando información geográfica

Tanto en el teórico como en el práctico se trabaja con datos georeferenciados en polígonos que corresponden al territorio de la Ciudad de Buenos Aires dividido en radios censales, la unidad geográfica más pequeña para la que se dispone de datos públicos producidos por el censo nacional.

Clase 5- Agregando interactividad y animación

En esta clase se emplean datos compilados por Gapminder, abordados anteriormente en la clase 2.

Bibliografía complementaria