Módulo I
Escuela Interdisciplinaria de Altos Estudios Sociales
Universidad Nacional de San Martín

Coordinación:
-Germán Rosati
Equipo Docente:
-Pablo Tiscornia
-Guido Weksler |
Github | X
-Santiago Nuñez
Rimedio
-Nayla Sol Garcilazo |
Github
Introducción a la Ciencia de Datos para Científicos Sociales
La ciencia de datos se ha convertido en una herramienta fundamental para
el análisis en las ciencias sociales. Más allá de su impacto en
disciplinas técnicas, su aplicación en este campo permite abordar
grandes volúmenes de información, extraer patrones y generar
conocimiento basado en evidencia.
Este módulo introduce los conceptos clave de la ciencia de datos y su
vínculo con las ciencias sociales. A través del uso de R, se explorarán
los principios de la programación estadística, la manipulación eficiente
de datos y el análisis descriptivo. Se abordarán estructuras de datos
fundamentales como vectores, listas, matrices y data frames, así como
herramientas del ecosistema tidyverse para limpiar, transformar y
visualizar información de manera efectiva.
El enfoque práctico del módulo permitirá a los participantes desarrollar
habilidades esenciales para el procesamiento y análisis de datos
sociales, facilitando su aplicación en investigaciones y proyectos del
campo. # Materiales de cursada Los materiales para la cursada se
encuentran estructurados por clases. En esta página encontrarán un botón
de descarga con el contenidos de cada clase.
Contenidos por clase
*Los materiales están organizados por clase: Pueden descargarse la
totalidad de los materiales de cada una para trabajar en un único
archivo .zip*
Clase 1 - Introduciendo a R y RBase:
- Temas de clase:
- Descripción del programa “R”. Lógica sintáctica del lenguaje y
comandos básicos
- Presentación de la plataforma RStudio para trabajar en “R”
- Caracteres especiales en “R”
- Operadores de asignación, lógicos y aritméticos
- Definición de Objetos: Valores, Vectores, DataFrames y Tibbles,
Listas
- Tipos de variable (numérica, de caracteres, factores, lógicas)
- Funciones

Clases 2 y 3 – Data wrangling – Tidyverse:
- Temas de clase:
- Lectura de bases de datos de distintos formatos/extensiones.
- Recomendaciones para análisis exploratorio de la base de datos
- Limpieza de Base de datos: Renombrar y recodificar variables,
tratamiento de valores faltantes (missing values/ NA´s)
- Creación de nuevas variables, selección de variables,
ordenamiento y agrupamiento de la base de datos para realizar
estimaciones.
- Aplicación de filtros sobre la base de datos
- Tidyr: Manejar la disposición de la base de datos, pivotear una
base (pivot_longer y pivot_wider)
- Operaciones de unión de bases de datos (Joins y bind_rows)
- Medidas de resumen de la información

Clase 4 – Flujos de Trabajo en R y repaso:
- Temas de clase:
- Directorios de trabajo
- Proyectos
- Recomendaciones para la organización del código.
- Exportación de resultados
- Repaso de temas clases 1 a 3

Encuentro 5: Loops y Programación Funcional
- Temas de clase:
- Creación de funciones propias por parte del usuario
- Estructuras de código condicionales (if)
- Estructuras iterativas (Loops)

Encuentro 6: R-Markdown
- Temas de clase:
- Manejo de las extensiones del software “Rmarkdown” y “RNotebook”
para elaborar documentos de trabajo, presentaciones interactivas
e informes:
- Opciones para mostrar u ocultar código en los reportes
- Definición de tamaño, títulos y formato con el cual se
despliegan los gráficos y tablas en el informe
- Caracteres especiales para incluir múltiples recursos en el
texto del informe: Links a páginas web, notas al pie,
enumeraciones, cambios en el formato de letra (tamaño,
negrita, cursiva)
- Código embebido en el texto para automatización de reportes

Encuentro 7: Manejo de Strings
- Temas de clase:
- Funciones principales del paquete stringr:
- Substraer dígitos específicos, detectar patrones simples,
operar con el largo de los caracteres
- Introducción a expresiones regulares

Bibliografía complementaria
-
Grolemund, G. y Wickham, H. (2019), R para Ciencia de
Datos
-
Wickham, H. (2016), ggplot2: elegant graphics for data analysis.
Springer, 2016.
-
Vázquez Brust, A. (2019), Ciencia de Datos para Gente
Sociable
-
Wickham, H. (2019), The tidyverse style
guide
-
Introduction to Modern
Statistics Este manual no forma
parte del contenido de la diplomatura, pero recomendamos su lectura
para quienes necesiten acompañamiento en nociones de estadística.