Diplomado en Ciencia de datos para políticas públicas

Estudia en la Universidad Nº 1 de Latinoamérica | Pontificia Universidad Católica de Chile

Acerca del programa:

El diplomado de Ciencia de Datos para Políticas Públicas es una iniciativa de la Escuela de Gobierno y el Instituto de Ingeniería Matemática y Computacional de la UC que busca preparar a profesionales de distintas áreas en el análisis y producción de estudios que utilicen distintas fuentes de datos y metodologías de análisis, y que sean de aplicación a problemas actuales de políticas públicas.  

Foto Diplomado en Ciencia de datos para políticas públicas

Dirigido a:

El diplomado está dirigido a profesionales que se desempeñen o busquen desempeñarse en instituciones públicas, ya sea instituciones del estado, organizaciones no gubernamentales, academia, centros de investigación, entre otros. Los estudiantes deberán tener conocimiento de conceptos de estadística básica equivalentes a un curso introductorio de análisis de datos. 


Jefe de Programa

Pablo Celhay

Doctor y Magíster en Políticas Públicas, Universidad de Chicago. Ingeniero Comercial (mención Economía), Universidad de Chile. Sus focos de investigación actual son el efecto de distintos mecanismos de pago a proveedores de salud, los efectos de expandir programas de seguros de salud universal sobre decisiones de trabajo e indicadores de salud de sus beneficiarios, causas y consecuencias de errores de medición en encuestas sociales en EE.UU., entre otros proyectos relacionados a la economía de la salud, salud pública y desarrollo económico. En el ámbito profesional, fue consultor del Banco Mundial y del Banco Interamericano de Desarrollo, asesorando evaluaciones de impacto de programas sociales en distintos países de América Latina. Profesor Asistente de la Escuela de Gobierno de la UC.
linkedin twitter

Equipo Docente

keyboard_arrow_down

Pablo Barceló

Ingeniero Civil Electricista, PhD en Ciencias de la Computación. Director Instituto de Ingeniería Matemática UC. 

Naim Bro

Sociólogo, PhD in Sociology. Post-doctorando en el IMFD UC.

Domagoj Vrgoc

PhD en Ciencias de la Computación. Profesor Asistente IMC UC. 

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de remplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa.

Descripción

El concepto de políticas basadas en evidencia adquiere cada vez más relevancia en distintos sectores dedicados a el análisis y diseño de políticas públicas, por lo que se hace necesario contar con profesionales preparados para estos efectos.

A través de este diplomado los estudiantes aprenderán a evaluar qué tipo de datos son apropiados para qué tipo de necesidades, conocerán alcances y limitaciones de trabajos cuantitativos para la toma de decisiones en políticas públicas, comprenderán aspectos básicos para el análisis de datos complejos y no estructurados mediante herramientas estadísticas y computacionales, conocerán técnicas de visualización y comunicación de datos, e identificarán modelos para la evaluación de impacto de políticas públicas.

Los estudiantes del diplomado tendrán las herramientas necesarias para saber cómo elaborar y encargar estudios a terceros que utilicen datos como su principal fuente de análisis, interpretar y leer estudios cuantitativos que utilicen datos complejos, y proponer análisis adecuados a distintos problemas en políticas públicas.

La metodología de aprendizaje consistirá en clases, talleres y exposición de expertos/as de varias temáticas en políticas públicas.

Requisitos de Ingreso

  • El alumno debe estar en posesión de un grado académico o de un título profesional universitario en alguna de las siguientes disciplinas: Economía, Ingeniería Civil, Ingeniería Comercial, Psicología, Sociología, Ciencias Políticas, u otras disciplinas afines.
  • Se recomienda experiencia laboral de 2 años en al área o áreas afines.

Objetivos de Aprendizaje

Los objetivos de aprendizaje del programa son:

  1. Formular preguntas de investigación e hipótesis que se puedan responder con análisis cuantitativo e identificar ventajas y desventajas de distintos métodos empíricos para tales efectos.
  2. Comprender aspectos básicos de la preparación, curación, análisis y visualización de datos estructurados y no estructurados.
  3. Presentar y sintetizar respuestas a problemas de políticas públicas utilizando distintas metodologías de análisis de datos.

Desglose de cursos

DESGLOSE DE CURSOS

Nombre del curso: Aproximación a las políticas públicas desde los datos

Nombre en inglés: Data in Public Policy

Horas cronológicas: 24; Créditos: 5

Resultados de Aprendizaje

Formular preguntas de investigación e hipótesis relacionadas a políticas públicas utilizados datos

Identificar tipos de datos para distintas preguntas de investigación.

Identificar ventajas y desventajas de distintos métodos empíricos.

Aplicar el concepto de contrafactual a distintos casos en políticas públicas.

Contenidos:

  1. Conceptos básicos para el análisis de datos
    1. Estudios observacionales vs experimentales
  2. Conceptos básicos en Big Data
  3. Conceptos básicos en Machine Learning
  4. Diseño de proyectos empíricos para la toma de decisiones
    1. Formulación de hipótesis
    2. Etapas de un diseño empírico
    3. Desafíos
  5. Tipos de datos y preguntas de investigación
    1. Datos primarios
    2. Datos secundarios
    3. Casos buenos/malos que utilizan big data
  6. Marco Legal y ética en el análisis de datos
  7. Análisis básico de datos
    1. Regresión lineal aplicada
    2. Predicción
    3. Escenario contrafactual, sesgo de selección, sesgo muestral

Metodología de enseñanza y aprendizaje:

Cátedras

Discusión de ejemplos y problemas aplicados

Ejercicios prácticos

Exposición de expertos

Trabajos grupales

Evaluación de los aprendizajes:

3 Tareas individuales (25% c/u). Cada tarea consistirá en una aplicación de los métodos analizados en clases, aplicados a un problema de políticas públicas en particular (el mismo para todas las tareas).

1 tarea grupal (25%), que seguirá el mismo formato de trabajo de las tareas individuales, pero deberá además ser presentada por el grupo ante la clase.


Nombre del curso: Gestión de Datos

Nombre en inglés: Data Management

Horas cronológicas: 24; Créditos: 5


Resultados de Aprendizaje

Documentar el ciclo de vida útil de los datos.

Manipular datos usando R Studio..

Identificar problemas de calidad de los datos disponibles.

Aplicar técnicas de limpieza de los datos (regresión lineal, sampling).

Integrar varias fuentes de los datos (texto, páginas Web, CSV,...) en una base de datos SQL para garantizar calidad y consistencia de los datos.

Contenidos:

  1. Ciclo de vida útil de los datos
  2. Documentación de los datos, garantías de validez, exactitud, consistencia, completitud, y uniformidad
  3. R para manejo de los datos.
  4. Herramientas para depuración de los datos I: regresión lineal
  5. Herramientas para depuración de los datos II: sampling
  6. Caso para datos estructurados I: Bases de datos relacionales
  7. Caso para datos estructurados II: Lenguaje de consulta SQL
  8. Integración de los datos y depuración de datos relacionales

Metodología de enseñanza y aprendizaje:

Cátedras

Discusión de ejemplos y problemas aplicados

 Ejercicios prácticos

Trabajos grupales 

Evaluación de los aprendizajes:

3 Tareas individuales (25% c/u). Cada tarea consistirá en una aplicación de los métodos analizados en clases, utilizando datos reales asociados a políticas públicas.

1 tarea grupal (25%), que seguirá el mismo formato de trabajo de las tareas individuales, pero deberá además ser presentada por el grupo ante la clase.


Nombre del curso: Análisis y Visualización de Datos

Nombre en inglés: Data Analysis and Visualization

Horas cronológicas: 24; Créditos: 5


Resultados de Aprendizaje

Comprender cuándo, cómo, y por qué las técnicas sofisticadas de análisis de datos pueden ser relevantes para tomar decisiones basadas en datos.

Utilizar técnicas computacionales para extraer datos desde texto y la Web.

 Analizar datos para agruparlos según características comunes, descubrir patrones o anomalías en ellos, o detectar asociaciones.

Aplicar métodos de clasificación y regresión basada en técnicas de machine learning para resolver problemas complejos sin necesidad de explicitar las instrucciones.

Implementar formas eficaces de visualizar y comunicar los datos para la toma de decisiones.

Contenidos:

 Introducción: Ejemplos y métodos de análisis y visualización de datos 

Minería de texto y web scrapping

Minería de datos: clustering, patrones más frecuentes, reglas de asociación

Machine learning: Perceptron, support vector machines, redes neuronales 

Visualización de datos: conceptos y tecnologías fundamentales

Metodología de enseñanza y aprendizaje:

Cátedras

Discusión de ejemplos y problemas aplicados

Ejercicios prácticos

Trabajos grupales

Evaluación de los aprendizajes:

3 Tareas individuales (25% c/u). Cada tarea consistirá en una aplicación de los métodos analizados en clases, aplicados a un problema de políticas públicas en particular (el mismo para todas las tareas).

1 tarea grupal (25%), que seguirá el mismo formato de trabajo de las tareas individuales, pero deberá además ser presentada por el grupo ante la clase.

Nombre del curso: Datos para la evaluación de impacto en políticas públicas

Nombre en inglés: Data and public policy impact evaluation

Horas cronológicas: 24; Créditos: 5


Resultados de Aprendizaje

Aplicar el concepto de escenario contrafactual para la evaluación de políticas públicas.

Evaluar la calidad de la evidencia empírica presentada en distintos medios sobre el impacto de las principales políticas públicas en Chile.

Identificar distintos métodos para preguntas de evaluación de impacto.

 Elaborar un diseño de evaluación de impacto de una política pública utilizando al menos dos de los métodos revisados en clase.

Presentar públicamente resultados de un ejemplo real de evaluación de impacto y presentar argumentos a favor y en contra de la calidad de la evaluación.

Contenidos:

  1. Introducción a la evaluación de impacto
  2. Experimentos
  3. Selección de muestra
  4. Cuasi experimentos
    1. Datos longitudinales
    2. Regresión Discontinua
    3. Matching
    4. Variables instrumentales
  5. Métodos mixtos para la evaluación de políticas públicas
  6. Ventajas de datos administrativos
  7. Diseño de estudios de impacto en políticas públicas

Metodología de enseñanza y aprendizaje:

Cátedras

Discusión de ejemplos y problemas aplicados

Ejercicios prácticos

Exposición de expertos

Trabajos grupales

Evaluación de los aprendizajes:

3 Tareas individuales (25% c/u). Cada tarea consistirá en una aplicación de los métodos analizados en clases, aplicados a un problema de políticas públicas en particular (el mismo para todas las tareas).

1 tarea grupal (25%), que seguirá el mismo formato de trabajo de las tareas individuales, pero deberá además ser presentada por el grupo ante la clase.

Nombre del curso: Taller de Análisis de Datos

Nombre en inglés: Data Analysis Workshop

Horas cronológicas: 48; Créditos: 5


Resultados de Aprendizaje

Identificar una pregunta específica de investigación aplicada en políticas públicas.

Formular hipótesis en el marco de una pregunta específica.

Manejar, limpiar, y analizar bases de datos para una pregunta específica.

Aplicar los métodos del curso a una pregunta específica.

Presentar resultados en formatos de presentación oral/visual.

Contenidos:

  1. Elección de tópicos
    1. Salud
    2. Educación
    3. Crimen
    4. Vivienda
    5. Opinión Pública
  2. Desarrollo del proyecto de investigación
  3. Taller de Curso 1
  4. Taller de Curso 2
  5. Taller de Curso 3
  6. Taller de Curso 4

 

Metodología de enseñanza y aprendizaje:

Discusión de ejemplos y problemas aplicados

Ejercicios prácticos

Trabajos grupales

Evaluación de los aprendizajes:

Los alumnos deberán realizar un trabajo grupal a lo largo de todo el diplomado, enfocándose en un problema de políticas públicas específico (uno por grupo) que ellos mismos deberán elegir dentro de una gama de posibilidades que se les proveerá al principio del diplomado. En este trabajo los alumnos deberán aplicar los conocimientos adquiridos durante todo el diplomado, y serán evaluados de la siguiente manera:

Una presentación final (50%).

Un informe final trabajo al final del diplomado (50%).


BIBLIOGRAFÍA

Angrist, J. D., & Pischke, J. S. (2014). Mastering"metrics: The path from cause to effect. Princeton University Press.

Burkov, Andriy. The Hundred-Page Machine Learning Book. 1st edition, 2019.

Cunningmham, Scott (2020). Causal Inference: The Mixed Tape. Disponible en http://scunning.com/cunningham_mixtape.pdf

Healy, Kieran. Data Visualization: A Practical Introduction. Princeton University Press, 2019, 1st Edition.

Leskovec, Jure; Rajaraman, Anand; Ullman, Jeffrey David. Mining of Massive Datasets. Cambridge University Press, 2014, 2nd edition.

Ramakrishnan, R., Gehrke, J., Database Management Systems, 3rd edition, McGraw-Hill, 2002.

Salganik, M. (2019). Bit by bit: Social research in the digital age. Princeton University Press.

 Taddy, Matt (2019). Business Data Science: Combining Machine Learning and Economics to Optimize, Automate, and Accelerate Business Decisions

VanderPlas, Jake. Python Data Science Handbook: Essential Tools for Working with Data. O’Reilly, 2016, 1st Edition.

Requisitos Aprobación

Se espera un cálculo de la nota final del diplomado. En el caso de los diplomados se deberá informar la ponderación de cada curso:


Curso Aproximación a las políticas públicas desde los datos:                   15%

Curso Gestión de Datos:                                                                                  15%

Curso Análisis y Visualización de Datos:                                                        15%

Curso Datos para la evaluación de impacto en políticas públicas:           15%

Curso Taller de Análisis de Datos:                                                                 40%

Los alumnos deberán ser aprobados de acuerdo a:

  1. Calificación mínima de 4,0 en el promedio ponderado de cada curso y
    1. 75% de asistencia o cifra superior a las sesiones presenciales.

Para aprobar los programas de diplomados se requiere la aprobación de todos los cursos que lo conforman y en el caso que corresponda, de la evaluación final integrativa

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile

El alumno que no cumpla con una de estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación.

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo: 

·        Fotocopia Carnet de Identidad.

·        Fotocopia simple del Certificado de Título

·        Curriculum Vitae actualizado.

El postulante será contactado, para asistir a una entrevista personal (si corresponde) con el Jefe de Programa del Diplomado o su Coordinadora Académica. Catalina Lavín al correo calavinv@ing.puc.cl

VACANTES: 20

INFORMACIONES RELEVANTES

Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo. 

·        El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.

·        No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula


¿Te parece interesante este programa?

No