Acerca del programa:
El Diplomado en Ciencia de Datos ofrece las herramientas computacionales y algorítmicas fundamentales para realizar análisis de datos de manera efectiva.
El Diplomado se encuentra articulado con el Magíster en ciencia de datos
"Por el momento este Diplomado no considera la entrega de insignias digitales"

Dirigido a:
- Profesionales de áreas afines a la ciencia de datos que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de ciencia de datos en su trabajo.
Jefe de Programa

Manuel Sánchez
Equipo Docente
keyboard_arrow_downAlejandro Cataldo
Profesor Asistente UC. Ph.D de la Pontificia Universidad Católica de Chile (2018). Profesor Asistente del Instituto de Ingeniería Matemática y Computacional UC. Su área de investigación está en el campo de la Gestión e Investigación de Operaciones para el diseño de políticas públicas en sistemas de salud y de educación, así como el diseño de políticas para la administración de precios e inventario.
Paula Aguirre
Profesora Asistente UC. Doctora en Astrofísica, Pontificia Universidad Católica (2012). Profesora Asistente del Instituto de Ingeniería Matemática y Computacional UC e Investigadora del Centro Nacional de Investigación para la Gestión Integrada de Desastres Naturales (CIGIDEN). Su área de investigación es en Riesgo y resiliencia en sistemas complejos y redes, Análisis de datos geoespaciales, Percepción remota.
Denis Parra
Profesor Asociado UC. Ph.D. of Philosophy in Information Science, University of Pittsburgh, EE.UU. Ingeniero Civil en Informática de la Universidad Austral de Chile. Profesor Asistente del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. El Dr. Parra es experto en sistemas de recomendación y personalización automatizada. Su área principal de trabajo se desarrolla en la frontera entre las temáticas de análisis de redes sociales, minería de datos y técnicas de visualización para sistemas recomendadores.
Jonathan Acosta
Profesor Asistente del Departamento de Estadística de la Pontificia Universidad Católica de Chile. Doctor en Matemática, consorcio PUCV-UTFSM-UV, Chile (2017). Ingeniero Civil Matemático con mención en Estadística Aplicada y Licenciado en Ciencias de la Ingeniería Matemática de la Universidad Técnica Federico Santa María (USM). Sus líneas de investigación incluyen el modelamiento de datos dependientes, estadística computacional y extracción de conocimiento desde bases de datos no estructuradas, así como modelación estadística para aplicaciones multidisciplinarias.
Descripción
keyboard_arrow_downEl Diplomado en Ciencia de Datos entregará las herramientas computacionales y algorítmicas esenciales para realizar análisis de datos. Los estudiantes aprenderán a utilizar Python, uno de los lenguajes más populares en este campo, y desarrollarán habilidades en visualización y análisis de datos. Además, aplicarán sus conocimientos en proyectos que cubren todo el ciclo de la ciencia de datos, desde la preparación de los datos hasta su análisis y visualización de resultados.
Este diplomado es ideal para quienes busquen aplicar ciencia de datos en distintos ámbitos profesionales. Los estudiantes aprenderán a resolver problemas y optimizar decisiones a partir de datos, habilidades clave en sectores como negocios, tecnología y salud. Al finalizar, estarán preparados para mejorar procesos y tomar decisiones basadas en información precisa.
El programa es 100% online y se imparte a través de la plataforma Coursera, combinando clases expositivas, talleres prácticos y recursos multimedia como videos, textos y foros. La plataforma permite acceder a todos los materiales del curso, clases en vivo y herramientas de apoyo, facilitando un aprendizaje flexible y dinámico que se adapta a las necesidades de cada estudiante.
Requisitos de Ingreso
keyboard_arrow_down- Certificado de Licenciatura en Ingeniería, ciencias básicas o áreas afines
- Experiencia laboral trabajando en gestión de datos
- Conocimientos básicos/intermedios de Python
- Curriculum vitae
Objetivos de Aprendizaje
keyboard_arrow_down- Implementar proyectos de ciencia de datos completos, abarcando la preparación, análisis y visualización de datos, en contextos de resolución de problemas aplicados.
Desglose de cursos
keyboard_arrow_downCurso: Análisis de datos en Python
keyboard_arrow_downDescripción del curso
En este curso los estudiantes aprenderán el uso adecuado y eficiente de Python como herramienta computacional para el análisis de datos, y su rol en la toma de decisiones dentro de una organización. Para ello se introducirán los conceptos básicos y generales sobre el manejo y análisis de datos, se explicará la importancia de una correcta visualización de los datos y de los resultados de los análisis que se realicen con estos, y se explicará en qué consisten los análisis descriptivos, predictivos, y prescriptivos, enseñando diferentes métodos para llevar a cabo estos análisis. El curso utilizará exposiciones a través de clases sincrónicas, análisis de casos, test basados en la interacción con bases de datos, contenidos entregados por las video clases, lecturas y reflexión individual a través de foros.
Resultados de aprendizaje
- Describir el rol del uso de herramientas computacionales en el quehacer actual de las organizaciones, para desarrollar técnicas de ciencia de datos a través de Python.
- Explicar el proceso y utilidad de la revisión, limpieza y procesamiento de datos, antes de su uso.
- Aplicar conceptos y herramientas básicas de programación en Python, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos.
- Desarrollar programas en el lenguaje de programación Python, que permitan resolver problemas sencillos.
- Distinguir el uso de la analítica descriptiva y prescriptiva, para aplicar pronósticos en escenarios futuros inciertos y apoyar procesos de toma de decisiones.
- Explicar la importancia del análisis exploratorio de datos, para su aplicación.
- Aplicar algoritmos básicos de aprendizaje de máquina, para el análisis descriptivo.
- Explicar la importancia de una visualización efectiva de los datos, que permiten evidenciar oportunidades y justificar decisiones en una organización.
Contenidos
- Módulo 1. Ciencia de Datos y Python
- Bienvenida e Introducción
- ¿Qué es la Ciencia de Datos?, ¿Por qué buscar evidencias en los datos?
- Información, datos, decisiones y programación, ¿cómo se integran estos conceptos?
- Secuencias de comandos en Python y Operaciones básicas
- Módulo 2. Manejo de Base de Datos y manejo de los datos
- Conceptos fundamentales de las Bases de Datos
- Conectores y librerías Python para trabajo con Bases de Datos relacionales
- Extracción directa de información desde un programa Python
- Librería de Python y el concepto de Dataframe
- Módulo 3. Visualización avanzada de Datos
- ¿Por qué es importante una visualización adecuada de los datos y resultados?
- ¿Cómo crear gráficos en Python?
- ¿Cómo crear una interface adecuada?
- Ejemplo práctico
- Módulo 4. Analítica descriptiva y predictiva
- ¿Qué es, por qué es importante y cómo se modela la incertidumbre?
- ¿Qué es la analítica descriptiva y predictiva?
- Cómo se utiliza Python en la construcción de modelos predictivos
- Decisiones bajo certidumbre, riesgo e incertidumbre
Estrategias Metodológicas:
- Clases online sincrónicas.
- Ayudantías.
- Recursos audiovisuales asincrónicos.
- Estudio de casos.
Estrategias Evaluativas:
- Controles de alternativas (50%)
- Laboratorios de programación (20%)
- Trabajo final (30%)
Curso: Introducción a la ciencia de datos
keyboard_arrow_downDescripción del curso
Este curso introduce a los estudiantes a este campo de la ciencia de datos, a través de sus principios básicos y las principales técnicas y herramientas utilizadas. Los estudiantes aprenderán sobre recolección e integración de datos, análisis exploratorio de datos, análisis descriptivo y predictivo, y creación de productos de información. Los temas serán tratados en amplitud, más que en profundidad, haciendo énfasis en la integración y síntesis de conceptos, y su aplicación a la solución de problemas.
Resultados de aprendizaje
- Describir lo que es ciencia de datos, sus aplicaciones y relevancia, para distintos tipos de organizaciones.
- Describir las distintas etapas, para el proceso de ciencia de datos.
- Implementar procesos simples de extracción, limpieza e integración de datos de diversas fuentes en lenguaje Python.
- Explicar la importancia del análisis exploratorio de datos, en ciencia de datos.
- Aplicar métodos de análisis exploratorio estadístico y gráfico, a un estudio de caso.
- Aplicar algoritmos básicos de aprendizaje de máquina, para el análisis descriptivo y predictivo.
- Analizar la importancia de una visualización y comunicación efectiva de los datos.
Contenidos
- Introducción a Ciencia de Datos y aprendizaje de máquinas.
- ¿Qué es la ciencia de datos? Usos y aplicaciones.
- El proceso de ciencia de datos.
- Herramientas de Python para ciencia de datos.
- Obtención y transformación de datos.
- Tipos y formatos de datos.
- Fuentes y métodos de extracción de datos.
- Limpieza e integración de conjuntos de datos.
- Análisis Exploratorio de Datos.
- Estadísticas descriptivas.
- Análisis gráfico univariado.
- Análisis gráfico multivariado.
- Algoritmos básicos para análisis predictivo.
- Introducción a aprendizaje de máquinas: tipos de aprendizaje y algoritmos básicos.
- Algoritmos de aprendizaje supervisado.
- Algoritmos de aprendizaje no supervisado.
- Resumen y comunicación de resultados.
Estrategias Metodológicas
- Clases expositivas en video.
- Cuadernos virtuales de programación (Jupyter Notebooks).
- Exposición y análisis de casos.
- Lecturas y reflexión individual.
- Cuestionarios en línea.
Estrategias Evaluativas:
- Tareas (45%)
- Controles de alternativas (40%)
- Proyecto final (15%)
Curso: Visualización de Datos
keyboard_arrow_downDescripción del curso
En este curso los estudiantes obtendrán conocimientos y habilidades para resumir y comunicar resultados de métodos de computación, estadística, minería y análisis de datos. Dentro de las actividades prácticas del curso, los estudiantes estudiarán técnicas y algoritmos para analizar, diseñar y crear visualizaciones efectivas, basadas en principios de diseño gráfico, artes visuales, y psicología cognitiva. El curso estará orientado a estudiantes con experiencia previa en programación.
Resultados de aprendizaje
- Evaluar visualizaciones de información existentes proponiendo mejoras.
- Identificar relaciones entre tipos de datos, tareas de visualización y tipos de gráfico.
- Diseñar visualizaciones de información a partir de datos.
- Implementar en lenguaje Python gráficos simples y avanzados usando datasets tabulares.
- Implementar en lenguaje Python gráficos usando datasets de red.
- Implementar en lenguaje Python gráficos para visualizar datos de texto y espaciales.
Contenidos
- Fundamentos
- Abstracción de Datos
- Marcas y Canales
- Percepción y procesamiento humano de la información
- Reglas y recomendaciones generales para visualizaciones efectivas
- Representaciones Estáticas y sus algoritmos
- Modelo anidado de Munzner para diseño y validación de visualización
- Datos tabulares
- Árboles, Grafos y Redes
- Funciones básicas de librerías de visualización en Python
- Implementación de gráficos en Python con datos tabulares
- Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado.
- Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado.
- Reducción de dimensionalidad.
- Implementación de gráficos en Python con datos de red, texto y espaciales
- Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado.
- Visualización básica de datos de texto.
- Visualización básica de datos espaciales.
Estrategias Metodológicas
- Cátedra en sesiones sincrónicas
- Videoclases
- Podcast o video tutorial
- Discusión de casos.
- Lecturas
- Análisis de casos
- Test formativos
- Foros de discusión
- Test basados en la interacción con bases de datos
Estrategias Evaluativas
- Tres pruebas on-line individuales, todas de igual ponderación (30%)
- Tres actividades de aplicación individuales, la tercera con doble ponderación (45%)
- Un trabajo grupal final (15%)
- Un foro grupal evaluado (10%)
Curso: Aprendizaje Estadístico y Computacional
keyboard_arrow_downDescripción del curso
En este curso los estudiantes aprenderán los conceptos elementales de machine learning y varias metodologías de aprendizaje supervisado y no supervisado. El estudiante deberá ser capaz de identificar los métodos más apropiados, aplicarlos y compararlos en diferentes contextos, en particular, para problemas de grandes volúmenes de datos.
Resultados de aprendizaje
- Explicar los conceptos claves y el potencial del aprendizaje estadístico moderno.
- Aplicar diferentes técnicas de machine learning a problemas de regresión, clasificación y agrupación.
- Comparar y seleccionar el mejor método de análisis basado en la problemática.
Contenidos
- Introducción a Machine Learning:
- Tipos de aprendizaje
- Modelos de regresión lineal y logística
- Etapas del modelamiento en machine learning
- Aprendizaje Supervisado:
- Árboles de decisión
- Bosque aleatorio
- Clasificador bayesiano ingenuo
- K-vecinos más cercanos (KNN)
- Máquinas de vectores de soporte (SVM)
- Aprendizaje No Supervisado:
- Análisis de componentes principales (PCA)
- K-medias
- Agrupación jerárquica
Estrategias Metodológicas:
- Clases expositivas.
- Aprendizaje basado en problemas.
- Estudio de casos.
- Tutoriales y trabajo personal de lectura.
Estrategias Evaluativas:
- Foro de discusión (10%)
- Trabajo final grupal (24%)
- Controles de alternativas (30%)
- Laboratorios de programación (36%)
Requisitos Aprobación
keyboard_arrow_downAprobar los siguientes cursos:
- Análisis de Datos en Python: 25%
- Introducción a la Ciencia de Datos: 25%
- Visualización de Datos: 25%
- Aprendizaje Estadístico y Computacional: 25%
Los estudiantes deberán ser aprobados de acuerdo los criterios que establezca la unidad académica:
- Calificación mínima de todos los cursos 4.0 en su promedio ponderado
Para aprobar un Diplomado o Programa de Formación o Especialización, se requiere la aprobación de todos los cursos que lo conforman y, en los casos que corresponda, de otros requisitos que indique el programa académico.
El estudiante será reprobado en un curso o actividad del Programa cuando hubiere obtenido como nota final una calificación inferior a cuatro (4,0).
Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.
*No se cuenta con ceremonia de graduación.
Proceso de Admisión
keyboard_arrow_downLas personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:
- Currículum vitae actualizado.
- Copia simple de título o licenciatura (de acuerdo a cada programa).
- Fotocopia simple del carnet de identidad por ambos lados.
Con el objetivo de brindar las condiciones y asistencia adecuadas, invitamos a personas con discapacidad física, motriz, sensorial (visual o auditiva) u otra, a dar aviso de esto durante el proceso de postulación.
El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
No se tramitarán postulaciones incompletas.
Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula.
¿Te parece interesante este programa?
Sí No