Diplomado en Data science

Estudia en la Universidad N°1 de habla hispana en Latinoamérica por QS Latam University Rankings 2025

Acerca del programa:

El Diplomado en Ciencia de Datos entrega herramientas en data science para implementar soluciones de inteligencia de datos en la gestión y procesos de toma de decisiones. 


Haz click aquí para conocer el Diplomado en Estadística.

Haz click aquí para conocer el Magíster en Estadística UC


Dirigido a:

Ingenieros Civiles y de Ejecución de los diversos ámbitos de especialización, Ingenieros Comerciales, Economistas, Administradores Públicos, Psicólogos, Sociólogos, y en general, profesionales de diversas disciplinas que se desempeñan en áreas de gestión de empresas o ámbito público, de diferentes rubros.


Jefe de Programa

Ricardo Olea Ortega

Profesor Docente Asociado. Licenciado en Matemáticas (2003) Estadístico (2003) Magíster en Estadística (2004) y Doctor en Estadística (Ph.D.) (2008) por la Pontificia Universidad Católica de Chile. Profesor e investigador en el Departamento de Estadística de la misma institución desde 2008 con más de 15 años de experiencia académica y profesional en el área. Autor de más de una decena de artículos especializados en estadística ha dirigido una tesis doctoral y más de 10 tesis de magíster. Su tesis doctoral recibió en 2008 una mención honrosa como finalista en el área de ciencias en la Pontificia Universidad Católica de Chile. Con una sólida trayectoria como docente ha formado a profesionales en Ingeniería Civil Ingeniería Comercial y Estadística destacándose por su enfoque práctico y metodológico. Es instructor y programador especializado en diversos softwares estadísticos con un dominio destacado en R-project donde desarrolló un paquete teórico-metodológico para pronósticos de series de tiempo con características localmente estacionarias. Como consultor ha asesorado a instituciones y empresas en el diseño e implementación de modelos avanzados incluyendo predicción de demanda modelos econométricos financieros de riesgo prepago y crecimiento. Su experiencia combina una sólida base teórica con aplicaciones prácticas en ciencia de datos y estadística aplicada.

Equipo Docente

keyboard_arrow_down

Alexis Alvear

Alonso Molina

Claudio Alarcón

Esteban Rucán

Felipe Ossa

Francia Berna

Hernán Robledo

Jonathan Acosta

José Miguel Ventura

Joshua Kunts

María José García

Mauricio Castro Miguel Muñoz

Nicolás Godoy

Oscar Ortíz

Pedro Ramos

Ricardo Aravena

Ricardo Olea

Riva Quiroga

Valeria Leiva.

Descripción

El desarrollo científico y tecnológico ha incrementado el acceso a información más completa y precisa, generando una abundancia de datos sin precedentes. Gracias a la disponibilidad de dispositivos tecnológicos, hoy se pueden medir múltiples variables y procesar grandes volúmenes de información mediante algoritmos computacionales. Este fenómeno tecnológico, científico y matemático, conocido como Big Data, ha permitido acceder a volúmenes insospechados de información, transformando la manera en que interactuamos con los datos.

Si bien el Big Data ofrece infinitas posibilidades, también plantea desafíos cruciales, como el saber cómo interpretar y utilizar tantos datos. Transformar esta abundancia en información útil y aplicable para la generación de conocimiento científico, social y económico es uno de los principales retos actuales. Aquí es donde entra la ciencia de datos (Data Science), que, mediante herramientas matemáticas, estadísticas y computacionales, permite analizar, integrar y modelar datos para comprender fenómenos complejos. En este contexto, el Big Data convierte los datos en información, y la ciencia de datos transforma esta información en conocimiento.

Una de las grandes fortalezas de la ciencia de datos es que no está restringida a matemáticos o informáticos. Sus herramientas pueden ser utilizadas por profesionales de diversas disciplinas, favoreciendo el trabajo interdisciplinario y multidisciplinario. Esto aporta una visión sistémica para abordar problemas complejos y comprender el comportamiento de sistemas dinámicos.

El Diplomado en Ciencia de Datos proporciona herramientas técnicas y metodológicas que capacitan a profesionales de distintas áreas para analizar datos, diseñar modelos matemáticos y estadísticos, y desarrollar aplicaciones orientadas a generar conocimiento estratégico e inteligencia en diferentes ámbitos.

El programa está compuesto por cinco cursos obligatorios, estructurados para abordar los contenidos con niveles de profundidad acordes a los objetivos de cada módulo. Comienza con un curso introductorio que ofrece bases teóricas, históricas y conceptuales de la disciplina, e incluye un proyecto integral que se extiende a lo largo del programa, permitiendo a los estudiantes aplicar progresivamente las herramientas y metodologías aprendidas. El segundo curso se centra en los modelos matemáticos y estadísticos clásicos, integrando el uso de herramientas computacionales. En el tercer curso, se aborda el aprendizaje automático (Machine Learning), proporcionando técnicas avanzadas para el diseño y programación de algoritmos predictivos. El cuarto curso desarrolla competencias en tecnologías de visualización de datos, facilitando la comunicación efectiva de hallazgos. Finalmente, el diplomado culmina con un curso especializado que brinda una visión amplia de las aplicaciones de la ciencia de datos en sectores clave como el marketing y la industria bancaria, explorando además otras áreas como la gestión pública, la salud y la innovación tecnológica.

El programa, impartido en modalidad online con clases en vivo, hará uso de la plataforma LSM Moodle, desarrollada por la Facultad de Matemáticas. A través de este entorno virtual, los alumnos podrán acceder a materiales de trabajo, presentaciones de clases, ejercicios y evaluaciones, facilitando así un aprendizaje estructurado e interactivo.

Requisitos de Ingreso

Profesional universitario, licenciatura, egresado de instituto profesional, con al menos un año de experiencia laboral en áreas de gestión en empresas de diferentes rubros. 

Objetivos de Aprendizaje

Diseñar estrategias integrales en ciencia de datos que integren fundamentos teóricos, métodos matemáticos y estadísticos, herramientas computacionales avanzadas, técnicas de visualización, y aplicaciones prácticas en sectores clave, con el propósito de resolver problemas complejos y generar conocimiento estratégico para la toma de decisiones basada en datos.

Desglose de cursos

Curso 1: Fundamentos de la Ciencia de Datos

keyboard_arrow_down
Fundamentals of data science.

Docente(s): Alexis Alvear (responsable del curso)

Unidad académica responsable: Facultad de Matemáticas.

Requisitos: Sin prerrequisitos

Créditos: 3

Horas totales: 60 | Horas directas: 15 | Horas indirectas: 45

Descripción del curso:  

Este curso práctico guía a los estudiantes en la comprensión y aplicación de la ciencia de datos como herramienta clave para la innovación tecnológica. Durante todo el diplomado, los participantes desarrollarán un proyecto integral que les permitirá aplicar progresivamente las herramientas y metodologías adquiridas en los distintos módulos. El curso aborda aspectos fundamentales de la ciencia de datos, como su definición, el rol del científico de datos, sus aplicaciones prácticas y los desafíos éticos asociados. A través del proyecto, los estudiantes explorarán cómo los datos pueden ser utilizados estratégicamente para detectar y satisfacer necesidades, promoviendo soluciones innovadoras y contextualizadas a problemas reales.      

Resultados de Aprendizaje:     

  • Comprender el desarrollo histórico y tecnológico de la ciencia de datos.
  • Explicar los fundamentos de la ciencia de datos y su impacto.
  • Formular estrategias innovadoras basadas en ciencia de datos, integrando la comprensión de desafíos éticos, la relación con la innovación y la aplicación de conceptos en casos reales, para abordar problemáticas complejas de manera estratégica y responsable.

Contenidos:

  • Introducción      
    • Evolución de la ciencia y la tecnología.
    • De la falta de datos al exceso de información.
    • El big data como desarrollo tecnológico de los datos.
    • Los desafíos del big data.
  • La ciencia de datos       
    • ¿Qué es el Data Science?
    • ¿Qué hace un Data Scientist?
    • Aplicaciones de Data Science
    • Desafíos éticos del Data Science
  • Data Science e Innovación       
    • ¿Por qué el Data Science se relaciona con la innovación?
    • Innovar a partir de los datos.
    • Datos para detectar y crear necesidades.        

Estrategias Metodológicas:     

  • Clases expositivas
  • Análisis de casos

Estrategias Evaluativas 

  • Proyecto basado en problemas integral: 100%
  • Que les permitirá aplicar progresivamente las herramientas y metodologías adquiridas en los distintos módulos.

Curso 2: Modelos Matemáticos y Estadísticos para Ciencia de Datos

keyboard_arrow_down
Mathematical and Statistical Models for Data Science

Docente(s): Ricardo Olea. (responsable del curso)

Unidad académica responsable: Facultad de Matemáticas.

Requisitos: Sin prerrequisitos

Créditos: 6

Horas totales: 100 | Horas directas: 60| Horas indirectas: 40          

Descripción del curso:  

En este curso, los estudiantes adquirirán habilidades fundamentales y avanzadas para el análisis estadístico y predictivo. Aprenderán a emplear herramientas de estadística descriptiva, distinguir entre eventos probabilísticos y determinísticos, y aplicar modelos estadísticos en análisis predictivo y de series de tiempo. Además, desarrollarán competencias en inferencia estadística, modelos lineales y técnicas de predicción temporal. El curso se apoya en los lenguajes de programación R y Python, herramientas ampliamente reconocidas en la ciencia de datos por su flexibilidad, potencia y capacidad para manejar grandes volúmenes de datos. R es ideal para análisis estadísticos y visualización de datos, mientras que Python se destaca por su versatilidad en modelado predictivo y aplicaciones avanzadas. El aprendizaje será complementado con análisis de casos prácticos, permitiendo a los estudiantes integrar conocimientos y aplicarlos en escenarios reales de análisis y predicción. La evaluación consistirá en trabajos prácticos y estudios de caso que demuestren su capacidad para implementar las herramientas estudiadas en entornos computacionales modernos.

Resultados de Aprendizaje:     

  • Manejo de herramientas computacionales: Utilizar R y/o Python para importar, manipular, visualizar y exportar datos.
  • Estadística descriptiva y exploratoria: Resumir y analizar datos mediante herramientas estadísticas básicas, visualización efectiva y conceptos de posición, dispersión e interpretación.
  • Formular soluciones innovadoras en ciencia de datos, integrando modelos probabilísticos, inferenciales y predictivos con herramientas computacionales como R y/o Python, para abordar problemas complejos mediante el análisis de series de tiempo y técnicas avanzadas de modelado estadístico.

Contenidos:

  • Introducción a Herramientas Computacionales
    • Introducción a Python: configuración y primeros pasos.
    • Introducción a Pandas: manipulación y análisis de datos en Python.
    • Introducción a R: conceptos básicos y entorno de trabajo.
    • Introducción a Tidyverse: librerías esenciales para manipulación y visualización de datos en R.
  • Manipulación y Visualización de Datos
    • Importar, manipular y exportar datos en R y/o Python.
    • Visualización de datos: gráficos básicos e interactivos en R y/o Python.
  • Estadística Descriptiva y Exploratoria
    • Introducción a la estadística: conceptos clave.
    • Tablas de frecuencias y estadísticos descriptivos.
    • Medidas de posición y dispersión.
    • Gráficos estadísticos y su interpretación.
    • Aplicaciones prácticas de estadística descriptiva.
  • Probabilidad
    • Fundamentos de probabilidad y su contexto matemático.
    • Diferenciación entre muestra y población.
    • Modelos de probabilidad clásicos y su interpretación práctica.
  • Introducción a la Inferencia Estadística
    • Distribuciones muestrales y principios de estimación.
    • Construcción e interpretación de intervalos de confianza.
    • Pruebas de hipótesis: aplicaciones y análisis en R y/o Python.
  • Modelos Predictivos
    • Análisis de varianza (ANOVA) para comparar grupos.
    • Regresión lineal simple y múltiple: teoría y aplicaciones en R y/o Python.
    • Introducción a los modelos lineales generalizados.
    • Regresión logística: fundamentos y aplicaciones en R y/o Python
  • Análisis de Series de Tiempo
    • Introducción a las series de tiempo y sus componentes.
    • Análisis de patrones temporales en datos cronológicos.
    • Modelos de series de tiempo estacionarias y no estacionarias.
    •  Implementación en R y/o Python.

Estrategias Metodológicas:     

  • Clases expositivas
  • Análisis de casos

Estrategias Evaluativas

  • Rúbrica cuantitativa al 100%.
  • A través de Talleres que permitan poner en práctica los contenidos vistos en el curso.

Curso3: Aprendizaje Automático (Machine Learning)

keyboard_arrow_down
Machine Learning.

Docente(s): Ricardo Olea. (responsable del curso)

Unidad académica responsable: Facultad de Matemáticas.

Requisitos: Sin prerrequisitos

Créditos: 6

Horas totales: 100 | Horas directas: 60 | Horas indirectas: 40         

Descripción del curso:

En este curso, los estudiantes desarrollarán habilidades para manejar las principales funcionalidades y aplicaciones de los lenguajes de programación R y/o Python, empleando técnicas avanzadas para la exploración, análisis y modelado de datos.

A través de clases expositivas y análisis de casos, profundizarán en el uso de procesos recursivos, métodos de aprendizaje automático y modelos estadísticos aplicados a la clasificación y gestión de grandes volúmenes de datos.

La evaluación se basará en la implementación de modelos estadísticos y de machine learning, validando la capacidad de los estudiantes para aplicar estos métodos a datos reales de manera eficiente y fundamentada. 

Resultados de Aprendizaje:

  • Manejar las principales funcionalidades y usos del software R y/o Python.
  • Utilizar y programar funciones, procesos recursivos y métodos de auto aprendizaje.
  • Crear estrategias estadísticas avanzadas que integren modelos descriptivos, métodos de clasificación y manejo de grandes volúmenes de datos, incorporando técnicas para la reducción de dimensionalidad y validación de modelos, con el objetivo de resolver problemas complejos y optimizar la toma de decisiones basada en datos.

Contenidos:

  • Introducción a los Modelos de Machine Learning   
    • Origen y evolución del aprendizaje automático (Machine Learning).
    • Aplicaciones prácticas de Machine Learning en ciencia de datos.
    • Herramientas esenciales para proyectos de Data Science
    • Tipos de aprendizaje: supervisado y no supervisado.  
  • Tipos de Aprendizaje y Etapas de Machine Learning         
    • Clasificación de imágenes: fundamentos y ejemplos.
    • Conceptos de modelamiento en Machine Learning.
    •  Etapas del proceso: Entrenamiento y validación.
    • Problemas de Underfitting y Overfitting.
    •  Validación cruzada (Cross Validation).
    •  Implementación de estos conceptos en R y/o Python. 
  • Árboles de Decisión, Bagging y Random Forest       
    • Recordatorio de los modelos supervisados.
    • Árboles de decisión: criterios de ramificación, ventajas y limitaciones.
    • Métodos avanzados: Bagging y Random Forest.
    • Implementación de árboles de decisión y Random Forest en R y/o Python.     
  • Algoritmos No Supervisados   
    •  Revisión de conceptos de modelos no supervisados.
    • Algoritmos de agrupación: K-means, K-mode, K-prototype.
    • Implementación de algoritmos de agrupación en R y/o Python.
  • Técnicas de Reducción de Dimensionalidad 
    • Importancia y objetivos de la reducción de dimensionalidad.
    • Técnicas clásicas: Análisis de componentes principales (PCA). Análisis factorial.
    • Técnicas avanzadas: t-SNE. Autoencoders.
    • Implementación de técnicas de reducción de dimensionalidad en R y/o Python.    
  • Detección de Anomalías
    • Importancia de la detección de anomalías en Data Science.
    • Métodos de detección:
    • Componentes principales (PCA).
    • Isolation Forest.
    • Implementación en R y/o Python.
  • Aplicaciones de Inteligencia Artificial
    • Ejemplos prácticos de inteligencia artificial en diversos sectores.
  • Redes neuronales          
    •  Componentes y estructuras.
    • Redes neuronales convolucionales (Convolutional Neural Networks).     
  • LSTM (Long Short-Term Memory) para predicción de series de tiempo.
  • Sistemas de recomendación: fundamentos y aplicaciones.  
  • Implementación de aplicaciones de IA en R y Python.        
  • Estadística Espacial para Data Science
    • Conceptos básicos de estadística espacial.
    • Aplicaciones y ejemplos en proyectos de ciencia de datos.

Estrategias Metodológicas:     

  • Clases expositivas
  • Análisis de casos

Estrategias Evaluativas:          

  • Rúbrica cuantitativa al 100%.
  • A través de Talleres que permitan poner en práctica los contenidos vistos en el curso.

Curso 4: Visualización de Datos

keyboard_arrow_down
Data Visualization

Docente(s): Ricardo Olea (responsable del curso)

Unidad académica responsable: Facultad de Matemáticas.

Requisitos: Sin prerrequisitos

Créditos: 1

Horas totales: 25 | Horas directas: 15 | Horas indirectas: 10           

Descripción del curso:

En este curso, los estudiantes aprenderán a identificar y utilizar herramientas clave para la visualización efectiva de datos, integrando conceptos básicos de programación y metodologías específicas de diseño visual. Mediante clases expositivas y análisis de casos, se familiarizarán con herramientas interactivas como Power BI, Google Data Studio y R Markdown, y explorarán el uso de librerías como Shiny para desarrollar visualizaciones y cuadros dinámicos. La evaluación estará basada en ejercicios prácticos, donde los estudiantes demostrarán su capacidad para crear visualizaciones interactivas que comuniquen datos de manera efectiva y profesional.

Resultados de Aprendizaje:     

  • Identificar las herramientas principales para la manipulación y visualización de datos.
  • Aplicar conceptos básicos de programación y metodologías para el diseño visual efectivo.
  • Diseñar visualizaciones dinámicas utilizando software interactivo como Power BI, Google Data Studio y librerías de R, integrando gráficos adecuados que maximicen la efectividad en la comunicación de datos y su impacto en la toma de decisiones.

Contenidos:

  • Introducción a Power BI y Google Data Studio       
    •  Instalación y configuración inicial.
    •  Manipulación de datos y objetos visuales.
    •  Creación de gráficos y cuadros interactivos.
    •  Integración de datos y generación de dashboards interactivos.
    •  Aplicaciones en R
  • Introducción a R Markdown para reportes dinámicos.
  • Uso de librerías Shiny para crear aplicaciones interactivas.
    •  Desarrollo de cuadros y gráficos dinámicos personalizados.
    •  Creación de aplicaciones dinámicas con R y Shiny.

Estrategias Metodológicas:     

  • Clases expositivas
  • Análisis de casos

Estrategias Evaluativas:          

  • Rúbrica cuantitativa al 100%.
  • A través de Talleres que permitan poner en práctica los contenidos vistos en el curso.

Curso 5: Aplicaciones de la Ciencia de Datos

keyboard_arrow_down
Applications of Data Science

Docente(s): Alexis Alvear. (responsable del curso)

Unidad académica responsable: Facultad de Matemáticas.

Requisitos: Sin prerrequisitos

Créditos: 1

Horas totales: 25 | Horas directas: 15 | Horas indirectas: 10           

Descripción del curso:

En este curso, los estudiantes explorarán el concepto de Business Analytics y las ventajas del Data Science en sectores clave como la banca, los mercados financieros, el marketing y el análisis de texto. A través de clases expositivas y análisis de casos prácticos, los participantes aprenderán a aplicar herramientas y técnicas para el análisis de información, la evaluación de impacto y el procesamiento de datos no estructurados. El curso también incluye prácticas en Web Scraping y análisis de texto, utilizando R y Python para resolver problemas reales. La evaluación se centrará en el desarrollo y análisis de casos de uso aplicados en contextos empresariales, financieros y de marketing.

Resultados de Aprendizaje:     

  • Comprender el concepto de Business Analytics y su relación con la ciencia de datos.
  • Identificar las ventajas y aplicaciones del Data Science en banca, mercados financieros y marketing.
  • Formular soluciones empresariales basadas en herramientas y técnicas de análisis de información, evaluando casos prácticos de Data Science que incluyan el procesamiento de texto y datos no estructurados, para abordar problemas complejos de manera estratégica y eficiente.

Contenidos:

  • Conceptos de Business Analytics y su relación con Data Science.
  • Aplicaciones en el ámbito bancario.
  • Aplicaciones en los mercados financieros.
  • Aplicaciones en marketing y estrategias comerciales.
  • Evaluación de impacto utilizando ciencia de datos.
  • Aplicaciones en análisis de texto: extracción y procesamiento de información clave.
  • Introducción a Web Scraping: técnicas y herramientas en R y Python.

Estrategias Metodológicas:     

  • Clases expositivas
  • Análisis de casos

Estrategias Evaluativas:

  • Rúbrica cuantitativa al 100%.
  • A través de Talleres que permitan poner en práctica los contenidos vistos en el curso.

Requisitos Aprobación

El promedio final del diplomado será el promedio ponderado de la nota final de cada curso con las siguientes ponderaciones en una escala del 1.0 a 7.0:  

  • Curso 1: Fundamentos de la ciencia de datos:  18 %
  • Curso 2: Herramientas estadísticas y forecast: 35%
  • Curso 3: Herramientas computacionales y machine learning:  35%
  • Curso 4: Herramientas tecnológicas de visualización de datos: 6%
  • Curso 5: Aplicaciones de data science: 6%

Nota: Las personas que no cumplan con el requisito de aprobación no recibirán ningún tipo de certificación. 

Los resultados de las evaluaciones serán expresados en notas en escala de 10 a 70 con un decimal sin perjuicio que la Unidad pueda aplicar otra escala adicional. 

Para aprobar un Diplomado o Programa de Formación o Especialización se requiere la aprobación de todos los cursos que lo conforman y en los casos que corresponda de otros requisitos que indique el programa académico. 

El estudiante será reprobado en un curso o actividad del Programa cuando hubiere obtenido como nota final una calificación inferior a cuatro (40). 

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.  

Además se entregará una insignia digital por diplomado. Sólo cuando alguno de los cursos se dicte en forma independiente además se entregará una insignia por curso.

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:    

  • Currículum vitae actualizado. 
  • Copia simple de título o licenciatura (de acuerdo a cada programa). 
  • Fotocopia simple del carnet de identidad por ambos lados. 

Con el objetivo de brindar las condiciones y asistencia adecuadas, invitamos a personas con discapacidad física, motriz, sensorial (visual o auditiva) u otra, a dar aviso de esto durante el proceso de postulación.  

El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado. 

No se tramitarán postulaciones incompletas. 

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula. 

https://educacioncontinua.uc.cl/pagos-y-convenios/ 


¿Te parece interesante este programa?

No