Diplomado en Minería de datos

Estudia en la Universidad N°1 de habla hispana en Latinoamérica por QS Latam University Rankings 2025

Acerca del programa:

El Diplomado en Minería de datos  está orientado a entregar un amplio conjunto de competencias en el ámbito del Data Mining, partiendo con los fundamentos estadísticos y las competencias de programación necesarias, para pasar a los fundamentos, técnicas y aplicaciones. Al no requerir conocimientos previos de programación ni tampoco de estadística, el diplomado está abierto no solo a personas con un background más técnico sino a todo tipo de profesionales. 

Diplomado UC Online en Minería de datos

Dirigido a:

  • Todas las personas que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.
  • Todas las personas que han aprendido lo esencial de Data Mining pero necesitan profundizar y adquirir algo de fundamentos estadísticos.

Jefe de Programa

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.
linkedin

Equipo Docente

keyboard_arrow_down

Mauricio Arriagada Benítez

Doctor en Ciencia de la Ingeniería, UC, Master en Ciencias de la Ingeniería de la UC, Ingeniero Civil en Computación e Informática, Universidad de Tarapacá, Chile. Master in Computer Science, University of Northern Iowa – USA. Master en Ingeniería de Software, Universidad de Tarapacá – Chile.

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, UC. Profesor Asociado del Departamento de Ciencia de la Computación, UC.

Nicolás Alvarado Monárdez

Licenciado en Matemáticas y Magíster en Matemáticas de la UC. Ph.D. (c) en el Departamento de Ciencia de la Computación de la Pontificia Universidad Católica de Chile.

Sebastián Raveau

Profesor Asistente del Departamento de Ingeniería de Transporte y Logística de la UC e investigador asociado del departamento de Ingeniería Civil y Ambiental del Massachusetts Institute of Technology. Asimismo, participa como investigador del Centro de Excelencia BRT, y del Centro de Desarrollo Urbano Sustentable CEDEUS. Anteriormente se ha desempeñado como académico de la Escuela de Ingeniería Industrial de la Universidad Diego Portales y como investigador postdoctoral del Singapore-MIT Alliance for Research and Technology (SMART). Ha sido también supervisor de estudios de transporte en DICTUC y en consultora CIS Transporte.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.

Descripción

Se dice que los datos son el nuevo petróleo. Al igual que en la minería tradicional es necesario extraer laboriosamente desde una montaña de áridos el material valioso mediante técnicas sofisticadas y con el uso de herramientas especializadas, los elementos de valor de los datos deben ser también extraídos o minados. La minería de datos o Data Mining es una disciplina que comprende estas técnicas y herramientas, de modo que, aquella montaña de datos que ha sido recopilada en el tiempo pueda ser usada para entender de mejor forma el negocio y construir modelos que permitan hacer predicciones, que pueden ser usadas en las decisiones y las acciones de la empresa.

Este diplomado se diferencia de otros similares, debido a que no requiere conocimientos previos de programación ni tampoco de estadística, ya que incluye un curso para aprender a programar en Python y un curso de fundamentos de estadística. Además, los otros dos cursos de Minería de datos permiten llegar a un nivel de profundidad más alto.

La modalidad del diplomado es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Requisitos de Ingreso

Se recomienda contar con: 

  • Licenciatura, título profesional o técnico de mínimo 4 años.
  • Conocimientos básicos de programación en Phyton.
  • Conocimientos de minería de datos o aprendizaje de máquina.
  • Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio.
  • Dos años de experiencia laboral.

Objetivos de Aprendizaje

Utilizar conceptos estadísticos y aprendizaje de máquina para el análisis de datos y la predicción de comportamientos.

Desglose de cursos

CURSO 1: Herramientas básicas de programación en Python

keyboard_arrow_down
Basic Python programming tools

Docente(s): Felipe López y Jaime Navón

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75

Horas directas: 35

Horas indirectas: 40

Descripción de curso

Quienes trabajan en Ciencia de Datos saben que el manejo de la programación en lenguaje Python es una necesidad. Pero este lenguaje puede ser usado no solo en ese dominio sino como una herramienta multipropósito general. En este curso aprenderás a plantear la solución de un problema en términos algorítmicos y a expresarlo mediante este lenguaje de programación usando entre otros variables, control de flujo, estructuras de datos y funciones. 

Al finalizar el curso, serás capaz de desarrollar tus propios programas en Python y de seguir explorando para construir nuevos programas y cada vez más complejos. Este curso es el primer paso para convertirte en un/a profesional con habilidades básicas de programación. 

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso. 

Resultados de aprendizaje

1.    Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos. 

2.    Utilizar los comandos de control de flujo y los ciclos para dirigir y repetir eficientemente un conjunto de operaciones básicas. 

3.    Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), etc en el procesamiento de datos. 

4.    Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos. 

5.    Desarrollar programas en el lenguaje de programación Python que permitan resolver problemas sencillos. 

Contenidos:

Módulo 1: Introducción a la programación 

·     Motivación 

o  De los datos a la información 

o  Datos, Información y Programación ¿Cómo conviven hoy estos elementos en el mundo laboral?: 

o  ¿Qué es la programación? 

o  Aplicaciones prácticas 

o  La programación en el mundo laboral y cómo debe convertirse en un hábito 

·     Secuencias de comandos en Python 

·     Operaciones básicas 

·     Creación y asignación de variables 

·     Operaciones lógicas 

Módulo 2: Control de Flujo 

·      Control de Flujo: 

o  If 

o  Else 

o  Elif 

o  Uso en conjunto 

·      Ciclos: 

o  While 

o  For 

Módulo 3: Tipos de datos y funciones 

·     Tipos de datos: Enteros, decimales, textos y listas. 

·     “Strings” 

o  ¿Qué es un string? 

o  Funciones básicas de un string 

o  Funciones avanzadas de un string 

·      Funciones 

o  ¿Qué es una función? 

o  ¿Por qué ocupar funciones? 

o  Declaración y uso de funciones. 

·      Listas 

o  Creación de listas 

o  Obtener elementos 

o  Añadir elementos o quitar elementos 

o  Operaciones sobre listas 

Módulo 4: Procesamiento de datos 

·      Listas de listas 

·      Archivos 

o  Cómo se interactúa con archivos y para qué sirven 

o  Leer archivos 

o  Escribir archivos 

·      Procesamiento de datos 

o  Carga masiva 

o  Edición masiva 

o  Ejemplos prácticos 

Módulo 5: Diccionarios y Tuplas 

·     Listas y listas de listas 

·     Manipulación de listas 

·     Funciones sobre listas 

·     Diccionarios 

·     Operaciones sobre diccionarios 

·     Aplicaciones de diccionarios 

·     Aplicaciones con listas y diccionarios 

·     Tuplas como tipo de dato inmutable 

·     Operaciones sobre tuplas

·     Combinando listas, tuplas y diccionarios 

Módulo 6: Funciones 

·     Concepto de función 

·     Definición de funciones 

·     Parámetros y valores de retorno 

·     Importación y llamado de módulos 

·     Invocación de funciones y scope 

·     Parámetros con nombre y parámetros por defecto 

·     Funciones recursivas 

·     Aplicación de funciones 

Estrategias metodológicas

-      Aprendizaje autónomo asincrónico estructurado en 6 módulos 

-      Clases expositivas  

-      Foros 

-      Estudio de caso 

Estrategias evaluativas 

-      3 controles individuales – 40% 

-      3 mini proyectos individuales – 60%

*Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.

CURSO 2: Estadística para ciencia de datos

keyboard_arrow_down
Statistics for data science

Docente(s): Nicolás Alvarado

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75

Horas directas: 35

Horas indirectas: 40

Descripción de curso

La mayor parte de las técnicas y algoritmos usados en el área de la ciencia de datos descansan en fundamentos estadísticos. El objetivo de este curso es entregar a los alumnos una base estadística mínima para construir sobre un fundamento robusto los conocimientos de minería de datos de los cursos posteriores. En este curso los alumnos aprenderán entre otros sobre técnicas de análisis exploratorio de datos, validación de hipótesis y regresión.

Resultados de aprendizaje

1.    Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.

2.    Mostrar en forma gráfica distribuciones empíricas de los datos.

3.    Modelar un problema en base a distribuciones analíticas conocidas.

4.    Analizar la interrelación entre dos o más variables.

5.    Evaluar la validez de una hipótesis en base a los datos.

Contenidos:

·     Análisis exploratorio de datos e introducción a las distribuciones

  • Variables y transformaciones

·     Distribuciones y funciones de probabilidad

  • Variables y efecto del tamaño
  • Funciones de probabilidad (PMFs)

·     Funciones de probabilidad

  • Distribuciones continuas
  • Familia exponencial
  • Funciones de distribución acumulada (CDFs)

·     Modelación de distribuciones e introducción a las relaciones entre variables

  • Distribuciones continuas
  • Gráficas distribución lognormal
  • Diagramas de dispersión
  • Correlación

·     Relación entre variables, correlación y una introducción al testeo de hipótesis

  • Covarianza
  • Testeo de hipótesis
  • Diferencia de medias
  • Formalización

·     Testeo de hipótesis, regresión e introducción a las series de tiempo

  • Testeo de correlación y testeo de proporciones
  • Mínimos cuadrados lineales
  • Introducción a las series de tiempo

Estrategias metodológicas

-      Aprendizaje autónomo asincrónico estructurado en 6 módulos 

-      Clases expositivas  

-      Foros 

-      Estudio de caso 

Estrategias evaluativas 

-      3 controles individuales – 40% 

-      3 mini proyectos individuales – 60%

*Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.

CURSO 3: Introducción a Minería de datos y Machine Learning

keyboard_arrow_down
Introduction to Data Mining and Machine Learning 

Docente(s): Mauricio Arriagada

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75

Horas directas: 35

Horas indirectas: 40

Descripción de curso

El curso comienza abordando la problemática de la obtención, preparación y limpieza de datos, para luego adentrarse en las técnicas y algoritmos asociados a la minería de datos, como clasificación, clustering, entre otros. Además, se exploran algoritmos, técnicas y herramientas de machine learning. 

Los estudiantes de este curso adquirirán conocimientos fundamentales sobre Minería de Datos, comprendiendo las diversas fuentes de información a utilizar, revisando el preprocesamiento de datos y aplicando técnicas de extracción de conocimiento. Esto incluye el uso de reglas de asociación, árboles de decisión, métodos de regresión, algoritmos de clasificación y la evaluación de clasificadores, junto con una introducción al aprendizaje de máquina. 

El enfoque del curso es práctico, brindando oportunidades para aplicar los conocimientos en proyectos y casos concretos. Se proporcionan herramientas de extracción y análisis de información para que una organización pueda generar valor a partir de los datos, mejorando su posición competitiva. 

Al finalizar el curso, los estudiantes contarán con conocimientos teóricos y prácticos sobre las principales técnicas utilizadas en la creación de programas capaces de extraer conocimiento relevante de bases de datos. También comprenderán algunas de las principales aplicaciones actuales de estas técnicas, así como sus potencialidades y limitaciones. 

Los contenidos serán abordados en 6 clases en línea (8 semanas), donde se entregarán los contenidos mediante recursos interactivos que integran videos, esquemas, artículos, lecturas y preguntas formativas. El curso se impartirá a través de una plataforma educativa virtual. 

Resultados de aprendizaje

1.    Identificar las principales teorías y prácticas de la Minería de Datos. 

2.    Aplicar reglas de asociación de manera efectiva para la ubicación de relaciones interesantes en un conjunto de transacciones. 

3.    Aplicar técnicas como árboles de decisión, clustering y otras en escenarios prácticos reales 

Contenidos:

·      Conceptos sobre Data Warehouse y uso de Dataframes 

·      Procesamiento y consolidación de datos. 

  • Preprocesamiento de datos 
  • Selección y transformación de datos 

·      Reglas de asociación 

·      Aplicación de los algoritmos Random Forest y KNN 

  • Árbol de decisión 
  • KNN 
  • Random Forest 

·      Aplicación de los algoritmos K-Means y DBSCAN 

  • Clustering 
  • K-Means 
  • Clustering jerárquico 

·      Introducción al Machine Learning 

  • Modelo de entrenamiento 
  • Métricas de evaluación 

Estrategias metodológicas:

-      Aprendizaje autónomo asincrónico estructurado en 6 módulos 

-      Clases expositivas  

-      Foros 

-      Estudio de caso 

Estrategias evaluativas:

-      3 controles individuales – 40% 

-      3 mini proyectos individuales – 60%

*Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.

CURSO 4: Técnicas avanzadas de minería de datos

keyboard_arrow_down
Advanced data mining techniques

Docente(s): Sebastián Raveau

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75

Horas directas: 35

Horas indirectas: 40

Descripción de curso

Este curso profundiza en las técnicas y algoritmos más utilizados en minería de datos. En particular se incluyen las técnicas de aprendizaje reforzado que han ido captando el interés en forma rápida por la amplia gama de aplicaciones donde puede usarse. Adicionalmente en este curso se estudian técnicas de Web Mining y análisis de texto. 

Resultados de aprendizaje

1.    Modelar problemas reales mediante técnicas avanzadas de minería de texto, para apoyar procesos de gestión del conocimiento en las organizaciones. 

2.    Aplicar técnicas de aprendizaje reforzado como alternativa de entrenar modelos de aprendizaje. 

3.    Utilizar herramientas de procesamiento de datos, para apoyar el proceso de modelado e interpretación de los resultados obtenidos. 

4.    Aplicar series de tiempo para predecir modelos de negocios, basados en datos históricos. 

Contenidos:

·     Series de tiempo

o  Análisis visual de series de tiempo

o  Componentes de una serie de tiempo

o  Estacionariedad de una serie de tiempo

o  Tratamiento de una serie de tiempo no estacionaria

o  Tipos de modelos de series de tiempo

o  Modelos MA

      Minería de texto y web scraping

o  Minería de texto

o  Web scraping

      Aprendizaje por refuerzo

o  Aprendizaje por refuerzo

o  Métodos de Monte Carlo

      Q-Learning

o  Funciones de valor

o  Q-Learning

      Redes neuronales artificiales

o  Estructura de una red neuronal artificial

o  Entrenamiento de redes neuronales artificiales

o  Otros tipos de redes neuronales

      Nuevas tendencias de machine learning

o  Modelos fundacionales

o  Inteligencia artificial generativa

Estrategias metodológicas 

-      Aprendizaje autónomo asincrónico estructurado en 6 módulos 

-      Clases expositivas  

-      Foros 

-      Estudio de caso 

Estrategias evaluativas 

-      3 controles individuales – 40% 

-      3 mini proyectos individuales – 60%

*Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.

Requisitos Aprobación

La nota final del diplomado se calculará de acuerdo con la siguiente ponderación de los cursos:

●     Curso: Herramientas básicas de programación en Python – 25%

●     Curso: Estadística para Ciencia de Datos – 25%     

●     Curso: Introducción a minería de datos y Machine Learning – 25%         

●     Curso: Técnicas avanzadas de minería de datos – 25%

Los alumnos deberán ser aprobados de acuerdo con el siguiente criterio:

●     Calificación mínima de 4.0 en cada uno de los cursos.

Los resultados de las evaluaciones serán expresados en notas, en escala de 1,0 a 7,0 con un decimal, sin perjuicio que la Unidad pueda aplicar otra escala adicional.

Para aprobar un Diplomado, se requiere la aprobación de todos los cursos que lo conforman y, en los casos que corresponda, de otros requisitos que indique el programa académico.

El estudiante será reprobado en un curso o actividad del Programa cuando hubiere obtenido como nota final una calificación inferior a cuatro (4,0).

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.

Además, se entregará una insignia digital por diplomado. Sólo cuando alguno de los cursos se dicte en forma independiente, además, se entregará una insignia por curso.

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación, accesible haciendo clic en el botón ubicado en la esquina superior derecha de esta página web. Además, deberán enviar los siguientes documentos al momento de la postulación o, si lo prefieren, posteriormente a la coordinación académica correspondiente: 

  • Copia simple de Cédula de Identidad o pasaporte

Cualquier información adicional o inquietud podrás escribir al correo programas.ing@uc.cl

Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo. 

El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.

No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula


Fechas disponibles

Los detalles del programa pueden variar en cada fecha de edición

Fecha Horario Lugar Valor
25 noviembre 2025 - 22 septiembre 2026 Asincrónico $2.190.000 Ver más

¿Te parece interesante este programa?

No