Diplomado en Minería de datos UC Online

Compartir en:

Acerca del programa:

El Diplomado en Minería de datos está orientado a entregar un amplio conjunto de competencias en el ámbito del Data Mining, partiendo con los fundamentos estadísticos y las competencias de programación necesarias, para pasar a los fundamentos, técnicas y aplicaciones. Al no requerir conocimientos previos de programación ni tampoco de estadística, el diplomado está abierto no solo a personas con un background más técnico sino a todo tipo de profesionales.

Dirigido a:

Todas las personas que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.
Todas las personas que han aprendido lo esencial de Data Mining pero necesitan profundizar y adquirir algo de fundamentos estadísticos.

Jefe de Programa

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Universidad de Chile. Profesor Asociado del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC.

Equipo Docente

Hernán Valdivieso

Magíster en Ciencias de la Ingeniería e Ingeniero Civil en Computación, UC. Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Su área principal de trabajo es la docencia y el desarrollo de técnicas de visualización.

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, UC. Profesor Asociado del Departamento de Ciencia de la Computación, UC.

Nicolás Alvarado Monárdez

Licenciado en Matemáticas y Magíster en Matemáticas de la UC. Ph.D. (c) en el Departamento de Ciencia de la Computación de la Pontificia Universidad Católica de Chile.

Sebastián Raveau

Profesor Asistente del Departamento de Ingeniería de Transporte y Logística de la UC e investigador asociado del departamento de Ingeniería Civil y Ambiental del Massachusetts Institute of Technology. Asimismo, participa como investigador del Centro de Excelencia BRT, y del Centro de Desarrollo Urbano Sustentable CEDEUS. Anteriormente se ha desempeñado como académico de la Escuela de Ingeniería Industrial de la Universidad Diego Portales y como investigador postdoctoral del Singapore-MIT Alliance for Research and Technology (SMART). Ha sido también supervisor de estudios de transporte en DICTUC y en consultora CIS Transporte.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.

Descripción

Se dice que los datos son el nuevo petróleo. Al igual que en la minería tradicional es necesario extraer laboriosamente desde una montaña de áridos el material valioso mediante técnicas sofisticadas y con el uso de herramientas especializadas, los elementos de valor de los datos deben ser también extraídos o minados. La minería de datos o Data Mining es una disciplina que comprende estas técnicas y herramientas, de modo que, aquella montaña de datos que ha sido recopilada en el tiempo pueda ser usada para entender de mejor forma el negocio y construir modelos que permitan hacer predicciones, que pueden ser usadas en las decisiones y las acciones de la empresa.

Este diplomado se diferencia de otros similares, debido a que no requiere conocimientos previos de programación ni tampoco de estadística, ya que incluye un curso para aprender a programar en Python y un curso de fundamentos de estadística. Además, los otros dos cursos de Minería de datos permiten llegar a un nivel de profundidad más alto.

La modalidad del diplomado es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

*Nota: Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.

Requisitos de Ingreso

Se recomienda contar con:

Licenciatura, título profesional o técnico de mínimo 4 años.
Conocimientos básicos de programación en Phyton.
Conocimientos de minería de datos o aprendizaje de máquina.
Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio.
Dos años de experiencia laboral.

Objetivos de Aprendizaje

Utilizar conceptos estadísticos y aprendizaje de máquina para el análisis de datos y la predicción de comportamientos.

Desglose de cursos

Curso 1: Herramientas básicas de programación en Python

Basic Python programming tools

Docente(s): Felipe López y Jaime Navón

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40

Descripción de curso

Quienes trabajan en Ciencia de Datos saben que el manejo de la programación en lenguaje Python es una necesidad. Pero este lenguaje puede ser usado no solo en ese dominio sino como una herramienta multipropósito general. En este curso aprenderás a plantear la solución de un problema en términos algorítmicos y a expresarlo mediante este lenguaje de programación usando entre otros variables, control de flujo, estructuras de datos y funciones.

Al finalizar el curso, serás capaz de desarrollar tus propios programas en Python y de seguir explorando para construir nuevos programas y cada vez más complejos. Este curso es el primer paso para convertirte en un/a profesional con habilidades básicas de programación.

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.

Resultados de aprendizaje

Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos.
Utilizar los comandos de control de flujo y los ciclos para dirigir y repetir eficientemente un conjunto de operaciones básicas.
Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), etc en el procesamiento de datos.
Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos.
Desarrollar programas en el lenguaje de programación Python que permitan resolver problemas sencillos.

Contenidos:

Módulo 1: Introducción a la programación

Motivación
- De los datos a la información
- Datos, Información y Programación ¿Cómo conviven hoy estos elementos en el mundo laboral?:
- ¿Qué es la programación?
- Aplicaciones prácticas
- La programación en el mundo laboral y cómo debe convertirse en un hábito
Secuencias de comandos en Python
Operaciones básicas
Creación y asignación de variables
Operaciones lógicas

Módulo 2: Control de Flujo

Control de Flujo:
- If
- Else
- Elif
- Uso en conjunto
Ciclos:
- While
- For

Módulo 3: Tipos de datos y funciones

Tipos de datos: Enteros, decimales, textos y listas.
“Strings”
- ¿Qué es un string?
- Funciones básicas de un string
- Funciones avanzadas de un string
Funciones
- ¿Qué es una función?
- ¿Por qué ocupar funciones?
- Declaración y uso de funciones.
Listas
- Creación de listas
- Obtener elementos
- Añadir elementos o quitar elementos
- Operaciones sobre listas

Módulo 4: Procesamiento de datos

Listas de listas
Archivos
- Cómo se interactúa con archivos y para qué sirven
- Leer archivos
- Escribir archivos
Procesamiento de datos
- Carga masiva
- Edición masiva
- Ejemplos prácticos

Módulo 5: Diccionarios y Tuplas

Listas y listas de listas
Manipulación de listas
Funciones sobre listas
Diccionarios
Operaciones sobre diccionarios
Aplicaciones de diccionarios
Aplicaciones con listas y diccionarios
Tuplas como tipo de dato inmutable
Operaciones sobre tuplas
Combinando listas, tuplas y diccionarios

Módulo 6: Funciones

Concepto de función
Definición de funciones
Parámetros y valores de retorno
Importación y llamado de módulos
Invocación de funciones y scope
Parámetros con nombre y parámetros por defecto
Funciones recursivas
Aplicación de funciones

Estrategias metodológicas

Aprendizaje autónomo asincrónico estructurado en 6 módulos
Clases expositivas
Foros
Estudio de caso

Estrategias evaluativas

3 controles individuales – 40%
3 mini proyectos individuales – 60%

Curso 2: Estadística para ciencia de datos

Statistics for data science

Docente(s): Nicolás Alvarado

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40

Descripción de curso

La mayor parte de las técnicas y algoritmos usados en el área de la ciencia de datos descansan en fundamentos estadísticos. El objetivo de este curso es entregar a los alumnos una base estadística mínima para construir sobre un fundamento robusto los conocimientos de minería de datos de los cursos posteriores. En este curso los alumnos aprenderán entre otros sobre técnicas de análisis exploratorio de datos, validación de hipótesis y regresión.

Resultados de aprendizaje

Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.
Mostrar en forma gráfica distribuciones empíricas de los datos.
Modelar un problema en base a distribuciones analíticas conocidas.
Analizar la interrelación entre dos o más variables.
Evaluar la validez de una hipótesis en base a los datos.

Contenidos:

Análisis exploratorio de datos e introducción a las distribuciones
- Variables y transformaciones
Distribuciones y funciones de probabilidad
- Variables y efecto del tamaño
- Funciones de probabilidad (PMFs)
Funciones de probabilidad
- Distribuciones continuas
- Familia exponencial
- Funciones de distribución acumulada (CDFs)
Modelación de distribuciones e introducción a las relaciones entre variables
- Distribuciones continuas
- Gráficas distribución lognormal
- Diagramas de dispersión
- Correlación
Relación entre variables, correlación y una introducción al testeo de hipótesis
- Covarianza
- Testeo de hipótesis
- Diferencia de medias
- Formalización
Testeo de hipótesis, regresión e introducción a las series de tiempo
- Testeo de correlación y testeo de proporciones
- Mínimos cuadrados lineales
- Introducción a las series de tiempo

Estrategias metodológicas

Aprendizaje autónomo asincrónico estructurado en 6 módulos
Clases expositivas
Foros
Estudio de caso

Estrategias evaluativas

3 controles individuales – 40%
3 mini proyectos individuales – 60%

Curso 3: Introducción a Minería de datos y Machine Learning

Introduction to Data Mining and Machine Learning

Docente(s): Hernán Valdivieso

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40

Descripción de curso

El curso comienza abordando la problemática de la obtención, preparación y limpieza de datos, para luego adentrarse en las técnicas y algoritmos asociados a la Minería de Datos, como clasificación, clustering, entre otros. Además, se exploran algoritmos, técnicas y herramientas de Machine Learning.

Los estudiantes de este curso adquirirán conocimientos fundamentales sobre Minería de Datos, comprendiendo las diversas fuentes de información a utilizar, revisando el preprocesamiento de datos y aplicando técnicas de extracción de conocimiento. Esto incluye el uso de reglas de asociación, árboles de decisión, algoritmos de clasificación y la evaluación de clasificadores, junto con una introducción al aprendizaje de máquina.

El enfoque del curso es práctico, privilegiando la experimentación mediante herramientas y entornos que permiten ejecutar y analizar ejemplos preconfigurados. Los estudiantes modificarán parámetros, observarán los efectos de dichos cambios y reflexionarán sobre su impacto en la calidad del modelo y la extracción de conocimiento.

Al finalizar el curso, los estudiantes comprenderán los principios teóricos y prácticos que sustentan las principales técnicas utilizadas en la minería de datos y el aprendizaje de máquina, pudiendo analizar sus resultados, evaluar su aplicabilidad en distintos contextos y reconocer sus potencialidades y limitaciones sin necesidad de programar directamente los algoritmos.

El desarrollo de estos aprendizajes se realizará a través de estudios de casos, mini proyectos prácticos, y el acceso a recursos especializados, lo que permitirá a los estudiantes experimentar, analizar y aplicar directamente los conceptos adquiridos.

La metodología de enseñanza y aprendizaje para este curso en línea se basa en técnicas metodológicas activas, permitiendo que el participante interactúe con sus pares y el profesor-tutor a través de los recursos tecnológicos proporcionados por la plataforma educativa virtual destinada para el curso.

Resultados de aprendizaje

Reconocer las principales teorías y prácticas de la Minería de Datos.
Identificar relaciones interesantes en un conjunto de transacciones mediante el uso de reglas de asociación.
Distinguir técnicas como árboles de decisión, clustering y otras, aplicándolas en escenarios prácticos reales.
Evaluar la calidad y pertinencia de los resultados obtenidos, reconociendo las potencialidades y limitaciones de cada técnica.

Contenidos:

Introducción a Minería de Datos y conceptos sobre Data Warehouse
Procesamiento, selección y transformación de datos.
Reglas de asociación
Clasificación
- Árbol de decisión
- KNN
- Random Forest
Clustering
- K-Means
- Clustering jerárquico
Introducción al Machine Learning
- Modelo de entrenamiento
Métricas de evaluación

Estrategias metodológicas:

Aprendizaje autónomo asincrónico estructurado en 6 módulos
Clases expositivas
Foros
Estudio de caso

Estrategias evaluativas:

3 controles individuales – 40%
3 mini proyectos individuales – 60%

Curso 4: Técnicas avanzadas de minería de datos

Advanced data mining techniques

Docente(s): Sebastián Raveau

Unidad académica responsable: Escuela de Ingeniería

Requisitos: sin prerrequisitos

Créditos: 4

Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40

Descripción de curso

Este curso profundiza en las técnicas y algoritmos más utilizados en minería de datos. En particular se incluyen las técnicas de aprendizaje reforzado que han ido captando el interés en forma rápida por la amplia gama de aplicaciones donde puede usarse. Adicionalmente en este curso se estudian técnicas de Web Mining y análisis de texto.

Resultados de aprendizaje

Modelar problemas reales mediante técnicas avanzadas de minería de texto, para apoyar procesos de gestión del conocimiento en las organizaciones.
Aplicar técnicas de aprendizaje reforzado como alternativa de entrenar modelos de aprendizaje.
Utilizar herramientas de procesamiento de datos, para apoyar el proceso de modelado e interpretación de los resultados obtenidos.
Aplicar series de tiempo para predecir modelos de negocios, basados en datos históricos.

Contenidos:

Series de tiempo
- Análisis visual de series de tiempo
- Componentes de una serie de tiempo
- Estacionariedad de una serie de tiempo
- Tratamiento de una serie de tiempo no estacionaria
- Tipos de modelos de series de tiempo
- Modelos MA
Minería de texto y web scraping
- Minería de texto
- Web scraping
Aprendizaje por refuerzo
- Aprendizaje por refuerzo
- Métodos de Monte Carlo
Q-Learning
- Funciones de valor
- Q-Learning
Redes neuronales artificiales
- Estructura de una red neuronal artificial
- Entrenamiento de redes neuronales artificiales
- Otros tipos de redes neuronales
Nuevas tendencias de machine learning
- Modelos fundacionales
- Inteligencia artificial generativa

Estrategias metodológicas

Aprendizaje autónomo asincrónico estructurado en 6 módulos
Clases expositivas
Foros
Estudio de caso

Estrategias evaluativas

3 controles individuales – 40%
3 mini proyectos individuales – 60%

Requisitos Aprobación

La nota final del diplomado se calculará de acuerdo con la siguiente ponderación de los cursos:

Curso: Herramientas básicas de programación en Python – 25%
Curso: Estadística para Ciencia de Datos – 25%
Curso: Introducción a minería de datos y Machine Learning – 25%
Curso: Técnicas avanzadas de minería de datos – 25%

Los alumnos deberán ser aprobados de acuerdo con el siguiente criterio:

Calificación mínima de 4.0 en cada uno de los cursos.

Los resultados de las evaluaciones serán expresados en notas, en escala de 1,0 a 7,0 con un decimal, sin perjuicio que la Unidad pueda aplicar otra escala adicional.

Para aprobar un Diplomado, se requiere la aprobación de todos los cursos que lo conforman y, en los casos que corresponda, de otros requisitos que indique el programa académico.

El estudiante será reprobado en un curso o actividad del Programa cuando hubiere obtenido como nota final una calificación inferior a cuatro (4,0).

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.

Además, se entregará una insignia digital por diplomado. Sólo cuando alguno de los cursos se dicte en forma independiente, además, se entregará una insignia por curso.

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:

Fotocopia simple del carnet de identidad por ambos lados.

Cualquier información adicional o inquietud podrás escribir al correo programas.ing@uc.cl

Con el objetivo de brindar las condiciones y asistencia adecuadas, invitamos a personas con discapacidad física, motriz, sensorial (visual o auditiva) u otra, a dar aviso de esto durante el proceso de postulación.

El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.

No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula

Fecha de inicio:

26 mayo 2026

Valor:

$2.290.000

2.544 USD

* Valor incluye matrícula

Hasta 12 cuotas sin interés. Pagarías $190.834 al mes

Postula aquí

Fecha de inicio: 26-05-2026

Valor: $2.290.000

Inscripción con pago por empresas

Para pagos en moneda nacional, tenemos la posibilidad de que pagues con 2 o más tarjetas o que combines pago con transferencia y tarjeta

Fechas

26 mayo 2026 al 19 enero 2027
Duración

300 Horas totales

140 Horas directas

160 Horas indirectas
Horario

Online
Unidad que dicta el programa

Escuela de Ingeniería
Tipo

Diplomado
Modalidad

Online - Mixta
Lugar de realización

Plataforma

Clase Ejecutiva UC

Al finalizar este programa, recibirás una insignia digital que podrás incorporar en tu CV o RRSS.

La insignia correspondiente podrá variar en color y texto según el programa académico. Su entrega aplicará únicamente para programas cursados y aprobados a partir del 1 de enero de 2024.

*La emisión de la insignia se realiza en un período de 45 a 60 días hábiles después de la finalización y aprobación del programa.

Programación en Python
Estadística aplicada
Minería de datos
Machine Learning
Ciencia de datos

Este programa requiere de un número mínimo de matriculados para poder dictarse y, por motivos de fuerza mayor, podría experimentar cambios en su programación, equipo docente y/o formato de realización. Cualquier cambio será informado por la coordinación a cargo.

Consulta y revisa aquí información importante sobre retiro, devolución, reglamento y otros.

Información de pago

Formas de pago

Forma de pago Chile:

- Web pay: Tarjeta de crédito hasta 12 cuotas sin interés y Tarjeta de débito-redcompra en 1 cuota
- Transferencia Bancaria:

Formas de pago extranjero:

- Tarjetas de créditos a través de webpay
- Transferencia Bancaria
- Paypal

Formas de pago por empresas:

- Con ficha de inscripción y Orden de compra

SENCE:

Beneficios al ser alumno de diplomados UC

Diplomado en Minería de datos

Estudia en la Universidad N°1 de Latinoamérica (QS Ranking Latam 2026)

Compartir en:

Acerca del programa:

Dirigido a:

Jefe de Programa

Jaime Navón Cohen

Equipo Docente

Descripción

Requisitos de Ingreso

Objetivos de Aprendizaje

Desglose de cursos

Curso 1: Herramientas básicas de programación en Python

Curso 2: Estadística para ciencia de datos

Curso 3: Introducción a Minería de datos y Machine Learning

Curso 4: Técnicas avanzadas de minería de datos

Requisitos Aprobación

Proceso de Admisión

Forma de pago Chile:

Formas de pago extranjero:

Formas de pago por empresas:

¿Por qué seguir aprendiendo en la UC?

¿No encuentras el programa que estás buscando?