Acerca del programa:
El Diplomado en Minería de datos está orientado a entregar un amplio conjunto de competencias en el ámbito del Data Mining, partiendo con los fundamentos estadísticos y las competencias de programación necesarias, para pasar a los fundamentos, técnicas y aplicaciones. Al no requerir conocimientos previos de programación ni tampoco de estadística, el diplomado está abierto no solo a personas con un background más técnico sino a todo tipo de profesionales.
Dirigido a:
- Todas las personas que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.
- Todas las personas que han aprendido lo esencial de Data Mining pero necesitan profundizar y adquirir algo de fundamentos estadísticos.
Jefe de Programa
Equipo Docente
keyboard_arrow_downHernán Valdivieso
Magíster en Ciencias de la Ingeniería e Ingeniero Civil en Computación, UC. Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Su área principal de trabajo es la docencia y el desarrollo de técnicas de visualización.
Jaime Navón Cohen
Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, UC. Profesor Asociado del Departamento de Ciencia de la Computación, UC.
Nicolás Alvarado Monárdez
Licenciado en Matemáticas y Magíster en Matemáticas de la UC. Ph.D. (c) en el Departamento de Ciencia de la Computación de la Pontificia Universidad Católica de Chile.
Sebastián Raveau
Profesor Asistente del Departamento de Ingeniería de Transporte y Logística de la UC e investigador asociado del departamento de Ingeniería Civil y Ambiental del Massachusetts Institute of Technology. Asimismo, participa como investigador del Centro de Excelencia BRT, y del Centro de Desarrollo Urbano Sustentable CEDEUS. Anteriormente se ha desempeñado como académico de la Escuela de Ingeniería Industrial de la Universidad Diego Portales y como investigador postdoctoral del Singapore-MIT Alliance for Research and Technology (SMART). Ha sido también supervisor de estudios de transporte en DICTUC y en consultora CIS Transporte.
* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.
Descripción
keyboard_arrow_downSe dice que los datos son el nuevo petróleo. Al igual que en la minería tradicional es necesario extraer laboriosamente desde una montaña de áridos el material valioso mediante técnicas sofisticadas y con el uso de herramientas especializadas, los elementos de valor de los datos deben ser también extraídos o minados. La minería de datos o Data Mining es una disciplina que comprende estas técnicas y herramientas, de modo que, aquella montaña de datos que ha sido recopilada en el tiempo pueda ser usada para entender de mejor forma el negocio y construir modelos que permitan hacer predicciones, que pueden ser usadas en las decisiones y las acciones de la empresa.
Este diplomado se diferencia de otros similares, debido a que no requiere conocimientos previos de programación ni tampoco de estadística, ya que incluye un curso para aprender a programar en Python y un curso de fundamentos de estadística. Además, los otros dos cursos de Minería de datos permiten llegar a un nivel de profundidad más alto.
La modalidad del diplomado es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.
*Nota: Los cursos que componen el diplomado tienen el orden determinado e indicado en la estructura curricular. Esto es, se tiene que aprobar el curso anterior para poder tomar el que viene.
Requisitos de Ingreso
keyboard_arrow_downSe recomienda contar con:
- Licenciatura, título profesional o técnico de mínimo 4 años.
- Conocimientos básicos de programación en Phyton.
- Conocimientos de minería de datos o aprendizaje de máquina.
- Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio.
- Dos años de experiencia laboral.
Objetivos de Aprendizaje
keyboard_arrow_downUtilizar conceptos estadísticos y aprendizaje de máquina para el análisis de datos y la predicción de comportamientos.
Desglose de cursos
keyboard_arrow_downCurso 1: Herramientas básicas de programación en Python
keyboard_arrow_downDocente(s): Felipe López y Jaime Navón
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción de curso
Quienes trabajan en Ciencia de Datos saben que el manejo de la programación en lenguaje Python es una necesidad. Pero este lenguaje puede ser usado no solo en ese dominio sino como una herramienta multipropósito general. En este curso aprenderás a plantear la solución de un problema en términos algorítmicos y a expresarlo mediante este lenguaje de programación usando entre otros variables, control de flujo, estructuras de datos y funciones.
Al finalizar el curso, serás capaz de desarrollar tus propios programas en Python y de seguir explorando para construir nuevos programas y cada vez más complejos. Este curso es el primer paso para convertirte en un/a profesional con habilidades básicas de programación.
La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.
Resultados de aprendizaje
- Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos.
- Utilizar los comandos de control de flujo y los ciclos para dirigir y repetir eficientemente un conjunto de operaciones básicas.
- Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), etc en el procesamiento de datos.
- Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos.
- Desarrollar programas en el lenguaje de programación Python que permitan resolver problemas sencillos.
Contenidos:
Módulo 1: Introducción a la programación
- Motivación
- De los datos a la información
- Datos, Información y Programación ¿Cómo conviven hoy estos elementos en el mundo laboral?:
- ¿Qué es la programación?
- Aplicaciones prácticas
- La programación en el mundo laboral y cómo debe convertirse en un hábito
- Secuencias de comandos en Python
- Operaciones básicas
- Creación y asignación de variables
- Operaciones lógicas
Módulo 2: Control de Flujo
- Control de Flujo:
- If
- Else
- Elif
- Uso en conjunto
- Ciclos:
- While
- For
Módulo 3: Tipos de datos y funciones
- Tipos de datos: Enteros, decimales, textos y listas.
- “Strings”
- ¿Qué es un string?
- Funciones básicas de un string
- Funciones avanzadas de un string
- Funciones
- ¿Qué es una función?
- ¿Por qué ocupar funciones?
- Declaración y uso de funciones.
- Listas
- Creación de listas
- Obtener elementos
- Añadir elementos o quitar elementos
- Operaciones sobre listas
Módulo 4: Procesamiento de datos
- Listas de listas
- Archivos
- Cómo se interactúa con archivos y para qué sirven
- Leer archivos
- Escribir archivos
- Procesamiento de datos
- Carga masiva
- Edición masiva
- Ejemplos prácticos
Módulo 5: Diccionarios y Tuplas
- Listas y listas de listas
- Manipulación de listas
- Funciones sobre listas
- Diccionarios
- Operaciones sobre diccionarios
- Aplicaciones de diccionarios
- Aplicaciones con listas y diccionarios
- Tuplas como tipo de dato inmutable
- Operaciones sobre tuplas
- Combinando listas, tuplas y diccionarios
Módulo 6: Funciones
- Concepto de función
- Definición de funciones
- Parámetros y valores de retorno
- Importación y llamado de módulos
- Invocación de funciones y scope
- Parámetros con nombre y parámetros por defecto
- Funciones recursivas
- Aplicación de funciones
Estrategias metodológicas
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Curso 2: Estadística para ciencia de datos
keyboard_arrow_downDocente(s): Nicolás Alvarado
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción de curso
La mayor parte de las técnicas y algoritmos usados en el área de la ciencia de datos descansan en fundamentos estadísticos. El objetivo de este curso es entregar a los alumnos una base estadística mínima para construir sobre un fundamento robusto los conocimientos de minería de datos de los cursos posteriores. En este curso los alumnos aprenderán entre otros sobre técnicas de análisis exploratorio de datos, validación de hipótesis y regresión.
Resultados de aprendizaje
- Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.
- Mostrar en forma gráfica distribuciones empíricas de los datos.
- Modelar un problema en base a distribuciones analíticas conocidas.
- Analizar la interrelación entre dos o más variables.
- Evaluar la validez de una hipótesis en base a los datos.
Contenidos:
- Análisis exploratorio de datos e introducción a las distribuciones
- Variables y transformaciones
- Distribuciones y funciones de probabilidad
- Variables y efecto del tamaño
- Funciones de probabilidad (PMFs)
- Funciones de probabilidad
- Distribuciones continuas
- Familia exponencial
- Funciones de distribución acumulada (CDFs)
- Modelación de distribuciones e introducción a las relaciones entre variables
- Distribuciones continuas
- Gráficas distribución lognormal
- Diagramas de dispersión
- Correlación
- Relación entre variables, correlación y una introducción al testeo de hipótesis
- Covarianza
- Testeo de hipótesis
- Diferencia de medias
- Formalización
- Testeo de hipótesis, regresión e introducción a las series de tiempo
- Testeo de correlación y testeo de proporciones
- Mínimos cuadrados lineales
- Introducción a las series de tiempo
Estrategias metodológicas
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Curso 3: Introducción a Minería de datos y Machine Learning
keyboard_arrow_downDocente(s): Hernán Valdivieso
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción de curso
El curso comienza abordando la problemática de la obtención, preparación y limpieza de datos, para luego adentrarse en las técnicas y algoritmos asociados a la Minería de Datos, como clasificación, clustering, entre otros. Además, se exploran algoritmos, técnicas y herramientas de Machine Learning.
Los estudiantes de este curso adquirirán conocimientos fundamentales sobre Minería de Datos, comprendiendo las diversas fuentes de información a utilizar, revisando el preprocesamiento de datos y aplicando técnicas de extracción de conocimiento. Esto incluye el uso de reglas de asociación, árboles de decisión, algoritmos de clasificación y la evaluación de clasificadores, junto con una introducción al aprendizaje de máquina.
El enfoque del curso es práctico, privilegiando la experimentación mediante herramientas y entornos que permiten ejecutar y analizar ejemplos preconfigurados. Los estudiantes modificarán parámetros, observarán los efectos de dichos cambios y reflexionarán sobre su impacto en la calidad del modelo y la extracción de conocimiento.
Al finalizar el curso, los estudiantes comprenderán los principios teóricos y prácticos que sustentan las principales técnicas utilizadas en la minería de datos y el aprendizaje de máquina, pudiendo analizar sus resultados, evaluar su aplicabilidad en distintos contextos y reconocer sus potencialidades y limitaciones sin necesidad de programar directamente los algoritmos.
El desarrollo de estos aprendizajes se realizará a través de estudios de casos, mini proyectos prácticos, y el acceso a recursos especializados, lo que permitirá a los estudiantes experimentar, analizar y aplicar directamente los conceptos adquiridos.
La metodología de enseñanza y aprendizaje para este curso en línea se basa en técnicas metodológicas activas, permitiendo que el participante interactúe con sus pares y el profesor-tutor a través de los recursos tecnológicos proporcionados por la plataforma educativa virtual destinada para el curso.
Resultados de aprendizaje
- Reconocer las principales teorías y prácticas de la Minería de Datos.
- Identificar relaciones interesantes en un conjunto de transacciones mediante el uso de reglas de asociación.
- Distinguir técnicas como árboles de decisión, clustering y otras, aplicándolas en escenarios prácticos reales.
- Evaluar la calidad y pertinencia de los resultados obtenidos, reconociendo las potencialidades y limitaciones de cada técnica.
Contenidos:
- Introducción a Minería de Datos y conceptos sobre Data Warehouse
- Procesamiento, selección y transformación de datos.
- Reglas de asociación
- Clasificación
- Árbol de decisión
- KNN
- Random Forest
- Clustering
- K-Means
- Clustering jerárquico
- Introducción al Machine Learning
- Modelo de entrenamiento
- Métricas de evaluación
Estrategias metodológicas:
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas:
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Curso 4: Técnicas avanzadas de minería de datos
keyboard_arrow_downDocente(s): Sebastián Raveau
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción de curso
Este curso profundiza en las técnicas y algoritmos más utilizados en minería de datos. En particular se incluyen las técnicas de aprendizaje reforzado que han ido captando el interés en forma rápida por la amplia gama de aplicaciones donde puede usarse. Adicionalmente en este curso se estudian técnicas de Web Mining y análisis de texto.
Resultados de aprendizaje
- Modelar problemas reales mediante técnicas avanzadas de minería de texto, para apoyar procesos de gestión del conocimiento en las organizaciones.
- Aplicar técnicas de aprendizaje reforzado como alternativa de entrenar modelos de aprendizaje.
- Utilizar herramientas de procesamiento de datos, para apoyar el proceso de modelado e interpretación de los resultados obtenidos.
- Aplicar series de tiempo para predecir modelos de negocios, basados en datos históricos.
Contenidos:
- Series de tiempo
- Análisis visual de series de tiempo
- Componentes de una serie de tiempo
- Estacionariedad de una serie de tiempo
- Tratamiento de una serie de tiempo no estacionaria
- Tipos de modelos de series de tiempo
- Modelos MA
- Minería de texto y web scraping
- Minería de texto
- Web scraping
- Aprendizaje por refuerzo
- Aprendizaje por refuerzo
- Métodos de Monte Carlo
- Q-Learning
- Funciones de valor
- Q-Learning
- Redes neuronales artificiales
- Estructura de una red neuronal artificial
- Entrenamiento de redes neuronales artificiales
- Otros tipos de redes neuronales
- Nuevas tendencias de machine learning
- Modelos fundacionales
- Inteligencia artificial generativa
Estrategias metodológicas
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Requisitos Aprobación
keyboard_arrow_downLa nota final del diplomado se calculará de acuerdo con la siguiente ponderación de los cursos:
- Curso: Herramientas básicas de programación en Python – 25%
- Curso: Estadística para Ciencia de Datos – 25%
- Curso: Introducción a minería de datos y Machine Learning – 25%
- Curso: Técnicas avanzadas de minería de datos – 25%
Los alumnos deberán ser aprobados de acuerdo con el siguiente criterio:
- Calificación mínima de 4.0 en cada uno de los cursos.
Los resultados de las evaluaciones serán expresados en notas, en escala de 1,0 a 7,0 con un decimal, sin perjuicio que la Unidad pueda aplicar otra escala adicional.
Para aprobar un Diplomado, se requiere la aprobación de todos los cursos que lo conforman y, en los casos que corresponda, de otros requisitos que indique el programa académico.
El estudiante será reprobado en un curso o actividad del Programa cuando hubiere obtenido como nota final una calificación inferior a cuatro (4,0).
Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.
Además, se entregará una insignia digital por diplomado. Sólo cuando alguno de los cursos se dicte en forma independiente, además, se entregará una insignia por curso.
Proceso de Admisión
keyboard_arrow_downLas personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:
- Fotocopia simple del carnet de identidad por ambos lados.
Cualquier información adicional o inquietud podrás escribir al correo programas.ing@uc.cl
Con el objetivo de brindar las condiciones y asistencia adecuadas, invitamos a personas con discapacidad física, motriz, sensorial (visual o auditiva) u otra, a dar aviso de esto durante el proceso de postulación.
El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
No se tramitarán postulaciones incompletas.
Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula
¿Te parece interesante este programa?
Sí No