Diplomado en Minería de datos - Online*

Este diplomado está orientado a entregar un amplio conjunto de competencias en el ámbito del Data Mining, partiendo con los fundamentos estadísticos y las competencias de programación necesarias, para pasar a los fundamentos, técnicas y aplicaciones. Al no requerir conocimientos previos de programación ni tampoco de estadística, el diplomado está abierto no solo a personas con un background más técnico sino a todo tipo de profesionales. 


Descripción

Se dice que los datos son el nuevo petróleo. Al igual que en la minería tradicional es necesario extraer laboriosamente desde una montaña de áridos el material valioso mediante técnicas sofisticadas y con el uso de herramientas especializadas, los elementos de valor de los datos deben ser también extraídos o minados. La minería de datos o Data Mining es una disciplina que comprende estas técnicas y herramientas, de modo que, aquella montaña de datos que ha sido recopilada en el tiempo pueda ser usada para entender de mejor forma el negocio y construir modelos que permitan hacer predicciones, que pueden ser usadas en las decisiones y las acciones de la empresa.

Este diplomado se diferencia de otros similares, debido a que no requiere conocimientos previos de programación ni tampoco de estadística, ya que incluye un curso para aprender a programar en Python y un curso de fundamentos de estadística. Además, los otros dos cursos de Minería de datos permiten llegar a un nivel de profundidad más alto.

La modalidad del diplomado es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Dirigido a
  • Todas las personas que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo.
  • Todas las personas que han aprendido lo esencial de Data Mining pero necesitan profundizar y adquirir algo de fundamentos estadísticos.
Prerrequisitos

Licenciatura, título profesional o técnico de mínimo 4 años.

Se sugiere:

  • Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio
  • Dos años de experiencia laboral.
  •  
Objetivo de aprendizaje
  1. Escribir programas simples usando el lenguaje Python.
  2. Analizar datos de forma exploratoria para explicar la correlación entre variables, aplicando conceptos estadísticos.
  3. Predecir el comportamiento de una organización a través de modelos que incorporan algoritmos de aprendizaje de máquina.

 

Desglose de cursos

CURSO 1
Nombre del curso: Herramientas básicas de programación en Python
Nombre en inglés: Basic Python programming tools
Horas cronológicas: 75 (35 horas directas)
Créditos: 5

Descripción de curso
En este curso se aprenden técnicas básicas de programación utilizando el lenguaje Python. Los alumnos aprenden a plantear la solución de un problema en forma algorítmica y a expresar esa solución utilizando los elementos del lenguaje Python.

Resultados del Aprendizaje
Identificar conceptos y operaciones básicas de programación, tales como variables, funciones, operadores lógicos.
Utilizar los comandos de control de flujo y los ciclos para la dirigir y repetir eficientemente un conjunto de operaciones básicas.
Emplear elementos básicos como tipos de archivos (.txt, csv), tipos de datos (texto, entero, decimal, listas), entre otros en el procesamiento de datos.
Aplicar conceptos y herramientas básicas de programación, como lectura, escritura de archivos y edición masiva de datos, resolviendo problemas reales relacionados con el procesamiento de datos.
Desarrollar programas en el lenguaje de programación Python que permitan resolver problemas sencillos.

Contenidos:

  • Introducción a la programación
  • Motivación
  • Secuencias de comandos en Python
  • Operaciones básicas
  • Creación y asignación de variables
  • Operaciones lógicas

Control de Flujo

  • Control de Flujo
  • Iteración y Ciclos

Tipos de datos y funciones

  • Enteros, decimales, textos y listas.
  • Manejo de strings de caracteres
  • Definición y uso de funciones
  • Listas

Procesamiento de datos

  • Listas de listas
  • Trabajo con archivos
  • Procesamiento de datos

Diccionarios y Tuplas

  • Listas y listas de listas
  • Diccionarios
  • Aplicaciones con listas y diccionarios
  • Tuplas como tipo de dato inmutable
  • Operaciones sobre tuplas
  • Combinando listas, tuplas y diccionarios

Funciones

  • Concepto de función
  • Definición de funciones
  • Parámetros y valores de retorno
  • Importación y llamado de módulos
  • Invocación de funciones y scope
  • Parámetros con nombre y parámetros por defecto
  • Funciones recursivas
  • Aplicación de funciones


CURSO 2
Nombre del curso: Estadística para ciencia de datos
Nombre en inglés: Statistics for data science
Horas cronológicas: 75 (35 horas directas)
Créditos: 5

Descripción de curso
La mayor parte de las técnicas y algoritmos usados en el área de la ciencia de datos descansan en fundamentos estadísticos.  El objetivo de este curso es entregar a los alumnos una base estadística mínima para construir sobre un fundamento robusto los conocimientos de minería de datos de los cursos posteriores.  En este curso los alumnos aprenderán entre otros sobre técnicas de análisis exploratorio de datos, validación de hipótesis y regresión.

Resultados del Aprendizaje
Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.
Mostrar en forma gráfica distribuciones empíricas de los datos.
Modelar un problema en base a distribuciones analíticas conocidas.
Analizar la interrelación entre dos o más variables.
Evaluar la validez de una hipótesis en base a los datos.

Contenidos:
Introducción al análisis exploratorio de datos
Histogramas y distribuciones
Distribución de probabilidades discretas y continuas
Modelación con distribuciones de probabilidad analíticas (exponencial, normal)
Relacionando variables: correlación, covarianza y correlación de Pearson
Correlación no lineal
Testeo de hipótesis
Regresión
Introducción a las series de tiempo

CURSO 3
Nombre del curso: Introducción a Minería de datos y Machine Learning
Nombre en inglés: Introduction to Data Mining and Machine Learning 
Horas cronológicas: 75 (35 horas directas)
Créditos: 5

Descripción de curso
Este curso introduce al alumno en los fundamentos y técnicas de la Minería de Datos desde la obtención y preparación de los datos hasta la selección y evaluación de modelos que utilizan los algoritmos más conocidos de Minería de Datos y Aprendizaje de Máquina.

Resultados del Aprendizaje

  1. Identificar las principales teorías y prácticas de la emergente área de Minería de Datos.
  2. Aplicar reglas de asociación para encontrar relaciones en un set de transacciones.
  3. Diseñar soluciones a problemas reales de Big Data y ciencia de datos que involucren la necesidad de técnicas de Minería de Datos como árboles de decisión y clustering.
  4. Implementar soluciones usando herramientas de software de Minería de Datos aplicándolas en datos reales.


Contenidos:
Conceptos fundamentales de Minería de Datos.
Preparación de datos y reducción de información.
Reglas de Asociación.
Algoritmos de Clasificación.
Algoritmos de Clustering y medidas de similaridad.
Selección de modelos e Introducción a Machine Learning.

CURSO 4
Nombre del curso: Técnicas avanzadas de minería de datos
Nombre en inglés: Advanced data mining techniques
Horas cronológicas: 75 (35 horas cronológicas)
Créditos: 5

Descripción de curso
Este curso profundiza en las técnicas y algoritmos más utilizados en Minería de Datos.  En particular se incluyen las técnicas de aprendizaje reforzado que han ido captando el interés en forma rápida por la amplia gama de aplicaciones donde puede usarse.  Adicionalmente en este curso se estudian técnicas de Web Mining y análisis de texto.

Resultados del Aprendizaje
Modelar problemas reales mediante técnicas avanzadas de minería de texto, para apoyar procesos de gestión del conocimiento en las organizaciones.
Aplicar técnicas de aprendizaje reforzado como alternativa de entrenar modelos de aprendizaje.
Utilizar herramientas de procesamiento de datos, para apoyar el proceso de modelado e interpretación de los resultados obtenidos.
Aplicar series de tiempo para predecir modelos de negocios, basados en datos históricos.

Contenidos:
Introducción General

  • Modelos alternativos de minería de datos
  • Extensión de los modelos de machine learning

Introducción a Web Mining

  • Web Scraping
  • Text análisis

Series de tiempo

  • Aprendizaje Reforzado
  • Introducción
  • Diferencias con otros modelos de aprendizaje
  • Agentes
  • Funcionamiento en base a premios, castigos y fuerza bruta
  • Q-Learning
    IntroducciónEcuación de Bellman
    Explorar vs Explotar

Tendencias de Machine Learning

Equipo Docente

JEFE DE PROGRAMA
Jaime Navón Cohen
Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.

EQUIPO DOCENTE
Mauricio Arriagada
Doctor en Ciencias de la Ingeniería, Pontificia Universidad Católica de Chile. Master in Computer Science, University of Northern Iowa (USA). Master en Ingeniería de Software e Ingeniero Civil en Computación e Informática, Universidad de Tarapacá (Chile).

Nicolás Alvarado Monárdez
Licenciado en Matemáticas y Magíster en Matemáticas de la Pontificia Universidad Católica de Chile.  Ph.D. (c) en el Departamento de Ciencia de la Computación de la Pontificia Universidad Católica de Chile.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa.

Metodología

CURSO 1:
La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos.

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar.

CURSO 2:
La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos.

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar. 

CURSO 3:

La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos.

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar.


CURSO 4:
La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos.

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar.

Evaluación

CURSO 1:
Tres pruebas individuales on-line, todas de igual ponderación         (40% en total)
Tres actividades individuales de aplicación, la tercera con doble ponderación (60% en total)

CURSO 2:
Tres pruebas individuales on-line, todas de igual ponderación               (40% en total)
Tres actividades individuales de aplicación, la tercera con doble ponderación       (60% en total)

CURSO 3:
Tres pruebas individuales on-line, todas de igual ponderación               (40% en total)
Tres actividades individuales de aplicación, la tercera con doble ponderación       (60% en total)

CURSO 4:
Tres pruebas individuales on-line, todas de igual ponderación               (40% en total)
Tres actividades individuales de aplicación, la tercera con doble ponderación       (60% en total)

 

 

Requisitos de aprobación

La nota final del diplomado se calculará de acuerdo con la siguiente ponderación de los cursos:

  • Curso: Herramientas básicas de programación en Python – 25%
  • Curso: Estadística para Ciencia de Datos – 25%           
  • Curso: Introducción a minería de datos y Machine Learning – 25%   
  • Curso: Técnicas avanzadas de minería de datos – 25%


Los alumnos deberán ser aprobados de acuerdo con el siguiente criterio:

 

  • Calificación mínima de 4.0 en cada uno de los cursos.

Para aprobar los programas de diplomados se requiere la aprobación de todos los cursos que lo conforman.

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.
El alumno que no cumpla con una de estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación.

En caso de que, por cualquier motivo, el alumno repruebe un curso perteneciente a un diplomado, en Educación Profesional Ingeniería UC ofrecemos la oportunidad de realizar un nuevo intento. Para ejercer este derecho, el alumno deberá pagar un valor de 3 UF por curso, e indicar la fecha de la versión en la que desea matricularse. Esta gestión debe realizarse dentro de un máximo de 2 años, a contar de la fecha de inicio del Diplomado cursado originalmente

Bibliografía

CURSO 1
Complementaria
González, R. (2011). Python para todos. Creative Commons Reconocimiento 2.5 España. Descargable en http://mundogeek.net/tutorial-python/
M. Lutz, (2013), Learning Python 5th Ed, O´Reilly.

CURSO 2
Complementaria
Downey, A., (2015), Think Stats, 2nd Ed. O"Reilly.
Hastie, T., Tibshirani, R., Friedman, J., (2016), The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd Ed.), Springer.

CURSO 3
Complementaria
Giudici, P. and Figini, S. (2009), Applied Data Mining, 2nd Ed, Wiley.
Tan Pang-Ning, Steinbach, M., Karpatne, A., Kumar, V. Introduction to Data Mining, (2019), 2nd Ed, Pearson.

CURSO 4
Complementaria
Sutton, R., Barto, A. (2018), Reinforced Learning: An Introduction, 2nd Ed, Bradford Books.
Tan Pang-Ning, Steinbach, M., Karpatne, A., Kumar, V. (2019), Introduction to Data Mining, 2nd Ed, Pearson.

Proceso de Admisión

Las personas interesadas deberán enviar los documentos que se detallan más abajo al correo programas@ing.puc.cl.
Fotocopia Carnet de Identidad.
Fotocopia simple del Certificado de Título o del Título.
Currículum Vitae actualizado.

El postular no asegura el cupo, una vez aceptado en el programa, se debe cancelar o documentar el valor, para estar matriculado.

VACANTES: 50
“No se tramitarán postulaciones incompletas”.

No se reservan cupos, el pago completo del valor del programa es requisito para gestionar la matrícula.

Importante- Sobre retiros y suspensiones.
La coordinación del programa se reserva el derecho de suspender o reprogramar la realización de la actividad si no cuenta con el mínimo de alumnos requeridos o por motivos de fuerza mayor. En tal caso se devuelve a los alumnos matriculados la totalidad del dinero a la brevedad posible con un máximo de 15 días hábiles. La devolución se efectuará con depósito en la cuenta (corriente o vista) que indique el alumno o a través de un vale vista que deberá ser retirado en cualquier sucursal del Banco Santander.

A las personas matriculadas que se retiren de la actividad antes de la fecha de inicio, se les devolverá el total pagado menos el 10% del valor del programa.* A las personas que se retiren una vez iniciada la actividad, se les cobrará las horas o clases cursadas o asistidas y materiales entregados a la fecha de la entrega de solicitud formal de retiro más el 10% del valor del programa*La solicitud de retiro debe realizarse a la coordinación a cargo y hasta antes de que el 50% de la actividad se haya desarrollado (Reglamento de alumno de Educación Continua). En ambos casos la devolución, demorará cómo máximo 15 días hábiles y se efectuará con depósito en la cuenta (corriente o vista) que indique el alumno o a través de un vale vista que deberá ser retirado en cualquier sucursal del Banco Santander. *El 10% corresponde al uso de vacante y se calcula en base al precio publicado, no el valor final pagado.

Para cursos (con inscripción):
Las personas interesadas deberán completar la ficha de inscripción ubicada al lado derecho de esta página web. - Las inscripciones son hasta completar las vacantes. - Si el pago lo efectúa su empresa, el encargado de capacitación de su empresa debe ingresar el requerimiento en “Inscripción Empresa”, subiendo ficha de inscripción con firma y timbre además de ODC, OTIC, OC CM. - El inscribirse no asegura el cupo, una vez inscrito en el programa, se debe cancelar el valor para estar matriculado.

SOLICITAR MÁS INFORMACIÓN
POSTULA AQUÍ

Mantente conectado a nuestras redes sociales