Acerca del programa:
El curso online en Introducción a Minería de Datos y Machine Learning tiene como propósito enseñar cuáles son los elementos que le permiten entender las principales teorías y prácticas de la emergente área de Minería de Datos. Se introducen también conceptos de Machine Learning. Al final del curso el alumno tendrá un conocimiento teórico y práctico de las principales técnicas utilizadas actualmente en la creación de programas capaces de extraer conocimiento relevante desde información de bases de datos, y conocer algunas de las principales aplicaciones donde este tipo de técnicas están siendo utilizadas en la actualidad, comprendiendo sus potencialidades y limitaciones.
Dirigido a:
- Profesionales que necesiten extraer conocimiento desde diferentes fuentes de información.
- Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para procurar los datos de entrada al proceso de análisis.
Jefe de Programa
Jaime Navón Cohen
Equipo Docente
keyboard_arrow_downMauricio Arriagada Benítez
Doctor en Ciencia de la Ingeniería, Pontificia Universidad Católica de Chile, Master en Ciencias de la Ingeniería de la Pontificia Universidad Católica de Chile, Ingeniero Civil en Computación e Informática, Universidad de Tarapacá, Chile. Master in Computer Science, University of Northern Iowa – USA. Master en Ingeniería de Software, Universidad de Tarapacá – Chile.
* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de remplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.
Descripción
keyboard_arrow_downEl curso comienza abordando la problemática de la obtención, preparación y limpieza de datos, para luego profundizar en las técnicas y algoritmos asociados a la minería de datos, como clasificación, clustering, entre otros. Además, se exploran algoritmos, técnicas y herramientas de machine learning.
Los estudiantes de este curso adquirirán conocimientos fundamentales sobre Minería de Datos, comprendiendo las diversas fuentes de información a utilizar, revisando el preprocesamiento de datos y aplicando técnicas de extracción de conocimiento. Esto incluye el uso de reglas de asociación, árboles de decisión, métodos de regresión, algoritmos de clasificación y la evaluación de clasificadores, junto con una introducción al aprendizaje de máquina.
El enfoque del curso es práctico, brindando oportunidades para aplicar los conocimientos en proyectos y casos concretos. Se proporcionan herramientas de extracción y análisis de información para que una organización pueda generar valor a partir de los datos, mejorando su posición competitiva.
Al finalizar el curso, los estudiantes contarán con conocimientos teóricos y prácticos sobre las principales técnicas utilizadas en la creación de programas capaces de extraer conocimiento relevante de bases de datos. También comprenderán algunas de las principales aplicaciones actuales de estas técnicas, así como sus potencialidades y limitaciones.
Los contenidos serán abordados en 6 clases en línea (8 semanas), donde se entregarán los contenidos mediante recursos interactivos que integran videos, esquemas, artículos, lecturas y preguntas formativas. El curso se impartirá a través de una plataforma educativa virtual.
Requisitos de Ingreso
keyboard_arrow_downSe recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.
Si desea evaluar su nivel, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba- python. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.
A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:
- MOOC “Introducción a la Programación en Python I: Aprendiendo a programar con Python”, disponible en el siguiente link: https://www.coursera.org/learn/aprendiendo-programar-python.
- Curso “Herramientas de programación en Python para procesamiento de datos”, disponible en el siguiente link: https://teleduc.uc.cl/curso/herramientas-programacion-python-procesamiento-datos/.
Es deseable contar con algún grado de conocimiento matemático (algebra lineal, estadística básica y cálculo).
Objetivos de Aprendizaje
keyboard_arrow_down- Aplicar los conceptos fundamentales de minería de datos y los algoritmos de aprendizaje de máquina para el apoyo en la toma de decisiones basada en datos
Metodología
keyboard_arrow_downLa modalidad de capacitación es e-learning asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.
Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos.
Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.
Al inicio del curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar.
Desglose de cursos
keyboard_arrow_downHoras totales: 75 | Horas directas: 35 | Horas indirectas: 40
Créditos: 4
Resultados del Aprendizaje
- Identificar las principales teorías y prácticas de la Minería de Datos.
- Aplicar reglas de asociación de manera efectiva para la ubicación de relaciones interesantes en un conjunto de transacciones.
- Aplicar técnicas como árboles de decisión, clustering y otras en escenarios prácticos reales
Contenidos:
- Conceptos sobre Data Warehouse y uso de Dataframes
- Procesamiento y consolidación de datos.
- Preprocesamiento de datos
- Selección y transformación de datos
- Reglas de asociación
- Aplicación de los algoritmos Random Forest y KNN
- Árbol de decisión
- KNN
- Random Forest
- Aplicación de los algoritmos K-Means y DBSCAN
- Clustering
- K-Means
- Clustering jerárquico
- Introducción al Machine Learning
- Modelo de entrenamiento
- Métricas de evaluación
Estrategias metodológicas
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas
- 3 controles individuales :40%
- 3 mini proyectos individuales: 60%
Requisitos Aprobación
keyboard_arrow_downLos alumnos deberán ser aprobados de acuerdo los criterios que establezca la unidad académica:
- Calificación mínima de todos los cursos 4.0 en su promedio ponderado.
El alumno que no cumpla con estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación.
Los resultados de las evaluaciones serán expresados en notas, en escala de 1,0 a 7,0 con un decimal, sin perjuicio que la Unidad pueda aplicar otra escala adicional.
Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.
Proceso de Admisión
keyboard_arrow_downLas personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:
- Fotocopia Carnet de Identidad
Cualquier información adicional o inquietud podrás escribir al correo programas@ing.puc.cl.
VACANTES: 40
Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo.
El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
No se tramitarán postulaciones incompletas.
Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula.
¿Te parece interesante este programa?
Sí No