Introducción a minería de datos y machine learning

Estudia en la Universidad Nº 1 de Latinoamérica | Pontificia Universidad Católica de Chile

Acerca del programa:

El curso online Introducción a Minería de Datos y Machine Learning tiene como propósito enseñar cuáles son los elementos que le permiten entender las principales teorías y prácticas de la emergente área de Minería de Datos. Se introducen también conceptos de Machine Learning. Al final del curso el alumno tendrá un conocimiento teórico y práctico de las principales técnicas utilizadas actualmente en la creación de programas capaces de extraer conocimiento relevante desde información de bases de datos, y conocer algunas de las principales aplicaciones donde este tipo de técnicas están siendo utilizadas en la actualidad, comprendiendo sus potencialidades y limitaciones.

minería datos machine learning

Dirigido a:

  • Profesionales que necesiten extraer conocimiento desde diferentes fuentes de información.
  • Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para procurar los datos de entrada al proceso de análisis.

Jefe de Programa

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.
linkedin

Equipo Docente

keyboard_arrow_down

Mauricio Arriagada Benítez

Doctor en Ciencia de la Ingeniería, Pontificia Universidad Católica de Chile, Master en Ciencias de la Ingeniería de la Pontificia Universidad Católica de Chile, Ingeniero Civil en Computación e Informática, Universidad de Tarapacá, Chile. Master in Computer Science, University of Northern Iowa – USA. Master en Ingeniería de Software, Universidad de Tarapacá – Chile.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de remplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.

Descripción

El curso comienza con la problemática de obtención, preparación y limpieza de los datos para pasar luego a las técnicas y algoritmos asociados a la minería de datos para clasificación, clustering, etc. además de algoritmos, técnicas y herramientas de machine learning.

Los alumnos de en este curso aprenderán los conceptos fundamentales asociados a Minería de Datos, entendiendo cuáles son las diferentes fuentes de información a utilizar, revisar un pre procesamiento de datos, y posteriormente entender y aplicar las diferentes técnicas de extracción de conocimiento de datos utilizando reglas de asociación, árboles de decisión, métodos de regresión, algoritmos de clasificación, evaluación de clasificadores y una introducción al aprendizaje de máquina.

El enfoque del curso es de tipo práctico, con oportunidades de aplicar los conocimientos en proyectos y casos concretos. Se entregan herramientas de extracción y análisis de información para que una organización pueda generar valor desde los datos para mejorar su posición competitiva.

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.

Requisitos de Ingreso

Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.

Si desea evaluar su nivel, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba- python. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.

A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:

Es deseable contar con algún grado de conocimiento matemático (algebra lineal, estadística básica y cálculo).

Objetivos de Aprendizaje

  1. Comprender los conceptos fundamentales de Minería da Datos
  2. Aplicar técnicas de extracción de conocimiento para análisis de datos.
  3. Aplicar algoritmos para encontrar patrones, establecer agrupaciones y clasificar datos.
  4. Comprender los fundamentos básicos de Aprendizaje de Máquina.

Desglose de cursos

Horas cronológicas: 75 (35 horas directas)

Créditos: 5

Resultados del Aprendizaje

  1. Conocer y comprender las principales teorías y prácticas de la emergente área de Minería de Datos
  2. Aplicar reglas de asociación para encontrar relaciones en un set de transacciones.
  3. Desarrollar soluciones a problemas reales de Big Data y ciencia de datos que involucren la necesidad de técnicas de Minería de Datos como árboles de decisión y clustering.
  4. Implementar soluciones usando herramientas de software de Minería de Datos aplicándolas en datos reales.

Contenidos:

  • Conceptos fundamentales de Minería de Datos
  • Preparación de datos y reducción de información
  • Reglas de Asociación
  • Algoritmos de Clasificación
  • Algoritmos de Clustering y medidas de similaridad
  • Selección de modelos e introducción a Machine Learning

Metodología de enseñanza y aprendizaje:

La modalidad de capacitación es e-learning asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos.

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.

Al inicio del curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar.

Evaluación de los aprendizajes:

Tres pruebas on-line, todas de igual ponderación: (40% en total)

Tres actividades de aplicación, la tercera con doble ponderación: (60% en total)

BIBLIOGRAFÍA

  1. Data Mining: Practical Machine Learning Tools and Techniques, Ian H. Witten, Eibe Frank.
  2. Data Mining: Concepts and Techniques, Jiawei Han and Micheline Kamber.
  3. Inmon, W.H., ”Building the DataWarehouse”, John Wiley and Sons; 3th edition, 2002.
  4. Berry, M. and Linoff, G., ”Data Mining Techniques for Marketing, Sales and Customer Support”, Wiley, 1997.

Requisitos Aprobación

  • Calificación mínima del curso 4,0 en su promedio ponderado.

En el caso de los programas en modalidad en línea, los estudiantes tendrán que cumplir con la calificación mínima de 4.0 y con los requisitos establecidos para cada programa. Si el alumno reprueba el curso tiene la posibilidad de realizarlo a la versión siguiente (2 strikes por curso).

Los participantes que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.

El participante que no cumpla con la exigencia reprueba automáticamente sin posibilidad de ningún tipo de certificación.

*En caso de que un alumno repruebe un curso perteneciente a un diplomado, en Educación Profesional Ingeniería UC ofrecemos la oportunidad de realizar un nuevo intento. Para ejercer este derecho, el alumno deberá pagar un valor de 3 UF por curso, e indicar la fecha de la versión en la que desea matricularse. La gestión debe realizarse dentro de un máximo de 2 años a contar de la fecha de inicio del diplomado original, y es factible para un máximo de 2 cursos por diplomado.

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo: 

  • Fotocopia Carnet de Identidad.
  • Fotocopia simple del Certificado de Título
  • Curriculum Vitae actualizado.

Cualquier información adicional o inquietud podrás escribir al correo programas@ing.puc.cl.

VACANTES: 40

INFORMACIONES RELEVANTES

Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo. 

  • El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
  • No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula


Fechas disponibles

Los detalles del programa pueden variar en cada fecha de edición

Fecha Horario Lugar Valor
28 noviembre 2023 - 16 enero 2024 Asincrónico $550.000 Ver más

¿Te parece interesante este programa?

No