Diplomado en Big data y machine learning

Estudia en la Universidad N°1 de habla hispana en Latinoamérica 2024 por QS World University Rankings

Acerca del programa:

Aprende las técnicas y los modernos algoritmos de Machine Learning, ocupando los enormes conjuntos de datos que se generan diariamente.

Conocimientos para construir aplicaciones y soluciones inteligentes que aprovechen el aprendizaje de máquinas (deep learning, reinforced learning) en la era del Big Data.

Metodología online, que consiste en herramientas activas, donde el participante puede interactuar con sus pares y profesor-tutor, a través de los recursos tecnológicos que provee la plataforma virtual.

Diplomado en Big data y machine learning

Dirigido a:

  • Profesionales que necesiten adquirir las competencias necesarias para construir aplicaciones de Big Data y Machine Learning usando las herramientas del ecosistema Python.
  • Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para interactuar y visualizar volúmenes grandes de datos.

Jefe de Programa

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.
linkedin

Equipo Docente

keyboard_arrow_down

Ignacio Becker

Ph.D. (c) en Ciencias de la Computación y Astrónomo UC. Ph.D. (c) en Ciencias de la Computación y Astrónomo, Pontificia Universidad Católica de Chile. Profesor de Educación Profesional de la Escuela de Ingeniería, Pontificia Universidad Católica de Chile.

Patricio Cofré

Profesor Instructor Adjunto Departamento de Ciencia de la Computación UC. Master of Engineering, Northwestern University. Ingeniero Civil de Industrias (con mención en Tecnologías de la Información), UC. Ha desarrollado diversos proyectos de analytics en varios países de Latinoamérica. Profesor Instructor Adjunto del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. CEO de Metric Arts, empresa consultora fundada el año 2007, especializada en las áreas de Inteligencia de Negocios y Análisis de Negocios.

Fernando Florenzano

Magíster en Ciencias de la Ingeniería, PUC. Ingeniero Civil PUC. Magíster en Ciencias de la Ingeniería, PUC. Ingeniero Civil Computación PUC.

Iván Lillo

Profesor Instructor, Depto. de Ciencia de la Computación, Ingeniería UC Magíster en Ciencias de la Ingeniería, UC; Candidato a Doctor en Ciencias de la Ingeniería, UC. Ingeniero Civil Elestricista, UC. Profesor Instructor, Departamento de Ciencia de la Computación, Escuela de Ingeniería UC.

Denis Parra

Profesor Asistente, Depto. de Ciencia de la Computación, Ingeniería UC. Ph.D. in Information Science, University of Pittsburgh, EE.UU. Ingeniero Civil en Informática, Universidad Austral de Chile. Profesor Asistente del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Experto en sistemas de recomendación y personalización automatizada. Su área principal de trabajo se desarrolla en las temáticas de análisis de redes sociales, minería de datos y técnicas de visualización para sistemas recomendadores.

Francisco Pérez

Ph.D. (c) en Ciencias de la Computación, UC. Magíster en Gestión de Operaciones e Ingeniero Civil Industrial, UTALCA. Ph.D. (c) en Ciencias de la Computación, Pontificia Universidad Católica de Chile. Magíster en Gestión de Operaciones e Ingeniero Civil Industrial, Universidad de Talca. Profesor de Educación Profesional de la Escuela de Ingeniería, Pontificia Universidad Católica de Chile.

Gabriel Sepúlveda

Profesor Instructor. Departamento de Ciencia de la Computación. Escuela de Ingeniería UC. Ingeniero Civil Electrónico, Universidad Técnica Federico Santa María. Ph.D. (c) en Ciencias de la Computación, UC. Miembro del Laboratorio de Inteligencia Artificial (IALAB) y Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC.

Hernán Valdivieso

Magíster en Ciencias de la Ingeniería e Ingeniero Civil en Computación, UC. Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Su área principal de trabajo es la docencia y el desarrollo de técnicas de visualización.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.

Descripción

El Diplomado en Big Data y Machine Learning aporta los conocimientos que te permitirán entender las técnicas y algoritmos asociados al aprendizaje de máquina en el contexto de gigantescos volúmenes de datos. El programa entrega, a través de sus 4 cursos, la mayor parte de las competencias que se requieren para trabajar en esta espectacular área. En uno de los cursos, aprenderás las técnicas y herramientas para el manejo de Big Data (Hadoop, Spark, etc). Un segundo curso, te entregará las competencias para utilizar el lenguaje Python en el contexto de machine learning. Otro de sus cursos, está enfocado íntegramente al importante tema de la visualización de la información. Por último, el curso de aplicaciones entrega una mirada al ámbito y tipo de aplicaciones más comunes y prometedoras para estas técnicas y herramientas.

El formato del Diplomado en Big Data y Machine Learning es 100% en línea y se estructura sobre cuatro cursos que utilizan técnicas metodológicas activas. Gracias a estas últimas, el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Requisitos de Ingreso

  • Se recomienda contar con conocimientos básicos de programación, específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.
  • Si desea evaluar su nivel, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba-python. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.

Objetivos de Aprendizaje

  1. Conocer la problemática de Big Data, las plataformas más importantes y las técnicas que permiten manejar esa data. Además, conocer las principales aplicaciones de Ciencia de Datos y Machine Learning.
  2. Comprender e implementar los principales algoritmos de Machine Learning usando el lenguaje Python.
  3. Presentar visualmente la data en forma efectiva.

Desglose de cursos

Curso: Técnicas de Big Data para Machine Learning

Al final del curso podrás:

  • Entender la problemática y particularidades del manejo de Big Data.
  • Conocer los principios, bases técnicas y herramientas del ecosistema Hadoop.
  • Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
  • Conocer Apache Spark, un framework de procesamiento de datos de propósito general.
  • Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
  • Aplicar herramientas de visualización para facilitar la interpretación de resultados. 

Contenidos:

  • Introducción a Big data
  • El ecosistema Hadoop
  • HDFS, YARN
  • Hadoop MapReduce
  • Herramientas del ecosistema Hadoop
  • Fundamentos de Apache Spark
  • Implementación de aplicaciones sobre Spark
  • Spark SQL
  • Spark MLlib
  • Técnicas de visualización

Curso: Python para Machine Learning

Al final del curso podrás:

  • Identificar, procesar y visualizar diferentes tipos de variables en una base de datos utilizando librerías de Python.
  • Diseñar e implementar modelos de aprendizaje supervisado basados en regresiones.
  • Comprender aspectos formales de modelos de aprendizaje supervisado tradicionales, experimentando y comparando su rendimiento.
  • Reconocer y emplear modelos de redes neuronales artificiales básicas
  • Comprender, implementar e interpretar modelos de aprendizaje no supervisado a través de librerías de Python.

Contenidos:

  • Conceptos fundamentales de Machine Learning
  • Análisis, procesamiento y visualización de datos a través de Python
  • Algoritmos de aprendizaje supervisado en Python utilizando scikit-learn:
    • Regresión Lineal
    • Regresión Logística
    • Regresiones Polinomiales
    • Regresiones con penalización
    • Árboles de Decisión
    • Random Forest
    • Random Forest para regresiones
    • Naive Bayes
    • Vecino más cercano
    • Redes Neuronales
    • Selección de modelos
  • Algoritmos de aprendizaje no supervisado en Python utilizando sciki
    • K-means
    • Mezcla de Gaussianas
    • Cluster Jerárquico
    • Autoencoders


Curso: Visualización de Información en la Era de Big Data

Al final del curso podrás:

  1. Analizar y evaluar visualizaciones de información existentes, así como proponer mejoras.
  2. Identificar relaciones entre tipos de datos, tareas de visualización y tipos de gráficos para diseñar visualizaciones de información.
  3. Diseñar e implementar en lenguaje Python gráficos simples y avanzados usando datasets tabulares.
  4. Diseñar e implementar en lenguaje Python gráficos usando datasets de red.
  5. Diseñar e implementar en lenguaje Python gráficos para visualizar datos de texto y espaciales.

Contenidos:

  • Ejemplos históricos de visualización de datos
  • Conceptos fundamentales de visualización de información
  • Funciones básicas de matplotlib y seaborn
  • Modelo anidado de Munzner para diseño y validación de visualización
  • Reglas y recomendaciones generales para visualizaciones efectivas
  • Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado
  • Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado
  • Reducción de dimensionalidad
  • Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado
  • Visualización básica de datos de texto
  • Visualización básica de datos espaciales


Curso: Aplicaciones de Machine Learning y Ciencia de Datos

Al final del curso podrás:

  • Identificar los principales conceptos y técnicas asociados a Machine Learning y ciencia de datos
  • Reconocer la importancia y los principales desafíos de los datos
  • Asociar las diversas técnicas con oportunidades de aplicación en los negocios
  • Examinar las dificultades y oportunidades en la aplicación de técnicas de ciencia de datos y aprendizaje de máquina.

Contenidos:

  • Conceptos de inteligencia de negocios y de minería de datos
  • Conceptos de ciencia de datos y de machine learning
  • Aplicación al ámbito de transacciones estructuradas
  • Aplicación al ámbito de aplicaciones de texto, audio y video
  • Aprendizaje supervisado, aprendizaje no supervisado y aprendizaje reforzado
  • Aplicaciones de aprendizaje supervisado, aprendizaje no supervisado y aprendizaje reforzado
  • Estudio de casos: seguros, banca, retail, calidad del aire, transporte, compras públicas, finanzas, astronomía

Requisitos Aprobación

La Nota final del diplomado se calculará de acuerdo a la siguiente ponderación de los cursos:

  • Curso: Técnicas de Big Data para Machine Learning 25%
  • Curso: Python para Machine Learning 25%
  • Curso: Visualización de Información en la Era de Big Data 25%
  • Curso: Aplicaciones de Machine Learning y Ciencia de Datos 25%

Los alumnos deberán ser aprobados de acuerdo a los siguientes criterios: 

  • Calificación mínima de todos los cursos 4,0 en su promedio ponderado y 
  • 75% de asistencia o cifra superior a las sesiones presenciales.

En el caso de los programas en modalidad en línea, los estudiantes tendrán que cumplir con la calificación mínima de 4.0 y con los requisitos establecidos para cada programa.  

Para aprobar los programas de diplomados se requiere la aprobación de todos los cursos que lo conforman y en el caso que corresponda, de la evaluación final integrativa.

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.

El alumno que no cumpla con una de estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación. 

*En caso de que un alumno repruebe un curso perteneciente a un diplomado, en Educación Profesional Ingeniería UC ofrecemos la oportunidad de realizar un nuevo intento. Para ejercer este derecho, el alumno deberá pagar un valor de 3 UF por curso, e indicar la fecha de la versión en la que desea matricularse. La gestión debe realizarse dentro de un máximo de 2 años a contar de la fecha de inicio del diplomado original, y es factible para un máximo de 2 cursos por diplomado. 

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo: 

  • Fotocopia Carnet de Identidad.
  • Fotocopia simple del Certificado de Título 
  • Curriculum Vitae actualizado.

Cualquier información adicional o inquietud podrás escribir al correo programas@ing.puc.cl.

VACANTES: 300

Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo. 

El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.

No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula


¿Te parece interesante este programa?

No