Nuevo - Diplomado en Big Data y Machine Learning - Online

El Diplomado online en Big Data y Machine Learning tiene como propósito entregar las competencias necesarias para construir aplicaciones y soluciones que puedan sacar partido de las técnicas de Machine Learning en la era de la Big Data.


Descripción

Todos hemos sido testigos de cómo en la actualidad la inteligencia artificial ha pasado a ser el gran protagonista. En buena medida, ello se debe a los espectaculares avances de los algoritmos y técnicas de Machine Learning (deep learning, reinforced learning) que permiten construir aplicaciones impresionantes en áreas como por ejemplo de reconocimiento visual. A su vez, el impresionante desempeño de estos algoritmos se debe a que gracias a las técnicas de Big Data pueden ahora ser entrenados con volúmenes gigantescos de datos.  Este diplomado les permitirá a los participantes adquirir los conocimientos necesarios para construir soluciones inteligentes utilizando las técnicas y algoritmos más modernos de Machine Learning, ocupando los enormes sets de datos que se generan diariamente. 

La metodología de enseñanza y aprendizaje para este diplomado online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.

Dirigido a
  • Profesionales que necesiten adquirir las competencias necesarias para construir aplicaciones de Big Data y Machine Learning usando las herramientas del ecosistema Python.
  • Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para interactuar y visualizar volúmenes grandes de datos
Prerrequisitos

Es obligatorio contar con conocimientos de programación, específicamente en lenguaje Python. Para cumplir con este requisito será necesario cumplir con una de estas alternativas:

 

-                 Acreditar por medio de algún certificado la realización previa de algún curso de Python, ya sea de pregrado, postgrado o capacitación. Ejemplos de cursos de capacitación:

-                 Aprobar una prueba de diagnóstico diseñada por el Jefe de Programa del diplomado. 

Objetivo de aprendizaje
  • Conocer la problemática de Big Data, las plataformas más importantes y las técnicas que permiten manejar esa data. Además, conocer las principales aplicaciones de Ciencia de Datos y Machine Learning.
  • Comprender e implementar los principales algoritmos de Machine Learning usando el lenguaje Python.
  • Presentar visualmente la data en forma efectiva.
Desglose de cursos

DESGLOSE DE CURSOS
Nombre del curso: Técnicas de Big Data para Machine Learning
Nombre en inglés: Big Data for Machine Learning  
Horas cronológicas: 27 hrs; Créditos: 5

Resultados de Aprendizaje

  • Entender la problemática y particularidades del manejo de Big Data.
  • Conocer los principios y bases técnicas del ecosistema Hadoop.
  • Conocer las principales herramientas del ecosistema Hadoop.
  • Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
  • Utilizar las principales herramientas del framework Spark. 

Contenidos:

  • Introducción a Big data.
  • El ecosistema Hadoop.
  • HDFS y YARN.
  • MapReduce.
  • Herramientas del ecosistema: Pig, Hive, HBase, Impala.
  • Fundamentos del ecosistema Spark.
  • RDDS en Spark.
  • Implementación de aplicaciones sobre Spark.
  • Spark SQL

Metolodogía de enseñanza y aprendizaje:
La metodología se presenta más adelante ya que para todos los cursos es la misma
Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.

Evaluación de los aprendizajes:

  • Tres pruebas on-line, todas de igual ponderación                                      (40% en total)
  • Tres actividades de aplicación, la tercera con doble ponderación          (60% en total) 

Nombre del curso: Python para Machine Learning
Nombre en inglés: Python for Machine Learning   
Horas cronológicas: 27 hrs; Créditos: 5

Resultados de Aprendizaje

  • Identificar, procesar y visualizar diferentes tipos de variables en una base de datos utilizando librerías de Python.
  • Diseñar e implementar modelos de aprendizaje supervisado basados en regresiones.
  • Comprender aspectos formales de modelos de aprendizaje supervisado tradicionales, experimentando y comparando su rendimiento.
  • Reconocer y emplear modelos de redes neuronales artificiales básicas.
  • Comprender, implementar e interpretar modelos de aprendizaje no supervisado a través de librerías de Python.

Contenidos:

  • Conceptos fundamentales de Machine Learning.
  • Análisis, procesamiento y visualización de datos a través de Python.
  • Algoritmos de aprendizaje supervisado en Python utilizando scikit-learn.
    • Regresión Lineal.
    • Regresión Logística.
    • Regresiones Polinomiales.
    • Regresiones con penalización.
    • Árboles de Decisión.
    • Random Forest.
    • Random Forest para regresiones.
    • Naive Bayes.
    • Vecino más cercano.
    • Redes Neuronales.
    • Selección de modelos
  • Algoritmos de aprendizaje no supervisado en Python utilizando scikit-learn.
    • K-means.
    • Mezcla de Gaussianas.
    • Cluster Jerárquico.
    • Autoencoders

Metolodogía de enseñanza y aprendizaje:
La metodología se presenta más adelante ya que para todos los cursos es la misma.

Evaluación de los aprendizajes:

  • Tres pruebas on-line, todas de igual ponderación                                      (40% en total)
  • Tres actividades de aplicación, la tercera con doble ponderación          (60% en total) 

Nombre del curso: Visualización de Información en la Era de Big Data
Nombre en inglés: Information Visualization in the era of Big Data   
Horas cronológicas: 27 hrs; Créditos: 5

Resultados de Aprendizaje

  • Analizar y evaluar visualizaciones de información existentes, así como proponer mejoras.
  • Identificar relaciones entre tipos de datos, tareas de visualización y tipos de gráficos para diseñar visualizaciones de información.
  • Diseñar e implementar en lenguaje Python gráficos simples y avanzados usando datasets tabulares.
  • Diseñar e implementar en lenguaje Python gráficos usando datasets de red.
  • Diseñar e implementar en lenguaje Python gráficos para visualizar datos de texto y espaciales.

    Contenidos:
  • Ejemplos históricos de Visualización de datos.
  • Conceptos fundamentales de visualización de información.
  • Funciones básicas de matplotlib y seaborn.
  • Modelo anidado de Munzner para diseño y validación de visualización.
  • Reglas y recomendaciones generales para visualizaciones efectivas.
  • Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado.
  • Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado.
  • Reducción de dimensionalidad.
  • Diseño e implementación de gráficos avanzados para datos de red usando modelo anidado.
  • Visualización básica de datos de texto.
  • Visualización básica de datos espaciales.

Metolodogía de enseñanza y aprendizaje:
La metodología se presenta más adelante ya que para todos los cursos es la misma.

Evaluación de los aprendizajes:

  • Tres pruebas on-line, todas de igual ponderación                                      (40% en total)
  • Tres actividades de aplicación, la tercera con doble ponderación          (60% en total) 

Nombre del curso: Aplicaciones de Machine Learning y Ciencia de Datos
Nombre en inglés: Machine Learning and Data Science Applications   
Horas cronológicas: 27 hrs; Créditos: 5

Resultados de Aprendizaje

  • Entender los principales conceptos y técnicas asociados a Machine Learnings y ciencia de datos.
  • Valorar aplicaciones de negocio según usen datos estructurados o no estructurados.
  • Asociar técnicas de ciencia de datos y Machine Learning con aplicaciones en los negocios.
  • Comprender las dificultades y oportunidades en casos de ciencia de datos.
  • Comprender las dificultades y oportunidades en casos de Machine Learning. 

Contenidos:

  • Analítica tradicional.
  • Analítica moderna.
  • Aplicaciones sobre datos estructurados.
  • Aplicaciones sobre datos no estructurados.
  • Técnicas de Ciencia de Datos y Machine Learning.
  • Técnicas básicas de Deep learning.
  • Aplicaciones de Ciencia de Datos y Machine Learning.
  • Aplicaciones de Deep learning.
  • Casos en Ciencia de Datos y Machine Learning.

Metolodogía de enseñanza y aprendizaje:
La metodología se presenta más adelante ya que para todos los cursos es la misma.

Evaluación de los aprendizajes:

  • Tres pruebas on-line, todas de igual ponderación                                      (40% en total)
  • Tres actividades de aplicación, la tercera con doble ponderación          (60% en total) 

Metolodogía de enseñanza y aprendizaje:
La modalidad de capacitación es e-learning asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos.

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor.

Nota: El orden de los cursos dependerá de la programación que realice la Dirección Académica.

BIBLIOGRAFÍA

  • Holmes, Alex, Hadoop in Practice 2nd Ed, Manning Pub 2014.
  • Luu, Hien, Beginning Apache Spark 2, Apress 2018.
  • Munzner, Tamara, Visualization and Fawcett, Tom, Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. O"Reilly Media, 2013.
  • Munzner, Tamara, Visualization Analysis and Design. A K Peters Visualization Series, CRC Press, 2014.
  • Kaldero, Nir, DataScience for Executives:Leveraging Machine Intelligence to Drive Business ROI. Lioncrest Publishing, 2018.
  • Kelleher, John, Mac Namee, Brian, Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies. The MIT Press, 2015.
  • Data Science from Scratch: First Principles with Python, Joel Grus, O´Reilly 2015.
  • Introduction to Machine Learning with Python, Andreas C. Müller & Sarah Guido, 2016.
  • Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, Wes McKinney, O"Reilly 2017.
  • Advanced Data Analytics Using Python,Sayan Mukhopadhyay, Apress, 2018.
  • Ward, Matthew, Grinstein, Georges and Keim, Daniel Interactive Data Visualization: Foundations, Techniques, and Applications, A K Peters Visualization Series, CRC Press, 2010.
Equipo Docente

JEFE DE PROGRAMA
Jaime Navón Cohen
Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.

EQUIPO DOCENTE
Ignacio Becker
Ph.D. candidate in Computer Science, Pontificia Universidad Católica de Chile. Licenciado en Astronomía, Pontificia Universidad Católica de Chile.

Patricio Cofré, MSc.  
Ingeniero Civil de industrias UC con con Mención en Tecnologías de la Información, Profesor Instructor Adjunto Departamento de Ciencia de la Computación - Escuela de Ingeniería UC, y Master of Engineering Management, Northwestern University. CEO at MetricArts, empresa consultora fundada el año 2007 y especializada en las áreas de Inteligencia de Negocios y Análisis de Negocios.

Fernando Florenzano
Estudiante de Magíster en el Departamento de Ciencia de la Computación, Escuela de Ingeniería, Pontificia Universidad Católica de Chile.

Jaime Navón Cohen
Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.

Denis Parra
Profesor Asistente UC; Ingeniero Civil en Informática, Universidad Austral de Chile; Doctor of Philosophy in Information Science, University of Pittsburgh, EE.UU.

Francisco Pérez
Ing. Civil Industrial, Magíster en Gestión de Operaciones U. de Talca.  Cursa el doctorado en Ciencias de Ingeniería en la PUC. Profesor part-time en la facultad de Ingeniería y en la Facultad de Economía de la U. de Talca.  Profesor asistente en las cátedras de Minería de Datos y Tópicos Avanzados de Inteligencia de Máquina en la PUC.

Hernán Valdivieso
Estudiante de Magíster en el Departamento de Ciencia de la Computación, Escuela de Ingeniería, Pontificia Universidad Católica de Chile.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de remplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa.

Requisitos de aprobación

La Nota final del diplomado se calculará de acuerdo a la siguiente ponderación de los cursos:

Curso: Técnicas de Big Data para Machine Learning                                   25%
Curso: Python para Machine Learning                                                           25%
Curso: Visualización de Información en la Era de Big Data                         25%
Curso: Aplicaciones de Machine Learning y Ciencia de Datos                  25%

Los alumnos deberán ser aprobados de acuerdo a los siguientes criterios:
a)              Calificación mínima de todos los cursos 4,0 en su promedio ponderado y
b)             75% de asistencia o cifra superior a las sesiones presenciales.
En el caso de los programas en modalidad en línea, los estudiantes tendrán que cumplir con la calificación mínima de 4.0 y con los requisitos establecidos para cada programa.
Para aprobar los programas de diplomados se requiere la aprobación de todos los cursos que lo conforman y en el caso que corresponda, de la evaluación final integrativa.
Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.
El alumno que no cumpla con una de estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación.

Proceso de Admisión

Las personas interesadas deberán enviar los documentos que se detallan más abajo al correo programas@ing.puc.cl.

  • Fotocopia Carnet de Identidad.
  • Fotocopia simple del Certificado de Título o del Título.
  • Curriculum Vitae actualizado.

-                 El postular no asegura el cupo, una vez aceptado en el programa, se debe cancelar o documentar el valor, para estar matriculado.
VACANTES: 50
“No se tramitarán postulaciones incompletas”.
El Programa se reserva el derecho de suspender la realización del curso si no cuenta con el mínimo de alumnos requeridos. En tal caso se devuelve a los alumnos matriculados la totalidad del dinero en un plazo aproximado de 10 días hábiles.
A las personas matriculadas que se retiren de la actividad antes de la fecha de inicio, se les devolverá el total pagado menos el 10% del total del arancel.

imagen
SOLICITAR MÁS INFORMACIÓN
POSTULA AQUÍ