Diplomado en Big Data y Cloud Computing

Estudia en la Universidad Nº 1 de Latinoamérica | Pontificia Universidad Católica de Chile

Acerca del programa:

¿Quieres aprovechar al máximo las oportunidades que la era digital tiene para ofrecerte? ¡Este diplomado es lo que necesitas! Consta de dos cursos que cubren las temáticas tradicionales de Big Data y Machine Learning, y otros dos cursos que se centran en el nuevo escenario de la nube y cómo aprovecharlo para proyectos de Ciencia de Datos y Machine Learning.

Después de completar el programa podrás extraer el máximo valor de los datos disponibles, desarrollando aplicaciones avanzadas que utilicen técnicas de minería de datos y aprendizaje automático. Podrás trabajar con servicios en la nube, lo que significa que implementarás tus soluciones de manera eficiente y efectiva.

Diplomado UC en Big Data y Cloud Computing

Dirigido a:

Profesionales, especialmente del área tecnológica, que estén involucrados o planeen participar en proyectos de Big Data y Machine Learning de sus organizaciones, con el interés de ampliar sus herramientas e incorporar las soluciones basadas en la nube, con ventajas tanto desde el punto de vista técnico como económico.


Jefe de Programa

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.
linkedin

Equipo Docente

keyboard_arrow_down

Mauricio Arriagada Benítez

Doctor en Ciencia de la Ingeniería, UC, Master en Ciencias de la Ingeniería de la Pontificia Universidad Católica de Chile, Ingeniero Civil en Computación e Informática, Universidad de Tarapacá, Chile. Master in Computer Science, University of Northern Iowa – USA. Master en Ingeniería de Software, Universidad de Tarapacá – Chile. 

Gabriel Sepúlveda

Ingeniero Civil Electrónico, con Mención en Control Automático, Mención Complementaria Computadores, Universidad Técnica Federico Santa María. Candidato a Doctor en Ciencias de la Ingeniería en el área de Ciencias de la Computación, UC. Profesor Instructor, Departamento de Ciencia de la Computación, Escuela de Ingeniería, UC. 

Iván Lillo

Doctor en Ciencias de la Ingeniería, UC. Magíster en Ciencias de la Ingeniería, UC. Ingeniero Civil Electricista, UC. Profesor Instructor, Departamento de Ciencia de la Computación, Escuela de Ingeniería, UC. 

Mauricio Gamboa

Consultor en Diseño, Desarrollo e Implementación de Aplicaciones en Entornos Microsoft. La Salle Campus Madrid. Ingeniería en Informática, Analista Programador, INACAP. Microsoft MVP Business Applications. MCSE: Data Management and Analytics - Certified 2019. MCSA: SQL 2016. Business Intelligence Development - Certified 2019. Microsoft Certified Solutions Developer: Web Applications. 

Stefanni Cavaletto

Ingeniería Matemática U. Santiago de Chile. Postítulo de Inteligencia de Negocios, Universidad de Chile. MSc Artificial Intelligence UAI. Actualmente es Senior Customer Engineer (ML & AI) en Google. Su línea de investigación es la ciencia de datos. Ha trabajado en diversas industrias en sus 8 años de experiencia, tales como Microsoft, Banca, Telecomunicaciones, Retail y Salud. Es miembro activo de 2 organizaciones sin fines de lucro, «Analytics & Python» y «R-Ladies», las cuales buscan fomentar el uso de herramientas y técnicas para todas las personas, en particular R-Ladies además busca disminuir la brecha de género en este rubro técnico donde la participación de mujeres no es tan equilibrada. 

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.

Descripción

La disponibilidad de servicios de cómputo y almacenamiento de datos en la nube ha ocasionado profundos cambios en la forma en que se diseñan los sistemas, capaces de incorporar "inteligencia" a través del uso de técnicas de Machine Learning (ML) sobre volúmenes muy grandes de datos (Big Data). Tradicionalmente, el construir este tipo de soluciones requería, por una parte, de hardware costoso y difícil de dimensionar a priori, y, por otra parte, de expertos en ingeniería de datos capaces de implementarlos. Gracias a la oferta de servicios cognitivos y de Big Data en la nube, totalmente administrados, la barrera ha disminuido muy significativamente. Por un lado, se reduce la necesidad de expertise y por otro, la elasticidad inherente de las soluciones en la nube permite partir pequeño e ir creciendo solo en la medida que se requiera.

Este programa incluye dos cursos que abordan las temáticas tradicionales de Big Data y Machine Learning y otros dos cursos que abordan este nuevo escenario de la nube, especialmente en cuanto a oportunidades para proyectos de Ciencia de Datos y Machine Learning.

Al finalizar diplomado el estudiante será capaz de sacar el máximo valor de los datos disponibles desarrollando aplicaciones que usen técnicas de minería de datos y aprendizaje de máquina que estén enteramente basadas en servicios en la nube.

El formato de estudio es 100% en línea y se estructura sobre técnicas metodológicas activas, mediante las cuales el participante puede interactuar con sus pares y tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual. Se contempla el ejercicio práctico de los conocimientos adquiridos a través de mini proyectos de aplicación.

Requisitos de Ingreso

A responsabilidad del estudiante, se sugiere contar con:

  • Grado de Licenciatura en Computación o en Tecnologías de Información, Ingenieros Civiles o de Ejecución en Computación o equivalente o bien un grado de licenciatura en otras carreras que incluyan competencias de programación a nivel intermedio
  • Se recomienda conocimiento en sistema operativo Windows y la disponibilidad de un PC con una versión de este sistema operativo actualizado.

Objetivos de Aprendizaje

  1. Identificar el alcance de las herramientas y servicios disponibles en la nube que pueden ser utilizados para desarrollar soluciones basadas en Big Data y Machine Learning.
  2. Desarrollar aplicaciones que incorporen aprendizaje de máquina utilizando las herramientas y servicios cognitivos disponibles en la nube.

Desglose de cursos


Curso 1: Introducción a minería de datos y Machine Learning

Nombre en Inglés: Introduction to Data Mining and Machine Learning

Horas Cronológicas: 75

Créditos: 5 

Descripción del curso

El curso comienza con la problemática de obtención, preparación y limpieza de los datos para pasar luego a las técnicas y algoritmos asociados a la minería de datos para clasificación, clustering, etc. además de algoritmos, técnicas y herramientas de machine learning. 

Los alumnos de en este curso aprenderán los conceptos fundamentales asociados a Minería de Datos, entendiendo cuáles son las diferentes fuentes de información a utilizar, revisar un pre procesamiento de datos, y posteriormente entender y aplicar las diferentes técnicas de extracción de conocimiento de datos utilizando reglas de asociación, árboles de decisión, métodos de regresión, algoritmos de clasificación, evaluación de clasificadores y una introducción al aprendizaje de máquina. 

El enfoque del curso es de tipo práctico, con oportunidades de aplicar los conocimientos en proyectos y casos concretos. Se entregan herramientas de extracción y análisis de información para que una organización pueda generar valor desde los datos para mejorar su posición competitiva. 

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso. 

Resultados del Aprendizaje

  1. Conocer y comprender las principales teorías y prácticas de la emergente área de Minería de Datos.
  2. Aplicar reglas de asociación para encontrar relaciones en un set de transacciones.
  3. Desarrollar soluciones a problemas reales de Big Data y ciencia de datos que involucren la necesidad de técnicas de Minería de Datos como árboles de decisión y clustering.
  4. Implementar soluciones usando herramientas de software de Minería de Datos aplicándolas en datos reales. 

Contenidos

  • Conceptos fundamentales de minería de datos.
  • Preparación de datos y reducción de información.
  • Reglas de asociación.
  • Algoritmos de clasificación.
  • Algoritmos de Clustering y medidas de similaridad.
  • Selección de modelos e introducción a Machine Learning. 

Metodología de enseñanza y aprendizaje

La modalidad de capacitación es e-learning asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación. 

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos. 

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor. 

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar. 

Evaluación de los Aprendizajes

  • Tres pruebas individuales on-line de igual ponderación :(40% en total)
  • Tres actividades grupales de aplicación : (60% en total)


Curso 2: Técnicas de Big Data para Machine Learning

Nombre en Inglés: Big Data Techniques for Machine Learning

Horas Cronológicas: 75

Creditos: 5 

Descripción del curso

El presente curso está diseñado para abordar la problemática de Big Data desde la perspectiva de uso de herramientas de manipulación de grandes cantidades de datos, y en la aplicación de técnicas de Machine Learning y sistemas computacionales de alto rendimiento sobre grandes fuentes de datos distribuidos. 

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso. 

Resultados del Aprendizaje

  1. Entender la problemática y particularidades del manejo de Big Data.
  2. Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
  3. Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
  4. Aplicar herramientas de visualización para facilitar la interpretación de resultados. 

Contenidos

  • Conceptos fundamentales de Minería de Datos.
  • Introducción a Big data.
  • El ecosistema Hadoop.
  • HDFS, YARN.
  • Hadoop MapReduce.
  • Herramientas del ecosistema Hadoop.
  • Fundamentos de Apache Spark.
  • Implementación de aplicaciones sobre Spark.
  • Spark SQL.
  • Spark MLlib.
  • Técnicas de visualización. 

Metodología de enseñanza y aprendizaje

La modalidad de capacitación es e-learning asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación. 

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos. 

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor. 

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar. 

Evaluación de los Aprendizajes

  • Tres pruebas individuales on-line de igual ponderación:(40% en total)
  • Tres actividades grupales de aplicación :(60% en total)


Curso 3: Introducción al Cloud Computing

Nombre en Inglés: Introducction to Cloud Computing

Horas Cronológicas: 75

Créditos: 5 

Descripción del curso

En este curso el estudiante analizará los conceptos fundamentales asociados a computación en la nube, tipo de servicios, forma de entrega de los servicios, elección de un proveedor, la seguridad y la gobernanza, etc. Realizará un trabajo práctico consistente en hacer algunas tareas simples como instalar un servidor o recursos de almacenamiento masivo usando alguno de los proveedores más conocidos.

Resultados del Aprendizaje

  1. Identificar las principales categorías disponibles en las grandes plataformas de computación en la nube.
  2. Discutir ventajas y riesgos de una solución tecnológica genérica basada en computación en la nube.
  3. Describir las principales tecnologías habilitantes relacionadas con computación en la nube.
  4. Utilizar servicios básicos de cómputo y almacenamiento en la nube

Contenidos

  • Introducción: Qué es Cloud Computing, características principales, tipos de servicio, tipos de nube
  • Tecnologías habilitantes (máquinas virtuales, arquitecturas orientadas a servicio, etc.)
  • Virtualización
  • Principales plataformas de servicios en la nube: Amazon AWS, Google Cloud, Microsoft Azure
  • Tipos de servicios en la nube: desde el fierro virtual a los servicios cognitivos
  • Tipos de Almacenamiento en la nube
  • Aspectos de seguridad

 Metodología de enseñanza y aprendizaje

La modalidad de capacitación es e-learning asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación.

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos. 

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor. 

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar. 

Evaluación de los aprendizajes

  • Tres pruebas individuales on-line de igual ponderación: (40% en total)
  • Tres actividades grupales de aplicación:(60% en total)


Curso 4: Servicios Cloud para ciencia de datos y Machine Learning

Nombre en Inglés: Cloud Services for Data Science and Machine Learning

Horas Cronológicas: 75

Créditos: 5 

Descripción del curso

Hasta hace poco tiempo un proyecto de inteligencia artificial requería el poder disponer de máquinas muy potentes (clusters de máquinas con GPU's) y complejas infraestructuras para manejar los datos en un contexto de Big Data. Gracias a los servicios totalmente administrados que ofrecen los principales proveedores de servicios Cloud, cualquier persona, empresa u organización puede armar un proyecto incluso sin tener un ingeniero de datos a disposición. Es posible incluso acceder a modelos de reconocimiento de imágenes o video ya entrenados y listos para ser utilizados.

El estudiante aprenderá algunos de los principales servicios totalmente administrados desde la nube que le permitirán armar una solución que incorpore inteligencia artificial sin necesidad de contar ni con infraestructura propia ni con capacidades propias de ingeniería de datos. Se realizarán miniproyectos que permitirán experimentar con algunas de las herramientas disponibles desde dos de los principales proveedores de servicios Cloud: Azure y GCP. 

Resultados del Aprendizaje

  1. Identificar las soluciones tecnológicas disponibles en los principales proveedores de Cloud que incorporan aprendizaje de máquina.
  2. Desarrollar aplicaciones de Machine Learning usando servicios de Azure y de GCP
  3. Construir aplicaciones que incorporen los servicios cognitivos de imágenes, texto o voz disponibles en las grandes plataformas de servicios Cloud

Contenidos

  • Introducción a Big data y ML
  • Modelos de Regresión y Clasificación
  • Preparación de Datos, el pipeline de datos
  • Manejo de Big Data en la nube
  • Servicios para ML en Azure
  • Azure machine learning studio
  • ML automatizado (Azure AML)
  • Servicios cognitivos en Azure
  • AutoML en GCP
  • Introducción a Vertex AI en GCP
  • Servicios cognitivos en GCP

Metodología de enseñanza y aprendizaje

La modalidad de capacitación es e-learning asincrónica, por lo que los participantes accederán a una plataforma educativa virtual (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. No obstante, el proceso de enseñanza-aprendizaje se acompañará con un tutor, quien tendrá un rol de mediador y facilitador, ofreciendo apoyo a los participantes en aspectos técnicos y también administrativos durante la actividad de capacitación. 

Respecto a las estrategias de enseñanza - aprendizaje, se utilizarán videoclases, screencast y clases interactivas para la presentación de contenidos y actividades de aplicación que serán desarrolladas a partir de cuestionarios y tareas, dirigidas a que los participantes resuelvan problemas/situaciones aplicando los conocimientos aprendidos y comprobar la comprensión de los contenidos a través de test automáticos. 

Los participantes también contarán con foros abiertos de consulta, como apoyo a su proceso de aprendizaje, donde podrán interactuar con sus pares y tutor. 

Al inicio de cada curso se contará con una clase sincrónica en formato streaming, en que el jefe de programa o un profesor del programa, introducirán a los alumnos en las materias a abordar. 

Evaluación de los Aprendizajes

  • Tres pruebas individuales on-line de igual ponderación: (40% en total)
  • Tres actividades grupales de aplicación: (60% en total)

Requisitos Aprobación

La nota final del diplomado se calculará de acuerdo a la siguiente ponderación de los cursos:  

  • Curso 1: Introducción a la Minería de Datos y Machine Learning – 25%
  • Curso 2: Técnicas de Big Data para Machine Learning – 25%          
  • Curso 3: Introducción al Cloud Computing – 25%                 
  • Curso 4: Servicios Cloud para ciencia de datos y Machine Learning – 25% 

Los alumnos deberán ser aprobados de acuerdo a los siguientes criterios:

Calificación mínima de 4.0 en cada uno de los cursos. 

Para aprobar los programas de diplomados se requiere la aprobación de todos los cursos que lo conforman. 

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.

El alumno que no cumpla con una de estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación. 

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo: 

  • Fotocopia Carnet de Identidad.
  • Fotocopia simple del Certificado de Título
  • Curriculum Vitae actualizado.

El postulante será contactado, para asistir a una entrevista personal (si corresponde) con el Jefe de Programa del Diplomado o su Coordinadora Académica. Cualquier información adicional o inquietud podrás escribir al correo programas@ing.puc.cl

VACANTES: 40

INFORMACIONES RELEVANTES

Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo. 

  • El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
  • No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula


¿Te parece interesante este programa?

No