Curso Técnicas de Big data para machine learning UC

Compartir en:

Acerca del programa:

El curso Técnicas de big data para machine learning entrega las principales técnicas que marcan el estado del arte y la agenda de investigación en el análisis de fuentes masivas de información, conocidas como el paradigma Big Data.

Curso en Técnicas de big data para machine learning UC

Dirigido a:

Profesionales que necesiten adquirir las competencias necesarias para construir aplicaciones de Big Data y Machine Learning usando las herramientas del ecosistema Hadoop y Apache Spark.
Interesados en el área de Ciencia de Datos que deseen adquirir habilidades para recolectar y analizar grandes volúmenes de datos.

Jefe de Programa

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Asociado del Departamento de Ciencia de la Computación, Pontificia Universidad Católica de Chile.

Equipo Docente

Gabriel Sepúlveda

Ingeniero Civil Electrónico, con Mención en Control Automático, Mención Complementaria Computadores, Universidad Técnica Federico Santa María. Candidato a Doctor en Ciencias de la Ingeniería en el área de Ciencias de la Computación, Pontificia Universidad Católica de Chile. Profesor Instructor, Departamento de Ciencia de la Computación, Escuela de Ingeniería, Pontificia Universidad Católica de Chile.

Iván Lillo

Doctor en Ciencias de la Ingeniería, Pontificia Universidad Católica de Chile. Magíster en Ciencias de la Ingeniería, Pontificia Universidad Católica de Chile. Ingeniero Civil Electricista, Pontificia Universidad Católica de Chile. Profesor Instructor, Departamento de Ciencia de la Computación, Escuela de Ingeniería, Pontificia Universidad Católica de Chile.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de remplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.

Descripción

Grandes repositorios de datos han comenzado a surgir en diversos ámbitos de nuestra sociedad. Estos corresponden a fuentes de información masiva, diversa y distribuida, cuyo análisis efectivo ofrece la oportunidad de obtener valiosa información en distintos ámbitos del quehacer social. Sin embargo, esta gran oportunidad presenta también grandes desafíos debido a la incapacidad de las aplicaciones tradicionales para el manejo de grandes volúmenes de datos.

El presente curso está diseñado para abordar la problemática de Big Data desde la perspectiva del uso de herramientas de manipulación de grandes cantidades de datos y en la aplicación de técnicas de Machine Learning y sistemas computacionales de alto rendimiento sobre grandes fuentes de datos distribuidos.

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y el profesor-tutor a través de los recursos tecnológicos proporcionados por la plataforma educativa virtual destinada para el curso.

Requisitos de Ingreso

Se recomienda contar con conocimientos básicos de programación y de comodidad en manejo de terminal (consola). Para Apache Spark, se enfocará el curso específicamente en lenguaje Python. En particular, debe ser capaz de utilizar controles de flujo, distintos tipos de datos y funciones, y diccionarios con Python.

Si desea evaluar su nivel de Python, puede realizar una prueba opcional gratuita en este link: https://www.hackerrank.com/prueba-python. Se recomienda iniciar los test en orden, ya que van creciendo en dificultad. Los dos últimos tienen un nivel superior al requerido para ingresar al diplomado, y han sido instalados allí sólo como desafío. Si uno de los test falló, se recomienda revisar y ejercitar esos contenidos antes del inicio del programa.

A continuación, ponemos a su disposición algunos cursos optativos por si desea prepararse previamente al inicio del programa:

MOOC “Introducción a la Programación en Python I: Aprendiendo a programar con Python”, disponible en el siguiente link: https://www.coursera.org/learn/aprendiendo-programar-python.
Curso “Herramientas de programación en Python para procesamiento de datos”, disponible en el siguiente link: https://teleduc.uc.cl/curso/herramientas-programacion-python-procesamiento-datos/.

Objetivos de Aprendizaje

Resultado de Aprendizaje General

Aplicar técnicas de Machine Learning que puedan escalar al caso de grandes fuentes de datos distribuidos.

Resultados del Aprendizaje

Identificar la problemática y particularidades del manejo de grandes volúmenes de dato en diferentes contextos.
Distinguir los principios, bases técnicas y herramientas del ecosistema Hadoop.
Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
Reconocer el esquema de trabajo Apache Spark para el procesamiento de datos de propósito general.
Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
Aplicar herramientas de visualización para facilitar la interpretación de resultados.

Metodología

Cada curso está organizado en 6 clases online, una clase en vivo y cuatro ayudantías, transmitidas vía streaming, realizadas por nuestros destacados académicos o tutores. En estas clases podrás interactuar, realizar preguntas y comentar a tus compañeros de clase.

Estrategias metodológicas

Aprendizaje autónomo asincrónico estructurado en 6 módulos
Clases expositivas
Foros
Estudio de caso

Desglose de cursos

Contenidos:

Ecosistema Hadoop
- Introducción a Big Data
- Instalación de herramientas Hadoop
Herramientas de Ecosistema Hadoop
- Hadoop MapReduce
- Apache Hive
- Apache Pig
Apache Spark
- Programación en Apache Spark
Data Analytics con Apache Spark
- Apache Flume
- Spark Streaming
- Spark SQL
Machine Learning con Apache Spark
- Spark MLLIB: Algoritmos supervisados
- Spark MLLIB: Algoritmos no supervisados
Técnicas de visualización
- Reducción de dimensionalidad

Evaluación

3 controles individuales – 40%
3 mini proyectos individuales – 60%

Requisitos Aprobación

Los alumnos deberán ser aprobados de acuerdo los criterios que establezca la unidad académica:

Calificación mínima de todos los cursos 4.0 en su promedio ponderado.

El alumno que no cumpla con estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación.

Los resultados de las evaluaciones serán expresados en notas, en escala de 1,0 a 7,0 con un decimal, sin perjuicio que la Unidad pueda aplicar otra escala adicional.

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:

Currículum vitae actualizado.

Cualquier información adicional o inquietud podrás escribir al correo programas.ing@uc.cl

INFORMACIÓN RELEVANTE

Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo.

El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.

No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula

Fecha de inicio:

28 julio 2026

Valor:

$575.000

639 USD

* Valor incluye matrícula

Hasta 3 cuotas sin interés. Pagarías $191.667 al mes

Postula aquí

Fecha de inicio: 28-07-2026

Valor: $575.000

Inscripción con pago por empresas

Para pagos en moneda nacional, tenemos la posibilidad de que pagues con 2 o más tarjetas o que combines pago con transferencia y tarjeta

Fechas

28 julio 2026 al 22 septiembre 2026
Duración

75 Horas totales

35 Horas directas

40 Horas indirectas
Horario

Online (6 clases online +1 clase en vivo + 4 ayudantías)
Unidad que dicta el programa

Escuela de Ingeniería
Tipo

Curso
Modalidad

Online - Mixta
Lugar de realización

Plataforma

Al finalizar este programa, recibirás una insignia digital que podrás incorporar en tu CV o RRSS.

La insignia correspondiente podrá variar en color y texto según el programa académico. Su entrega aplicará únicamente para programas cursados y aprobados a partir del 1 de enero de 2024.

*La emisión de la insignia se realiza en un período de 45 a 60 días hábiles después de la finalización y aprobación del programa.

Big Data
Análisis y procesamiento de Datos
Machine Learning
Visualización de datos

Este programa requiere de un número mínimo de matriculados para poder dictarse y, por motivos de fuerza mayor, podría experimentar cambios en su programación, equipo docente y/o formato de realización. Cualquier cambio será informado por la coordinación a cargo.

Consulta y revisa aquí información importante sobre retiro, devolución, reglamento y otros.

Información de pago

Formas de pago

Forma de pago Chile:

- Web pay: Tarjeta de crédito hasta 3 cuotas sin interés y Tarjeta de débito-redcompra en 1 cuota
- Transferencia Bancaria:

Formas de pago extranjero:

- Tarjetas de créditos a través de webpay
- Transferencia Bancaria
- Paypal

Formas de pago por empresas:

- Con ficha de inscripción y Orden de compra

SENCE:

Técnicas de big data para machine learning

Estudia en la Universidad N°1 de Latinoamérica (QS Ranking Latam 2026)