Acerca del programa:
Comprende el manejo de grandes volúmenes de datos para obtener información valiosa que permita agilizar la toma de decisiones.

Dirigido a:
El real mejoramiento de la eficiencia organizacional está relacionado con la implementación de soluciones tecnológicas que permiten agilizar la toma de decisiones en base a información cuantitativa y cualitativa relevante en tiempo real. Dicha información proviene de una adecuada administración de grandes volúmenes de datos por minuto, que demandan extensos y rigurosos análisis junto con métricas e indicadores cada vez más exactos. El análisis de grandes volúmenes de datos permite extraer tendencias y patrones complejos de información, con enormes implicancias estratégicas, permitiendo predecir mejor y transformando la forma en la que se hacen hoy en día los negocios. Este curso permite al alumno escoger las herramientas adecuadas para manejo de los datos en su empresa, entendiendo las infraestructuras computacionales que se requieren para manejar datos de distintos volúmenes y características.
La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.
Jefe de Programa

Cristián Paris Ibarra
Equipo Docente
keyboard_arrow_downJEFE DE PROGRAMA Y EQUIPO DOCENTE
CRISTIAN PARIS
Máster en Gestión de Emprendimientos Tecnológicos, Universidad Adolfo Ibáñez. Ingeniero Civil de Industrias, Diploma en Ingeniería Matemática, UC. Actualmente es Subdirector del Instituto de Ingeniería Matemática y Computacional UC. Anteriormente fue Project Manager, Ingeniero de Desarrollo de Negocios e Ingeniero de I+D en la Fundación Inria Chile. Cuenta con experiencia en el desarrollo de modelos matemáticos avanzados de análisis estocástico para simulaciones de dinámica de fluidos computacional con aplicaciones en parques eólicos.
* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.
Descripción
keyboard_arrow_downComprende el manejo de grandes volúmenes de datos para obtener información valiosa que permita agilizar la toma de decisiones.
Requisitos de Ingreso
keyboard_arrow_down- Se recomienda poseer título profesional universitario o técnico, licenciatura o egreso de instituto profesional.
- Se recomienda dominio básico de Excel y manejo de internet a nivel usuario.
Objetivos de Aprendizaje
keyboard_arrow_down- Conocer las herramientas necesarias para transformar una empresa tradicional a una empresa que maneja datos de distinta complejidad.
- Analizar las distintas fuentes de los datos, e identificar las mejores infraestructuras computacionales para su manejo.
- Utilizar herramientas clásicas de manejo de los datos en el contexto de una organización.
Metodología
keyboard_arrow_down3 Foros de Discusión
1 Clase Sincrónica
Desglose de cursos
keyboard_arrow_downHoras cronológicas: 75 horas (35 horas directas)
Créditos: 5 cr
Resultados del Aprendizaje
Al finalizar este curso los/las estudiantes debieran ser capaces de:
- Modelar datos usando herramientas de bases de datos relacionales (SQL), bases de datos NoSQL y bases de datos distribuidas.
- Estimar la necesidad de cambiar la infraestructura de los datos desde un modelo clásico centralizado (tipo SQL) a un modelo de Big Data distribuido.
- Identificar las herramientas de manejo de datos adecuadas para el contexto de su empresa.
Contenidos:
- Bases de datos relacionales
- Diversas fuentes de datos (Excel, CSV, texto plano, páginas web,)
- Organización clásica de los datos: Bases de datos relacionales
- Lenguaje SQL
- Propiedades de una base de datos relacional: ACID
- Integración de los datos
- Bases de datos distribuidas
- Paso al mundo de Big Data (limitaciones de una base de datos relacional)
- Un sistema distribuido
- Propiedades de sistemas distribuidos: CAP y BASE
- Limitaciones de sistemas distribuidos: ACID vs CAP
- Resolución de fallas en un sistema distribuido usando el consenso distribuido
- Bases de datos NoSQL
- Características de sistemas NoSQL
- Bases de datos de búsqueda: Amazon Dynamo
- Bases de datos de documentos: MongoDB
- Bases de datos de grafos: Neo4J
- Procesamiento masivo de datos
- Distribución de los datos (Google distributed File System)
- Map-reduce
- Infraestructura de Apache Hadoop
- Apache Pig: lenguaje de scripting para Hadoop
Metodología de enseñanza y aprendizaje:
En cada curso se desplegarán semanalmente las clases, contenidos, actividades y evaluaciones. Las clases se estructuran bajo una lógica de diseño instruccional centrada en el estudiante, que contribuye a la motivación y facilita su aprendizaje. Se busca que estén siempre presente tres elementos: contenido, evaluación y reflexión. El componente de reflexión es clave para generar comunidades de aprendizaje activas que permitan compartir experiencias.
En el caso del contenido, este se organiza a través de recursos interactivos que integran videos, esquemas, artículos, lecturas complementarias y preguntas formativas, todos dispuestos para facilitar el aprendizaje de los estudiantes.
En cuanto a las estrategias de evaluación, estas se organizan en cuestionarios con preguntas de opción múltiple, cuyo propósito es medir el nivel de aprendizaje logrado en cada una de las clases. Complementariamente, se dispone de foros en donde se evaluará tanto la participación como la calidad de dicha participación, brindando de esta forma al estudiante la oportunidad de intercambiar y fundamentar sus opiniones respecto a temas de actualidad asociados al contenido. Finalmente, el curso contempla la entrega de un trabajo, el que debe ser desarrollado a lo largo del curso, en donde se espera que el estudiante tenga la oportunidad de aplicar los conocimientos adquiridos y un examen final.
Cada curso cuenta con tutores de contenidos cuya función es dar respuesta a todas las preguntas sobre la materia tratada, ya sea directamente, o bien, sirviendo de puente con el profesor responsable del curso.
Cada curso además cuenta con una clase en vivo donde los alumnos podrán reforzar y resolver dudas. La asistencia a dicha clase es obligatoria y los alumnos podrán participar mediante streaming o asistiendo presencialmente en los lugares y horarios de realización que defina la Clase Ejecutiva.
Para consultas técnicas (soporte técnico) o administrativas (coordinación asuntos estudiantiles) los alumnos pueden contactarse con la clase ejecutiva escribiendo mediante el formulario de “contacto Coordinación” dispuesto en el curso, el email alumnosuc@claseejecutiva.cl o llamando al número (+562) 2840 0821 en horario hábil (lunes a viernes de 9:00 a 18:00).
Evaluación de los Aprendizajes:
- Controles: (15%).
- Foros de discusión: (20%).
- Trabajo grupal: (25%).
- Test on-line o presencial:(40%).
BIBLIOGRAFÍA
- Hogan, A., Procesamiento masivo de datos, http://aidanhogan.com/teaching/cc5212-1-2019/, 2019.
- Ramakrishnan, R., Gehrke, J., Database Management Systems, 3rd edition, McGraw-Hill, 2002.
- Bradshaw, S., Chodorow, K., MogoDB: The Definitive Guide, 3rd edition, O’Reilly Media, 2019.
- Robinson, I., Webber, J., Eifrem, E., Graph Databases: New Opportunities for Connected Data, 2nd edition, O’Reilly Media, 2015.
- The Apache Foundation, Apache Hadoop, http://hadoop.apache.org/, 2019.
- Ghemawat, S., Gobioff, H., Leung, S., The Google file system. Symposium on Operating Systems Principles (SOSP) 2003: 29-43, 2003.
- Dean, J., Ghemawat, S., MapReduce: Simplified Data Processing on Large Clusters. Operating Systems Design and Implementation (OSDI) 2004: 137-150, 2004
Requisitos Aprobación
keyboard_arrow_downLos alumnos deberán ser aprobados de acuerdo los criterios que establezca la unidad académica:
- Calificación mínima de 4.0 en su promedio ponderado y
- Realizar todas las actividades del curso
*En caso de que un alumno repruebe un curso perteneciente a un diplomado, en Educación Profesional Ingeniería UC ofrecemos la oportunidad de realizar un nuevo intento. Para ejercer este derecho, el alumno deberá pagar un valor de 3 UF por curso, e indicar la fecha de la versión en la que desea matricularse. La gestión debe realizarse dentro de un máximo de 2 años a contar de la fecha de inicio del diplomado original, y es factible para un máximo de 2 cursos por diplomado.
Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.
El alumno que no cumpla con una de estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación.
Proceso de Admisión
keyboard_arrow_downLas personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:
- Fotocopia Carnet de Identidad.
Cualquier información adicional o inquietud podrás escribir al correo programas@ing.puc.cl.
VACANTES: 40
INFORMACIÓN RELEVANTE
Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo.
- El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
- No se tramitarán postulaciones incompletas.
Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula