Diplomado en Big data para la toma de decisiones

Estudia en la Universidad Nº 1 de Latinoamérica | Pontificia Universidad Católica de Chile

Acerca del programa:

Conocimientos y herramientas para aprovechar los grandes volúmenes de datos que se generan en una organización, logrando información valiosa para la toma de decisiones estratégicas.

El Big Data permite extraer tendencias y patrones complejos de información, permitiendo predecir mejor y transformar la forma en la que se hacen hoy en día los negocios.

La metodología online consiste en herramientas activas, donde el participante puede interactuar con sus pares y profesor-tutor, a través de los recursos tecnológicos que provee la plataforma educativa virtual.

Diplomado en Big data para la toma de decisiones

Dirigido a:

El diplomado está dirigido a profesionales, ejecutivos o emprendedores que requieran tomar decisiones eficaces de gestión basado en los beneficios del uso de tecnologías relacionadas a Big Data y con esto puedan incrementar significativamente las ventajas competitivas en la agilidad de su organización, área funcional o emprendimiento que tengan en curso. Así también, el diplomado está dirigido a los profesionales que requieran conocer los fundamentos de Big-Data para liderar proyectos de gestión que tengan como base el uso cuantitativo de información para así lograr tener una mejor precisión e impacto en la toma de decisiones de la empresa.


Jefe de Programa

Cristián Paris Ibarra

Máster en Gestión de Emprendimientos Tecnológicos, Universidad Adolfo Ibáñez. Ingeniero Civil de Industrias, Diploma en Ingeniería Matemática, UC. Actualmente es Subdirector del Instituto de Ingeniería Matemática y Computacional UC. Anteriormente fue Project Manager, Ingeniero de Desarrollo de Negocios e Ingeniero de I+D en la Fundación Inria Chile. Cuenta con experiencia en el desarrollo de modelos matemáticos avanzados de análisis estocástico para simulaciones de dinámica de fluidos computacional con aplicaciones en parques eólicos.

Equipo Docente

keyboard_arrow_down

ALEJANDRO JARA

Ph.D. en Matemáticas de la Universidad Católica de Leuven, Bélgica. Profesor Asociado del Departamento de Estadísticas de la UC.

CLAUDIO MORCHÓN

Master en Ingeniería Matemática, especialidad en Ciencias y Técnicas Estadísticas e Investigación Operativa, Universidad Carlos III de Madrid. Contador Público y Master en Finanzas, Universidad de San Andrés.

RICARDO VEGA

Diseñador y artista, MFA Technology (Parsons, The New School, Nueva York). Profesor de la Escuela de Diseño de la Universidad Católica. Trabaja en temas relativos a la visualización de información, programación aplicada en el diseño y el arte, con especial énfasis en las implicancias sociales y culturales de la tecnología.

DOMAGOJ VRGOC

Profesor Asistente del Instituto de Ingeniería Matemática y Computacional de la Pontificia Universidad Católica. Doctor en Computación de la Universidad de Edimburgo, Reino Unido. Sus áreas de interés son manejo de datos, la Web Semántica y Teoría de Computación. Su tesis de doctorado fue destacada por la British Computing Society como una de las mejores de su generación. Es autor de más de 30 papers técnicos y ha sido parte de los comités de programas de las conferencias más importantes en bases de datos, la Web, e Inteligencia Artificial, como ACM PODS, ICDT, WWW, ISWC, IJCAI, entre otros.

Descripción

El real mejoramiento de la eficiencia organizacional está relacionado con la implementación de soluciones tecnológicas que permitan agilizar la toma de decisiones en base a información cuantitativa y cualitativa relevante en tiempo real. El uso eficiente de dicha información requiere de una adecuada administración de grandes volúmenes de datos por minuto, que demandan extensos y rigurosos análisis junto con métricas e indicadores cada vez más exactos. El análisis de grandes volúmenes de datos permite extraer tendencias y patrones complejos de información, con enormes implicancias estratégicas, permitiendo predecir mejor y transformando la forma en la que se hacen hoy en día los negocios.

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el diplomado.

Requisitos de Ingreso

  • Se recomienda poseer un título profesional universitario o técnico, licenciatura o egreso de instituto profesional.
  • Se recomienda dominio básico de Excel y manejo de internet a nivel usuario y conocimientos básicos de estadística.

Objetivos de Aprendizaje

  1. Explicar los fundamentos, principios y últimas tendencias en plataformas computacionales relacionadas a Big Data.
  2. Reconocer las aplicaciones y herramientas analíticas de ciencias de datos y estadística para la predicción, optimización y visualización de información.
  3. Formular y evaluar proyectos de aplicación de Big Data en una organización


Metodología

La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual Moodle (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje.

En cada clase se utilizan métodos de Enseñanza–Aprendizaje complementarios: 1) desarrollo expositivo de contenido, donde se aprovecha la experiencia del experto disciplinar a través de los recursos interactivos. Los contenidos del curso se presentan en formato RISE los cuales integran vídeos, animaciones y cuestionarios formativos que fomentan una mayor interacción del participante, además de contar con un archivo descargable en pdf con el contenido de dicha clase para lectura. 2) desarrollo de reflexión por parte del participante, a través del análisis de casos y actividades de aplicación retroalimentados por el Relator y 3) de Formulación de Proyectos mediante la realización de un Trabajo final de aplicación pertinente al contexto laboral.

 

Adicionalmente, se realizan dos clases en vivo a través de la plataforma Zoom, cuya grabación queda alojada en la plataforma, cuyo objetivo es profundizar en los contenidos y resolver consultas de los participantes.

Como actividades de evaluación, en cada clase el participante debe: 1) Realizar un Control para comprobar los aprendizajes de cada clase y 2) Aplicar los contenidos aprendidos a través del análisis de casos en un foro de interacción con los demás participantes, utilizando la bibliografía del curso como sustento a las respuestas 3) Actividades formativas en cada clase. Además, a lo largo del curso el participante deberá 4) Desarrollar un Trabajo final de aplicación y 5) Rendir una evaluación final que busca medir la comprensión y aplicación de los conceptos globales del curso, a través de un instrumento que combina preguntas de desarrollo y de selección múltiple. 

Además de las herramientas didácticas descritas anteriormente, el curso contará con un “Foro de Consultas Académicas” que permite resolver dudas y profundizar conceptos desarrollados en las clases con un plazo de respuesta máximo de 24 hrs. hábiles; mensajería para contactar a los otros participantes; y un Glosario como resumen del desarrollo del curso. Adicionalmente, para consultas técnicas o administrativas pueden contactarse con el equipo de Coordinación mediante el formulario “Contacto Coordinación” dispuesto en el curso o mediante el correo alumnosuc@claseejecutiva.cl, cuyo tiempo de respuesta máximo es 24 hrs. hábiles, de lunes a viernes de 9:00 a 18:00 hrs. 

Como material de apoyo al participante se cuenta con: Programa del Alumno (Guía del Participante), Tutorial de Navegación multimedia, Formulario “Contacto Coordinación” para soporte técnico y administrativo, Foro de Anuncios y Foro “Consultas Académicas” para consultas académicas.

Se establece el siguiente plan de comunicación tutorial del ayudante con los alumnos, con el fin de orientar el proceso de aprendizaje:

  • Mensaje semanal por correo electrónico con el fin de recordar las actividades de la semana y los focos de trabajo. Estos mensajes se alojan en el apartado “Anuncios de Curso” para posterior revisión por parte de los alumnos.
  • 2 reuniones virtuales por plataforma Zoom sincrónicas con el ayudante. En la primera se revisa el programa del curso y se explican las diferentes actividades. En la segunda sesión se focaliza en la explicación del trabajo final y la resolución de consultas académicas más frecuentes.

Desglose de cursos

Nombre del curso: Big Data en Empresas y Organizaciones

Nombre en inglés: Big Data in companies and organizations

Horas cronológicas: 75 horas (35 horas directas)

Créditos: 5 

Descripción del curso

El propósito de este curso es entregar al alumno los conocimientos básicos que necesita para comprender qué es el Big Data, cuál es su valor en una organización y cómo puede ésta aprovechar dicho valor. Durante el curso, el estudiante aprenderá los conceptos básicos relacionados al Big Data, las herramientas que utiliza, el potencial de creación de valor que tiene, la preparación necesaria dentro de la organización para explotar dicho potencial, y cómo evaluar su impacto económico. 

Una vez concluido el curso, el estudiante tendrá una visión con altura de miras respecto a la aplicabilidad y el valor del Big Data dentro de las organizaciones, y podrá evaluar la pertinencia, requerimientos y preparación necesaria para llevar a cabo satisfactoriamente proyectos de Big Data. 

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso. 

Resultados del Aprendizaje

  1. Comprender de manera general qué es Big Data y cuáles son sus herramientas.
  2. Desarrollar estrategias para capturar y crear valor desde el Big Data.
  3. Estructurar los principales elementos en la realización de proyectos de Big Data.
  4. Entender las herramientas utilizadas y las diferentes alternativas de arquitectura y software.
  5. Comprender los perfiles profesionales necesario, sus habilidades y formas de administrar proyectos digitales.
  6. Conocer casos de uso en diferentes negocios y estimar el impacto económico para la empresa.

Contenidos:

  • Introducción general al Big Data en una compañía u organización.
    • ¿Qué es?
    • ¿Que no es?
    • ¿Quién está a cargo?
    • ¿Qué debería hacer como Chief Data & Analytics Officer en mis primeros 90 días?
  • Cómo evaluar la aplicabilidad en la empresa, tipos de problemas de negocios, datos disponibles, ejemplos de caso de uso, armado de un caso de negocio.
    • ¿Qué proyectos son de interés?
    • ¿Cuáles son los posibles?
    • ¿Cómo se financian estos proyectos?
  • Data Science usando Big Data como deporte de equipo. Roles y funciones.
    • ¿Cómo se arma un equipo de Data Science?
    • Roles y responsabilidades.
    • Habilidades necesarias.
    • Estrategia de Crecimiento.
    • Administración de Proyectos Digitales.
    • Agile.
  • Herramientas de Big Data – Arquitectura.
    • ¿Con qué herramientas se cuenta?
    • Diferentes arquitecturas de Big Data: On premise, Cloud, Híbridos.
    • ¿Cómo se gobiernan los datos?
    • ¿Cómo se protege la privacidad del Dato y la Seguridad?
    • ¿Son los datos suficientes y representativos?
  • Modelos Analíticos y herramientas.
    • ¿Cuáles son los diferentes tipos de modelos de machine learning?
    • Herramientas: extracción de datos, entrenamiento de modelos, visualización.
    • ¿Cómo es el paso a Producción?
  • Ejemplos de Casos de Uso, nuevas tendencias.
  • Armado de una evaluación económica de un caso de uso. 

Metodología de enseñanza y aprendizaje:

La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual Moodle (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje.

En cada clase se utilizan métodos de Enseñanza–Aprendizaje complementarios: 1) desarrollo expositivo de contenido, donde se aprovecha la experiencia del experto disciplinar a través de los recursos interactivos. Los contenidos del curso se presentan en formato RISE los cuales integran vídeos, animaciones y cuestionarios formativos que fomentan una mayor interacción del participante, además de contar con un archivo descargable en pdf con el contenido de dicha clase para lectura. 2) desarrollo de reflexión por parte del participante, a través del análisis de casos y actividades de aplicación retroalimentados por el Relator y 3) de Formulación de Proyectos mediante la realización de un Trabajo final de aplicación pertinente al contexto laboral. 

Adicionalmente, se realizan dos clases en vivo a través de la plataforma Zoom, cuya grabación queda alojada en la plataforma, cuyo objetivo es profundizar en los contenidos y resolver consultas de los participantes.

Como actividades de evaluación, en cada clase el participante debe: 1) Realizar un Control para comprobar los aprendizajes de cada clase y 2) Aplicar los contenidos aprendidos a través del análisis de casos en un foro de interacción con los demás participantes, utilizando la bibliografía del curso como sustento a las respuestas 3) Actividades formativas en cada clase. Además, a lo largo del curso el participante deberá 4) Desarrollar un Trabajo final de aplicación y 5) Rendir una evaluación final que busca medir la comprensión y aplicación de los conceptos globales del curso, a través de un instrumento que combina preguntas de desarrollo y de selección múltiple. 

Además de las herramientas didácticas descritas anteriormente, el curso contará con un “Foro de Consultas Académicas” que permite resolver dudas y profundizar conceptos desarrollados en las clases con un plazo de respuesta máximo de 24 hrs. hábiles; mensajería para contactar a los otros participantes; y un Glosario como resumen del desarrollo del curso. Adicionalmente, para consultas técnicas o administrativas pueden contactarse con el equipo de Coordinación mediante el formulario “Contacto Coordinación” dispuesto en el curso o mediante el correo alumnosuc@claseejecutiva.cl, cuyo tiempo de respuesta máximo es 24 hrs. hábiles, de lunes a viernes de 9:00 a 18:00 hrs. 

Como material de apoyo al participante se cuenta con: Programa del Alumno (Guía del Participante), Tutorial de Navegación multimedia, Formulario “Contacto Coordinación” para soporte técnico y administrativo, Foro de Anuncios y Foro “Consultas Académicas” para consultas académicas.

Se establece el siguiente plan de comunicación tutorial del ayudante con los alumnos, con el fin de orientar el proceso de aprendizaje:

  • Mensaje semanal por correo electrónico con el fin de recordar las actividades de la semana y los focos de trabajo. Estos mensajes se alojan en el apartado “Anuncios de Curso” para posterior revisión por parte de los alumnos.
  • 2 reuniones virtuales por plataforma Zoom sincrónicas con el ayudante. En la primera se revisa el programa del curso y se explican las diferentes actividades. En la segunda sesión se focaliza en la explicación del trabajo final y la resolución de consultas académicas más frecuentes. 

Evaluación de los Aprendizajes:

  • Controles: (15%).
  • Foros de discusión: (20%).
  • Trabajo grupal :(25%).
  • Test on-line o presencial: (40%).

 

Nombre del curso: Modelamiento Estadístico y Sistemas Recomendadores

Nombre en inglés: Statistical Modeling and Recommender Systems

Horas cronológicas: 75 horas (35 horas directas)

Créditos: 5 

Descripción del curso

El curso entregará al estudiante conocimientos y habilidades básicas de modelamiento matemático y estadístico que le permitan extraer información útil de un conjunto de datos. En particular, el estudiante aprenderá – de manera teórica y práctica, utilizando herramientas computacionales a procesar, clasificar y agrupar datos, y utilizarlos como insumo para sistemas recomendadores. 

Lo que el estudiante aprenda en el curso le permitirá trabajar con datos para poder convertir éstos en información útil para la toma de decisiones en su organización, en un amplio rango de aplicaciones, y/o para supervisar a equipos de personas dentro de la misma que deban realizar esta tarea. 

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso. 

Resultados del Aprendizaje

Al finalizar este curso los/las estudiantes debieran ser capaces de: 

  1. Explicar el fundamento del modelamiento estadístico para el manejo de grandes volúmenes de datos.
  2. Explicar el proceso de modelamiento y sus distintas fases para la implementación de soluciones.
  3. Generar flujos de trabajo de datos para proyectos de Big Data en la organización.
  4. Realizar inferencias estadísticas sobre datos para aumentar el impacto positivo en la toma de decisión de una organización, utilizando herramientas computacionales (software R).

Contenidos:

  • Pre procesamiento de datos
    • Calidad de datos
    • Limpieza de datos
    • Integración de datos
    • Reducción de datos
    • Transformación de datos
  • Métodos de clasificación
    • El proceso de clasificación
    • Árboles de decisión
    • Bayes ingenuo
    • K-vecinos más cercanos
    • Métodos conjuntos: Bagging, Boosting y Random Forests
  • Métodos de Agrupación
    • Definición y propiedades
    • Métodos de partición: K-means y K-medoides
    • Métodos Jerárquicos
  • Sistemas Recomendadores
    • Impacto y casos importantes
    • Filtrado colaborativo
    • Filtrado basado en contenido
    • Métodos híbridos 

Metodología de enseñanza y aprendizaje:

La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual Moodle (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje.

En cada clase se utilizan métodos de Enseñanza–Aprendizaje complementarios: 1) desarrollo expositivo de contenido, donde se aprovecha la experiencia del experto disciplinar a través de los recursos interactivos. Los contenidos del curso se presentan en formato RISE los cuales integran vídeos, animaciones y cuestionarios formativos que fomentan una mayor interacción del participante, además de contar con un archivo descargable en pdf con el contenido de dicha clase para lectura. 2) desarrollo de reflexión por parte del participante, a través del análisis de casos y actividades de aplicación retroalimentados por el Relator y 3) de Formulación de Proyectos mediante la realización de un Trabajo final de aplicación pertinente al contexto laboral. 

Adicionalmente, se realizan dos clases en vivo a través de la plataforma Zoom, cuya grabación queda alojada en la plataforma, cuyo objetivo es profundizar en los contenidos y resolver consultas de los participantes.

Como actividades de evaluación, en cada clase el participante debe: 1) Realizar un Control para comprobar los aprendizajes de cada clase y 2) Aplicar los contenidos aprendidos a través del análisis de casos en un foro de interacción con los demás participantes, utilizando la bibliografía del curso como sustento a las respuestas 3) Actividades formativas en cada clase. Además, a lo largo del curso el participante deberá 4) Desarrollar un Trabajo final de aplicación y 5) Rendir una evaluación final que busca medir la comprensión y aplicación de los conceptos globales del curso, a través de un instrumento que combina preguntas de desarrollo y de selección múltiple. 

Además de las herramientas didácticas descritas anteriormente, el curso contará con un “Foro de Consultas Académicas” que permite resolver dudas y profundizar conceptos desarrollados en las clases con un plazo de respuesta máximo de 24 hrs. hábiles; mensajería para contactar a los otros participantes; y un Glosario como resumen del desarrollo del curso. Adicionalmente, para consultas técnicas o administrativas pueden contactarse con el equipo de Coordinación mediante el formulario “Contacto Coordinación” dispuesto en el curso o mediante el correo alumnosuc@claseejecutiva.cl, cuyo tiempo de respuesta máximo es 24 hrs. hábiles, de lunes a viernes de 9:00 a 18:00 hrs. 

Como material de apoyo al participante se cuenta con: Programa del Alumno (Guía del Participante), Tutorial de Navegación multimedia, Formulario “Contacto Coordinación” para soporte técnico y administrativo, Foro de Anuncios y Foro “Consultas Académicas” para consultas académicas.

Se establece el siguiente plan de comunicación tutorial del ayudante con los alumnos, con el fin de orientar el proceso de aprendizaje:

  • Mensaje semanal por correo electrónico con el fin de recordar las actividades de la semana y los focos de trabajo. Estos mensajes se alojan en el apartado “Anuncios de Curso” para posterior revisión por parte de los alumnos.
  • 2 reuniones virtuales por plataforma Zoom sincrónicas con el ayudante. En la primera se revisa el programa del curso y se explican las diferentes actividades. En la segunda sesión se focaliza en la explicación del trabajo final y la resolución de consultas académicas más frecuentes. 

Evaluación de los Aprendizajes:

  • Controles (15%).
  • Foros de discusión (20%).
  • Trabajo grupal (25%).
  • Test on-line o presencial (40%).

 

Nombre del curso: Visualización de datos

Nombre en inglés: Data Visualization

Horas cronológicas: 75 horas (35 horas directas)

Créditos: 5 

Descripción de curso

Este curso permite al alumno desarrollar habilidades para identificar y evaluar volúmenes de datos mediante el uso de estrategias de representación de información, apoyado en el reconocimiento de conceptos de diseño y principios perceptivos y cognitivos. Esto permite tanto un a correcta configuración de los mensajes como una apropiada lectura y comprensión de estos. 

El estudiante aprenderá a utilizar herramientas técnicas conceptuales y metodológicas básicas que le permitirán desarrollar proyectos de visualización de grandes volúmenes datos eficientes, según sus objetivos comunicacionales. desde el reconocimiento de usuarios y sus necesidades de información, hasta los procesos de transformación de datos a representación visual. Estas herramientas resultan fundamentales a la hora de convertir los datos y su análisis, en información relevante pueda ser comunicada de manera eficiente, fácil de comprender, y útil para la toma de decisiones, ya sea dentro de una organización, o en el contexto de cualquier proyecto relacionado con Big Data. 

La metodología de enseñanza y aprendizaje para este curso online consiste en metodologías activas, donde el participante puede interactuar con sus pares y con su y profesor-tutor, a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso.  

Resultados del Aprendizaje

  1. Identificar las herramientas y metodologías para el desarrollo de proyectos de visualización de datos.
  2. Elaborar estrategias de alto impacto para la comunicación de grandes volúmenes de datos.
  3. Diseñar representaciones perceptibles que permitan amplificar el conocimiento organizacional.
  4. Diseñar mecanismos de síntesis y visualización de datos de valor para apoyar la toma de decisiones.

 Contenidos:

  • ¿Qué es la visualización de datos?
    • De qué trata la visualización
    • Breve contexto
    • Breve historia de la visualización
    • Panorama de la visualización hoy
    • Una definición operativa
  • ¿Para qué sirve la visualización de datos?
    • Visualización para amplificar el conocimiento
    • Para qué nos sirve la visualización
    • Qué queremos mostrar
    • El proceso interactivo
    • ¿Cómo trabajar la visualización de datos?
    • Proceso de Visualización
    • Representación: percepción
    • Representación: diseño y codificación visual
    • Qué no hacer
    • Evaluación
    • ¿Cómo continuar la visualización?
    • Recomendaciones para profundizar
    • Herramientas recomendadas
    • Autores recomendados
    • Recordando los objetivos de la visualización

Metodología de enseñanza y aprendizaje:

La modalidad de capacitación es online asincrónica, por lo que los participantes accederán a una plataforma educativa virtual Moodle (LMS). Las actividades se desarrollan en forma remota, lo que permite entregar flexibilidad en los horarios, de manera que cada participante pueda distribuir su tiempo y ser autónomo en su proceso de aprendizaje. En cada clase se utilizan métodos de Enseñanza–Aprendizaje complementarios: 1) desarrollo expositivo de contenido, donde se aprovecha la experiencia del experto disciplinar a través de los recursos interactivos. Los contenidos del curso se presentan en formato RISE los cuales integran vídeos, animaciones y cuestionarios formativos que fomentan una mayor interacción del participante, además de contar con un archivo descargable en pdf con el contenido de dicha clase para lectura. 2) desarrollo de reflexión por parte del participante, a través del análisis de casos y actividades de aplicación retroalimentados por el Relator y 3) de Formulación de Proyectos mediante la realización de un Trabajo final de aplicación pertinente al contexto laboral. 

Adicionalmente, se realizan dos clases en vivo a través de la plataforma Zoom, cuya grabación queda alojada en la plataforma, cuyo objetivo es profundizar en los contenidos y resolver consultas de los participantes.

Como actividades de evaluación, en cada clase el participante debe: 1) Realizar un Control para comprobar los aprendizajes de cada clase y 2) Aplicar los contenidos aprendidos a través del análisis de casos en un foro de interacción con los demás participantes, utilizando la bibliografía del curso como sustento a las respuestas 3) Actividades formativas en cada clase. Además, a lo largo del curso el participante deberá 4) Desarrollar un Trabajo final de aplicación y 5) Rendir una evaluación final que busca medir la comprensión y aplicación de los conceptos globales del curso, a través de un instrumento que combina preguntas de desarrollo y de selección múltiple. 

Además de las herramientas didácticas descritas anteriormente, el curso contará con un “Foro de Consultas Académicas” que permite resolver dudas y profundizar conceptos desarrollados en las clases con un plazo de respuesta máximo de 24 hrs. hábiles; mensajería para contactar a los otros participantes; y un Glosario como resumen del desarrollo del curso. Adicionalmente, para consultas técnicas o administrativas pueden contactarse con el equipo de Coordinación mediante el formulario “Contacto Coordinación” dispuesto en el curso o mediante el correo alumnosuc@claseejecutiva.cl, cuyo tiempo de respuesta máximo es 24 hrs. hábiles, de lunes a viernes de 9:00 a 18:00 hrs. 

Como material de apoyo al participante se cuenta con: Programa del Alumno (Guía del Participante), Tutorial de Navegación multimedia, Formulario “Contacto Coordinación” para soporte técnico y administrativo, Foro de Anuncios y Foro “Consultas Académicas” para consultas académicas.

Se establece el siguiente plan de comunicación tutorial del ayudante con los alumnos, con el fin de orientar el proceso de aprendizaje:

  • Mensaje semanal por correo electrónico con el fin de recordar las actividades de la semana y los focos de trabajo. Estos mensajes se alojan en el apartado “Anuncios de Curso” para posterior revisión por parte de los alumnos.
  • 2 reuniones virtuales por plataforma Zoom sincrónicas con el ayudante. En la primera se revisa el programa del curso y se explican las diferentes actividades. En la segunda sesión se focaliza en la explicación del trabajo final y la resolución de consultas académicas más frecuentes.

Evaluación de los Aprendizajes:

  • Controles (15%).
  • Foros de discusión (20%).
  • Trabajo grupal (25%)
  • Test on-line o presencial (40%).

 

Nombre del curso: Manejo de Grandes Volúmenes de Datos (Big Data)

Nombre en inglés: Managing Big Data

Horas cronológicas: 75 horas (35 horas directas)

Créditos: 5 

Descripción del curso 

El real mejoramiento de la eficiencia organizacional está relacionado con la implementación de soluciones tecnológicas que permiten agilizar la toma de decisiones en base a información cuantitativa y cualitativa relevante en tiempo real. Dicha información proviene de una adecuada administración de grandes volúmenes de datos por minuto, que demandan extensos y rigurosos análisis junto con métricas e indicadores cada vez más exactos. El análisis de grandes volúmenes de datos permite extraer tendencias y patrones complejos de información, con enormes implicancias estratégicas, permitiendo predecir mejor y transformando la forma en la que se hacen hoy en día los negocios. Este curso permite al alumno escoger las herramientas adecuadas para manejo de los datos en su empresa, entendiendo las infraestructuras computacionales que se requieren para manejar datos de distintos volúmenes y características. 

La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y profesor-tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual provista para el curso. 

Resultados del Aprendizaje

Al finalizar este curso los/las estudiantes debieran ser capaces de: 

  1. Modelar datos usando herramientas de bases de datos relacionales (SQL), bases de datos NoSQL y bases de datos distribuidas.
  2. Estimar la necesidad de cambiar la infraestructura de los datos desde un modelo clásico centralizado (tipo SQL) a un modelo de Big Data distribuido.
  3. Identificar las herramientas de manejo de datos adecuadas para el contexto de su empresa.

Contenidos:

  • Bases de datos relacionales
    • Diversos fuentes de datos (Excel, CSV, texto plano, páginas web,…)
    • Organización clásica de los datos: Bases de datos relacionales
    • Lenguaje SQL
    • Propiedades de una base de datos relacional: ACID
    • Integración de los datos
  • Bases de datos distribuidas
    • Paso al mundo de Big Data (limitaciones de una base de datos relacional)
    • Un sistema distribuido
    • Propiedades de sistemas distribuidos: CAP y BASE
    • Limitaciones de sistemas distribuidos: ACID vs CAP
    • Resolución de fallas en un sistema distribuido usando el consenso distribuido
  • Bases de datos NoSQL
    • Características de sistemas NoSQL
    • Bases de datos de búsqueda: Amazon Dynamo
    • Bases de datos de documentos: MongoDB
    • Bases de datos de grafos: Neo4J
  • Procesamiento masivo de datos
    • Distribución de los datos (Google distributed File System)
    • Map-reduce
    • Infraestructura de Apache Hadoop
    • Apache Pig: lenguaje de scripting para Hadoop

Metodología de enseñanza y aprendizaje:

La metodología se presenta más adelante ya que para todos los cursos es la misma. 

Evaluación de los Aprendizajes:

  • Controles (15%).
  • Foros de discusión (20%).
  • Trabajo grupal (25%).
  • Test on-line o presencial (40%).

 BIBLIOGRAFÍA

  • Ajay Agrawal, Joshua Gans, Avi Goldfarb (2018) Prediction Machines: The Simple Economics of Artificial Intelligence.
  • Bradshaw, S., Chodorow, K., MogoDB: The Definitive Guide, 3rd edition, O’Reilly Media, 2019.
  • Cairo, Alberto. Infografía 2.0: visualización interactiva de información en prensa. Alamut Editores, 2008.
  • Dean, J., Ghemawat, S., MapReduce: Simplified Data Processing on Large Clusters. Operating Systems Design and Implementation (OSDI) 2004: 137-150, 2004.
  • Fan, J., Han, F., Liu, H. (2014) Challenges of Big Data analysis. Natl. Sci. Rev. 1: 293–314.
  • Ghemawat, S., Gobioff, H., Leung, S., The Google file system. Symposium on Operating Systems Principles (SOSP) 2003: 29-43, 2003.
  • Han, J., Kamber, M., Pei, J. (2011). Data Mining: Concepts and Technique, Third Edition. The Morgan Kaufmann Series.
  • Hogan, A., Procesamiento masivo de datos, http://aidanhogan.com/teaching/cc5212-1-2019/, 2019.
  • Kai-Fu Lee (2018) AI Superpowers: China, Silicon Valley, and the New World Order.
  • Knell, R. (2013) Introductory R: A Beginner's Guide to Data Visualisation, Statistical Analysis and Programming in R, Kindle Edition.
  • Lima, Manuel. Visual Complexity: Mapping Patterns of Information. New York. Princeton Architectural Press, 2013.
  • Mariya Yao, Adelyn Zhou, Marlene Jia (2018) Applied Artificial Intelligence: A Handbook For Business Leaders
  • Mark Grover (2015) Hadoop Application Architectures: Designing Real-World Big Data Applications.
  • Mijksenaar, Paul. Diseño de la información. Ediciones G. Gili, 2001.
  • Nathan Marz (2015) Big Data: Principles and best practices of scalable realtime data systems.
  • Parra, D., & Sahebi, S. (2013). Recommender systems: Sources of knowledge and evaluation metrics. In Advanced Techniques in Web Intelligence-2 (pp. 149-175). Springer Berlin Heidelberg.
  • Pichara, K.; Soto, A.; and Araneda, A. (2008) Detection of Anomalies in Large Datasets Using an Active Learning Scheme Based on Dirichlet Distributions. In IBERAMIA, volume 5290, of Lecture Notes in Computer Science, pages 163-172,
  • Pogorelova, K. The looks of understanding: visual appeal of information graphics, 2013.
  • Ramakrishnan, R., Gehrke, J., Database Management Systems, 3rd edition, McGraw-Hill, 2002.
  • Robinson, I., Webber, J., Eifrem, E., Graph Databases: New Opportunities for Connected Data, 2nd edition, O’Reilly Media, 2015.
  • Seth Stephens-Davidowitz (2018) Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are.
  • The Apache Foundation, Apache Hadoop, http://hadoop.apache.org/, 2019.
  • Tufte, Edward. Visual Explanations: Images and Quantities, Evidence and Narrative. Graphics Press, 1997.
  • Vardeman, S. (1994) Statistics for Engineering Problem Solving. PWS Publishing Co.
  • Ware, Colin. Visual Thinking for Design. Morgan Kaufmann, 2008.
  • Yau, Nathan. Data Points. John Wiley & Sons, 2013.

Requisitos Aprobación

La Nota final del diplomado se calculará de acuerdo a la siguiente ponderación de los cursos:

  •  Curso Big Data en Empresas y Organizaciones: 25%
  • Curso Modelamiento Estadístico y Sistemas Recomendadores:25%
  • Curso Visualización de Datos: 25%
  • Curso Manejo de grandes volúmenes de datos (Big Data): 25%

El estudiante aprobará el diplomado cumpliendo con los siguientes requisitos:

  • Calificación mínima de 4.0 en cada curso
  • Realizar todas las actividades del diplomado.

*En caso de que un alumno repruebe un curso perteneciente a un diplomado, en Educación Profesional Ingeniería UC ofrecemos la oportunidad de realizar un nuevo intento. Para ejercer este derecho, el alumno deberá pagar un valor de 3 UF por curso, e indicar la fecha de la versión en la que desea matricularse. La gestión debe realizarse dentro de un máximo de 2 años a contar de la fecha de inicio del diplomado original, y es factible para un máximo de 2 cursos por diplomado. 

Para aprobar los programas de diplomados se requiere la aprobación de todos los cursos que lo conforman. 

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por Pontificia Universidad Católica de Chile.

Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo: 

  • Fotocopia Carnet de Identidad.

Cualquier información adicional o inquietud podrás escribir al correo programas@ing.puc.cl.

VACANTES: 40

INFORMACIONES RELEVANTES

Con el objetivo de brindar las condiciones de infraestructura necesaria y la asistencia adecuada al inicio y durante las clases para personas con discapacidad: Física o motriz, Sensorial (Visual o auditiva) u otra, los invitamos a informarlo. 

  • El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
  • No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula


Fechas disponibles

Los detalles del programa pueden variar en cada fecha de edición

Fecha Horario Lugar Valor
23 mayo 2023 - 23 enero 2024 Asincrónico $2.190.000 Ver más
25 julio 2023 - 21 mayo 2024 Asisncrónico $2.190.000 Ver más
26 septiembre 2023 - 23 julio 2024 Asincrónico $2.190.000 Ver más
28 noviembre 2023 - 24 septiembre 2024 Asincrónico $2.190.000 Ver más

¿Te parece interesante este programa?

No