Estadística para ciencia de datos

Estudia en la Universidad N°1 de habla hispana en Latinoamérica por QS Latam University Rankings 2025

Acerca del programa:

El curso en  Estadística para ciencia de datos tiene como propósito entregar los fundamentos estadísticos necesarios para trabajar en el área de Ciencia de Datos y sacar máximo partido de las técnicas y herramientas asociadas a ella.

Curso Estadística para ciencia de datos UC

Dirigido a:

  • Todas las personas que necesiten o estén interesadas en adquirir las habilidades para aplicar técnicas de Data Mining a su trabajo
  • Todas las personas que han aprendido lo esencial de Data Mining pero necesitan profundizar y adquirir algo de fundamentos estadísticos.

Jefe de Programa

Jaime Navón Cohen

Ph.D. Computer Science, University of North Carolina at Chapel Hill. Master of Science, Technion-Israel Institute of Technology. Ingeniero Civil Electricista, Universidad de Chile. Profesor Asociado del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC.
linkedin

Equipo Docente

keyboard_arrow_down

Nicolás Alvarado Monárdez

Ph.D. (c) en Ciencia de la Computación de la UC. También es licenciado en Matemáticas y magíster en Matemáticas de la UC.

* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de remplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.

Descripción

La mayor parte de las técnicas y algoritmos usados en el área de la ciencia de datos descansan en fundamentos estadísticos. El objetivo de este curso es entregar a los alumnos una base estadística mínima para construir sobre un fundamento robusto los conocimientos de minería de datos de los cursos posteriores. En este curso los alumnos aprenderán entre otros sobre técnicas de análisis exploratorio de datos, validación de hipótesis y regresión.

*Este curso forma parte del Diplomado en Minería de datos.

Requisitos de Ingreso

Se recomienda contar con:

  • Licenciatura, título profesional o técnico de mínimo 4 años.
  • Conocimientos básicos de programación en Python.
  • Manejo de computación a nivel usuario, considerando el uso de planillas Excel a nivel medio
  • Dos años de experiencia laboral.

Objetivos de Aprendizaje

Resultados del Aprendizaje general

  • Analizar datos de forma exploratoria para explicar la correlación entre variables, aplicando conceptos estadísticos.

Resultados del Aprendizaje Específicos

  • Producir desde un dataset histogramas y medidas estadísticas como parte de un análisis exploratorio de los datos.
  • Mostrar en forma gráfica distribuciones empíricas de los datos.
  • Modelar un problema en base a distribuciones analíticas conocidas.
  • Analizar la interrelación entre dos o más variables.
  • Evaluar la validez de una hipótesis en base a los datos.

Metodología

Cada curso está organizado en 6 clases online, una clase en vivo y cuatro ayudantías, transmitidas vía streaming, realizadas por nuestros destacados académicos o tutores. En estas clases podrás interactuar, realizar preguntas y comentar a tus compañeros de clase.

  • Aprendizaje autónomo asincrónico estructurado en 6 módulos
  • Clases expositivas
  • Foros
  • Estudio de caso 

Desglose de cursos

Horas Totales: 75 | Horas directas: 35 | Horas indirectas: 40

Créditos: 4 créditos.

Contenidos:

  • Análisis exploratorio de datos e introducción a las distribuciones
    • Variables y transformaciones
  • Distribuciones y funciones de probabilidad
    • Variables y efecto del tamaño
    • Funciones de probabilidad (PMFs)
  • Funciones de probabilidad
    • Distribuciones continuas
    • Familia exponencial
    • Funciones de distribución acumulada (CDFs)
  • Modelación de distribuciones e introducción a las relaciones entre variables
    • Distribuciones continuas
    • Gráficas distribución lognormal
    • Diagramas de dispersión
    • Correlación
  • Relación entre variables, correlación y una introducción al testeo de hipótesis
    • Covarianza
    • Testeo de hipótesis
    • Diferencia de medias
    • Formalización
  • Testeo de hipótesis, regresión e introducción a las series de tiempo
    • Testeo de correlación y testeo de proporciones
    • Mínimos cuadrados lineales
    • Introducción a las series de tiempo

Evaluación

  • 3 controles individuales – 40%
  • 3 mini proyectos individuales – 60%

Requisitos Aprobación

Los alumnos deberán ser aprobados de acuerdo los criterios que establezca la unidad académica: 

  • Calificación mínima de todos los cursos 4.0 en su promedio ponderado.

El alumno que no cumpla con estas exigencias reprueba automáticamente sin posibilidad de ningún tipo de certificación.

Los resultados de las evaluaciones serán expresados en notas, en escala de 1,0 a 7,0 con un decimal, sin perjuicio que la Unidad pueda aplicar otra escala adicional.

Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.


Proceso de Admisión

Las personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:  

  • Fotocopia simple del carnet de identidad por ambos lados.

Con el objetivo de brindar las condiciones y asistencia adecuadas, invitamos a personas con discapacidad física, motriz, sensorial (visual o auditiva) u otra, a dar aviso de esto durante el proceso de postulación.

El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.

No se tramitarán postulaciones incompletas.

Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula


¿Te parece interesante este programa?

No