FACULTAD DE CIENCIAS EXACTAS DE LA UNICEN

1 año / 6 módulos

2 seminarios especiales

+15 docentes / 50 alumnos

Cursada 2025 modalidad virtual

Módulo #2

30/05/2025 al 17/06/2025

Aprendizaje de Máquina

El aprendizaje de máquina (machine learning) refiere a un área dentro de las ciencias de la computación y la inteligencia artificial cuyo fin es proveer herramientas para lograr que las computadoras aprendar a resolver problemas a partir de experiencia previa. En particular, los algoritmos de machine learning exploran conjuntos de datos para descubrir patrones de comportamiento que luego aplican para resolver un problema en particular. El objetivo de este módulo es brindarle al/la alumno/a las herramientas necesarias para comprender, planificar, diseñar e implementar soluciones basadas en machine learning para problemas de regresión, clasificación, detección de anomalías y agrupamiento o clustering.

Objetivos de aprendizaje

Que el alumno logre:

  • Estudiar, interpretar y preparar una base de datos para el desarrollo de una solución basada en aprendizaje automático.
  • Desarrollar habilidades para la identificación y selección del mejor algoritmo para la resolución de problemas de regresión, clasificación, detección de anomalías y clustering, en base a las características de los datos con los que trabajar.
  • Desarrollar modelos predictivos eficaces para tareas que involucren el uso de datos retrospectivos.
  • Cuantificar la performance de dichos algoritmos de manera correcta, y comparar las diferentes alternativas para escoger la más adecuada.
  • Desarrollar soluciones basadas en machine learning utilizando librerías básicas del lenguaje de programación Python.
  • Documentar las soluciones con la terminología apropiada.

Contenidos

Unidad 1 – Introducción a ML – Los datos

Introducción a la materia. Diferencias entre AI y ML. Datos en ML. Formato. Tipos de variable. Curado. Visualización.

Unidad 2 – Modelado de problemas

Introducción al los tipos de tareas que se pueden resolver con ML. Tipos de problemas. Ejemplos. Etapas de trabajo en el ciclo de vida de ML. Validación de resultados. Comparación de modelos.

Unidad 3 – Regresión

Introducción al problema de regresión lineal. Técnicas de regularización. Métricas de evaluación para problemas de regresión. Regresión no lineal: Random Forest Regression.

Unidad 4 – Clasificación

Introducción al problema de clasificación binaria. Regresor logístico. Support Vector machines. Random Forests y XGBoost. kNNs. Métricas de evaluación para problemas binarios. Clasificadores probabilísticos. Métricas de evaluación para clasificadores probabilísticos. Calibración. Problemas multiclase. Problemas de clase sesgada.

Unidad 5 – Detección de anomalías

Definición del problema. Modelos basados en densidades. Local Outlier Factor. One-class SVMs / Support Vector Data Description. Isolation Forests.

Unidad 6 – Clustering

Definición del problema. Métricas para la evaluación de clusters. K-means. Clustering jerárquico.

Metodología de trabajo

Se desarrollarán 6 clases teóricas con presentaciones con slides y códigos de ejemplo en Google Colab, que los alumnos podrán utilizar para realizar pruebas propias o para su trabajo práctico especial. Además, se desarrollarán clases de consulta asincrónicas a través de la plataforma Moodle, ofreciéndose además un espacio sincrónico en el que se presentará el objetivo del trabajo especial, y otro para las presentaciones finales de los trabajos.

Mecanismo de evaluación

Se deberá entregar un trabajo especial en grupos de 2 o 3 personas, que serán postulados por los propios estudiantes o en su defecto armados por la cátedra. En el trabajo especial deberán tomar alguna de las bases de datos sugeridas en la materia y desarrollar un problema de punta a punta, desde el entrenamiento a la evaluación final. Deberán entregar un Google Colab con el código completamente funcional, y realizar una presentación de 10 minutos abordando el problema, la solución propuesta y los resultados obtenidos.

Bibliografía sugerida

  • Hastie 2009. “The Elements of Statistical Learning”.
  • Grus 2015. “Data Science from Scratch”.
  • Géron 2017. “Hands-On Machine Learning with Scikit-learn & Tensorflow”.
  • Marsland 2015. “Machine Learning: An Algorithm Perspective”.
  • Unpingo 2016. “Python for Probability, Statistics and machine Learning”.
DOCENTES


José Ignacio Orlando

Doctor en Matemática Computacional e Ingeniero de Sistemas. Actualmente es Investigador Adjunto del CONICET en el grupo Yatiris del Instituto Pladema de la UNICEN. Dirige además los AI Labs de la compañía Arionkoder. Sus investigaciones se centran en técnicas de aprendizaje automático y visión por computadora para imágenes médicas, principalmente oftalmológicas, y en grandes modelos de lenguaje.


Duilio Deangeli

Bioingeniero egresado de la UNER y estudiante avanzado del Doctorado en Matemática Computacional en el grupo Yatiris del Instituto Pladema de la UNICEN. Cuenta con experiencia en el ámbito médico/hospitalario y en la industria. Actualmente es becario doctoral del CONICET, donde desarrolla su investigación basada en técnicas de aprendizaje profundo y asimetrías cerebrales.

CLASE #1

30/05/2025

CLASE #2

31/05/2025

CLASE #3

03/06/2025

CLASE #4

06/06/2025

CLASE #5

07/06/2025

CLASE #1

10/06/2025

CLASE #2

13/06/2025

CLASE #3

14/06/2025

CLASE #4

17/06/2025