Introducción a machine learning
MT3006 - Robótica 2
Dos caras de la misma moneda
Versus
statistics
statistics
optimization
optimization
O al menos en sus inicios*
¿Por qué?
La ingeniería tradicional es top-down
principios fundamentales
matemática
física
química
electrónica
mecánica
etc.
Pero machine learning es bottom-up
el sistema consume data y aprende el modelo
data
Aprender se refiere a emplear un conjunto de ejemplos para inferir algo acerca del proceso subyacente
¿Cómo se ve esto?
Partamos de un ejemplo sencillo
paciente sano
paciente con COVID-19
paciente sano
paciente con COVID-19
al inicio de la pandemia, se tenía poco conocimiento técnico sobre el virus...
paciente sano
paciente con COVID-19
al inicio de la pandemia, se tenía poco conocimiento técnico sobre el virus...
...pero muchos pacientes contagiados
enfermo
saludable
enfermo
saludable
machine learning
enfermo
saludable
machine learning
este es un ejemplo de un problema de clasificación, en donde cada caso debe colocarse dentro de alguna categoría (discreta)
en este caso, el algoritmo de machine learning cumple con dos objetivos:
en este caso, el algoritmo de machine learning cumple con dos objetivos:
formalicemos un poco la situación
Data como punto de inicio
datos, observaciones o ejemplos
Data como punto de inicio
feature vector
vector de características
Supervised learning
datos junto con...
Supervised learning
labels |
etiquetas
Supervised learning
training data
training set
Supervised learning
objetivo:
explicación
+
predicción
Supervised learning
objetivo:
explicación
+
predicción
Clasificación: \(\quad y\in\{1,2,...,m\}\)
Regresión: \(\quad y \in \mathbb{R}\)
Ejemplo: regresión
precio ($k)
área
superficial \((m^2)\)
50
100
150
200
250
150
300
Ejemplo: regresión
precio ($k)
50
100
150
200
250
150
300
área
superficial \((m^2)\)
Ejemplo: regresión
precio ($k)
50
100
150
200
250
150
300
225
área
superficial \((m^2)\)
¿Qué otros tipos de machine learning hay?
Unsupervised [self-supervised] learning
encontrar y/o comprender estructura o distribución
Unsupervised [self-supervised] learning
Ejemplo: clustering
Ejemplo: clustering
Ejemplo: diffusion and denoising
Reinforcement learning
environment
policy
actor
action
state
reward
Ejemplo: robots jugando fútbol
Formalizando aún más al supervised learning, partiendo de un ejemplo conocido
¿Modelo que prediga \(y_i\) para un \(x_i\) desconocido?
¿Modelo que prediga \(y_i\) para un \(x_i\) desconocido?
¿Modelo que prediga \(y_i\) para un \(x_i\) desconocido?
trivial, pero con esto ya entrenamos un modelo de machine learning
¿Por qué?
¿Por qué?
Formalizando conceptos
Emplear regresión lineal implica resolver
¿Cómo se ve esto en el proceso?
se prueban distintas hipótesis
(líneas rectas)
se prueban distintas hipótesis
(líneas rectas)
se prueban distintas hipótesis
(líneas rectas)
se prueban distintas hipótesis
(líneas rectas)
hasta encontrar la mejor
se prueban distintas hipótesis
(líneas rectas)
hasta encontrar la mejor
¿Cómo?
encontrando la que minimice la discrepancia (pérdida) entre el modelo y los datos de entrenamiento
encontrando la que minimice la discrepancia (pérdida) entre el modelo y los datos de entrenamiento
En general, se da una situación similar en todo problema de supervised learning
\(\Rightarrow\) optimización de pérdida
(loss optimization)
Optimización de pérdida
Optimización de pérdida
parámetros del modelo (a encontrar)
Optimización de pérdida
función de pérdida (loss function)
Optimización de pérdida
sample loss
Optimización de pérdida
hipótesis (\(f_1,f_2,...,f_K\) para el caso vectorial)
observaciones
etiquetas | labels (\(y_k^{(i)}\) con \(k=1,...,K\) para el caso vectorial)
Optimización de pérdida
se emplea todo el training set
este caso particular se conoce como la empirical loss (se efectúa una sumatoria desde \(1\) hasta \(K\) en el caso vectorial)
Optimización de pérdida
se emplea todo el training set
este caso particular se conoce como la empirical loss (se efectúa una sumatoria desde \(1\) hasta \(K\) en el caso vectorial)
Si bien este setup es adecuado, requiere que seleccionemos la hipótesis (próximas semanas)