Aprendizaje automático
Diseñador de métodos de aprendizaje automático para la generación de conocimientos a través de un enfoque de aprendizaje a partir de datos. Actualmente centrado en la investigación, el desarrollo, y la implementación del procesamiento cognitivo basado en el sistema 1 y el sistema 2 a través del aprendizaje profundo en servicios web3 utilizando herramientas como redes descentralizadas, certificados digitales y metaversos.
Jacobo León @jacoboggleon
🎰ML Engineer 🧠
Frameworks
Machine Learning
Deep Learning
Bibliografía
- Knox S. (2018). Machine learning: a concise introduction. Vol. 285. John Wiley & Sons.
- Jiang H. (2022). Machine Learning Fundamentals: A Concise Introduction. Cambridge University Press
- Goodfellow I., Bengio Y., & Courville A. (2016). Deep learning. MIT press.
- Jung A. (2022). Machine Learning: The Basics (Machine Learning: Foundations, Methodologies, and Applications). Springer.
Agenda
- Explorar, definir, e introducir el área de estudio
Datos
Información
Tarea: segmentación de objetos
Proceso
inteligente
"Pensar" como un proceso computacional
¿Qué es aprendizaje automático?
- Recopilamos datos (observables del entorno) con nuestros sensores
- Procesamos los datos para obtener información y reglas abstractas
- Almacenamos la información y las esas reglas abstractas
- Controlamos nuestras acciones en ese entorno
- Recordamos y usamos estas reglas cuando es necesario
La percepción del entorno como inspiración para la generación de conocimientos
¿Cómo percibimos el mundo?
Deducción
Inducción
Recolectar datos
Procesar datos
Controlar las acciones
Almacenar patrones
Recordar las reglas
Usar las reglas
Encontrar patrones
¿Cómo abstraemos nuestra percepción?
La percepción del entorno como inspiración para la generación de conocimientos
¿Cómo sistematizamos nuestra percepción?
Los datos como recurso artificial (digital):
- Valor de utilidad
- Información
- Valor de intercambio
- Producto
R: metodología de análisis de datos (multivariables)
La percepción del entorno como inspiración para la generación de conocimientos
¿Cómo modelamos "la percepción del entorno"?
Statistical learning
Machine learning
Deep learning
R: métodos y arquitecturas de aprendizaje automático
La percepción del entorno como inspiración para la generación de conocimientos
No supervisado
Supervisado
Regresión
Clasificación
Reforzado
Predicción
Descripción
Aprendizaje automático
Agrupación
Aprendizaje automático supervisado
Entrenamiento
Generalización
Aprendizaje
Modelo
Modelo
Datos observados
Aprendizaje
Aprendizaje
Modelo
Datos no observados
Validación
Error
- 2008-2018
-
45 indicadores:
- educación, salud, alimentación y vivienda
- "generar información no sólo de acceso sino también de calidad"
- "crear herramientas para la elaboración de diagnósticos de cualquier política social"
Problema: modelo mutidimensional
¿Cómo medir la pobreza con ~45 variables?
Datos iid
(observables)
Método de aprendizaje
Parámetros & hiperparámetros
Distribución desconocida
Modelo
(basado en datos)
Propuesta de solución
Función desconocida
Generalización
53%
47%
input
output
Sistema tradicional
entrada
resultado esperado
modelo
Aprendizaje automático supervisado como sistema generador de conocimientos
variables explicativas \(X=\{x_1, x_2, \dots, x_n\}\)
variable explicada \(y\)
Perspectiva inicial
🐒
🐒
🐒
🤖
🐒
¿Cómo funciona el aprendizaje automático supervisado?
Epistemología y ciencia
(de datos)
ἐπιστήμη, epistēmē, knowledge, conocimiento
-λογία, -logia, -logy, -logía
El estudio del conocimiento
datos
Scientia, science, ciencia
(a.k.a conocimiento)
Sistema para generar conocimiento
Enfoque desde la epistemología: la filosofía del conocimiento
¿Qué es conocimiento?
Evidencia
Datos
Modelo
Hipótesis
¿Cómo obtener conocimiento?
Enfoque de descubrimiento de conocimiento en bases de datos: la extracción no trivial de conocimiento implícito, previamente desconocido y potencialmente útil de los datos
¿Cómo obtener conocimiento?
Investigación y desarrollo: nuevas metodologías, métodos, arquitecturas; nuevos tiempos, viejos amigos.
Set de hipótesis
Datos
Modelo
de aprendizaje
\(H\)
\({P(X,Y)}\)
Aprender conocimiento (relaciones) a partir de datos a través de un modelo basado en datos.
¿Cómo aprender de los datos?
\({\hat{f}}≈{f}\)
\({X}\)
\({Y}\)
\({h_1= \hat{f}}\)
El problema del aprendizaje: existe un conjunto conocido \(X\) y una función desconocida \(f\) en \(X\). Dados los datos, construye una buena aproximación \(\hat{f}\) de \(f\). Esto es aprender desde los datos.
¿Qué es aprender de los datos?
Set de hipótesis
Ejemplos de entrenamiento
Método de aprendizaje
\(H\)
\(P(X,Y)={(x_1, y_1)}{\dots}{(x_N,y_N)}\)
\({f:X \rightarrow{Y}}\)
Función entrenamiento-target desconocida
\(A\)
Final hypothesis
\({\hat{f}}≈{f}\)
Modelo o función de aprendizaje
Primera aproximación al aprendizaje automático supervisado
Problema de clasificación \(n-\text{dimensional}\)
Resumen
- Introducción y primera aproximación del área de estudio
- Enfoques y metodologías para el aprendizaje automático basado en datos
El aprendizaje automático
By Goa J
El aprendizaje automático
- 19