Aprendizaje automático 

Diseñador de métodos de aprendizaje automático para la generación de conocimientos a través de un enfoque de aprendizaje a partir de datos. Actualmente centrado en la investigación, el desarrollo, y la implementación del procesamiento cognitivo basado en el sistema 1 y el sistema 2 a través del aprendizaje profundo en servicios web3 utilizando herramientas como redes descentralizadas, certificados digitales y metaversos.

Jacobo León @jacoboggleon 

🎰ML Engineer 🧠

Frameworks

Machine Learning

Deep Learning

Bibliografía

  • Knox S. (2018). Machine learning: a concise introduction. Vol. 285. John Wiley & Sons.
  • Jiang H. (2022). Machine Learning Fundamentals: A Concise Introduction. Cambridge University Press
  • Goodfellow I., Bengio Y., & Courville A. (2016). Deep learning. MIT press.
  • Jung A. (2022). Machine Learning: The Basics (Machine Learning: Foundations, Methodologies, and Applications). Springer.

Agenda

  • Explorar, definir, e introducir el área de estudio

Datos

Información

Tarea: segmentación de objetos

Proceso

inteligente

"Pensar" como un proceso computacional

¿Qué es aprendizaje automático?

  • Recopilamos datos (observables del entorno) con nuestros sensores
  • Procesamos los datos para obtener  información y reglas abstractas
  • Almacenamos la información y las esas reglas abstractas
  • Controlamos nuestras acciones en ese entorno
  • Recordamos y usamos estas reglas cuando es necesario 

La percepción del entorno como inspiración para la generación de conocimientos

¿Cómo percibimos el mundo?

Deducción

Inducción

Recolectar datos

Procesar datos

Controlar las acciones

Almacenar patrones

Recordar las reglas

Usar las reglas

Encontrar patrones

¿Cómo abstraemos nuestra percepción?

La percepción del entorno como inspiración para la generación de conocimientos

¿Cómo sistematizamos nuestra percepción?

Los datos como recurso artificial (digital):

  • Valor de utilidad
    • Información
  • Valor de intercambio
    • Producto

R: metodología de análisis de datos (multivariables)

La percepción del entorno como inspiración para la generación de conocimientos

¿Cómo modelamos "la percepción del entorno"?

Statistical learning

Machine learning

Deep learning

R: métodos y arquitecturas de aprendizaje automático 

La percepción del entorno como inspiración para la generación de conocimientos

No supervisado

Supervisado

Regresión

Clasificación

Reforzado

Predicción

Descripción

Aprendizaje automático

Agrupación

Aprendizaje automático supervisado

Entrenamiento

Generalización

Aprendizaje

Modelo

Modelo

Datos observados

Aprendizaje

Aprendizaje

Modelo

Datos no observados

Validación

Error

  • 2008-2018 
  • 45 indicadores:
    • educación, salud, alimentación y vivienda
  • "​generar información no sólo de acceso sino también de calidad"
  • "crear herramientas para la elaboración de diagnósticos de cualquier política social"

Problema: modelo mutidimensional

¿Cómo medir la pobreza con ~45 variables?

Datos iid

(observables)

Método de aprendizaje

Parámetros & hiperparámetros

Distribución desconocida 

Modelo

(basado en datos)

Propuesta de solución

Función desconocida

Generalización

53%

47%

input

output

Sistema tradicional

entrada

resultado esperado

modelo

Aprendizaje automático supervisado como sistema generador de conocimientos

variables explicativas \(X=\{x_1, x_2, \dots, x_n\}\)

variable explicada \(y\)

Perspectiva inicial

🐒

🐒

🐒

🤖

🐒

¿Cómo funciona el aprendizaje automático supervisado?

Epistemología y ciencia 

(de datos)

ἐπιστήμη, epistēmē, knowledge, conocimiento

-λογία, -logia, -logy, -logía

El estudio del conocimiento

 

datos

Scientia, science, ciencia

(a.k.a conocimiento)

Sistema para generar conocimiento

 

Enfoque desde la epistemología: la filosofía del conocimiento

¿Qué es conocimiento?

Evidencia

Datos

Modelo

Hipótesis

¿Cómo obtener conocimiento?

Enfoque de descubrimiento de conocimiento en bases de datos: la extracción no trivial de conocimiento implícito, previamente desconocido y potencialmente útil de los datos

¿Cómo obtener conocimiento?

Investigación y desarrollo: nuevas metodologías, métodos, arquitecturas; nuevos tiempos, viejos amigos.

Set de hipótesis

Datos

Modelo

de aprendizaje

\(H\)

\({P(X,Y)}\)

Aprender conocimiento (relaciones) a partir de datos a través de un modelo basado en datos.

¿Cómo aprender de los datos?

\({\hat{f}}≈{f}\)

\({X}\)

\({Y}\)

\({h_1= \hat{f}}\)

El problema del aprendizaje: existe un conjunto conocido \(X\) y una función desconocida \(f\) en \(X\). Dados los datos, construye una buena aproximación \(\hat{f}\) de \(f\). Esto es aprender desde los datos.

¿Qué es aprender de los datos?

Set de hipótesis

Ejemplos de entrenamiento

Método de aprendizaje

\(H\)

\(P(X,Y)={(x_1, y_1)}{\dots}{(x_N,y_N)}\)

\({f:X \rightarrow{Y}}\)

Función entrenamiento-target desconocida

\(A\)

Final hypothesis

\({\hat{f}}≈{f}\)

Modelo o función de aprendizaje

Primera aproximación al aprendizaje automático supervisado

Problema de clasificación \(n-\text{dimensional}\)

Resumen

  • Introducción y primera aproximación del área de estudio
  • Enfoques y metodologías para el aprendizaje automático basado en datos

El aprendizaje automático

By Goa J

El aprendizaje automático

  • 19