Ciencia de Sistemas de Datos en la Era del Aprendizaje Profundo

Presenta: Jacobo León

Seminario LEEIA

"Una vez, soñé que era una mariposa, revoloteando aquí y allá, a todo lo que se parece a una mariposa.

 

Estaba consciente de mi felicidad como mariposa, inconsciente de mi individualidad como hombre.

 

De repente, desperté, y allí estaba yo, verdaderamente yo de nuevo.

 

Ahora no sé si yo era un hombre que soñó ser una mariposa, o si soy una mariposa soñando que soy un hombre."

 

Zhuangzi (también conocido como Chuang Tzu), un influyente filósofo taoísta que vivió alrededor del siglo IV a.C

Seminario LEEIA

Motivación

Seminario LEEIA

Charla: Ontología y ética de la IA

Presentó: Dr. Alfredo Marcos

 

Directrices:

  • Implicaciones ontológicas
    • ¿Existe la IA? ¿Qué es la IA?
  • Implicaciones epistemológicas
    • ¿qué y cómo aporta al "conocimiento"?
  • Implicaciones prácticas
    • Ético-políticas

Agenda

  • Desentrañar
    • disentangle
  • Secretos ocultos
    • relaciones
  • Espacio latente
    • imaginación
  • Síntesis de conocimiento
    • datos → conocimientos
  • ​Marco unificador
    • ​ciencia de sistemas de datos
  • Sistemas
    • de datos, de información, de representación
  • Modelado de conocimiento
    • arquitecturas de representación
  • Procesamiento cognitivo
    • sistema 1 y sistema 2

Revisar conceptos clave

Seminario LEEIA

Seminario LEEIA

Seminario LEEIA

Seminario LEEIA

Pasado

Presente

Futuro

Seminario LEEIA

Secuencia

Abstracción

Seminario LEEIA

Dominio humano

Dominio máquina

Intérprete

Agente

Seminario LEEIA

Seminario LEEIA

Seminario LEEIA

↑ entropía

↑información

↑ incertidumbre

↓ entropía

↓ información

↓ incertidumbre

Seminario LEEIA

↑ entropía

↑información

↑ incertidumbre

↓ entropía

↓ información

↓ incertidumbre

Seminario LEEIA

Seminario LEEIA

Seminario LEEIA

↑ Extensión

↓ Reducción

≈ Transformación invariante

1

≈ Transformación invariante

2

Seminario LEEIA

Seminario LEEIA

Seminario LEEIA

Seminario LEEIA

Seminario LEEIA

Reinforcement Learning

Seminario LEEIA

Contexto histórico-temporal:

Era del Aprendizaje Profundo

Aprendizaje Profundo → Aprendizaje de Representación

AI Winter

2023

Año 1

 ChatGPT

1936

Año 0

 Cómputo

Seminario LEEIA

Seminario LEEIA

1

Aprendizaje de Representación

Seminario LEEIA

Aprendizaje de Representación

Seminario LEEIA

Arquitecturas de Representación

Seminario LEEIA

Oportunidades

2021

Seminario LEEIA

Oportunidades

Seminario LEEIA

Línea de investigación propuesta:

Ciencia de Sistemas de Datos

Jacobo León, 2024

Seminario LEEIA

Línea de investigación propuesta:

Ciencia de Sistemas de Datos

Sistema de Datos

Sistema de Información

Sistema de Representación

Seminario LEEIA

3-dimensional Knowledge Discovery (3dKD)

3d Knowledge Discovery Process (3dKDP)

Seminario LEEIA

Information Granules

Synthesis (IGS)

Deep Artificial Neural Network Architectures (DANNAs) for Information Extraction

Seminario LEEIA

Goal-Oriented Human-Machine Process (GO-HMP)

Data-System Science framework

Seminario LEEIA

Caso de estudio 1

Human Domain Card

  • Project: Booking Simulator
  • Context: Benefit Earnings Aproximation
  • Goals: AIaaS (AI as a Service)
  • Systems: Extract, Learning, and Deploy
  • Data: Hotel
  • Tasks: Source, Preprocessing, Modeling, Evaluation, Validation, and Deploy

Machine Domain Card

  • Sources: 1 Mixed Tabular (36 275, 19~30)
  • Preprocessing:
    • numerical → Min-Max Scaling
    • categorical → One-hot Encoder
  • Model: Multi-task Regressor
  • Hyp. Opt.: Random Search
  • Evaluation: MSE, R2
  • Validation: 10-fold cross validation

Multi-task Regressor

\(f_{i}: x → \hat{y}_i\)

Product Evidence

Seminario LEEIA

Human Domain Card

  • Project: FAOSTAT
  • Context: Food and agriculture indicators
  • Goals: Latent Space 2 map
  • Systems: Information Extraction
  • Data: Food and agriculture indicators
  • Tasks: Source, Preprocessing and Granulation

Machine Domain Card

  • Sources: 2 Mixed Tabular (659 143, 65~294)
  • Preprocessing:
    • numerical → Min-Max Scaling
    • categorical → One-hot Encoder
  • Models: Single-Task Representation Learning
  • Evaluation: Accuracy, F1, Recall, Precision
  • Validation: 10-fold cross validation

Product Evidence

Caso de estudio 2

Caso de estudio 3

Human Domain Card

  • Project: Defunciones México
  • Context: DGIS México
  • Goals: Knowledge Discovery Process (KD)
  • Systems: Information Extraction
  • Data: Defunciones 2019-2021
  • Tasks: Source, Preprocessing, Granulation, Mining, Evaluation, and Interpretation

Machine Domain Card

  • Sources: 1 Mixed Tabular (2 089 174, 18~793)
  • Preprocessing:
    • numerical → Min-Max Scaling
    • categorical → One-hot Encoder
  • Models:
    • Single-Task Representation Learning 
    • K-medoids
  • Evaluation: Similarity
  • Validation: 10-fold cross validation

Product Evidence

Single-task Representation Learning

\(f: x → z, g: z → \hat{y}\)

\(f ○ g: x → z → \hat{y}\)

K-medoids

\(\psi:  z→ \hat{\mu}\)

Seminario LEEIA

Trabajo futuro

Souce Data System

(2025)

Knowledge Discovery System

(2026)

Data Systems Science Process

(2027)

Information Learning Sytem (2024)

DL Architectures for Data Science Systems

(2029)

DL Regularization for Data Science Systems

(2028)

Seminario LEEIA

Discusión

  • Implicaciones ontológicas
    • ¿Existe la IA? ¿Qué es la IA?
  • Implicaciones epistemológicas
    • ¿qué y cómo aporta al "conocimiento"?
  • Implicaciones prácticas
    • Ético-políticas

Seminario LEEIA

Seminario LEEIA

¿Cómo usarías la ciencia de sistemas de datos?

¿Qué conocimientos esperarías? ¿Qué implicaciones tendría?

Seminario LEEIA

¡Gracias!

🤗

+ info: @jacoboggleon

Ciencia de Sistemas de Datos en la Era del Aprendizaje Profundo

By jacoboggleon

Ciencia de Sistemas de Datos en la Era del Aprendizaje Profundo

  • 95