Ciencia de Sistemas de Datos en la Era del Aprendizaje Profundo
Presenta: Jacobo León

Seminario LEEIA

"Una vez, soñé que era una mariposa, revoloteando aquí y allá, a todo lo que se parece a una mariposa.
Estaba consciente de mi felicidad como mariposa, inconsciente de mi individualidad como hombre.
De repente, desperté, y allí estaba yo, verdaderamente yo de nuevo.
Ahora no sé si yo era un hombre que soñó ser una mariposa, o si soy una mariposa soñando que soy un hombre."
Zhuangzi (también conocido como Chuang Tzu), un influyente filósofo taoísta que vivió alrededor del siglo IV a.C

Seminario LEEIA
Motivación

Seminario LEEIA
Charla: Ontología y ética de la IA
Presentó: Dr. Alfredo Marcos
Directrices:
- Implicaciones ontológicas
- ¿Existe la IA? ¿Qué es la IA?
- Implicaciones epistemológicas
- ¿qué y cómo aporta al "conocimiento"?
- Implicaciones prácticas
- Ético-políticas
Agenda
-
Desentrañar
- disentangle
-
Secretos ocultos
- relaciones
-
Espacio latente
- imaginación
-
Síntesis de conocimiento
- datos → conocimientos
-
Marco unificador
- ciencia de sistemas de datos
-
Sistemas
- de datos, de información, de representación
-
Modelado de conocimiento
- arquitecturas de representación
-
Procesamiento cognitivo
- sistema 1 y sistema 2
Revisar conceptos clave

Seminario LEEIA








Seminario LEEIA




Seminario LEEIA


Seminario LEEIA



Pasado
Presente
Futuro

Seminario LEEIA
Secuencia

Abstracción

Seminario LEEIA



Dominio humano
Dominio máquina
Intérprete
Agente

Seminario LEEIA


Seminario LEEIA



Seminario LEEIA

↑ entropía
↑información
↑ incertidumbre
↓ entropía
↓ información
↓ incertidumbre

Seminario LEEIA

↑ entropía
↑información
↑ incertidumbre
↓ entropía
↓ información
↓ incertidumbre





Seminario LEEIA




Seminario LEEIA





Seminario LEEIA
↑ Extensión
↓ Reducción

≈ Transformación invariante
1
≈ Transformación invariante
2

Seminario LEEIA






Seminario LEEIA




Seminario LEEIA







Seminario LEEIA


Seminario LEEIA



Reinforcement Learning







Seminario LEEIA
Contexto histórico-temporal:
Era del Aprendizaje Profundo
Aprendizaje Profundo → Aprendizaje de Representación

AI Winter
2023
Año 1
ChatGPT
1936
Año 0
Cómputo









Seminario LEEIA

Seminario LEEIA
1
Aprendizaje de Representación








Seminario LEEIA
Aprendizaje de Representación







Seminario LEEIA
Arquitecturas de Representación







Seminario LEEIA
Oportunidades



2021

Seminario LEEIA
Oportunidades











Seminario LEEIA

Línea de investigación propuesta:
Ciencia de Sistemas de Datos

Jacobo León, 2024

Seminario LEEIA
Línea de investigación propuesta:
Ciencia de Sistemas de Datos

Sistema de Datos
Sistema de Información
Sistema de Representación

Seminario LEEIA
3-dimensional Knowledge Discovery (3dKD)
3d Knowledge Discovery Process (3dKDP)




Seminario LEEIA
Information Granules
Synthesis (IGS)
Deep Artificial Neural Network Architectures (DANNAs) for Information Extraction




Seminario LEEIA
Goal-Oriented Human-Machine Process (GO-HMP)
Data-System Science framework




Seminario LEEIA
Caso de estudio 1
Human Domain Card
- Project: Booking Simulator
- Context: Benefit Earnings Aproximation
- Goals: AIaaS (AI as a Service)
- Systems: Extract, Learning, and Deploy
- Data: Hotel
- Tasks: Source, Preprocessing, Modeling, Evaluation, Validation, and Deploy
Machine Domain Card
- Sources: 1 Mixed Tabular (36 275, 19~30)
-
Preprocessing:
- numerical → Min-Max Scaling
- categorical → One-hot Encoder
- Model: Multi-task Regressor
- Hyp. Opt.: Random Search
- Evaluation: MSE, R2
- Validation: 10-fold cross validation
Multi-task Regressor
\(f_{i}: x → \hat{y}_i\)
Product Evidence


Seminario LEEIA
Human Domain Card
- Project: FAOSTAT
- Context: Food and agriculture indicators
- Goals: Latent Space 2 map
- Systems: Information Extraction
- Data: Food and agriculture indicators
- Tasks: Source, Preprocessing and Granulation
Machine Domain Card
- Sources: 2 Mixed Tabular (659 143, 65~294)
-
Preprocessing:
- numerical → Min-Max Scaling
- categorical → One-hot Encoder
- Models: Single-Task Representation Learning
- Evaluation: Accuracy, F1, Recall, Precision
- Validation: 10-fold cross validation
Product Evidence




Caso de estudio 2
Caso de estudio 3
Human Domain Card
- Project: Defunciones México
- Context: DGIS México
- Goals: Knowledge Discovery Process (KD)
- Systems: Information Extraction
- Data: Defunciones 2019-2021
- Tasks: Source, Preprocessing, Granulation, Mining, Evaluation, and Interpretation
Machine Domain Card
- Sources: 1 Mixed Tabular (2 089 174, 18~793)
-
Preprocessing:
- numerical → Min-Max Scaling
- categorical → One-hot Encoder
-
Models:
- Single-Task Representation Learning
- K-medoids
- Evaluation: Similarity
- Validation: 10-fold cross validation
Product Evidence

Single-task Representation Learning
\(f: x → z, g: z → \hat{y}\)
\(f ○ g: x → z → \hat{y}\)
K-medoids
\(\psi: z→ \hat{\mu}\)


Seminario LEEIA
Trabajo futuro

Souce Data System
(2025)
Knowledge Discovery System
(2026)
Data Systems Science Process
(2027)
Information Learning Sytem (2024)



DL Architectures for Data Science Systems
(2029)




DL Regularization for Data Science Systems
(2028)


Seminario LEEIA
Discusión

- Implicaciones ontológicas
- ¿Existe la IA? ¿Qué es la IA?
- Implicaciones epistemológicas
- ¿qué y cómo aporta al "conocimiento"?
- Implicaciones prácticas
- Ético-políticas

Seminario LEEIA


Seminario LEEIA
¿Cómo usarías la ciencia de sistemas de datos?
¿Qué conocimientos esperarías? ¿Qué implicaciones tendría?

Seminario LEEIA
¡Gracias!
🤗
+ info: @jacoboggleon

Ciencia de Sistemas de Datos en la Era del Aprendizaje Profundo
By jacoboggleon
Ciencia de Sistemas de Datos en la Era del Aprendizaje Profundo
- 232

