Supports CSV, JSON, and Parquet formats.
Use command: write.format("delta") for storage.
Utilize Auto Loader for efficient data streaming.
Es el sistema para programar y automatizar la ejecución de trabajos en Databricks.
Ejecutar ETL, cargas de datos o procesos programados sin intervención manual.
Centraliza seguridad y control de acceso a datos en Databricks.
Cumplimiento normativo, control de acceso preciso y descubrimiento de datos.
Reacción a eventos en tiempo real: sensores, logs y métricas.
Construir un sistema inteligente que prediga la demanda futura de autos usados (por marca, modelo, año y ciudad), y recomiende niveles óptimos de stock a distribuidores o concesionarios.
Delta Lake: ingestión y versionado de inventario, ventas y búsquedas
Auto Loader: conexión continua a nuevas ventas o búsquedas desde APIs
Delta Live Tables (DLT): pipeline declarativo
MLflow: entrenamiento y despliegue del modelo de predicción
Unity Catalog: gobernanza del dato (control por ciudad o distribuidor)
Databricks SQL Dashboard: para mostrar insights y alertas
Databricks Fundamentals Learning Plan:
https://customer-academy.databricks.com/learn/learning-plans/215/databricks-fundamentals-learning-plan
Data Engineer Learning Plan:
https://customer-academy.databricks.com/learn/learning-plans/10/data-engineer-learning-plan