Big Data Meetup
Földi Tamás - Starschema
@tfoldi
Oké, szóval kicsit random lesz, személyes és elfogult.
Snowflake IPO
Frank Slootman
Executive Officer Frank Slootman one of the best-paid technology executives. A compensation package he received upon joining Snowflake in April 2019 awards him a batch of options every month — for four years — that are now worth almost *$95 million each, or about $1.1 billion annually.
*Hó eleji SMS:
27.895.801.856 Ft
Óradíj:
174.348.761 Ft
Az "adattárház"
újra szexi
ONE COPY
MULTIPLE WORKLOAD
Cserébe drága.
Analitikus
DWH
AWS Redshift?
https://cloudwars.co/oracle/oracles-larry-ellison-admits-snowflake-is-killing-amazon-redshift/
Azure Synapse?
Pro
Működik. Többnyire.
Eléggé fejlesztik.
Egy platform, Databricks/Spark, ADF, DL
Contra
Nincs rendes storage-computation szétválasztás
Kicsit olyan mint majális, van benne minden is
Single-cloud
Harmadszorra nevezik át
Analitikus
DWH
Gyors
réteg
Kihívók
JÖVŐBELÁTÁS 1:
TOVÁBBRA IS TAROL A SNOWFLAKE
2021-BEN
JÖVŐBELÁTÁS 2:
NINCS EGYÉRTELMŰ GYŐZTES A "SPEED LAYER" KATEGÓRIÁBAN
Big Data
Hadoop = ✞
Spark = ???
1 - Project Hydrogen
Erről még lesz szó.
2. Delta Lake
Delta Lake Megoldások
Python
Python
Lassú, interpretált
Nem-típusos, None
GIL
Eager execution
Borzasztó vektorizálás
Halál csomagkezelés
Rakás külső függés (BLAS)
+1 Python 2 vs Python 3
Normális nyelv
Gyors (JIT vagy LLVM)
Típusos
Lock-free
Lazy-execution
Vektorizálás
Cargo/Cabal/Go csomagk.
Minimum külső függés
Python, mint de facto data nyelv egy tévedés
Pandas tuning
bodo.ai
JÖVŐBELÁTÁS 3: HPC/MPI LEVÁLTJA A "SMALL TASK" MÓDSZERT
2021 Trendek
Data Literacy
ML assisted Data Management (Alation, BigId, Collibra)
SQL/Python DWH Frameworks (dbt)
Accelerated Visualization (streamlit, panel, plotly)
Data Science Model Management as a Service
Data Marketplaces
Kubernetes
Multi-cloud disaster recovery
Köszike
bigdata-meetup-2021-01
By Tamas Foldi
bigdata-meetup-2021-01
- 566