Földi Tamás - tfoldi@starschema.com - @tfoldi
+1. Compliance
Saját adatbázis-kezelő virtuális gépen
AWS RDS
AWS Reshift
Azure CDaaS
Google BigQuery
Amazon Aurora Serverless
Amazon Athena
Üzleti vagy technikai szabály alapján ("Utoljára módosítva" oszlop)
Lassú
Csak kötegelve működik
Sok hibalehetőség
Terheli a forrásrendszert
Teljesen haszontalan, az iparág szégyene
Sok hibalehetőség (tizedesjel, dátumforma)
Nincs metaadat
Sok helyet foglal, lassú
(Azonnali segítség: SQLite, Parquet, RC, HDF5, ProtoBuf)
A Dicső Múlt
(Change Data Capture)
Adatbázis tranzakcios logok alapján (redolog, journal, stb)
Nem kell üzleti definició
Valós idejű, de kötegelhető
Nem veszik el adat
Nem terheli a forrást
Vagy "rendesen, vagy sehogy":
Amint egyetlen custom SQL vagy tárolt eljárás belekerül, elveszítjük a fő értékét
Szabályzás > Teljesítmény
Lehetőleg kód generálás és ELT
Adatbázisban tárolni ETL kódokat nem túl jó ötlet:
TÉVEDÉS: A tárolt eljárás nem gyorsabb
Miért jobb:
Annyira komplex nálunk a környezet, hogy mi már nem is tesztelünk
banki adattárház vezető
Menedzselt szolgáltatás - csak felhő
Extra funkciók:
Oracle Database In-Memory a tábla adatait egyszerre tartja sor és oszlop alapú memória tárolóban. Az optimizer a tranzakciós SQL utasításokat a sor alapún, míg az analitikusakat az oszlop alapún hajtja végre.
Usability Engineering, Jakob Nielsen
OLAP Indexek Hadoop vagy Spark adatokon
Földi Tamás - tfoldi@starschema.com
@tfoldi