data warehouse (tsz. data warehouses)
A data warehouse (magyarul: adattárház) egy speciális típusú adatbázis-rendszer, amelyet kifejezetten nagy mennyiségű strukturált adat hosszú távú tárolására, elemzésére és riportálására terveztek. Az adattárházak célja, hogy különböző forrásokból származó adatokat összevonjanak, megtisztítsanak, átalakítsanak és egységes szerkezetbe integráljanak, majd ezeket üzleti intelligencia (BI) rendszerek számára elérhetővé tegyék.
Tulajdonság | Leírás |
---|---|
Tárgyorientált | Üzleti entitásokra (pl. termékek, ügyfelek) épül |
Integrált | Különböző forrásokból származó adatokat egységesít |
Időhöz kötött | Minden adat időbélyeggel rendelkezik |
Nem változó | A betöltött adatok nem módosulnak, csak bővülnek (historikus tárolás) |
📌 Ezt a folyamatot nevezzük ETL-nek (Extract, Transform, Load).
Komponens | Feladata |
---|---|
Adattárház (DW) | A központi adattároló rendszer |
ODS (Operational Data Store) | Rövid távú operatív adattárolás |
Data Mart | Témaspecifikus részhalmaz (pl. értékesítés, HR) |
ETL-eszközök | Adatkinyerés és -feldolgozás (pl. Talend, Informatica, Apache Nifi) |
OLAP | Gyors lekérdezések multidimenziós adatokra |
BI eszközök | Riportok, dashboardok (pl. Power BI, Tableau, Qlik) |
Forrásrendszerek (ERP, CRM, Weblogok, IoT) ↓ ETL folyamat (adatkinyerés, transzformálás) ↓ Adattárház (Data Warehouse) ↓ BI eszközök, dashboardok, riportok
Dimenziók | Fakt |
---|---|
termék_id , bolt_id , idő_id
|
eladott_darab , bevétel
|
Szolgáltató | Platform |
---|---|
Amazon | Redshift |
BigQuery | |
Microsoft | Azure Synapse Analytics |
Snowflake | Snowflake |
Oracle | Oracle Data Warehouse |
IBM | Db2 Warehouse |
A data warehouse egy speciális adattároló rendszer, amely integrált, megbízható és elemzésre optimalizált adatokat biztosít a döntéshozatal támogatásához. Fontos része a modern üzleti intelligencia ökoszisztémáknak, és az ETL-folyamatokon keresztül képes átalakítani a nyers adatokat értékes információvá.