Data-Warehouse-Prozess
aus Wikipedia, der freien Enzyklopädie
Der Data-Warehouse-Prozess (englisch data warehousing) ist der Prozess zur Bewirtschaftung und Auswertung eines Data-Warehouses (Datenlager), der die folgenden Schritte umfasst:
- Datenbeschaffung: das heißt die Extraktion der relevanten Daten aus den Quellsystemen, Transformation und gegebenenfalls Datenbereinigung in einem Arbeitsbereich sowie Laden in das Data-Warehouse. Dieser Schritt wird auch Extract-Transform-Load-Prozess (ETL-Prozess) genannt.
- Datenhaltung: das heißt die langfristige Speicherung der Daten im Data-Warehouse
- Versorgung und Datenhaltung der für die Analyse notwendigen separaten Datenbestände, den Data-Marts
- Datenauswertung durch Analyse der Daten im jeweiligen Data Mart bzw. Versorgung nachgelagerter Anwendungssysteme
Dabei ist bei allen Schritten das Repositorium eingebunden, das insbesondere beim ETL-Prozess mit Metadaten versorgt wird und insbesondere bei der Analyse der Daten genutzt wird.
Siehe auch
Literatur
- A. Bauer, H. Günzel: Data Warehouse Systeme – Architektur, Entwicklung, Anwendung. dpunkt, 2013, ISBN 978-3-89864-785-4.
- W. Lehner: Datenbanktechnologie für Data-Warehouse-Systeme, Konzepte und Methoden. dpunkt, 2002, ISBN 3-89864-177-5.
Weblinks
- Data Warehousing als Organisationskonzept des Datenmanagements
- Bernhard Strauch, Robert Winter: Vorgehensmodelle für die Informationsbedarfsanalyse im Data Warehousing. (PDF; 231 kB)
- Data Warehousing braucht Prozessdenken. (Memento vom 17. Dezember 2015 im Internet Archive) (PDF; 4112 kB)