Datawarehouse Grundlagen
Ein Data Warehouse (kurz DWH oder DW; wörtlich „Datenlager“) ist eine für Analysezwecke optimierte zentrale Datenbank, die Daten aus mehreren, in der Regel heterogenen Quellen zusammenführt.[1] Der Begriff stammt aus dem Informationsmanagement in der Wirtschaftsinformatik.
Mitte der 1980er-Jahre wurde bei IBM der Begriff information warehouse geschaffen. Der Terminus data warehouse wurde erstmals 1988 von Barry Devlin verwendet.[2]
Es gibt derzeit keine einheitliche Definition für den Begriff „Data Warehouse“. Weitgehend gilt jedoch:
Ein Data Warehouse ermöglicht eine globale Sicht auf heterogene und verteilte Datenbestände, indem die für die globale Sicht relevanten Daten aus den Datenquellen zu einem gemeinsamen konsistenten Datenbestand zusammengeführt werden. Dies ermöglicht einen komfortablen Datenzugriff.[3]
Der Inhalt eines Data Warehouse entsteht durch Kopieren und Aufbereiten von Daten aus unterschiedlichen Quellen.
Meist ist ein Data Warehouse die Basis für die Aggregation von betrieblichen Kennzahlen und darauf aufbauende Analysen, das sogenannte Online Analytical Processing (OLAP).
Ein Data Warehouse ist häufig Ausgangsbasis für Data Mining.
Oft arbeiten die Anwendungen mit anwendungsspezifisch erstellten Auszügen aus dem Data Warehouse, den sogenannten Data Marts.