Data Warehouse

Ein Data Warehouse ist eine Sammlung von elektronischen Daten aus verschiedenen Quellen ist so organisiert , dass die bestmögliche ermöglicht es Ihnen , Berichte zu erstellen und Daten analysieren. Zum Beispiel. von einer Organisation verwendet , die Daten sammeln , auf seinen Produktionseinheiten Umsatz pro Tag, Kosten pro Tag will, oder wie für Entscheidungen eine Grundlage haben.

Definition

Bill Inmon ‚s formale Definition eines Data Warehouse ist eine Computer – Datenbank , die die folgenden Anforderungen erfüllt:

  • Themenorientiert , was bedeutet , dass die Daten in der Datenbank ist so organisiert , dass alle Elemente , die mit einem bestimmten Objekt oder ein Ereignis in der realen Welt müssen zusammen in der Datenbank house’et verknüpft werden.
  • Zeitabhängig , was bedeutet , dass die Daten in der Datenbank zusammen mit der Zeit gespeichert werden , so dass Sie , wie die Daten im Laufe der Zeit verändert hat sehen können.
  • Unveränderliche , die , dass die Daten nicht verändert oder gelöscht verstanden werden müssen, sondern beibehalten , so dass sie in künftigen Berichten verwendet werden können; und,
  • Integrierte , was bedeutet , dass die Daten aus allen Systemen kommen muss die Organisation verwendet und die Daten müssen konsistent sein.

Geschichte

Data Warehousing in den frühen 80er Jahren kam die Notwendigkeit für Cross-Berichterstattung zu erfüllen Unternehmen , sahen im gleichen Zeitraum eine schnell wachsende Menge an Daten, zum Teil , weil. Die allgemeine Umstellung auf größere Einheiten und zum Teil , weil. Der Aufstieg der Computer verwenden. Die Unternehmen der Ansicht , dass Systeme Datendateien und Datenbanken direkt aus der Produktion berichten gab eine unangemessene Belastung für diese und verursacht Probleme in Daten aus unterschiedlichen Systemen ohne gemeinsame Definitionen Sortier.

Gebäude

Die Gründung eines Data Warehouse ist eine Datenbank, die regelmäßig Daten von Produktionssystemen und anderen Informationsquellen in einer solchen Art und Weise kopieren, die die Daten vergleichbar ist, dh das gleiche Nummerierungssystem, das gleichzeitig Division, gleiches Konzept Definition. sucht weiter Daten von Eingabefehlern, unzuverlässige Daten und alles andere ausgespült, die Fehler in der Berichterstattung führen würde, die aber aus verschiedenen Gründen nicht in Produktionssystemen korrigiert.

Ein Data Warehouse wird in der Regel mehrere Jahre Geschichte sammeln Berichterstattung für eine lange Zeit Perspektiven gerecht zu werden. Im Idealfall, so dass ein Data-Warehouse-Daten aus allen Unternehmenssystemen enthalten, dass in allen Kontexten analysiert werden kann und im Bericht ein vollständiges Bild bilden, aber in der Regel ein Unternehmen „stecken“, dass nur einzelnen Abteilungen oder einzelne Bereichen von Daten abgedeckt Lager durch. organisatorische Fragen oder technische Hindernisse.

Ein Data Warehouse mit detaillierten Daten für mehrere Jahre enthält oft eine überwältigende Menge an Daten und damit große Rechenleistung und teilweise erhebliche und unvorhersehbare Reaktionszeiten für die Analyse und Berichterstattung wird ergeben erfordern würde. Um dieses Problem zu lösen, gibt es eine zusätzliche Datenaufbereitung für die Berichterstattung, in der Regel Daten und unterliegen Pannen zusammen. So können Sie detaillierte Daten mit begrenzten Geschichte zu lassen, während die vollständige Geschichte zum Beispiel ugesummer oder eine Produktgruppe Summer gehalten. In ähnlicher Weise kann eine themenorientierte sogenannte ‚bauen Data Marts ‘ , das unterstützt die besondere Art der Berichterstattung , um die gewünschten Bericht Geschwindigkeit zu erreichen.

Verwenden Sie

Die Entwicklung von Data-Warehousing bewegt (vor allem in kundenorientierten Unternehmen) weg von der traditionellen Sicht als historisches Datenarchiv und in Richtung Operationalisierung, dh die Data Warehouse-basierte Funktionalität ist ein wesentlicher Bestandteil des täglichen Geschäftsprozesse. Letzteres setzt voraus, dass die Daten auf die letzte Minute aktualisiert, und die Differenz der Betriebssysteme wird somit immer weniger.

Die typische Stromstruktur, wobei das Datenlager ein separates, zentralisiert Analysesystem ist, wird durch eine erhöhte Analysefunktionen in den sogenannten in Zukunft allmählich ersetzt erwartete ERP – Systemen (integrierte Betrieb Netze), wobei ein Teil des oben beschriebenen Prozesses wird überflüssig. In ähnlicher Weise die neuen Web-basierten erlauben Integrationsmethoden auf den Daten aus dem Quellsystem ohne ersten Kopier analysiert werden.