Skip to main content

Was sind die verschiedenen Arten von Data Warehouse -Systemen?

Es gibt zwei Hauptdatenlagersysteme;normalisiert und dimensional.In einer normalisierten Struktur sind die Daten auf eine einfache Darstellung von sachlichen Informationen beschränkt.Es gibt keinen Kontext oder Hintergrund zu den Daten, die über das hinausgehen, was der Benutzer bereit ist, zu korrelieren.In einem dimensionalen System kommen die Informationen in einem Kontext anderer Fakten, die zeigen, was die Daten insgesamt sind.In diesem Fall stehen eine Fülle von Informationen zur Verfügung, unabhängig davon, ob Sie diese möchten oder nicht.

Die beiden Hauptdatenlagersysteme sind die beiden Extreme.In den meisten Data Warehouses wird zwischen diesen beiden ein Mittelweg erreicht.Die tatsächlichen Beschreibungen gelten für die reinste Form des Stils, obwohl dies selten auftritt.In diesem Stil werden Informationen auf individuelle Fakten ohne Verbindungen zu anderen Daten abgeholt.Beispielsweise werden die Seriennummer und der Name des Produkts ohne zusätzliche Informationen zusammengestellt.Die Informationen stehen jedem Benutzer zur Verfügung, der dies mag, aber sie müssen die Arbeit erledigen, um dies zu machen.

Um Informationen in normalisierten Data Warehouse -Systemen zu verstehen, sammelt der Benutzer verbundene Informationen, um ein Ganzes zusammenzuschließenBild.Um die Telefonnummer eines Kunden zu finden, können die obigen Informationen mit einer Seriennummer und einer Kontonummer der Person, die den Artikel gekauft hat, verbunden sein.Dann könnte die Kontonummer und der Name gefunden werden.Schließlich werden der Name und die Telefonnummer gefunden.Jeder dieser Schritte ist eine separate Datenbankabfrage, die vom Benutzer zur Erfassung von Informationen ausgeführt wird.

Dimensionale Daten sind genau das Gegenteil.Im Allgemeinen sind diese Data Warehouse -Systeme für Menschen am einfachsten zu verwenden, aber am schwierigsten zu ändern oder zu manipulieren.Wenn Informationen gesammelt werden, wird alles zu einem großen Datenball kombiniert.Anstelle einer seriellen und Produktnummer würde eine gesamte Einkaufsrechnung gleichzeitig eingehen.

Wenn ein Benutzer in einer dimensionalen Datenbank nach einer Telefonnummer suchen würde, wäre der Prozess unterschiedlich.Die Seriennummer würde einen ganzen Geschichte für diesen Kunden, Namen und Daten von allem ergeben, was jemals gekauft wurde, und alle Serviceanrufe oder Rückgaben.Darüber hinaus wäre auch jede Adresse und Telefonnummer, die der Kunde jemals verwendet hat, direkt verfügbar.Das Bild ist sehr vollständig, aber vielleicht so vollständig, dass die erforderlichen Informationen schwer zu finden sind.