Die Data Warehouse Lite

Ein Data Warehouse lite ist ein No-Frills, nackte Knochen, Low-Tech-Ansatz Daten zu bieten, die mit einigen Ihrer Geschäfts Entscheidungsfindung helfen können. No-Frills bedeutet, dass Sie zusammen, wo immer möglich, bewährten Fähigkeiten und Tools bereits in Ihrer Organisation Ihr System zu bauen.

Themenbereiche und Dateninhalt eines Data Warehouse-lite

Ein Data Warehouse lite auf der Berichterstattung oder die Analyse von nur ein oder möglicherweise zwei Themenbereiche fokussiert. Nehmen wir an, dass in Ihrem Job bei einer Wireless Division von einer Telefongesellschaft, können Sie den Verkauf von Dienstleistungen wie in-Netzwerk Minuten analysieren, out-of-Network-Minuten, SMS, Internetzugang und andere mobile Nutzung an Verbraucher Haushalten.

Wenn Sie ein Data Warehouse lite ausschließlich zu diesem Zweck bauen, haben Sie alle notwendigen Informationen, um Ihre Analyse zu unterstützen und für den Consumer-Markt berichten. Sie haben keine Informationen über Business-Anwender und Zahlungsverhalten jedoch, da diese Informationen Teil einer anderen Fachrichtung ist, wie es in dieser Figur gezeigt.

bild0.jpg

Basierend auf dem Fachgebiet beschränkt zu sein, hat ein Data-Warehouse lite gerade genug, um Dateninhalt der Hauptzweck der Umwelt, aber nicht genug für viele unstrukturierte Was-wäre-wenn-Szenarien seinen Nutzern schaffen könnte zu befriedigen.

Sie müssen sorgfältig wählen, also aus der Menge aller möglichen Datenelemente und eine überschaubare Teilmenge wählen - Elemente, die, ohne Zweifel zu haben, sind wichtig. Dieses Verfahren ist das gleiche für alle Data Warehouse-Implementierung, mit der Ausnahme, dass Sie extrem diszipliniert sein müssen, wenn Sie Entscheidungen darüber, welche Inhalte aufzunehmen.

Verwenden Sie Standard-Berichte, insbesondere diejenigen, die derzeit sehr viel manuelle Vorbereitung erfordern, als eine Ihrer primären Führer Dateninhalt in einem Data Warehouse lite zu bestimmen.

Datenquellen

Ein Data Warehouse lite verfügt über eine begrenzte Anzahl von Datenquellen - in der Regel ein auf eine Handvoll. Im Rahmen einer umfassenden Umgebung mit einer einzelnen Anwendung, beispielsweise auf die Data-Warehouse lite fungiert als Umstrukturierungsmittel für die Daten der Anwendung machen es query- und berichten freundlich.

Die häufigste Mittel einer einzigen Anwendung die Daten der Umstrukturierung ist es, die Inhalte der Anwendung des relationalen Datenbanktabellen denormalize so viele zu beseitigen relationale Join-Operationen (Der Prozess der Zusammenführung von Daten aus mehr als einer Datenbanktabelle) wie möglich, wenn Benutzer Berichte ausführen oder nicht einfache Abfragen.

Denormalisierung ist das Gegenteil von der relationalen Datenbank Konzept der Normalisierung, eine etwas komplexe Reihe von Richtlinien, die Ihnen sagt, welche Datenelemente, in der Tabellen in einer Datenbank enthalten sein sollte.

Wenn du denormalize eine Datenbank, tun Sie sich keine Sorgen über dupliziert Daten- Sie versuchen, Datenzeilen in einer einzigen Tabelle zu erstellen, die am ehesten die Berichte und Abfragen spiegelt die Benutzer ausführen. Diese Abbildung zeigt ein Beispiel für eine Single-Source-Data-Warehouse lite auf Normalisierungs gebaut.

image1.jpg

Obwohl Sie extern zur Verfügung gestellten Daten in einem Data Warehouse lite Implementierung verwenden kann, wird die Daten, die Sie verwenden selten neu erworben. Du bist eher Daten zu übernehmen, die Sie bereits für die Analyse verwendet werden (vielleicht in einer eigenständigen Art und Weise).

Business-Intelligence-Tools

Die Anwender eines Data Warehouse lite in der Regel Fragen stellen und Berichte erstellen, die eine reflektieren # 147-Sag mir, was # 148- Perspektive passiert ist. Da die Benutzer tun nicht viel schwere analytische Verarbeitung, die Produkte verwenden sie das Data Warehouse zugreifen sollte einfach für sie zu verwenden.

Datenextraktion, Bewegung und Belastung

Einfachheit ist der Name des Spiels in einem Data Warehouse lite. Stellen Sie daher den Prozess der Daten aus Quellen zu extrahieren und alle Funktionen, die Durchführung erforderlich sind, um diese Daten vorzubereiten für so unkompliziert wie möglich Laden durch diese beiden Elemente unter Verwendung von:

  • Einfache Datei Auszüge aus dem Run-the-Business-Systemen und Dateiübertragungen, die es Ihnen ermöglichen, Daten aus den Quellen bis zum Data Warehouse-lite zu bewegen

  • Geradlinig benutzerdefinierten Code (oder vielleicht ein einfach zu bedienendes Werkzeug), die zu extrahieren und die Daten bewegen

Wenn die Datenquelle für Data Warehouse-lite auf einer relationalen Datenbank aufgebaut wird, und Sie planen, das gleiche Datenbankprodukt für Data-Warehouse zu verwenden, verwenden Sie SQL auf einfache Weise Datenextraktion und Bewegung handhaben. Diese Schritte - wie in der Abbildung gezeigt - eine Standardprozedur für diesen Prozess (Sie werden diese Schritte, um Ihre Umgebung, natürlich anpassen wollen):

  1. Auf dem System, das Ihr Lager befindet, verwenden Sie die SQL-Anweisung CREATE TABLE die Definition für jede Tabelle in Data Warehouse-lite zu erstellen.

  2. Erstellen Sie eine Datenbank Sicherungskopie dass enthält Kopien aller Tabellen aus der Quelle, die Daten an das Lager zur Verfügung stellen, und dann diese Tabellen in einem Staging-Bereich auf dem System neu zu laden, wo Sie planen, Ihr Data-Warehouse zu finden.

    Sie sollten sicherstellen, dass die Netzwerkbandbreite und Zeitfenster ausreichend sind alle Quellentabellen in das System zu kopieren, indem ein Dateiübertragungsprogramm.

  3. Verwenden Sie die SQL-Anweisung INSERT, mit einer verschachtelten SELECT-Anweisung unter Angabe der Quelltabellen und ihre jeweiligen Spalten, die die Data Warehouse-Tabelle zu füllen (und, wie die Tabellen werden verbunden), um die Daten in Data Warehouse-lite zu laden.

  4. Führen Sie eine Reihe von Qualitätssicherung (QA) Routinen, um zu überprüfen, dass alle Daten ordnungsgemäß geladen wurde.

    Überprüfen Sie Zeilenanzahl, numerische Summen, und was sonst Sie können.

    image2.jpg

Die Architektur

Die Architektur eines Data Warehouse-lite ist aus der Datenbank zusammengesetzt verwendet, um die Daten zu speichern, die Front-End-Tools Business Intelligence verwendet, um die Daten zuzugreifen, die Art und Weise die Daten bewegt wird, und die Anzahl der Fachgebiete. Die Losung dieser Umgebung ist minimalistisch: keine Glocken, keine Pfeifen, nichts Besonderes - gerade genug, um Technologie für die Umwelt angewendet Nutzer Daten erhalten Zugriff auf die sie benötigen.

Die Architektur eines Data Warehouse-lite, wie es in dieser Figur gezeigt, enthält diese Hauptkomponententypen:

  • Eine einzige Datenbank enthält die Lagerdaten.

  • Diese Datenbank wird direkt von jeder der Quellen gespeist Daten an das Lager bereitstellt.

  • Der Zugriff auf die Daten direkt aus dem Lager.

    image3.jpg

Menü