Data Warehousing und die Infrastruktur Herausforderung

Die Art eines Data Warehouse (dass es in erster Linie zusammengesetzt ist, oder ausschließlich von Daten, die aus anderen Ländern, anderen Anwendungsdatenbanken kommt, und wird in einen Daten Asset umgewandelt) bedeutet, dass es nicht allein als eigenständige Einheit innerhalb des Unternehmens stehen.

Das phänomenale Wachstum des verteilten Rechnens (Internet und Intranet sowie Data Warehousing interne und externe Daten) in einem grundlegenden Wandel in der Art und Weise führte Anwendungen aufgebaut sind. In den alten Tagen der Mainframes und Minicomputer, ein einzelnes physisches System enthalten weitgehend die Infrastruktur (Betriebssysteme, Datenbanken und Dateisysteme und Kommunikations- und Transaktionsmanager).

Mit verteilten Computing nun das vorherrschende Modell (auch Mainframes und Minicomputer sind in der Regel Teil eines größeren verteilten Umgebung) wird die Infrastruktur außerhalb Ihres Unternehmens vielen verschiedenen Plattformen in Ihrem Unternehmen und möglicherweise verteilt.

Wenn Sie eine Anwendung oder ein System zu entwickeln, so oder Data Warehousing oder eine traditionelle Transaktionsverarbeitungsanwendung, haben Sie erhebliche Abhängigkeiten von Stücken der gesamten Umgebung, über die Sie keine direkte Kontrolle haben. Hier sind einige Beispiele speziell für Data Warehousing:

  • Sie entwerfen ein Data Warehouse, die, basierend auf Geschäftsanforderungen und Verfügbarkeit der Anwendungen Datenrichtlinien, müssen etwa 25 Gigabyte an neuen und aktualisierten Daten extrahiert aus verschiedenen Quellen jeden Abend haben und über das Netzwerk an die Hardware-Plattform der Data-Warehouse, auf dem gesendet wird, läuft .

    Ihr Unternehmensnetzwerkinfrastruktur ist noch zu klein. Nach weiteren Analyse kann das Netzwerk nicht nahe kommen, um den Durchsatz erforderlich sind, um die Daten in Ihrem Lager zu bewegen in der zur Verfügung stehenden Zeitfenster zu unterstützen.

  • Während der Datenumfang Phase des Lager Projekt legen Sie fest, dass eine Push-Strategie, um die Data-Warehouse zu aktualisieren ist die am besten geeignete Modell zu folgen. Um eine Push-Strategie umzusetzen, obwohl, müssen Sie jede Source-Anwendung ändern, um Code enthalten, wenn die Anwendung erkennt, muss drücken (Senden) Daten an das Data Warehouse.

    Die Legacy-Anwendungen, die Daten an das Lager liefern sind leider so schwierig machen keine Änderungen, dass eine Politik zu verstehen, wenn es nicht unbedingt in der Tat notwendig, für jede Anwendung ist.

  • Sie entscheiden, ein relationales OLAP (ROLAP oder) Lösung zu verfolgen und eine Reihe von Benchmarks im Vergleich zu drei relationalen DBMS (RDBMS) Produkte laufen zu sehen, die man am besten unterstützt Informations- und Entscheidungsunterstützungsverarbeitung (eher als Transaktionsverarbeitung).

    Das Produkt, das in Ihre Benchmarks durchgeführt am schlechtesten ist leider auch Ihre Corporate-Standard, und jeder relationalen Datenbank überall in Ihrem Unternehmen installiert ist, muss dieser Sorte sein, egal, wie Sie planen, es zu benutzen.

Denken Sie konzeptionell (nicht über Details der Implementierung Sorgen) in den frühen Phasen eines Data-Warehousing-Projekt, oder jede andere Anwendung Entwicklungsaufwand - es ist nicht nur akzeptabel, sondern auch eine gute Entwicklung der Systeme der Praxis.

Irgendwann jedoch müssen Sie Hardware, Software, Kosten, Budget und andere Arten von realen Einschränkungen berücksichtigen. Bevor mit dem Bau beginnen, sollten Sie alles zu berücksichtigen, die Ihre Entwürfe und Pläne für Ihre Data Warehouse beeinflussen können.

Dieses Projekt ist sehr ähnlich, ein Haus zu bauen. Sie folgen einem Prozess, bei dem Sie Ihre Bedürfnisse bestimmen, und dann der Architekt erarbeitet Baupläne. Die Pläne markieren Sie die Materialien, die Sie benötigen, um Ihre Anforderungen zu unterstützen - sicherzustellen, dass das fertige Produkt die Vision am Anfang etabliert erfüllt.

Menü