Wie ein Hadoop-Cluster-Architektur zu wählen

Hadoop ist so konzipiert, auf einem großen Cluster von vernetzten Computern eingesetzt werden, Master-Knoten mit (die Host-Dienste, die Hadoop der Lagerung und Verarbeitung zu steuern) und Slave-Knoten (wo die Daten gespeichert und verarbeitet werden). Sie können jedoch laufen Hadoop auf einem einzelnen Computer, die eine gute Möglichkeit ist durch das Experimentieren in einem kontrollierten Raum, um die Grundlagen der Hadoop zu lernen.

Hadoop hat zwei Implementierungsarten: Pseudo verteilten Modus und vollständig verteilten Moden, von denen beide hier beschrieben werden.

Pseudo-verteilten Modus (Einzelknoten)

Ein Ein-Knoten-Hadoop-Implementierung wird als Lauf Hadoop in Pseudo verteilt Modus, in dem alle Hadoop Dienste, einschließlich der Master- und Slave-Dienste, die alle auf einem einzigen Rechenknoten ausgeführt werden. Diese Art von Einsatz ist nützlich für Anwendungen schnell zu testen, während Sie sie zu entwickeln, ohne über die Verwendung von Hadoop-Cluster-Ressourcen jemand anderes brauchen könnte zu kümmern.

Es ist auch eine bequeme Möglichkeit, mit Hadoop zu experimentieren, da die meisten von uns nicht Cluster von Computern zur Verfügung haben.

Vollständig verteilten Modus (ein Cluster von Knoten)

Ein Hadoop Einsatz, wo die Hadoop Master- und Slave-Dienste auf einem Cluster von Computern ausgeführt wird, läuft in dem, was ist bekannt als vollständig verteilten Modus. Dies ist ein geeigneter Modus für die Produktion Clustern und Entwicklungscluster. Eine weitere Unterscheidung kann hier vorgenommen werden: a Entwicklungscluster hat in der Regel eine kleine Anzahl von Knoten und verwendet wird, um die Arbeitsbelastung bis zum Prototyp, der schließlich auf ein laufen Produktionscluster.

Menü