Die HBase Masterserver

Starten einer Diskussion von HBase (Hadoop Database) Architektur von RegionServers anstelle der Masterserver beschreiben können Sie sich überraschen. Der Begriff RegionServer scheint zu implizieren, dass es abhängt (und ist sekundär) der Masterserver, und dass Sie deshalb den Masterserver zuerst besprechen sollte. Wie das alte Lied geht, obwohl, # 147-es ist nicht notwendigerweise so # 148.

Die RegionServers hängen von der Masterserver für bestimmte Funktionen, aber nicht im Sinne einer Master-Slave-Beziehung für Datenspeicherung und -abfrage. In der oberen linken Ecke der Figur, feststellen, dass die Kunden auf den Masterserver nicht Punkt, sondern auf die Zookeeper Cluster und RegionServers zeigen.

bild0.jpg

Der Masterserver ist nicht im Pfad für die Datenspeicherung und Zugriff - das ist die Aufgabe des Zookeeper Clusters und die RegionServers. Werfen Sie einen Blick auf die Hauptfunktionen des Masterserver, der auch ein Software-Prozess ist (oder Dämon) wie die RegionServers. Der Masterserver ist es zu

  • Überwachen Sie die RegionServers im HBase Cluster: Der Masterserver verwaltet eine Liste der aktiven RegionServers im HBase Cluster.

  • Handle Metadatenoperationen: Wenn eine Tabelle erstellt oder seine Attribute verändert werden (Komprimierung, Cache-Einstellungen, Versionierung und mehr) übernimmt die Masterserver den Vorgang und speichert die erforderlichen Metadaten.

  • Vergeben Regionen: Der Masterserver ordnet Regionen RegionServers.

  • Verwalten RegionServer Failover: Wie bei jedem verteilten Cluster, hoffen Sie, dass Knotenfehler nicht auftreten und Sie planen, auf jeden Fall für sie. Wenn der Regional Server ausfallen, meldet Zookeeper den Masterserver, so dass Failover und Wiederherstellungsvorgänge eingeleitet werden kann.

  • Beaufsichtigen Sie den Lastausgleich von Regionen über alle verfügbaren RegionServers: Vielleicht erinnern Sie sich, dass Tische sind aus Regionen besteht, die über alle verfügbaren RegionServers gleichmäßig verteilt sind. Das ist die Arbeit der Ausgleichs Gewinde (oder lästige Arbeit, wenn Sie bevorzugen), die der Masterserver aktiviert in regelmäßigen Abständen.

  • Verwalten (und reinigen) Katalogtabellen: Zwei Schlüsselkatalogtabellen werden vom HBase-System verwendet ein Client, um bestimmte Schlüsselwertpaar im System zu finden.

    Der Masterserver ermöglicht die Verwaltung dieser kritischen Tabellen im Namen des gesamten HBase Systems.

  • Deaktivieren Sie das WAL: Der Masterserver interagiert mit dem WAL während RegionServer Failover und reinigt regelmäßig die Protokolle.

  • Geben Sie einen Coprozessor Rahmen Master-Operationen für die Beobachtung: Hier ist ein weiterer neuer Begriff für wachsende HBase Glossar. Coprozessoren laufen im Rahmen des Masterserver oder RegionServers. Zum Beispiel ermöglicht ein Masterserver Beobachter Coprozessor Sie die normale Funktionalität des Servers, wenn Operationen wie das Erstellen von Tabellen oder Tabellen Löschung stattfinden zu ändern oder zu erweitern. Oft sind Coprozessoren verwendet, um Tabellenindizes für fortgeschrittene HBase Anwendungen verwalten.

Ein Coprozessor, der im Rahmen der Masterserver läuft und oder RegionServer (oder beides) verwendet werden, die Sicherheit zu erhöhen, erstellen Sekundärindizes und vieles mehr. Sie können mehr Informationen über Coprozessoren bei einem finden HBase Community-Blog.

Wie bei allen Open-Source-Hadoop-Technologien, wird Masterserver Operationen wahrscheinlich im Laufe der Zeit als die Gemeinschaft ändern von Ingenieuren an Innovationen arbeiten HBase zu verbessern entworfen. Zum Zeitpunkt des Schreibens, aber Sie haben jetzt eine ziemlich gründliche Liste, die für den Masterserver als High-Level-Referenz dient.

Schließlich ein weiterer wichtiger Punkt, über den HBase Masterserver zu machen: Es kann und eine Backup-Masterserver in jedem HBase Cluster sein sollte. Es braucht nur eine aktive Masterserver zu einem gegebenen Zeitpunkt zu sein, so dass der Backup-Masterserver für Failover ist ähnlich.

Vielleicht erinnern Sie sich, dass der Masterserver für HBase Kunden nicht in der Datenzugriffspfad ist. Sie können jedoch auch daran erinnern, dass der Masterserver für Aktionen wie RegionServer Failover und Lastverteilung verantwortlich ist. Die gute Nachricht ist, dass die Kunden weiterhin die HBase Cluster abfragen, wenn der Master geht nach unten, aber für den normalen Clusteroperationen sollte der Master nicht bleiben unten für längere Zeit.

Menü