RegionServers in HBase

RegionServers sind die Software-Prozesse (oft als Daemons) Sie aktivieren (Datenbank Hadoop) zum Speichern und Abrufen von Daten in HBase. In Produktionsumgebungen wird jeder RegionServer auf einem eigenen dedizierten Rechenknoten eingesetzt. Wenn Sie mit HBase starten, wird eine Tabelle erstellt und dann beginnen Sie Ihre Daten speichern und abzurufen.

Doch irgendwann - und vielleicht ganz schnell in großen Datenanwendungsfälle - die Tabelle wächst über einen einstellbaren Grenzwert. An diesem Punkt teilt der HBase System automatisch den Tisch und verteilt die Last auf einen anderen RegionServer.

Bei diesem Verfahren wird oft als Auto-sharding, HBase automatisch skaliert, wie Sie Daten in das System hinzufügen - ein großer Vorteil im Vergleich zu den meisten Datenbankmanagementsysteme, die manuelle Eingriffe erfordern das Gesamtsystem über einen einzigen Server zu skalieren. Mit HBase, solange Sie im Rack verfügen über eine andere Ersatzserver, der konfiguriert ist, ist Skalierung automatisch!

Warum ein Limit auf den Tischen und teilen sie dann? Immerhin ist HDFS die zugrunde liegenden Speichermechanismus, so dass alle verfügbaren Laufwerke im HDFS Cluster zum Speichern von Tabellen zur Verfügung stehen. (Nicht mitgerechnet die Replikationsfaktor, natürlich.) Wenn Sie einen gesamten Cluster zur Verfügung zu haben, warum sich RegionServer einem beschränken Sie Ihre Tabellen zu verwalten?

Einfach. Sie können eine beliebige Anzahl von Tabellen groß oder klein haben, und Sie werden HBase alle verfügbaren RegionServers nutzen möchten, wenn Sie Ihre Daten zu verwalten. Sie wollen den vollen Nutzen aus den Cluster-Rechenleistung zu übernehmen. Darüber hinaus mit vielen Kunden Ihr HBase System zugreifen, sollten Sie viele RegionServers verwenden, um die Nachfrage zu befriedigen.

HBase richtet sich an alle diese Bedenken für Sie und skaliert automatisch in Bezug auf die Speicherkapazität und Rechenleistung.

bild0.jpg

Menü