Spalte Familien in der HBase Data Model

In den HBase Daten werden Modellspalten gruppiert Spalte Familien, die Front während der Tabellenerstellung definiert werden müssen. Spalte Familien zusammen auf der Festplatte gespeichert, weshalb HBase als spaltenorientierten Datenspeicher bezeichnet wird.

Logische Sicht des Kunden Kontaktinformationen in HBase
Row KeySpalte Familie: {Spalte Qualifier: Version: Wert}
00001Kundenname: { 'FN': 1383859182496: "John",
'LN': 1383859182858: 'Smith',
'MN': 1383859183001: "Timothy",
'MN': 1383859182915: 'T'}

Contact: { 'EA': 1383859183030:'[email protected] ',
"SA": 1383859183073: "1 Hadoop Lane, NY11111 '}
00002Kundenname: { 'FN': 1383859183103: 'Jane',

'LN': 1383859183163: "Doe",
Kontaktinformation: {
"SA": 1383859185577: "7 HBase Ave, CA22222 '}

Die Tabelle zeigt zwei Spalte Familien: Kundenname und Contact. Wenn Sie eine Tabelle in HBase zu schaffen, wird der Entwickler oder Administrator erforderlich unter Verwendung von druckbaren Zeichen eine oder mehrere Spalte Familien zu definieren.

Im Allgemeinen Spalte Familien bleiben während der gesamten Lebensdauer eines HBase Tabelle festgelegt, sondern neue Spalte Familien kann durch die Verwendung von Verwaltungsbefehlen hinzugefügt werden. Die offizielle Empfehlung für die Anzahl der Spalte Familien pro Tabelle ist drei oder weniger. (Siehe Apache HBase Online-Dokumentation.)

Darüber hinaus sollten Sie Daten mit ähnlichen Zugriffsmuster in der gleichen Spalte Familie speichern - würden Sie nicht ein Kunden mittleren Namen in einer separaten Spalte Familie aus dem Vor- oder Nachnamen gespeichert werden soll, weil Sie in der Regel alle Namendaten zur gleichen Zeit zugreifen.

Spalte Familien zusammengefasst sind auf der Festplatte, so dass Muster-Daten mit ähnlichen Zugang Gruppierung reduziert die Gesamtplattenzugriff und erhöht die Leistung.

Menü