Datenversionen im HBase Data Model

(: 1383859182496: "John," zum Beispiel "FN") Sie können eine Zahl zwischen der Spalte Qualifier und Wert zu sehen. Diese Zahl ist die Version Nummer für jeden Wert in der Tabelle. Die Werte in HBase gespeichert sind Zeit standardmäßig abgestempelt, was bedeutet, dass Sie eine Möglichkeit haben, direkt aus der Box verschiedene Versionen Ihrer Daten zu identifizieren.

Logische Sicht des Kunden Kontaktinformationen in HBase
Row KeySpalte Familie: {Spalte Qualifier: Version: Wert}
00001Kundenname: { 'FN': 1383859182496: "John",
'LN': 1383859182858: 'Smith',
'MN': 1383859183001: "Timothy",
'MN': 1383859182915: 'T'}

Contact: { 'EA': 1383859183030:'[email protected] ',
"SA": 1383859183073: "1 Hadoop Lane, NY11111 '}
00002Kundenname: { 'FN': 1383859183103: 'Jane',

'LN': 1383859183163: "Doe",
Kontaktinformation: {
"SA": 1383859185577: "7 HBase Ave, CA22222 '}

Es ist möglich, eine benutzerdefinierte Versionsschema zu erstellen, aber die Benutzer gehen typischerweise mit einem Zeitstempel der aktuellen Unix-Zeit erstellt. (Die Unix-Zeit oder Unix Epoche stellt die Anzahl der Millisekunden seit Mitternacht 1. Januar 1970 UTC). Die versionierten Daten in absteigender Reihenfolge gespeichert ist, so dass der jüngste Wert standardmäßig zurückgegeben wird, es sei denn, eine Abfrage einen bestimmten Zeitstempel angibt.

Sie können sehen, dass der fiktive Dienstleistungsunternehmen zunächst nur eine erste für John Smith mittleren Namen hatte, aber dann später auf sie, dass die gelernt # 147-T # 148- stand # 147-Timothy. # 148- Der letzte Wert für die Spalte 'MN' wird zunächst in der Tabelle gespeichert.

Sie können eine Obergrenze für die Höhe der Zeit gesetzt, die Daten in HBase mit einer Variablen namens Zeit (TTL) zu leben bleiben. Sie können auch eine Variable, die die Anzahl der Versionen pro Wert steuert. Dies kann pro Spalte Familie erfolgen.

Menü