The Hive CLI-Client

Der erste Hive-Client ist die Hive Befehlszeilenschnittstelle (CLI). Um die Feinheiten des Hive CLI-Client meistern, könnte es helfen, die (etwas beschäftigt aussehende) Hive Architektur zu überprüfen.

bild0.jpg

In der zweiten Figur ist die Architektur nur auf den Komponenten zu konzentrieren rationalisiert, die erforderlich sind, wenn die CLI ausgeführt wird.

image1.jpg

Dies sind die Komponenten von Hive, die benötigt werden, wenn die CLI auf einem Hadoop-Cluster ausgeführt. Hier laufen Sie Hive im lokalen Modus, der lokale Speicher verwendet, anstatt die HDFS, für Ihre Daten.

Um die Hive CLI laufen, führen Sie die Bienenstock Befehl und geben Sie den CLI als Dienst, den Sie ausführen möchten. In der folgenden Auflistung können Sie den Befehl zu sehen, die ebenso wie einige unserer ersten HiveQL Aussagen erforderlich ist. (A Schritte Anmerkung der A-B-C-Modell ist in der Auflistung enthalten, um Ihre Aufmerksamkeit auf die wichtigsten Befehle zu lenken.)

(EIN) $ $ HIVE_HOME / bin hive --service cli(B) hive> set hive.cli.print.current.db = Echt-(C) hive (Standard)> CREATE DATABASE ourfirstdatabase-OKTime genommen: 3,756 Sekunden(D) hive (default)> USE ourfirstdatabase-OKTime genommen: 0,039 Sekunden(E) hive (ourfirstdatabase)> CREATE TABLE our_first_table (> Vorname STRING> LastNameSTRING,> EmployeeId INT) -OKTime genommen: 0,043 secondshive (ourfirstdatabase)> quit-(F) $ Ls /home/biadmin/Hive/warehouse/ourfirstdatabase.dbour_first_table

Der erste Befehl (Schritt A sehen) startet die Hive CLI mit Hilfe der $ HIVE_HOME Umgebungsvariable. Das -Service cli Befehlszeilenoption leitet das Hive-System die Kommandozeilen-Schnittstelle zu starten, obwohl Sie andere Server gewählt haben könnte.

Als nächstes wird in Schritt B, sagen Sie den Hive CLI aktuellen Arbeits Datenbank zu drucken, so dass Sie wissen, wo Sie im Namensraum sind. (Diese Aussage wird Sinn machen, nachdem wir erklären, wie man den nächsten Befehl zu verwenden, so halten sie fest.)

In Schritt C verwenden Sie HiveQL der Datendefinitionssprache (DDL) Ihre erste Datenbank zu erstellen. (Denken Sie daran, dass die Datenbanken in Hive sind einfach Namespaces, wo bestimmte Tabellen reside-, weil eine Reihe von Tabellen kann als eine Datenbank oder Schema gedacht werden, könnten Sie den Begriff verwendet haben SCHEMA anstelle von DATENBANK das gleiche Ergebnis zu erreichen.).

Genauer gesagt, DDL verwenden Sie das System anweisen, eine Datenbank mit dem Namen zu erstellen ourfirstdatabase und dann diese Datenbank zu machen die Standardeinstellung für nachfolgende HiveQL DDL-Befehlen der BENUTZEN Befehl in Schritt D. In Schritt E, können Sie Ihre erste Tabelle zu erstellen und geben ihm die (durchaus angemessen) Name our_first_table.

(Bis jetzt haben Sie vielleicht geglaubt, dass es viel wie SQL aussieht, mit vielleicht ein paar kleine Unterschiede in der Syntax, je nachdem, welche RDBMS sind Sie es gewohnt, -. Und Sie würden Recht haben) Der letzte Befehl, in der Stufe F, so führt ein Verzeichnis von dem gewählten Hive Lager Verzeichnis heraus, dass Sie das sehen können our_first_table in der Tat wurde auf der Festplatte gespeichert.

Sie setzen die hive.metastore.warehouse.dir Variable in das lokale Verzeichnis zu zeigen / Home / BiAdmin / Hive / Lager in Ihrer virtuellen Linux-Maschine anstatt die HDFS verwenden wie auf einem richtigen Hadoop-Cluster.

Nachdem Sie eine Tabelle erstellt haben, ist es interessant, die Tabellen Metadaten anzuzeigen. In Produktionsumgebungen, können Sie Dutzende von Tabellen oder mehr haben, so ist es hilfreich, in der Lage sein, die Tabellenstruktur von Zeit zu Zeit zu überprüfen. Sie cein verwenden, um einen HiveQL Befehl, dies zu tun, um die Hive CLI verwenden, aber das Hive Web Interface (HWI) Server stellt eine hilfreiche Schnittstelle für diese Art von Operation.

Verwendung des HWI Server anstelle der CLI kann auch sicherer. Die sorgfältige Abwägung vorgenommen werden müssen, wenn die CLI in Produktionsumgebungen zu verwenden, da die Maschine die CLI läuft Zugriff auf den gesamten Hadoop-Cluster haben muss.

Daher anstelle Tools wie die Secure Shell-Administratoren System in der Regel setzen (sshum) kontrollierten und sicheren Zugriff auf die Maschine, um die CLI sowie laufende Netzwerk-Verschlüsselung zur Verfügung zu stellen. Wenn jedoch der HWI Server verwendet wird, kann ein Benutzer nur Zugriff auf Daten erlaubt Hive vom HWI Server über seinen Web-Browser.

Menü