So verwenden Hive Create Table Wie Select (CTAS)

Im Hive DML hier gezeigten Beispiel bekannt, dass die leistungsstarke Technik, die in Hive als Tabelle erstellen Wie Select, oder CTASveranschaulicht. Seine Konstrukte können Sie schnell Hive Tabellen aus anderen Tabellen ableiten, wie Sie leistungsstarke Schemata für große Datenanalyse erstellen.

(EIN) hive> TABLE myflightinfo2007 CREATE AS> Jahr, Monat, DepTime, ArrTime, FlightNum, Herkunft, Dest VON FlightInfo2007> WHERE (Monat = 7 und DAYOFMONTH = 3) und (Origin = 'JFK' AND DEST = 'ORD') -(B) hive> SELECT * FROM myFlightInfo2007-OK20077 700 834 5447JFK ORD20077 163318125469JFK ORD20077 190521005492JFK ORD20077 145316244133JFK ORD20077 181019564392JFK ORD20077 643 759 903 JFK ORD20077 939 1108907 JFK ORD20077 13131436915 JFK ORD20077 16171755917 JFK ORD20077 20022139919 JFK ORDTime genommen: 0,089 Sekunden, Fetched: 10 Zeile (n) hive> CREATE TABLE myFlightInfo2008 AS> Jahr, Monat, DepTime, ArrTime, FlightNum, Herkunft, Dest VON FlightInfo2008> WHERE (Monat = 7 und DAYOFMONTH = 3) und (Origin = 'JFK' AND DEST = 'ORD) - Nest > SELECT * FROM myFlightInfo2008-OK20087 930 11035199JFK ORD20087 705 849 5687JFK ORD20087 164519145469JFK ORD20087 134515144392JFK ORD20087 171819071217JFK ORD20087 757 929 1323JFK ORD20087 928 1057907 JFK ORD20087 13581532915 JFK ORD20087 16461846917 JFK ORD20087 21292341919 JFK ORDTime genommen: 0,186 Sekunden, Fetched: 10 Zeile (n)

In Schritt A, bauen Sie zwei kleinere Tabellen aus der abgeleiteten FlightInfo2007 und FlightInfo2008 durch eine Teilmenge von Feldern aus den größeren Tabellen für einen bestimmten Tag auszuwählen (in diesem Fall, 3. Juli), wo der Ursprung des Fluges New York JFK Flughafen (JFK) ist und das Ziel ist: Chicago O'Hare Flughafen (ORD).

Dann wird in Schritt B-Dump Sie einfach den Inhalt dieser kleinen Tabellen, so dass Sie die Daten anzeigen können.

Menü