Apache Drill

Apache Drill ist ein Kandidat Projekt im Apache-Inkubator. Apache Drill ist nicht besonders kränklich, aber. Die Apache Software Foundation (ASF) Kandidat Technologien beginnen alle als Inkubator Projekte vor offiziellen ASF-Technologien zu werden. Sie können über das lesen Apache Incubator. Sie können lesen über Bohren.

Inspiriert von den Google-Dremel-Technologie, ist das erklärte Ziel für Performance Drill zu SQL-Abfragen gegen ein Petabyte ermöglichen oder mehr über 10.000-plus-Server verteilte Daten. Die Abbildung zeigt die Architektur von Apache Drill.

bild0.jpg

Sie können sehen, dass der Schlüssel für die Drill-Architektur die Drillbit-Server auf jedem Datenknoten implementiert sind. Beachten Sie, dass jeder Server über eine Abfrage-Parser enthält, Compiler, Optimierer und Laufzeit, aber es ist ein Meister Drillbit Server von Zookeeper Server nominiert, die die Ausführung der Abfragen überwacht und kümmert sich um die Aufgabe, ziehen zusammen, um die Zwischenergebnismengen in einem einzigen set-Ausgang.

Wie Dremel können Drill koexistieren mit und ergänzen, MapReduce, aber MapReduce ist nicht Abfragen verwendet zu erfüllen, wie es mit Apache Hive. Stattdessen forderte Ausführungsmaschinen Bohrspitzen wurden von den Mitgliedern der Drill-Community entwickelt.

Diese Gemeinschaft zielt darauf ab, Low-Latency-Abfragen für Anwendungen wie Echtzeit-Business-Intelligence-Dashboards, Betrugserkennung und andere zeitkritische Anwendungsfälle zur Verfügung zu stellen. Drill unterstützt verschachtelte Datentypen wie Avro, JSON und Google Protokoll Puffer. Diese verschachtelten Datentypen erlauben sehr große normalisierte Tabellen.

Die Drill-Entwicklungsteam arbeitet auch umfangreiche SQL-Unterstützung auf die Bereitstellung von SQL2003 Compliance-Targeting. Schließlich ist zu beachten, dass die Drill Team HBase Unterstützung bietet, so dass Benutzer in der Lage sein wird, HBase Tabellen mit SQL abzufragen.

Menü