Apache Bigtop und Hadoop

Um Ihnen zu helfen mit Hadoop beginnen, hier sind Anweisungen, wie man schnell herunterladen und einrichten Hadoop auf Ihrem eigenen Laptop-Computer. Der Cluster wird in Pseudo-verteilten Modus auf einer virtuellen Maschine ausgeführt werden, so dass Sie keine spezielle Hardware benötigen.

EIN virtuelle Maschine (VM) ist eine simulierte Computer, den Sie auf einem echten Computer ausgeführt werden können. Zum Beispiel können Sie ein Programm auf Ihrem Laptop ausführen, # 147-spielt # 148- eine VM, die ein Fenster öffnet, das aussieht wie es auf einem anderen Computer ausgeführt wird. In der Tat läuft ein pretend Computer in Ihrem realen Computer.

Sie erhalten eine VM werden Herunterladen und es beim Laufen, werden Sie Hadoop zu installieren.

Apache Bigtop ist eine gute Alternative, wenn Sie Ihre eigene Hadoop Komponenten zu montieren. Bigtop sammelt die Kern Hadoop Komponenten für Sie und sorgt dafür, dass Ihre Konfiguration funktioniert. Apache Bigtop ist eine 100-prozentige Open-Source-Distribution.

Das primäre Ziel der Bigtop - selbst ein Apache-Projekt, so wie Hadoop - ist eine Community rund um die Verpackung, Bereitstellung und Integration von Projekten in der Apache-Hadoop-Ökosystem aufzubauen. Der Schwerpunkt liegt auf dem System als Ganzes und nicht auf einzelne Projekte.

Mit Bigtop, können Sie einfach installieren und Hadoop Komponenten bereitstellen, ohne dass diese in einer bestimmten Verteilung auf die Spur zu kommen und passen sie mit einem bestimmten Hadoop-Version. Wenn neue Versionen von Hadoop Komponenten freigegeben werden, sie manchmal mit den neuesten Versionen nicht von anderen Projekten arbeiten. Wenn Sie auf eigene Faust sind, wird erhebliche Tests erforderlich.

Mit Bigtop (oder einem kommerziellen Hadoop-Release) können Sie darauf vertrauen, dass Hadoop-Experten diese Tests für Sie getan haben. Um Ihnen eine Vorstellung davon, wie expansive Bigtop bekommen hat, finden Sie in der folgenden Liste aller Komponenten in Bigtop enthalten:

  • Apache Crunch

  • Apache Flume

  • Apache Giraph

  • Apache HBase

  • Apache HCatalog

  • Apache Hive

  • Apache Mahout

  • Apache Oozie

  • Apache Pig

  • Apache Solr

  • Apache Sqoop

  • Apache Whirr

  • Apache Zookeeper

  • Cloudera Hue

  • LinkedIn DataFu

Diese Sammlung von Hadoop Ökosystem-Projekte ist etwa so expansiv wie es nur geht, da beide Haupt- und Nebenprojekte enthalten sind. Apache Bigtop wird kontinuierlich weiterentwickelt.

Menü