10 Hadoop Ressourcen verdient ein Lesezeichen

Im Folgenden sind zehn tolle Hadoop-Ressourcen, die ein Lesezeichen zu schaffen, in Ihrem Browser würdig sind. Diese Ressourcen helfen Ihnen einen lebenslangen Lernplan für Hadoop erstellen.

Zentrales Nervensystem: Apache.org

Das Apache Software Foundation (ASF) ist die zentrale Community für Open-Source-Software-Projekten. Nicht irgendein Projekt kann ein Apache-Projekt sein - viele Konsens getragene Prozesse umwandeln ein Stück Software von seiner anfänglichen Designs und Beta-Code (sein Inkubator Status) zu vollwertigen, allgemein verfügbaren Software.

Die ASF ist nicht nur, wo Projekte wie Hadoop verwaltet werden - es ist, wo sie # 147-leben und atmen. # 148- Heute gibt es Hunderte von Apache-Projekten. Vor diesem Hintergrund sollten Sie ein Lesezeichen auf den Apache Hadoop Seite als eine Ihrer Hauptstütze Lernressourcen. Diese Seite ist wichtig, weil Sie dort den Quellcode zugreifen können.

Jetzt twittern

Twitter ist nicht der Ort, zu lernen Hadoop per se - schließlich kann man nicht so leicht MapReduce Programmierung im Unterricht beherrschen, die nur 140 Zeichen umfassen. Sei es wie es sei, eine ganze Reihe von großen Daten-Gurus sind auf Twitter, und sie äußern Meinungen und verweisen auf Ressourcen, die Ihnen eine intelligentere Hadoop Benutzer machen kann.

Eine Reihe von Top-Influencer-Listen in der Twitter Landschaft Abdeckung Hadoop und Big Data, und das ist der beste Weg, um diese Hadoop Persönlichkeiten zu finden und sie zu Ihrem Twitter-Listen hinzuzufügen.

Hortonworks Universität

Hortonworks Universität bietet Hadoop Schulungen und Zertifizierungen. Die Seite bietet Kurse Hadoop gebaut für entweder Administrator oder Entwickler Praktiker mit der Option auf ein strenges Zertifizierungsprogramm. Hortonworks beschäftigt einige der tiefsten und Hadoop-Experten der Welt festgestellt, so dass Sie hinter dem Kursqualitäts Know-how gewährleistet.

Cloudera Universität

Cloudera Universität in ihr Geschäftsmodell und Charter ist ähnlich Hortonworks University, eine Reihe von Lern ​​Möglichkeiten bietet, die den Bogen von der traditionellen Text zu Video laufen. Cloudera ist eine prominente feste Größe in der Hadoop Welt. (Doug Cutting, die # 147-Vater # 148- von Hadoop ist ihr Chefarchitekt.) Die Seite bietet eine umfangreiche Reihe von Kursen und vieles mehr, die auf der Cloudera Verteilung basieren für Hadoop (CDH).

bild0.jpg

BigDataUniversity.com

BigDataUniversity.com (Der Fall, spielt keine Rolle, wenn Sie die URL in Ihren Browser eingeben) ist eine fantastische Ressource für das Lernen über - Sie ahnen es - große Datenmengen. Natürlich ist groß Daten nicht nur Hadoop, so dass Sie mehr als Hadoop Ressourcen auf dieser Website zu finden. Diese Universität hat mehr als 100.000 Studenten eingeschrieben und täglich über Hadoop und Big Data zu lernen.

image1.jpg

Planet Big Data Blog Aggregator

Es ist toll, wenn der Name einer Website sagt Ihnen genau, was sie tut - wie Planeten Big Data Blog Aggregator: Es ist ein Aggregator von Blogs über große Datenmengen, Hadoop und anderen verwandten Themen auf dem Planeten (na ja, jedenfalls auf dem Planeten Erde).

Beide großen Namen und No-Names zeigen auf der Website, aber das ist hilfreich: Obwohl es zweifellos Engagement von Cloudera zu Hadoop ist, Hortonworks, IBM und andere, ist es oft erfrischend und wertvolle Engagement in den Gedanken und Meinungen von Graswurzeln zu bekommen, Nichtverbundenen Praktiker von Gemeinden nicht auf einen bestimmten Anbieter in Ihrem Lern ​​Roadmap gebunden.

Quoren von Apache Hadoop-Forum

Das Quoren Apache Hadoop-Forum mehr über Hadoop zu erfahren, oder um große Daten im Allgemeinen, für diese Angelegenheit ist der Grundstein für alle, die.

Wie in jedem Forum, ist der Bereich der Fragen und Antworten, die Sie auf dieser Seite finden können schwindelerregende, aber sie alle führen Sie zu dem, was Sie suchen: Wissen. Die Website Verknüpfungen zu Hadoop und seiner einzelnen Komponenten hat - zum Beispiel, hat es spezifische Foren für MapReduce, HDFS, Schwein, HBase und vieles mehr.

Die Seite hat auch im Zusammenhang Hadoop forums- zum Beispiel Cloudera und Hortonworks für ihre Verteilungen spezifischen Diskussionsgruppen haben - ein Beweis dafür, wie beliebt dieses Forum ist.

Die IBM Big Data Hub

Das IBM Big Data Hub ist ein ausgezeichneter Ort, um Hadoop und sein Ökosystem zu lernen. Obwohl er im Besitz von IBM und betrieben wird, Inhalte dieser Website nicht immer mit IBM-Produkten verknüpft.

Die IBM Big Data Hub bietet für jeden Besucher mit genügend Wissen jemand Durst nach großen Daten zu löschen. Hier finden Sie alle Arten von Blogs finden, Videos, Analysten Artikel, Use Cases, Infografiken, Präsentationen und vieles mehr. Es ist wirklich ein Schatz von großen Datenbeständen.

Konferenzen nicht entgehen lassen

Es gibt viele Hadoop Konferenzen und noch mehr große Datenkonferenzen - die Hadoop Summit und Strata Hadoop Welt wie die Quintessenz der Konferenzen nicht entgehen lassen. Typischerweise Anbietern der Distribution Co-Sponsoren diese Konferenzen. Zum Beispiel, Yahoo! und Hortonworks Sponsor der Hadoop Summit und Cloudera ist Co-Sponsor von Strata Hadoop Welt.

Sowohl Strata Hadoop World und die Hadoop Summit sind das Treffpunkte der hellsten Hadoop Köpfe der geschäfts- diese Konferenzen ziehen eine breite Palette von Hadoop-interessierte Fachleute, darunter Entscheider, Architekten, Entwickler, Analysten und vieles mehr.

Die Google-Papiere, die alles begann

Was ist nun bekannt, wie Hadoop hat seinen Ursprung in einer Reihe von Veröffentlichungen von Google-Mitarbeitern, die sich auf das Problem konzentriert wurden die Web von der Indizierung.

Während der Apache Nutch-Projekt (ein Open-Source-Technologie, um das Web für das Crawling) wurde auf die Skalierung nach außen, um Index höhere Mengen von Web-Daten seinen Fokus Drehen, veröffentlichte Google ein Papier, # 147-Das Google File System# 148- (Oktober 2003), die stark Doug Cutting und seine Nutch Mitbegründer Mike Cafarella beeinflusst. Kurz darauf veröffentlichte Google seinen Papier # 147-MapReduce: Vereinfachtes Datenverarbeitung auf großen Clustern# 148- (Dezember 2004).

Gemeinsam wurden das Konzept eines verteilten Dateisystems und einer groß angelegten Parallelverarbeitung Rahmen von Cutting und Cafarella genommen Apache Hadoop zu entwickeln. Natürlich ist diese Arbeit, während bei Yahoo kommerzialisiert Cutting !, und der Rest, wie sie sagen, ist Geschichte.

Menü