10 Hadoop-bronnen die een bladwijzer waard zijn

10 Hadoop-bronnen die de moeite waard zijn als een bladwijzer - dummies

Hieronder volgen tien geweldige Hadoop-bronnen die het waard zijn om een ​​bladwijzer in uw browser te maken. Met deze bronnen kunt u een plan voor een leven lang leren opstellen voor Hadoop.

Centraal zenuwstelsel: Apache. org

De Apache Software Foundation (ASF) is de centrale community voor open source softwareprojecten. Niet zomaar een project kan een Apache-project zijn - veel consensusgestuurde processen zetten een stuk software om van de initiële ontwerpen en bètacode (de incubator -status) naar volledige, algemeen beschikbare software.

De AdZG is niet alleen waar projecten als Hadoop worden beheerd - het is waar ze "leven en ademen. "Tegenwoordig zijn er honderden Apache-projecten. Met dit in gedachten, moet je de Apache Hadoop-pagina als een van je belangrijkste leermiddelen aanmerken. Deze site is belangrijk omdat je daar toegang hebt tot de broncode.

Tweet dit

Twitter is niet de plek om Hadoop per se te leren - je kunt MapReduce-programmering immers niet gemakkelijk beheersen in lessen die slechts 140 tekens omvatten. Hoe het ook zij, nogal wat big data goeroes staan ​​op Twitter en ze geven hun mening en wijzen op middelen die van je een slimmere Hadoop-gebruiker kunnen maken.

Een aantal topbeïnvloeders in het Twitter-landschap hebben betrekking op Hadoop en big data, en dat is de beste manier om deze Hadoop-persoonlijkheden te vinden en toe te voegen aan je Twitter-lijsten.

Hortonworks University

Hortonworks University biedt Hadoop-trainingen en certificeringen. De site biedt Hadoop-cursussen die zijn gebouwd voor zowel beheerders als ontwikkelaars, met de optie van een rigoureus certificeringsprogramma. Hortonworks biedt werk aan enkele van de diepste en meest bekende Hadoop-experts ter wereld, dus u bent verzekerd van kwaliteitsexpertise achter het courseware.

Cloudera University

Cloudera University is vergelijkbaar in zijn bedrijfsmodel en charter voor Hortonworks University en biedt een aantal leerwegen die het hele gamma van traditionele tekst naar video lopen. Cloudera is een prominent onderdeel van de Hadoop-wereld. (Doug Cutting, de "vader" van Hadoop is de belangrijkste architect.) De site biedt een uitgebreide reeks cursussen, en meer, die gebaseerd zijn op de Cloudera-distributie voor Hadoop (CDH).

BigDataUniversity. nl

BigDataUniversity. com (het geval doet er niet toe wanneer u de URL in uw browser invoert) is een fantastische bron voor meer informatie over - u raadt het al - big data. Big data is natuurlijk niet alleen Hadoop, dus je vindt meer dan alleen Hadoop-bronnen op deze site.Deze universiteit heeft meer dan 100.000 studenten die elke dag meedoen en leren over Hadoop en big data.

planet Big Data Blog Aggregator

Het is geweldig als de naam van een site precies vertelt wat het doet - zoals Planet Big Data Blog Aggregator: het is een aggregator van blogs over big data, Hadoop en andere gerelateerde onderwerpen over de planeet (nou ja, op de planeet aarde sowieso).

Zowel grote namen als geen namen verschijnen op de site, maar dat is handig: hoewel er ongetwijfeld een verbintenis is met Hadoop door Cloudera, Hortonworks, IBM en anderen, is het vaak verfrissend en waardevol om blootstelling te krijgen aan de gedachten en meningen van grass roots, niet-aangesloten beoefenaars door communities die niet gebonden zijn aan een specifieke leverancier in uw leertraject.

Quora's Apache Hadoop forum

Het Quora Apache Hadoop forum is de hoeksteen voor iedereen die meer wil weten over Hadoop, of over big data in het algemeen.

Zoals op elk forum is het aantal vragen en antwoorden dat u op deze site kunt vinden duizelingwekkend, maar ze leiden u allemaal naar wat u zoekt: kennis. De site heeft koppelingen naar Hadoop en de afzonderlijke componenten ervan - het heeft bijvoorbeeld specifieke fora voor MapReduce, HDFS, Pig, HBase en meer.

De site heeft ook bijbehorende Hadoop-forums; Cloudera en Hortonworks hebben bijvoorbeeld specifieke discussiegroepen voor hun distributies - een bewijs van hoe populair dit forum is.

De IBM Big Data Hub

De IBM Big Data Hub is een uitstekende plaats om meer te weten te komen over Hadoop en zijn ecosysteem. Ondanks dat IBM eigendom is van en wordt beheerd door IBM, is de inhoud van deze site niet altijd gekoppeld aan IBM-producten.

De IBM Big Data Hub biedt elke bezoeker voldoende kennis om iemands honger naar big data te lessen. U vindt allerlei soorten blogs, video's, artikelen van analisten, use cases, infographics, presentaties en meer. Het is echt een schatkist aan grote gegevensbronnen.

Conferenties die u niet mag missen

Er zijn veel Hadoop-conferenties en zelfs nog meer big data-conferenties - de Hadoop Summit en Strata Hadoop World als de belangrijkste conferenties die u niet mag missen. Doorgaans sponsort een distributieleverancier deze conferenties. Bijvoorbeeld Yahoo! en Hortonworks sponsoren de Hadoop Summit en Cloudera is de co-sponsor van Strata Hadoop World.

Zowel Strata Hadoop World als de Hadoop Summit zijn de verzamelplaatsen van de helderste Hadoop-geesten in het bedrijf; deze conferenties trekken een breed scala aan door Hadoop geïnteresseerde professionals aan, waaronder beleidsmakers, architecten, ontwikkelaars, analisten en meer.

De Google-documenten waarmee alles is begonnen

Wat nu bekend staat als Hadoop is ontstaan ​​in een aantal artikelen geschreven door Google-medewerkers die zich concentreerden op het probleem van het indexeren van het web.

Terwijl het Apache Nutch-project (een open source-technologie voor het crawlen van internet) zich richtte op opschalen naar buiten om hogere volumes webgegevens te indexeren, publiceerde Google een paper, "The Google File System" (oktober 2003) , wat Doug Cutting en zijn Nutch mede-oprichter Mike Cafarella enorm heeft beïnvloed.Kort daarna bracht Google het papier uit "MapReduce: Vereenvoudigde gegevensverwerking voor grote clusters" (december 2004).

Samen werden het concept van een gedistribueerd bestandssysteem en een grootschalig parallel verwerkingsraamwerk door Cutting en Cafarella ontwikkeld om Apache Hadoop te ontwikkelen. Natuurlijk heeft Cutting dit werk op Yahoo! en de rest, zoals ze zeggen, is geschiedenis.