Kot eden najmočnejših odprtokodnih programskih okvirov je Hadoop pomembno orodje za vsakogar, ki upa, da bo našel veliko podatkovno službo. Če želite izboljšati svoje znanje Hadoop ali se naučiti, kako ga obvladati, je najboljša možnost, da opravite spletni tečaj. Če vam to ni na voljo, si oglejte brezplačne spletne vaje in uporabite referenčne materiale za odpravljanje posebnih težav. Ko odkrijete osnove, vadite na majhnih nizih podatkov iz resničnega sveta, da izboljšate svoje sposobnosti.
Koraki
Metoda 1 od 2: Obiskovanje tečajev in uporaba vadnic
Korak 1. Prijavite se za Cloudera za 6-delni tečaj in interaktivne vaje
Cloudera vam ponuja primere iz resničnega sveta za vadbo v okolju samo za branje, zato vam ni treba skrbeti, da boste naredili velike napake. Ponujajo tudi analitična orodja, ki vam pomagajo eksperimentirati pri poizvedovanju po podatkih, ter brezplačno predstavitev v živo, imenovano Cloudera Live, ki vam pomaga pri spoznavanju okolja Hadoop.
Čeprav vas bo celoten poglobljen tečaj s certifikatom stal 295 USD, se bo vsekakor splačalo, če te veščine uporabljate za svoje delo. Z uporabo tečaja Cloudera boste lažje ujeli napake in prihranili čas, zaradi česar se bo hitro poplačal
Korak 2. Poskusite brezplačne spletne tečaje prek Cloudera, če že poznate osnove
Če imate izkušnje s Hadoopom in si želite samo osvežitve, vam morda ne bo treba porabiti denarja za tečaj iz 6 delov. Namesto tega si oglejte brezplačne spletne tečaje na spletnem mestu Univerze Cloudera.
Za skrbnike, razvijalce in analitike podatkov obstajajo viri, zato ne glede na to, kakšna je vaša vloga, bi morali najti ustrezen tečaj
Korak 3. Če želite več teorije, opravite univerzitetni tečaj o Courseri
Coursera je znan, cenjen vir programerskih tečajev. Čeprav so navodila na splošno bolj teoretična in ne vključujejo toliko tekaških primerov, lahko vadite skupaj z vadnico in uporabite tečajne projekte za pridobivanje praktičnih izkušenj.
- Ta tečaj najdete na spletu na naslovu
- Stroški se med tečaji razlikujejo, vendar Coursera ponuja tudi možnost finančne pomoči tistim, ki izpolnjujejo pogoje.
Korak 4. Sledite brezplačnemu tečaju na Univerzi Big Data za cenovno ugodno možnost
Če ne želite plačati za spletni tečaj, je Univerza Big Data odlična možnost. Imajo dvodelni tečaj, ki se osredotoča najprej na osnove Hadoopa, nato na programiranje s Hadoopom, spletna oblika pa olajša delo v svojem tempu.
- Te tečaje najdete na
- Ponujajo številne vaje v angleščini, pa tudi v japonščini, španščini, portugalščini in ruščini.
Korak 5. Poiščite navodila za uporabo v YouTubu, če potrebujete brezplačno, posebno usposabljanje
Obstaja na tisoče videoposnetkov, ki pojasnjujejo Hadoop in kako ga uporabljati. Široka paleta videoposnetkov vam daje prožnost in je brezplačna. Če naletite na določeno težavo, v YouTubu poiščite videoposnetek, ki vas vodi skozi postopek.
Hadoop vadnice bi morale biti tudi precej enostavne za iskanje, saj je "hadoop" edinstven iskalni izraz
Korak 6. Uporabite Yahoojeve brezplačne vaje, če želite vaditi z virtualnim primerom
Te vaje so razdeljene na 7 modulov in vas poučujejo o namestitvi in delovanju Hadoopa že od samega začetka. To je odlična možnost za poglobitev posebnih veščin, če so nekoliko zarjavele.
Korak 7. Brezplačna, poglobljena navodila najdete v IBM-ovem odprtokodnem dokumentu
To je neverjetno temeljit odprtokodni dokument PDF, ki ga je ustvarila pobuda za usposabljanje IBM-a. Previdno, korak za korakom vas vodi skozi Hadoop in daje jasna pisna navodila.
Ta navodila dobro delujejo tudi, če so povezana z predstavitvijo v živo, kot je Cloudera
Metoda 2 od 2: Prehod na uporabo v resničnem svetu
Korak 1. Vprašajte, ali lahko pri delu implementirate Hadoop za vadbo z resničnimi podatki
Oddajte zahtevo svojemu šefu ali nadzorniku ali se pogovorite z njimi na štiri oči o tem, kako te nove veščine prenesti na delovno mesto. To je še posebej pomembno, če je vaše podjetje plačalo kakršno koli usposabljanje ali spletne tečaje.
Prej ko začnete izvajati naučene veščine, prej jih boste lahko obvladali
Korak 2. Poiščite preproste projekte, na katerih boste vadili svoje sposobnosti
Izberite projekte, ki so razmeroma preprosti in z nizkim tveganjem, na primer štetje in razvrščanje števila interakcij na zastopnika stranke, kot so e-poštna sporočila in seje klepeta.
- Nekatere druge resnične podatkovne aplikacije vključujejo skeniranje napak v spletnih dnevnikih ali spremljanje razpoloženja blagovnih znamk v družabnih medijih.
- Vadite lahko tudi z vzorčnimi podatki s spletnih mest, kot so https://www.kaggle.com/datasets ali
Korak 3. Redno preverjajte svojo kodo z majhnimi podskupinami, da odpravite morebitne hrošče
Preden zaženete celoten niz podatkov, vzemite manjši testni niz na svoj lokalni računalnik in ga zaženite v več različnih načinih. Na primer, lahko ga zaženete iterativno prek lokalnega Jobrunnerjevega načina, nato psevdo-porazdeljenega načina in nato popolnoma porazdeljenega načina.
- Tako boste lahko prepoznali vse pomanjkljivosti ali hrošče, preden se pojavijo v celotnem naboru podatkov.
- Lokalni način Jobrunner vam omogoča, da lokalno preizkusite in odpravite napake pri kodi Zemljevid in Zmanjšajte, Psevdo-porazdeljeni način posnema proizvodno okolje, Popolnoma porazdeljen način pa gleda na vašo pravo proizvodno gručo.
Korak 4. Uporabite enoletno brezplačno preskusno različico za vadbo v okolju navideznega računalnika
Podjetja, kot sta Amazon in Microsoft, ponujajo plačljive naročnine za svoje storitve Hadoop. Amazonov navidezni stroj se imenuje Amazon Web Service (AWS), Microsoftova storitev pa Microsoft Azure. Za obe storitvi je prvo leto brezplačno, ko vnesete podatke o kreditni kartici.
Ne pozabite preklicati naročnine po enem letu, da se izognete zaračunavanju
Nasveti
- Ne pozabite, da je Hadoop bolj specializiran programski jezik za ozko uporabo. To vam bo zagotovo dalo prednost v svetu velikih podatkov, ni pa nujno, da postanete programer.
- Preberete lahko tudi knjige in članke o Hadoopu, na primer Hadoop: Dokončni vodnik, 3. izdaja Toma Whitea.