Hur kan jag lära mig att använda Hadoop för att analysera big data? googletag.cmd.push (funktion () {googletag.display (div-gpt-ad-1562928221186-0);}); F:

Författare: Judy Howell
Skapelsedatum: 5 Juli 2021
Uppdatera Datum: 21 Juni 2024
Anonim
Hur kan jag lära mig att använda Hadoop för att analysera big data? googletag.cmd.push (funktion () {googletag.display (div-gpt-ad-1562928221186-0);}); F: - Teknologi
Hur kan jag lära mig att använda Hadoop för att analysera big data? googletag.cmd.push (funktion () {googletag.display (div-gpt-ad-1562928221186-0);}); F: - Teknologi

Innehåll

F:

Hur kan jag lära mig att använda Hadoop för att analysera big data?


A:

Apache-programvaruuppsättningen som kallas Hadoop blir en mycket populär resurs för att hantera stora datamängder. Denna typ av datahanteringsprogramvara har byggts för att hjälpa till att samla data på specifika sätt, baserat på mönster som kan göra vissa typer av dataprojekt mer effektiva. Som sagt, Hadoop är bara ett av många verktyg för att hantera stora datamängder.

Ett av de första och mest grundläggande sätten att lära sig om big data-analys med Hadoop är att förstå några av toppnivåkomponenterna i Hadoop och vad den gör. Dessa inkluderar en Hadoop YARN "resurshanteringsplattform" som kan tillämpas på vissa typer av nätverksinställningar, liksom en Hadoop MapReduce uppsättning funktioner som gäller stora datauppsättningar. Det finns också ett Hadoop distribuerat filsystem (HDFS), som hjälper till att lagra data över distribuerade system så att det snabbt och effektivt kan indexeras eller hämtas.


Utöver detta kan de som vill bli mer bekanta med Hadoop titta på enskilda publicerade resurser för proffs som förklarar programvaran på en relatabel nivå. Detta exempel från Chris Stucchio på en personlig blogg ger en utmärkt uppsättning poäng om Hadoop och dataskala. En av de grundläggande takeawaysna är att Hadoop kan användas mer än vad som är nödvändigt och kanske inte är den bästa lösningen för ett enskilt projekt. Genom att granska sådana resurser kommer proffs att bli mer bekanta med detaljerna om att använda Hadoop i ett visst scenario. Stucchio tillhandahåller också metaforer för att relatera Hadoops-funktioner till specifika fysiska uppgifter. Här är exemplet att räkna antalet böcker i ett bibliotek, medan en Hadoop-funktion kan dela upp det biblioteket i sektioner, vilket ger individuella räkningar som är blandade i ett sammanlagt dataresultat.


Ett mer djupgående sätt som proffsen kan lära sig mer om Hadoop och dess tillämpning på big data är genom specifika utbildningsresurser och program. Till exempel har onlineinlärningsföretaget Cloudera, en framträdande leverantör av fjärrutbildningssessioner, ett antal intressanta alternativ kring Hadoop-användning och liknande typer av datahantering.