Hadoop Distribuerat filsystem (HDFS)

Författare: Judy Howell
Skapelsedatum: 28 Juli 2021
Uppdatera Datum: 1 Juli 2024
Anonim
What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka
Video: What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka

Innehåll

Definition - Vad betyder Hadoop Distribuerat filsystem (HDFS)?

Hadoop Distribuerat filsystem (HDFS) är ett distribuerat filsystem som körs på standard- eller avancerad hårdvara. HDFS är utvecklat av Apache Hadoop och fungerar som ett standarddistribuerat filsystem men ger bättre datauppsättning och åtkomst via MapReduce-algoritmen, hög feltolerans och inbyggt stöd för stora datamängder.


En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar Hadoop Distribution File System (HDFS)

HDFS lagrar en stor mängd data som placeras över flera maskiner, vanligtvis i hundratals och tusentals samtidigt anslutna noder, och ger datapålitlighet genom att replikera varje datainstans som tre olika kopior - två i en grupp och en i en annan. Dessa kopior kan ersättas i händelse av fel.

HDFS-arkitekturen består av kluster, som alla har åtkomst till via ett enda NameNode-mjukvaruverktyg installerat på en separat maskin för att övervaka och hantera det klusterfilsystemet och användaråtkomstmekanismen. De andra maskinerna installerar en instans av DataNode för att hantera klusterlagring.


Eftersom HDFS är skriven i Java, har det ursprungligt stöd för Java-applikationsprogrammeringsgränssnitt (API) för applikationsintegration och tillgänglighet. Det kan också nås via vanliga webbläsare.