Google File System (GFS)

Författare: Robert Simon
Skapelsedatum: 15 Juni 2021
Uppdatera Datum: 1 Juli 2024
Anonim
Google File System - Paper that inspired Hadoop
Video: Google File System - Paper that inspired Hadoop

Innehåll

Definition - Vad betyder Google File System (GFS)?

Google File System (GFS) är ett skalbart distribuerat filsystem (DFS) skapat av Google Inc. och utvecklat för att tillgodose Googles expanderande krav på databehandling. GFS tillhandahåller feltolerans, tillförlitlighet, skalbarhet, tillgänglighet och prestanda för stora nätverk och anslutna noder. GFS består av flera lagringssystem byggda av hårdvarukomponenter med låg kostnad. Det är optimerat för att anpassa Googles olika dataanvändnings- och lagringsbehov, till exempel dess sökmotor, som genererar enorma mängder data som måste lagras.


Google File System utnyttjar styrkan hos off-the-shelf-servrar och minimerar hårdvarusvagheter.

GFS kallas också GoogleFS.

En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar Google File System (GFS)

GFS-nodklusteret är en enda master med flera chunk-servrar som kontinuerligt nås av olika klientsystem. Chunk-servrar lagrar data som Linux-filer på lokala diskar. Lagrad information delas in i stora bitar (64 MB), som replikeras i nätverket minst tre gånger. Den stora bitstorleken minskar nätverksomkostningen.

GFS är utformad för att tillgodose Googles stora klusterkrav utan att tynga applikationer. Filer lagras i hierarkiska kataloger identifierade med bannamn. Metadata - såsom namnutrymme, åtkomstkontrolldata och kartläggningsinformation - styrs av befälhavaren, som interagerar med och övervakar statusuppdateringarna för varje chunk-server genom tidsinställd hjärtslag.


GFS-funktioner inkluderar:

  • Feltolerans
  • Kritisk datareplikation
  • Automatisk och effektiv dataåterställning
  • Hög sammanlagd genomströmning
  • Minskad klient- och masterinteraktion på grund av stor storleksserverstorlek
  • Namnrymdshantering och låsning
  • Hög tillgänglighet

De största GFS-klustren har mer än 1 000 noder med lagringskapacitet på 300 TB. Detta kan hundratals kunder komma åt kontinuerligt.