Vad är skillnaden mellan big data och Hadoop?

Innehåll

F:

A:

Skillnaden mellan big data och det öppna källkodsprogrammet Hadoop är en distinkt och grundläggande. Den förstnämnda är en tillgång, ofta en komplex och tvetydig, medan den senare är ett program som uppnår en uppsättning mål och mål för att hantera den tillgången.

Big data är helt enkelt de stora uppsättningarna data som företag och andra parter sätter ihop för att tjäna specifika mål och verksamheter. Big data kan innehålla många olika typer av data i många olika format. Till exempel kan företag lägga mycket arbete på att samla in tusentals uppgifter om köp i valutaformat, på kundidentifierare som namn eller personnummer eller produktinformation i form av modellnummer, försäljningsnummer eller lagernummer. Allt detta, eller någon annan stor mängd information, kan kallas big data. Som regel är det rått och osorterat tills det läggs igenom olika typer av verktyg och hanterare.

Hadoop är ett av verktygen för att hantera big data. Hadoop och andra mjukvaruprodukter arbetar för att tolka eller analysera resultaten från big data-sökningar genom specifika proprietära algoritmer och metoder. Hadoop är ett öppen källkodsprogram under Apache-licensen som upprätthålls av en global användare av användare. Den innehåller olika huvudkomponenter, inklusive en MapReduce-uppsättning funktioner och ett Hadoop distribuerat filsystem (HDFS).

Tanken bakom MapReduce är att Hadoop först kan kartlägga en stor datauppsättning och sedan utföra en reduktion på det innehållet för specifika resultat. En reduceringsfunktion kan betraktas som ett slags filter för rådata. HDFS-systemet agerar sedan för att distribuera data över ett nätverk eller migrera det vid behov.

Databasadministratörer, utvecklare och andra kan använda de olika funktionerna i Hadoop för att hantera big data på valfritt antal sätt. Till exempel kan Hadoop användas för att följa datastrategier som kluster och inriktning med icke-enhetlig data, eller data som inte passar snyggt i en traditionell tabell eller svara bra på enkla frågor.