Parallell dataanalys

Författare: Eugene Taylor
Skapelsedatum: 11 Augusti 2021
Uppdatera Datum: 10 Maj 2024
Anonim
Parallel Data Analysis in Python | SciPy 2017 Tutorial | Matthew Rocklin, Ben Zaitlen & Aron Ahmadia
Video: Parallel Data Analysis in Python | SciPy 2017 Tutorial | Matthew Rocklin, Ben Zaitlen & Aron Ahmadia

Innehåll

Definition - Vad betyder parallelldataanalys?

Parallell dataanalys är en metod för att analysera data med hjälp av parallella processer som körs samtidigt på flera datorer.


Processen används vid analys av stora datamängder som stora telefonsamtal, nätverksloggar och webblager för dokument som kan vara för stora för att kunna placeras i en enda relationsdatabas. Metoden används ofta i Big Data Analytics och allmän dataanalys.

En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar parallelldataanalys

Det primära konceptet bakom parallell dataanalys är parallellism, definierad i datoranvändning som samtidigt exekvering av processer.

Detta uppnås ofta genom att använda flera processorer eller till och med flera datorer och är en vanlig praxis inom distribuerad databehandling. Vid parallell analys av data utför olika datorer som utför olika aspekter av dataanalys samtidigt dessa processer och konsoliderar senare resultaten till en enda stor rapport.


Anledningen till denna parallellism är främst att göra analysen snabbare, men det är också för att vissa datamängder kan vara för dynamiska, för stora eller helt enkelt för olämpliga för att kunna placeras effektivt i en enda relationsdatabas. Resultatet skulle vara att dessa datamängder finns i olika databaser optimerade för den typen av data och i olika maskiner, så linjär analys kommer helt enkelt inte att vara ett effektivt alternativ.