Dataprofilering

Författare: Lewis Jackson
Skapelsedatum: 10 Maj 2021
Uppdatera Datum: 25 Juni 2024
Anonim
Pandas Profiling for Data Science (Quick and Easy Exploratory Data Analysis)
Video: Pandas Profiling for Data Science (Quick and Easy Exploratory Data Analysis)

Innehåll

Definition - Vad betyder dataprofilering?

Dataprofilering är en teknik som används för att undersöka data för olika ändamål som att bestämma noggrannhet och fullständighet. Denna process undersöker en datakälla som en databas för att avslöja de felaktiga områdena i dataorganisationen. Distribution av denna teknik förbättrar datakvaliteten.


Dataprofilering kallas också dataupptäckt.

En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar dataprofilering

Dataprofilering är metoden för att undersöka tillgängliga data i en datakälla och samla in statistik och information om dessa uppgifter. Sådan statistik hjälper till att identifiera användningen och datakvaliteten för metadata. Denna metod används ofta i företagets datalagring.

Dataprofilering klargör strukturen, förhållandet, innehållet och härledningen av data som hjälper till att förstå avvikelser inom metadata. Dataprofilering använder olika typer av beskrivande statistik inklusive medel, minimum, maximum, percentil, frekvens och andra aggregat som räkning och summa. Den ytterligare metadatainformation som erhålls under profilering är datatyp, längd, diskreta värden, unikhet och abstrakt typigenkänning.