Mer upptäckt

Författare: Eugene Taylor
Skapelsedatum: 11 Augusti 2021
Uppdatera Datum: 10 Maj 2024
Anonim
Mer upptäckt - Teknologi
Mer upptäckt - Teknologi

Innehåll

Definition - Vad betyder mer upptäckt?

Detektering av tidigare är processen för att detektera och därefter utesluta utdelare från en given uppsättning data.


En fördjupare kan definieras som en datainformation eller observation som drastiskt avviker från den givna normen eller genomsnittet för datauppsättningen. En outlier kan orsakas helt enkelt av en slump, men det kan också indikera mätfel eller att den givna datauppsättningen har en tung svansfördelning.

Här är ett enkelt scenario när det gäller upptäckt av mer omfattande, en mätprocess ger konsekvent avläsningar mellan 1 och 10, men i vissa sällsynta fall får vi mätningar på mer än 20.

Dessa sällsynta mätningar utöver normen kallas outliers eftersom de "ligger utanför" normalfördelningskurvan.

En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar Outlier Detection

Det finns verkligen ingen standardiserad och styv matematisk metod för att bestämma en outlier eftersom den verkligen varierar beroende på uppsättningen eller datapopulationen, så att dess bestämning och detektion i slutändan blir subjektiv. Genom kontinuerlig provtagning i ett givet datafält kan egenskaper hos en utlöpare fastställas för att underlätta detektering.


Det finns modellbaserade metoder för att upptäcka outliers och de antar att uppgifterna alla är hämtade från en normalfördelning och kommer att identifiera observationer eller punkter, som anses vara osannolika baserade på medelvärde eller standardavvikelse, som outliers. Det finns flera metoder för att upptäcka tidigare:

  • Grubb's Test for Outliers - Detta baseras på antagandet att uppgifterna har en normalfördelning och tar bort en outlier i taget när testet itereras tills det inte finns fler utskott.
  • Dixons Q-test - Även baserat på datauppsättningens normalitet testar denna metod för dålig data. Det har noterats att detta bör användas sparsamt och aldrig mer än en gång i en datauppsättning.
  • Chauvenets kriterium - Detta används för att analysera om utflyttaren är falsk eller fortfarande ligger inom gränserna och betraktas som en del av uppsättningen. Medel- och standardavvikelsen tas och sannolikheten för att utfallaren inträffar beräknas. Resultaten kommer att avgöra om det ska inkluderas eller inte.
  • Pierces kriterium - En felgräns är inställd för en serie observationer, utöver vilka alla observationer kommer att kasseras eftersom de redan innebär ett så stort fel.