Principal Component Analysis (PCA)

Författare: Roger Morrison
Skapelsedatum: 22 September 2021
Uppdatera Datum: 10 Maj 2024
Anonim
StatQuest: Principal Component Analysis (PCA), Step-by-Step
Video: StatQuest: Principal Component Analysis (PCA), Step-by-Step

Innehåll

Definition - Vad betyder principkomponentanalys (PCA)?

Principal component analysis (PCA) är en teknik som används för att identifiera ett mindre antal okorrelerade variabler kända som huvudkomponenter från en större uppsättning data. Tekniken används allmänt för att betona variation och fånga starka mönster i en datamängd. Uppfunnen av Karl Pearson 1901, är huvudkomponentanalys ett verktyg som används i prediktiva modeller och undersökande dataanalys. Huvudkomponentanalys anses vara en användbar statistisk metod och används inom områden som bildkomprimering, ansiktsigenkänning, neurovetenskap och datorgrafik.


En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar Principal Component Analysis (PCA)

Huvudkomponentanalys hjälper till att göra data lättare att utforska och visualisera. Det är en enkel icke-parametrisk teknik för att extrahera information från komplexa och förvirrande datamängder. Huvudkomponentanalysen är inriktad på det maximala variansbeloppet med det minsta antalet huvudkomponenter. En av de distinkta fördelarna som är förknippade med den huvudsakliga komponentanalysen är att när mönster hittas i den berörda datan, stöds också komprimering av data. Man använder huvudkomponentanalys för att eliminera antalet variabler eller när det finns för många prediktorer jämfört med antalet observationer eller för att undvika multikollinearitet. Det är nära besläktat med kanonisk korrelationsanalys och använder sig av ortogonal transformation för att konvertera uppsättningen observationer som innehåller korrelerade variabler till en uppsättning värden kända som huvudkomponenter. Antalet huvudkomponenter som används i analysen av huvudkomponenterna är mindre än eller lika med det mindre antalet observationer. Huvudkomponentanalys är känslig för den relativa skalningen av de ursprungligen använda variablerna.


Huvudkomponentanalys används ofta inom många områden som marknadsundersökningar, samhällsvetenskaper och inom industrier där stora datamängder används. Tekniken kan också hjälpa till att tillhandahålla en lägre dimensionell bild av originaldata. Endast minimal ansträngning behövs i fallet med huvudkomponentanalys för att reducera en komplex och förvirrande datauppsättning till en förenklad användbar informationsuppsättning.