Djupa Q-nätverk

Författare: Laura McKinney
Skapelsedatum: 5 April 2021
Uppdatera Datum: 24 Juni 2024
Anonim
Djupa Q-nätverk - Teknologi
Djupa Q-nätverk - Teknologi

Innehåll

Definition - Vad betyder Deep Q-Networks?

Deep Q Networks (DQN) är neurala nätverk (och / eller relaterade verktyg) som använder djup Q-inlärning för att tillhandahålla modeller som simulering av intelligent videospel. I stället för att vara ett specifikt namn för en specifik nervnätverksbyggnad, kan Deep Q Networks vara sammansatt av invändiga neurala nätverk och andra strukturer som använder specifika metoder för att lära sig om olika processer.


En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar Deep Q-Networks

Metoden för djup Q-inlärning använder vanligtvis något som kallas allmän policy-iteration, beskrivet som en kombination av policyutvärdering och policy-iteration, för att lära sig policyer från högdimensionell sensorisk inmatning.

Till exempel tar en vanlig typ av djup Q-nätverk som omfattas av tekniska publikationer som Medium sensorisk inmatning från Atari 2600 videospel för att ta fram resultat. Detta görs på en mycket grundläggande nivå genom att samla in prover, lagra dem och använda dem för uppspelning av erfarenheter för att uppdatera Q-nätverket.


Generellt sett tränar djupa Q-nätverk på ingångar som representerar aktiva spelare i områden eller andra erfarna sampel och lär sig att matcha dessa data med önskade utgångar. Detta är en kraftfull metod för utveckling av konstgjord intelligens som kan spela spel som schack på en hög nivå eller genomföra andra kognitiva aktiviteter på hög nivå - Atari eller schack-videospel som exempel är också ett bra exempel på hur AI använder typer av gränssnitt som traditionellt användes av mänskliga agenter.

Med andra ord, med djup Q-inlärning, kommer AI-spelaren att bli mer som en mänsklig spelare när han lär sig att uppnå önskade resultat.