Apache Nutch

Författare: Eugene Taylor
Skapelsedatum: 8 Augusti 2021
Uppdatera Datum: 18 Juni 2024
Anonim
Apache Nutch 2.0 Tutorial (with Elasticsearch)
Video: Apache Nutch 2.0 Tutorial (with Elasticsearch)

Innehåll

Definition - Vad betyder Apache Nutch?

Apache Nutch är en mjukvaruprodukt för webbsökare som kan användas för att samla data från webben. Det används tillsammans med andra Apache-verktyg, som Hadoop, för dataanalys.


En introduktion till Microsoft Azure och Microsoft Cloud | I hela denna guide kommer du att lära dig vad cloud computing handlar om och hur Microsoft Azure kan hjälpa dig att migrera och driva ditt företag från molnet.

Techopedia förklarar Apache Nutch

Apache Nutch är en öppen källkodsprodukt licensierad av Apache Software Foundation. Denna utvecklare gemenskapen har licenser för en rad Apache-programverktyg som kan sortera och analysera data. En av de centrala teknologierna är Apache Hadoop, ett stordataanalysverktyg som är mycket populärt i näringslivet.

Tillsammans med verktyg som Apache Hadoop och funktioner för fillagring, analys och mer, är Nutchs roll att samla in och lagra data från webben genom användning av webbgenomsökningsalgoritmer.

Användare kan dra nytta av enkla kommandon i Apache Nutch för att samla information under URL: er. Användare använder vanligtvis Apache Nutch tillsammans med ett annat öppet källverktyg, ett ramverk som heter Apache Solr, som kan fungera som ett arkiv för data som samlas in med Apache Nutch.