Jobbroll: Data Scientist

Författare: Roger Morrison
Skapelsedatum: 28 September 2021
Uppdatera Datum: 11 Maj 2024
Anonim
Data Scientist Job Description explained by Brillio Data Scientist
Video: Data Scientist Job Description explained by Brillio Data Scientist

Innehåll


Källa: Sergey Khakimullin / iStockphoto

Hämtmat:

Datavetare har omfattande jobb som varierar avsevärt beroende på applikationen. Men en sak de alla har gemensamt är drivkraften för att utnyttja data.

Vad gör en datavetare när det gäller artificiell intelligens och maskininlärningsarbete? Många proffs som hanterar dessa typer av projekt varje dag skulle säga att frågan är svårt att svara helt enkelt. En bättre fråga skulle vara: Vad gör dataforskare INTE?

En datavetare är integrerad i en AI- eller ML-process, i den meningen att alla dessa projekt beror på big data eller komplexa insatser. Datavetenskapsmannen är den väsentliga karriäristen som vet hur man arbetar med data för att producera resultat.

Det finns dock några sätt att prata om vad en datavetare gör, vilka kvalifikationer han eller hon behöver och vad hans eller hennes roll är i processen.


Läsa: 6 viktiga datavetenskapskoncept som du kan behärska genom online-lärande

Varierade definitioner, varierade skyldigheter

Många experter som beskriver en datavetares arbete talar om det i stora termer.

”På små företag eller när man arbetar på en ny marknad är datavetenskapens roll att konvertera relativt nya (men uppenbara) datakällor till saker som löser ett problem för en slutanvändare, vilket inte tidigare hade varit möjligt, där de tekniker som används inte fanns, säger Antonio Hicks, en kontochef på Mercury Global Partners. "Den perfekta kandidaten är någon som är en del av matematiker, en del av programvaruingenjör och en del entreprenör."

Andra ekar denna grundidé och nämner vilka data forskare behöver för att ta itu med modelleringsprojekt.


"Det viktigaste attributet som en datavetare behöver är en djup nyfikenhet kring världen omkring dem - oavsett om de svarar på frågor eller bygger modeller, en önskan att förstå problemet framför dem är nyckeln," säger Erin Akinci, Data Scientist Manager på Asana. "Därifrån kommer de flesta människor att kräva kompetens inom matematik och programmering för att hitta lösningar, men de specifika typerna av matematik och programmering varierar mycket beroende på kompetensområdet inom datavetenskap."

Inga buggar, ingen stress - din steg-för-steg-guide för att skapa livsförändrad programvara utan att förstöra ditt liv

Du kan inte förbättra dina programmeringsfärdigheter när ingen bryr sig om mjukvarukvalitet.

"Utmärkt vetenskapligt arbete har mer att göra med hur en forskare tänker på ett problem än de verktyg de använder för att lösa det," tillägger Charlie Burgoyne, grundare och VD för Valkyrie Intelligence. Valkyrie är ett tillämpat vetenskapskonsultföretag med imponerande projekt under sin vinge, som Mark I, en dedikerad nätverksenhet som ökar neuralt nätverksträning och testning och förbättrar vad som är möjligt med föregående molnbaserade maskininlärningsplattformar.

"Marknaden kräver forskare som är skickliga i Python-utveckling, neuralt nätverksdesign och förmågan att omforma ett datalagringssätt till den senaste databasarkitekturen," säger Burgoyne. ”Dessa förmågor är emellertid tabeller för en begåvad forskare. Det som är mindre uppenbart är en forskares förmåga till oförskämd nyfikenhet, aggressiv uppfinningsrikedom och en efterlevnad av den vetenskapliga metoden. ”

Dataforskarens färdigheter

Så långt som praktiska kunskaper sätter, behöver dataforskare lite kreativitet och kunniga såvida modellering går. De kan också ha ganska mycket nytta av att ha ”hårda färdigheter” som erfarenhet av kodning i Python, C ++ eller andra vanliga språk som tillämpas på ML-projekt.

"Python och C ++ är viktiga och att kunna kombinera kodningskompetens med dataanalys och bearbetning och statistik är grundläggande färdigheter som får en datavetare att stå ut som en stark kandidat eller anställd," säger Val Streif på Pramp, en online hålig intervjuplattform för programvaruingenjörer, utvecklare och datavetare. "Även om en del av programmeringsfärdigheterna kan tas om hand genom att para en datavetare med en utvecklare, är det mycket lättare om du har båda färdigheterna kombinerade i en, ur ett företags perspektiv.

Andra experter lägger till R, Hadoop, Spark, Sas och Java i listan samt tekniker som Tableau, Hive och MATLAB.

Alla dessa ger en imponerande CV, men några av dem som har erfarenhet av att rekrytera datavetare säger att den andra "mänskliga" sidan också är viktig. (En typ av datavetare är medborgardataforskaren. Läs mer i rollen som medborgardataforskare i Big Data World.)

”Traditionellt gör individer med en mångfaldig liberal konstutbildning utmärkta datavetare,” säger Burgoyne och gör en åtskillnad mellan ingenjörer som är på byggnadssidan och datavetare, vars arbete kan vara mycket mer konceptuellt. Han fortsätter:

Kompetens inom ett traditionellt STEM-fält med kompletterande fokus inom humaniora, konst eller affärsområden ger de kvaliteter som gör en utmärkt branschorienterad forskare. Det måste sägas att det är lika viktigt för organisationens förmåga att utnyttja dessa egenskaper och att utforma deras glöd och metoder på ett produktivt sätt. Jag har observerat att när ett datavetenskapligt initiativ inte lyckas så är organisationen lika trolig att vara lika skyldig som forskarna. Forskare är inte ingenjörer. De drivs inte att utföra och bygga. De drivs att upptäcka och förstå. Organisationer som förstår denna skillnad belönas väl för odlingen av båda åkrarna.

När det gäller vilken information forskarna vanligtvis använder sig av, har det att göra med företagets kärnmål. Vissa företag jagar ett decentraliserat internet - andra spelar med IoT eller SaaS. Andra försöker banbrytande "användarvänlig" eller "etisk" eller "transparent" AI.

I vilket fall som helst kommer dataforskare troligen att överbrygga klyftan mellan de hårda mätvärdena på de data de använder, oavsett vilken teknikbunke det är i spel, och det frihjulande arbetet med att konceptualisera AI / ML-funktionalitet.

"Vi anställer datavetare för att hantera datainsamling och rengöring, samt översätta dessa data till meningsfull information," säger Michael Hupp, chef för Data Science and Analytics på G2 Crowd. Han utarbetar:

Vanligtvis innebär det att hantera alla viktiga algoritmer som driver ett företags datamaskin och är flytande i viktiga analysverktyg och språk, men under de senaste åren har också inkluderat nya fält som naturligt språkbearbetning, maskininlärning, andra former av AI-aktiverad analys. De mest framgångsrika datavetarna är de som kombinerar sina hårda färdigheter med en förmåga att lära sig snabbt och förmågan att effektivt kommunicera de insikter de upptäcker så att de kommer att vara meningsfulla för sin verksamhet.

Med dessa typer av insikter är det lättare för unga yrkesverksamma eller studenter att ta reda på om datavetare skulle vara en bra roll för dem och hur man skaffar färdigheter. STEM-lärande blir allt mer tillgängligt i skolor runt om i landet, men det är ingen ersättning för en passion för kodning och teknik och förmågan att lära sig i farten.