5 bästa metoderna för automatisering av hantering av större incidenter

Författare: Roger Morrison
Skapelsedatum: 27 September 2021
Uppdatera Datum: 21 Juni 2024
Anonim
5 bästa metoderna för automatisering av hantering av större incidenter - Teknologi
5 bästa metoderna för automatisering av hantering av större incidenter - Teknologi

Innehåll



Källa: Pixtum / iStockphoto

Hämtmat:

Med en smart automatiseringsstrategi kan du göra incidentreaktion snabbare och enklare än någonsin - minimera driftstopp och potentiella säkerhetsbrott.

Stora IT-incidenter äger rum inom företag varje dag. Medan bara en handfull gör rubrikerna, kan händelser som avbrott och säkerhetsbrott allvarligt krama anställdas produktivitet, negativt påverka kundernas uppfattningar, och viktigast av allt, resultera i förlorade intäkter.

Så när det gäller att hantera större IT-incidenter är det bäst att fokusera på affärseffekterna och i slutändan. Enligt Ponemon Institute var den genomsnittliga kostnaden för driftsstopp under 2016 8 851 dollar per minut - det är över 500 000 dollar per timme och typiska drifttid i genomsnitt mer än 90 minuter. Och detta är bara den omedelbara kostnaden! Påverkan på lång sikt som rykte och skador på kunder är oförutsägbara och potentiellt katastrofala.


Även om du inte helt kan undvika alla större incidenter, kan du beväpna din organisation så att du är så beredd som möjligt att hantera dem när de uppstår. Och en viktig del av din strategi bör vara att integrera automatisering. Organisationer som maximerar användningen av automatisering i sina stora processer för lösning av händelser uppnår snabbare återställning av tjänster och mycket färre misstag på grund av mänskliga misstag. Det beror på att automatisering påverkar direkt din förmåga att krympa varaktigheten för fönstret för företagspåverkan - eller den dyra perioden där dina användare och affärsverksamheter faktiskt känner påverkan av en incident. (För mer information om automatisering, se Automation: The Future of Data Science and Machine Learning?)

För att maximera fördelarna med automatisering bör du undersöka vilka aktiviteter som behöver ske under påverkningsfönstret och ta reda på hur du flyttar alla andra aktiviteter till antingen innan incidenten inleds eller efter att verksamheten har återgått till normal drift. Här är fem användbara sätt att komma igång.


1. Utveckla och definiera en process

Att definiera en viktig process för hantering av händelser handlar om att kartlägga vad som kan planeras, samordnas eller genomföras under en incident. Det kan till exempel innebära att identifiera viktiga supportteammedlemmar efter skicklighet och schema, till exempel, så att din servicedesk kan engagera dem så snabbt och effektivt som möjligt. Det betyder också att du räknar ut hur du kommer att vidarebefordra relevant information till ditt team så att de kan börja lösa problemet direkt, samt att hålla rätt intressenter informerade och uppdaterade.

Automation är avgörande för viktiga aspekter av denna process. Till exempel kan du automatisera införandet av relevant information från dina övervakningsverktyg i biljetter till serviceavdelningen, eller inkludera information från serviceavdelningen i aviseringar till händelseupplösarna. Du kan också dokumentera hela incidenten till en enda källa till omfattande sanning som är tillgänglig för alla. Kom ihåg att du kan öva den här processen för att få den rätt - du behöver inte vänta på en verklig incident för att testa din strategi.

2. Få din infrastruktur rätt

Under denna dag och ålder av varningströtthet är det viktigt att du inte fortsätter att bombardera dina lag med irrelevanta meddelanden och information som inte gäller dem. Om du använder filter på dina övervakningsvarningar kommer dina team att göra det lättare att nollställa in nålen i höstacket med rutinbuller. Detta är nyckeln till att göra alla dina insikter och data verkligen handlingsbara, snarare än att bara lägga till överbelastning av information.

Bra sätt att automatisera är att använda en APM-lösning för att genomsöka alla dina applikationer och system för att proaktivt identifiera orsakerna vid en prestationsförsämring innan du orsakar stora servicestörningar. Du kan också integrera din övervakning, servicedesk, samarbetsappar och chattverktyg för att dela konual information i realtid.

Inga buggar, ingen stress - din steg-för-steg-guide för att skapa livsförändrad programvara utan att förstöra ditt liv

Du kan inte förbättra dina programmeringsfärdigheter när ingen bryr sig om mjukvarukvalitet.

3. Mät noggrant MTTR

Hur mäter du genomsnittlig tid för reparation (MTTR)? Baserar du det på den totala tiden som IT-team är engagerade eller på den totala tiden som verksamheten påverkas? Om ditt svar är det förra bör du överväga att mäta påverkningsfönstret med hjälp av affärsperspektivet istället. Detta är en mycket mer exakt nackdel för dina optimeringsinsatser, eftersom ditt mål är att minimera effekterna av incidenter och inte bara lägga fram bättre svarrapporter till ditt styrelse. (För att lära dig mer om driftsstopp och hur det hanteras, kolla in vilken genomsnittlig tid mellan fel som verkligen betyder.)

Du kan automatisera genom att tillhandahålla full synlighet i applikationer för att retroaktivt "starta klockan" om det behövs och bevara en fullständig registrering av dina upplösningsaktiviteter och kommunikationer för analys och revision för att förbättra dina processer.

4. Håll intressenterna informerade - men utan att avbryta lösningen

Intressenter förväntar sig effektiv och snabb kommunikation samtidigt som de förväntar sig att ämnesexperter kommer att vara laserfokuserade på att fixa problem. Även om du kan utse en kommunikationspunkt för att övervaka och engagera affärsanvändare, skulle en effektivare strategi vara att skapa en självbetjäningssida med statusuppdateringar. Detta ger intressenten möjlighet att kontrollera sig utan att bombardera ditt team med ytterligare samtal och s. Kom bara ihåg att uppdatera dina intressenter med jämna mellanrum så att de alltid får, och vet att de kan förvänta sig, den senaste statusrapporten. Glöm inte att kommunikationen inte bör sluta bara för att tjänsten återställs! Det är viktiga intressenter som får en sammanfattning av vad som hände, vad som lärt sig och hur situationen kan förhindras i framtiden.

Automatisering i det här fallet kan implementeras för att skapa en automatisk statussida i realtid för intressenter, samt bygga snedstreckskommandon i ditt chattverktyg för att uppdatera den sidan.

5. Samla in data för att stödja problemhantering

Återställningstjänsten representerar inte slutet på incidenthantering! I själva verket inträffar några av de mest värdefulla aktiviteterna efter upplösningen. Genom att samla in diagnostiska data och effektdata och utföra rotorsakanalys kan du utföra en fullständig granskning av en större incident som inkluderar att förebyggande åtgärder vidtas för att undvika liknande incidenter i framtiden. Dessutom, även om en igenkännbar incident inträffar igen, kan du skapa en definierad procedur för vilken typ av data du behöver samla in och stegen som måste ske för att köra upplösning. På detta sätt måste ditt team helt enkelt hänvisa till en checklista och fokusera på deras huvudmål att återställa tjänsten, snarare än att oroa sig för vad de behöver och när.

Automation här kan fånga och bevara upplösningsaktiviteter, inklusive saker som chattutskrifter, i ett enda register för analys. Dessutom hjälper det dig att bygga en katalog över bekanta incidenter eller problem, stärka bästa praxis för var och en och därmed öka upplösningshastigheten i framtiden.

Slutsats: Automatisera smartare, inte mer

Var försiktig att mer automatisering inte nödvändigtvis är den bättre metoden! Det är viktigare att du förstår när, var och hur du ansluter dina IT-system tillsammans för att stödja incidenthantering. Du vill inte lägga till onödig komplexitet för att öka automatiserade processer. Kom ihåg att målet är att förenkla och konsolidera verksamheten så mycket som möjligt för att dina team ska känna sig befogen att effektivt hantera problem. Det handlar om intelligent implementering av automatisering för att underlätta en välkoordinerad uppsättning processer, kunnig personal och effektiv intressentkommunikation, för att minimera den totala affärseffekten av större incidenter.