Fermer

mai 15, 2024

Atténuez les risques et gagnez en efficacité grâce à l’automatisation basée sur les événements

Atténuez les risques et gagnez en efficacité grâce à l’automatisation basée sur les événements



Un sujet de discussion brûlant parmi les DSI est de rendre les organisations plus efficaces grâce à l’IA et à l’automatisation. C’est un mandat émanant de vos investisseurs, des membres de votre conseil d’administration et de votre PDG. Mais par où commencer ?

De nombreux DSI ont pour mission de réduire les coûts tout en atténuant les risques pour l’entreprise. La prévention des perturbations des services numériques s’impose comme un domaine clé d’amélioration car elle a un impact sur l’équipe, les clients et les résultats. Et les incidents filtrent souvent via un point central : le Network Operations Center. Cependant, les CNO sont inondés de bruit et de tâches manuelles, et coûteux pour le personnel composé d’intervenants L1 et L2, uniquement pour que ces intervenants soient transmis aux experts en la matière (SME). Pour lutter contre cela, les responsables informatiques intègrent l’automatisation basée sur les événements dans leur NOC.

Définir l’automatisation basée sur les événements

L’automatisation basée sur les événements est lancée au niveau de l’événement. Cela signifie que les NOC peuvent déclencher des actions de traitement d’événements immédiatement dès que les données proviennent de sources fiables telles que des outils de surveillance. Les utilisations de l’automatisation basée sur les événements dans le NOC sont nombreuses, allant de l’ajout d’un contexte critique à un incident pour mieux cibler l’intervenant, à la détermination de la prochaine meilleure action, à l’exécution de diagnostics et même à la déclaration d’un incident majeur.

La beauté de l’automatisation événementielle est qu’elle ne se limite pas à réduire l’intervention humaine, elle peut l’éliminer complètement pour certains problèmes. L’automatisation basée sur les événements peut être étroitement intégrée de bout en bout, ce qui signifie que les organisations peuvent s’appuyer sur des processus d’auto-réparation avec les machines comme première ligne de défense. Cela garantit que les équipes ne sont impliquées que lorsque des compétences et des connaissances humaines sont nécessaires. Et il peut être affiné au fil du temps pour répondre à davantage de cas d’utilisation.

Des équipes renforcées grâce à l’automatisation basée sur les événements

Pour de nombreuses organisations, le NOC est responsable de la détection, de la classification et du tri des incidents afin de remettre les services en ligne sans l’implication des PME. Grâce à l’automatisation basée sur les événements, la réponse aux incidents devient plus proactive, en complétant ces étapes et en résolvant les problèmes avant que les clients n’en remarquent l’impact. En effet, une grande partie du travail manuel effectué par les CNO est reléguée à l’automatisation. Par conséquent, les ingénieurs L1 NOC doivent passer moins de temps à surveiller les tableaux de bord et à signaler manuellement les incidents.

Mais ces avantages ne profitent pas seulement aux L1. Grâce à l’automatisation de l’extraction du contexte et des diagnostics, les niveaux 2 disposent également de plus (et de meilleures) informations pour comprendre la cause profonde, réduisant ainsi davantage les efforts des PME. Et il y a un effet de retombée à mesure que l’on applique davantage d’automatisation basée sur les événements. De nombreuses équipes constatent également un impact positif des efforts de modernisation du NOC, notamment un impact moindre sur leur travail quotidien.

Les équipes d’ingénierie de fiabilité des sites (SRE) et d’ingénierie de plateforme : Les équipes SRE et Platform Engineering peuvent développer l’automatisation afin qu’un humain ne soit jamais gêné par une tâche qu’une machine peut accomplir. Parfois, cela prend la forme d’une auto-remédiation, résolvant complètement les incidents avant l’intervention humaine. D’autres fois, cela signifie créer des runbooks qui peuvent aider les CNO et d’autres équipes à résoudre les problèmes plus rapidement à l’aide de scripts automatisés. Cela aide les intervenants à réagir plus rapidement aux problèmes, réduisant ainsi le MTTR et l’impact sur les clients.

Gestion des incidents majeurs (MIM) : Les équipes MIM ne doivent recevoir que les incidents confirmés ayant un impact sur les clients qui ne peuvent pas être corrigés automatiquement et s’appuyer sur le NOC pour catégoriser correctement et acheminer immédiatement ces problèmes. Lorsque cela se produit, les équipes MIM ont besoin que l’incident soit complété par des informations de diagnostic et de tri automatisées afin de disposer du contexte approprié pour une réponse immédiate. Après l’incident, les équipes MIM sont souvent les moteurs de l’apprentissage continu, garantissant que toutes les opportunités d’automatisation supplémentaires sont réintégrées dans le système technique pour améliorer le processus la prochaine fois.

Ingénierie: L’automatisation basée sur les événements garantit que seul un minimum de PME en ingénierie reçoit des notifications pour les incidents sur lesquels elles doivent travailler avec le bon contexte déjà appliqué. Et les équipes d’ingénierie peuvent créer des solutions automatiques pour des problèmes bien compris afin de pouvoir consacrer davantage de temps à l’innovation.

Soutien: La remédiation automatique résout les problèmes avant que les clients ne s’en rendent compte et sans avoir à impliquer inutilement des humains. Et, avec de meilleures données et des équipes compétentes sur l’incident dès le début, le support recevra moins de cas de clients mécontents.

Avec des équipes de toute l’organisation capables de constater des améliorations grâce à l’automatisation basée sur les événements dans le NOC, cela semble être une victoire facile, n’est-ce pas ? Mais il vous reste encore une chose à faire : prouver la valeur avec des données concrètes.

Quantifier la valeur de l’automatisation basée sur les événements

L’essentiel pour prouver la valeur d’une initiative est de l’aligner sur les principaux objectifs de l’entreprise. Dans ce cas, nous pouvons utiliser « réduire les coûts tout en atténuant les risques ».

Le risque se présente sous de nombreuses formes, mais les entreprises le ressentent et peuvent le quantifier en fin de compte, ce sont les pénalités SLA. À mesure que vous appliquez davantage d’automatisation et que votre MTTR s’améliore, combien payez-vous de moins en SLA ? Même un incident majeur évité ou réduit peut avoir des impacts à six chiffres.

Quantifier les revenus et la croissance projetés peut être délicat, mais cela dépend du temps. Il est temps de résoudre, en fait. Plus un incident est résolu rapidement, moins il y a d’impact sur les revenus et plus de temps est consacré à l’innovation. Par exemple, un incident qui prenait auparavant une heure à résoudre et coûtait à l’entreprise 100 000 $ de perte de revenus pourrait être détecté plus rapidement et corrigé automatiquement, n’entraînant ainsi aucune perte de revenus.

L’avenir de l’automatisation événementielle

En 2024, une chose est sûre : l’automatisation est un outil puissant lorsqu’elle est utilisée pour atteindre des objectifs concrets. Comprendre les nouvelles technologies et évaluer où elles s’intègrent le mieux dans vos processus opérationnels est essentiel pour éviter de tomber dans une position à la traîne, alors commencez petit et itérez rapidement. L’automatisation basée sur les événements dans votre NOC, qui génère des améliorations cohérentes et progressives dans l’ensemble de l’organisation, est un excellent point de départ.

Pour en savoir plus, visitez-nous ici.




Source link