Les technologues ont besoin de nouvelles solutions pour gérer les performances au sein des applications et architectures cloud natives

La transformation numérique, en partie accélérée par la pandémie de COVID-19, a entraîné l’adoption rapide de technologies cloud natives telles que les microservices et Kubernetes au cours des deux dernières années.
Ces architectures d’applications modernes offrent d’énormes avantages aux organisations en termes de rapidité d’innovation, de flexibilité accrue et de fiabilité améliorée.
Mais de nombreuses équipes informatiques se retrouvent désormais sous une pression immense alors qu’elles tentent de surveiller et de gérer la disponibilité et les performances sur des architectures d’applications cloud natives extrêmement complexes. Ils ont du mal à obtenir une visibilité sur les applications et l’infrastructure sous-jacente pour les grands environnements Kubernetes gérés exécutés sur des clouds publics.
Sans aucun doute, rester au top de la disponibilité et des performances est beaucoup plus difficile dans un environnement cloud défini par logiciel, où tout change constamment en temps réel. Mais les projets de transformation numérique et les initiatives d’innovation continuent de se dérouler à une vitesse vertigineuse, les technologues sont pressés de s’adapter et d’obtenir la visibilité et les connaissances dont ils ont besoin dans ces environnements modernes.
Une question d’échelle
Les approches traditionnelles de la disponibilité et des performances étaient souvent basées sur l’infrastructure physique. Retour en arrière 10 ans, et les services informatiques exploitaient un nombre fixe de serveurs et de câbles réseau – ils avaient affaire à des constantes et à des tableaux de bord fixes pour chaque couche de la pile informatique. L’introduction de l’informatique en nuage a ajouté un nouveau niveau de complexité, les organisations se sont retrouvées à augmenter et réduire continuellement leur utilisation de l’informatique, en fonction des besoins commerciaux en temps réel.
Alors que les solutions de surveillance se sont adaptées pour s’adapter aux déploiements croissants du cloud parallèlement aux environnements traditionnels sur site, la réalité est que la plupart n’ont pas été conçues pour gérer efficacement les environnements cloud natifs dynamiques et très volatils que nous voyons de plus en plus aujourd’hui.
C’est une question d’échelle… ces systèmes hautement distribués reposent sur des milliers de conteneurs et génèrent un volume massif de télémétrie de métriques, d’événements, de journaux et de traces (MELT) chaque seconde. Et actuellement, la plupart des technologues n’ont tout simplement aucun moyen de réduire ce volume de données et ce bruit paralysants lors du dépannage des problèmes de disponibilité et de performances des applications causés par des problèmes liés à l’infrastructure qui s’étendent à travers les environnements hybrides.
Présentation de l’observabilité cloud native
C’est pourquoi il est désormais si essentiel pour les technologues de mettre en œuvre une solution d’observabilité cloud native, afin de fournir une observabilité dans des applications cloud natives et une pile technologique hautement dynamiques et complexes.
Pour que les technologues puissent comprendre correctement le comportement de leurs applications, ils ont besoin d’une visibilité au niveau de l’application, sur les services numériques de support (tels que Kubernetes) et sur les services d’infrastructure en tant que code (IaC) sous-jacents (tels que calcul, serveur, base de données et réseau) qu’ils exploitent auprès de leurs fournisseurs de cloud.
Mais avant de se précipiter pour mettre en œuvre une solution à ce défi croissant, les technologues doivent prendre en compte certains facteurs importants lorsqu’ils réfléchissent à l’observabilité dans les environnements cloud :
Premièrement, les technologues doivent chercher à mettre en œuvre une solution spécialement conçue pour observer les applications cloud natives distribuées et dynamiques. Les solutions de surveillance traditionnelles continuent de jouer un rôle vital – et le feront pour les années à venir – mais cela devient problématique lorsque la fonctionnalité cloud est intégrée aux solutions de surveillance et APM existantes. Trop souvent, lorsque de nouveaux cas d’utilisation sont ajoutés aux solutions existantes, les données restent déconnectées et cloisonnées, obligeant les utilisateurs à passer d’un onglet à l’autre pour essayer d’identifier les causes profondes des problèmes de performances. Très peu de ces solutions offrent une visibilité complète, par exemple un aperçu des mesures commerciales ou des performances de sécurité, et beaucoup sont naturellement orientées vers une couche particulière de la pile informatique en fonction de leur héritage, qu’il s’agisse de l’application ou de l’infrastructure centrale.
De nouvelles équipes nécessitent de nouvelles approches
Les applications Cloud-Native sont construites de manière complètement différente et sont gérées par de nouvelles équipes – Site Reliability Engineers (SRE), DevOps et CloudOps – avec de nouveaux ensembles de compétences, d’états d’esprit et de méthodes de travail. Par conséquent, ils demandent un type de technologie complètement différent pour suivre et analyser les données de disponibilité et de performance. Ils ont besoin d’une solution véritablement adaptée aux besoins de la pile technologique native du cloud pour déchiffrer les interactions de microservices de courte durée les uns avec les autres et qui peuvent disparaître depuis longtemps une fois le dépannage terminé.
Les équipes SRE et DevOps ont besoin d’une solution qui adopte des normes ouvertes, offrant une vue complète et corrélée de toutes les données de télémétrie à travers la pile technologique – plus particulièrement, Open Telemetry. Les technologues doivent être en mesure de collecter toutes les télémétries à travers la pile et les domaines, puis d’analyser toutes ces données de télémétrie – car elles sont interconnectées et interdépendantes – en même temps. Une solution basée sur les normes est essentielle pour les organisations à l’épreuve du temps pour la prochaine décennie et au-delà.
Les technologues ont également besoin d’une solution qui leur permette de surveiller la santé des transactions commerciales clés qui sont réparties dans leur paysage technologique. Si un problème est détecté, ils doivent suivre le fil des données de télémétrie de la transaction commerciale, afin de pouvoir déterminer rapidement la cause première des problèmes, avec l’isolement du domaine d’erreur, et de trier le problème vers les équipes appropriées pour une résolution rapide.
Enfin, les technologues devraient rechercher une solution qui combine l’observabilité avec des fonctionnalités AIOps avancées. Ils doivent tirer parti de la puissance de l’AIOps et de l’intelligence d’affaires pour hiérarchiser les actions pour leurs environnements cloud. À l’avenir, les organisations utiliseront la détection et le diagnostic des problèmes assistés par l’IA avec des informations pour un dépannage plus rapide. En fin de compte, cela permet aux technologues de se concentrer plus rapidement sur ce qui compte vraiment, où et pourquoi cela s’est produit.
Le monde des applications a considérablement évolué au cours des deux dernières années et les technologues doivent s’assurer que leurs capacités de surveillance suivent le rythme. Qu’il s’agisse de comprendre le fonctionnement des applications cloud natives hautement distribuées et de prévoir les incidents ou d’adopter de nouvelles méthodes pour collecter de grandes quantités de données de télémétrie MELT, les équipes des opérations informatiques, des DevOps, des CloudOps et des SRE ont besoin d’informations contextuelles qui fournissent un contexte métier au plus profond de la technologie. empiler.
Ce n’est qu’avec la bonne solution d’observabilité native du cloud en place que les organisations pourront maximiser les avantages des applications modernes, en améliorant les expériences numériques pour les clients et en améliorant les résultats commerciaux.
Source link