Fermer

août 28, 2025

Payer à Ping? Nous sommes passés à la disponibilité de Kuma et avons sauvé grand

Payer à Ping? Nous sommes passés à la disponibilité de Kuma et avons sauvé grand


Introduction

Nous avions l’habitude de compter sur Pingdom pour la surveillance de la disponibilité. Cela a bien fonctionné avec des vérifications simples, une belle interface utilisateur et des alertes fiables et propres. Mais un jour, quelqu’un dans notre équipe DevOps a dit avec désinvolture:

« Hé, pourquoi payons-nous pour quelque chose qui ne pingle que des URL? »

Et cela a lancé une grande conversation.

Le réveil des coûts

Pingdom n’était pas cher, mais ce n’était pas bon marché non plus – surtout quand:

  • Vous surveillez 20+ services à travers la mise en scène, l’AQ, l’intégration et la prod
  • Vous voulez plusieurs chèques par minute
  • Vous voulez plus d’un membre / canal de l’équipe pour obtenir des alertes
  • Vous voulez des pages d’état et des intégrations

Notre projet de loi a continué de croître. Et pire – nous frappions des limites.

Entrez Kuma de disponibilité

Quelqu’un a suggéré Time de disponibilité Kuma – Un outil de surveillance open source qui ressemblait à un projet parallèle au début. Mais ensuite nous l’avons essayé. Et wow. C’était exactement ce dont nous avions besoin.

Time de disponibilité Kuma

Time de disponibilité Kuma

Ce que nous avons fait

Nous avons tourné Kuma sur une petite instance EC2 (T4G.Micro – super bon marché) et avons commencé à mettre en place des moniteurs:

  • URL HTTP / HTTPS pour API, sites Web et Jenkins
  • TCP vérifie les services internes
  • Ping vérifie les IP critiques
  • Alertes personnalisées sur Microsoft Teams & Telegram
  • Bases de données MySQL
  • Producteurs de kafka
    Surveillance avec Kuma de disponibilité

    Surveillance avec Kuma de disponibilité

En moins d’une heure, nous avions remplacé 100% de notre configuration de Pingdom.

Ce que nous aimions instantanément

  • Moniteurs illimités – pas de niveaux de prix
  • 1-seconde ichèques nterval (le pingdom ne se passe pas si vite à moins que vous ne payiez plus)
  • Belle ui – Honnêtement, mieux que prévu
  • Pages d’état public intégrées – Aucun outil supplémentaire requis
  • Intégrations d’alerte personnalisées – via webhooks, e-mail, slack, télégrammeetc.
  • Pages de statut simples et belles.
  • Il peut tout surveiller à partir de simples Points de terminaison HTTP à de minuscules conteneurs Docker.
    Types de surveillance

    Types de surveillance

Avantages réels

1 et 1 Plus de contrôle: Nous contrôlons la fréquence à laquelle les choses sont vérifiées, où elles se déroulent et qui est informée – pas de verrouillage du fournisseur.

2 Économies de coûts: Nous sommes passés du paiement mensuel à ne pas dépenser presque rien (juste le coût d’une EC2 ou d’une machine virtuelle interne).

3 et 3 Surveillance des services internes: Pingdom n’a pas pu surveiller les URL privées / internes – la disponibilité de Kuma peut (parce que nous l’auto-hébergez à l’intérieur du réseau).

Avant vs après

FonctionnalitéPingdom (payé)Time de disponibilité Kuma (auto-hébergé)
LimiterPrix ​​à plusieurs niveauxGratuit, open source et illimité
Vérifier l’intervalle1 min (inférieur = $$$)Jusqu’à chaque 1 seconde
Surveillance de l’URL interneNonOui
Canaux d’alerteLimitéMicrosoft Teams, Slack, Telegram, WhatsApp, etc.
Page de statut publicAjouter surIntégré
CoûtRécurrent / abonnement requisGRATUIT (juste coût VM)

Billets de sécurité

  • L’accès est derrière un VPN
  • La configuration et les données sont stockées sur un volume connecté
  • Nous utilisons des groupes de sécurité pour limiter l’accès
  • Les alertes Slack et les équipes sont basées sur webhook avec des jetons et des webhooks appropriés

Ce que l’équipe a dit

“Honestly, I thought it would be buggy. But it’s fast, clean, and we control everything.”

– Un de nos ingénieurs DevOps

Qu’est-ce qui n’est pas parfait?

Soyons réels – la disponibilité de Kuma n’est pas parfaite.

  • Aucune application mobile (encore)
  • Certaines configurations d’alerte ont besoin d’essais et d’erreurs
  • Pas aussi poli dans l’analyse / les rapports que les outils payants
  • Mais cela ne nous dérangeait pas. Pour la plupart des cas d’utilisation, cela a simplement fonctionné.

Notre configuration finale

Nous surveillons maintenant:

  • Tous les environnements: Dev, QA, intégration, prod
  • Outils et applications privées comme Jenkins, Nexus, ECS Points de terminaison, API
  • Applications orientées publiques
  • Nous avons même une page de statut partagée pour nos équipes internes afin qu’ils puissent vérifier si quelque chose est en baisse avant de lever un billet.

Réflexions finales

Pingdom est super – pas de haine là-bas. Mais pour notre cas d’utilisation, la disponibilité de Kuma nous a donné 100% de la valeur à 0% du coût. À Au nouveau (TTN), nous gérons l’infrastructure pour plusieurs environnements sur divers clients. L’optimisation des coûts est un effort continu, et la surveillance était l’un de ces domaines que nous savions pourrait être amélioré. Contactez-nous votre charge de travail de surveillance. Nous pouvons construire et surveiller votre infrastructure.

Si vous faites partie d’une équipe DevOps ou SRE qui cherche à:

  • Réduire les coûts de surveillance
  • Acquérir une flexibilité
  • Surveiller les services internes et externes d’un endroit centralisé
  • Essayez Kuma de disponibilité.

Cela pourrait vous surprendre – tout comme cela nous a surpris.

Vous avez trouvé cela utile? PARTAGEZ-LE






Source link