Payer à Ping? Nous sommes passés à la disponibilité de Kuma et avons sauvé grand

Introduction
Nous avions l’habitude de compter sur Pingdom pour la surveillance de la disponibilité. Cela a bien fonctionné avec des vérifications simples, une belle interface utilisateur et des alertes fiables et propres. Mais un jour, quelqu’un dans notre équipe DevOps a dit avec désinvolture:
« Hé, pourquoi payons-nous pour quelque chose qui ne pingle que des URL? »
Et cela a lancé une grande conversation.
Le réveil des coûts
Pingdom n’était pas cher, mais ce n’était pas bon marché non plus – surtout quand:
- Vous surveillez 20+ services à travers la mise en scène, l’AQ, l’intégration et la prod
- Vous voulez plusieurs chèques par minute
- Vous voulez plus d’un membre / canal de l’équipe pour obtenir des alertes
- Vous voulez des pages d’état et des intégrations
Notre projet de loi a continué de croître. Et pire – nous frappions des limites.
Entrez Kuma de disponibilité
Quelqu’un a suggéré Time de disponibilité Kuma – Un outil de surveillance open source qui ressemblait à un projet parallèle au début. Mais ensuite nous l’avons essayé. Et wow. C’était exactement ce dont nous avions besoin.

Time de disponibilité Kuma
Ce que nous avons fait
Nous avons tourné Kuma sur une petite instance EC2 (T4G.Micro – super bon marché) et avons commencé à mettre en place des moniteurs:
- URL HTTP / HTTPS pour API, sites Web et Jenkins
- TCP vérifie les services internes
- Ping vérifie les IP critiques
- Alertes personnalisées sur Microsoft Teams & Telegram
- Bases de données MySQL
- Producteurs de kafka
Surveillance avec Kuma de disponibilité
En moins d’une heure, nous avions remplacé 100% de notre configuration de Pingdom.
Ce que nous aimions instantanément
- Moniteurs illimités – pas de niveaux de prix
- 1-seconde ichèques nterval (le pingdom ne se passe pas si vite à moins que vous ne payiez plus)
- Belle ui – Honnêtement, mieux que prévu
- Pages d’état public intégrées – Aucun outil supplémentaire requis
- Intégrations d’alerte personnalisées – via webhooks, e-mail, slack, télégrammeetc.
- Pages de statut simples et belles.
- Il peut tout surveiller à partir de simples Points de terminaison HTTP à de minuscules conteneurs Docker.
Types de surveillance
Avantages réels
1 et 1 Plus de contrôle: Nous contrôlons la fréquence à laquelle les choses sont vérifiées, où elles se déroulent et qui est informée – pas de verrouillage du fournisseur.
2 Économies de coûts: Nous sommes passés du paiement mensuel à ne pas dépenser presque rien (juste le coût d’une EC2 ou d’une machine virtuelle interne).
3 et 3 Surveillance des services internes: Pingdom n’a pas pu surveiller les URL privées / internes – la disponibilité de Kuma peut (parce que nous l’auto-hébergez à l’intérieur du réseau).
Avant vs après
Fonctionnalité | Pingdom (payé) | Time de disponibilité Kuma (auto-hébergé) |
Limiter | Prix à plusieurs niveaux | Gratuit, open source et illimité |
Vérifier l’intervalle | 1 min (inférieur = $$$) | Jusqu’à chaque 1 seconde |
Surveillance de l’URL interne | Non | Oui |
Canaux d’alerte | Limité | Microsoft Teams, Slack, Telegram, WhatsApp, etc. |
Page de statut public | Ajouter sur | Intégré |
Coût | Récurrent / abonnement requis | GRATUIT (juste coût VM) |
Billets de sécurité
- L’accès est derrière un VPN
- La configuration et les données sont stockées sur un volume connecté
- Nous utilisons des groupes de sécurité pour limiter l’accès
- Les alertes Slack et les équipes sont basées sur webhook avec des jetons et des webhooks appropriés
Ce que l’équipe a dit
“Honestly, I thought it would be buggy. But it’s fast, clean, and we control everything.”
– Un de nos ingénieurs DevOps
Qu’est-ce qui n’est pas parfait?
Soyons réels – la disponibilité de Kuma n’est pas parfaite.
- Aucune application mobile (encore)
- Certaines configurations d’alerte ont besoin d’essais et d’erreurs
- Pas aussi poli dans l’analyse / les rapports que les outils payants
- Mais cela ne nous dérangeait pas. Pour la plupart des cas d’utilisation, cela a simplement fonctionné.
Notre configuration finale
Nous surveillons maintenant:
- Tous les environnements: Dev, QA, intégration, prod
- Outils et applications privées comme Jenkins, Nexus, ECS Points de terminaison, API
- Applications orientées publiques
- Nous avons même une page de statut partagée pour nos équipes internes afin qu’ils puissent vérifier si quelque chose est en baisse avant de lever un billet.
Réflexions finales
Pingdom est super – pas de haine là-bas. Mais pour notre cas d’utilisation, la disponibilité de Kuma nous a donné 100% de la valeur à 0% du coût. À Au nouveau (TTN), nous gérons l’infrastructure pour plusieurs environnements sur divers clients. L’optimisation des coûts est un effort continu, et la surveillance était l’un de ces domaines que nous savions pourrait être amélioré. Contactez-nous votre charge de travail de surveillance. Nous pouvons construire et surveiller votre infrastructure.
Si vous faites partie d’une équipe DevOps ou SRE qui cherche à:
- Réduire les coûts de surveillance
- Acquérir une flexibilité
- Surveiller les services internes et externes d’un endroit centralisé
- Essayez Kuma de disponibilité.
Cela pourrait vous surprendre – tout comme cela nous a surpris.
Vous avez trouvé cela utile? PARTAGEZ-LE
Source link