L'anatomie de l'observabilité.
La première couche est la télémétrie ; nous ne pouvons pas avoir d'observabilité sans les données brutes de télémétrie. En fonction de l'infrastructure et des moyens d'exploitation disponibles, il existe de nombreuses options d'outils pour recueillir la télémétrie brute. L'objectif principal de la première couche doit toujours être d'obtenir l'accès à une télémétrie de haute qualité.
La deuxième couche est celle du stockage ; il ne s'agit pas seulement de la façon dont nous stockons les données, mais aussi de la durée de ce stockage. Lorsque l'on considère les magasins de données pour l'observabilité, trouver le bon solde peut s'avérer être une situation difficile. Fondamentalement, si nous voulons manipuler efficacement des données à haut débit (par exemple, comptabiliser 100 % de tous les messages passés dans une appli mise à l'échelle, ou même prendre des mesures infra de haute fidélité comme la charge du processeur ou l'utilisation de la mémoire par conteneur), nous devons enregistrer des statistiques dans une base de données de séries temporelles. Sinon, nous gaspillons trop d'argent pour transférer et stocker des événements individuels. Et bien que certains puissent suggérer que tu peux échantillonner les événements, pour les données à basse fréquence cachées dans le firehose à haute fréquence, tu peux passer complètement à côté. Cette situation appelle à la création d'une base de données dédiée aux séries temporelles (TSDB) : un magasin de données conçu spécifiquement pour la conservation, l'indexation et l'interrogation de statistiques de séries temporelles comme celles-ci.
Et pourtant ! Si nous voulons manipuler des données de grande cardinalité (par exemple des tags par client, des identifiants uniques pour une infrastructure éphémère, ou des fragments d'URL), une TSDB est un désastre absolu. L'explosion de la cardinalité des tags s'accompagne d'une explosion des séries de spécifications uniques, et donc d'une explosion des coûts. Traditionnellement, il s'agissait d'une base de données de journalisation, bien qu'il soit plus sage de construire autour d'une base de données de transaction distribuée et orientée vers le traçage (nous y reviendrons plus tard) qui permet de faire d'une pierre deux coups (journalisation et traçage).
Néanmoins, trouver des bases de données transactionnelles et de séries de spécifications à la pointe de la technologie est nécessaire mais pas suffisant. Pour que l'observabilité se fasse sans heurt, la couche de données doit également être intégrée et faire l'objet de références croisées, de préférence dans le cadre d'une intégration approfondie.
Les défis ci-dessus peuvent parfois rendre l'observabilité difficile et parfois, elle peut sembler insaisissable. Cela nous amène à la troisième couche, les valeurs réelles ; dans le domaine de la gestion des produits, on les appellerait simplement les résultats commerciaux et ils constituent une partie essentielle de la proposition de valeur lorsque nous vendons l'observabilité et le monitoring à nos clients.
En fin de compte, la télémétrie, qu'elle soit en mouvement ou au repos, n'a pas de valeur intrinsèque. Ce sont seulement les flux de travail et les applications construites dessus qui peuvent avoir de la valeur. Pourtant, dans la présentation conventionnelle de " l'observabilité sous forme de métriques, de journaux et de traces", nous ne savons même pas quel problème nous sommes en train de résoudre ! Et encore moins comment nous le résolvons.
Lorsqu'il s'agit d'applications logicielles modernes et distribuées, il existe deux problèmes primordiaux qui méritent d'être résolus grâce à l'observabilité:
- Comprendre la santé : Connecter le bien-être d'un sous-système aux objectifs de l'application globale et des affaires d'entreprises par le biais d'un monitoring réfléchi.
- Comprendre le Change : Accélérer les changements planifiés tout en atténuant les effets des changements non planifiés.
En conclusion, le monitoring et l'observabilité vont de pair ; l'un ne remplace pas l'autre, mais ensemble, ils permettent et améliorent les résultats commerciaux définis.
Pour plus d'informations, visite le site de Swisscom Public Cloud Services. Tu peux aussi nous rejoindre en contactant nos experts ici pour t'aider à donner le coup d'envoi de tes solutions sur le cloud.
Ceci est la première partie d'un blog en deux parties, dans le prochain billet nous décrirons comment nous faisons de l'observabilité et de la gestion chez Public Cloud Managed Services pour nos clients dans le cadre de notre offre de services Manager.