Fermer

mai 11, 2018

Prévention des trous de données dans le cloud –


Cet article a été publié à l'origine le mongoDB . Merci de soutenir les partenaires qui rendent SitePoint possible.

Les trous noirs sont des régions dans l'espace-temps avec une attraction gravitationnelle si forte que rien ne peut s'échapper. Pas entièrement destructrice comme vous pourriez avoir été amené à croire, leurs effets gravitationnels aident à conduire la formation et l'évolution des galaxies. En fait, notre propre galaxie de la Voie Lactée orbite autour d'un trou noir supermassif avec 4,1 millions de fois la masse du Soleil. Certains théorisent qu'aucun d'entre nous ne serait ici s'il n'y avait pas un trou noir.

D'un autre côté, on peut aussi trouver des trous noirs qui dévalent le cosmos – souvent à des millions de kilomètres à l'heure – . On dit que tout ce qui en fait l'événement, le «point de non-retour», ne sera plus jamais vu ni entendu, faisant des trous noirs certains des objets les plus intéressants et les plus terrifiants de l'espace.

sur les trous noirs, les effets gravitationnels et les points de non-retour? Parce que quelque chose d'analogue est en train de se produire en informatique

inventé en 2010 par Dave McCrory le concept de "gravité des données" traite les données comme une planète ou un objet céleste avec masse. Au fur et à mesure que les données s'accumulent dans un environnement, les applications et les services qui s'appuient sur ces données seront naturellement attirés dans le même environnement. Plus la "masse" de données est grande, plus l'attraction gravitationnelle est forte et plus cela se produit rapidement. Les applications et les services ont chacun leur propre gravité mais la gravité des données est de loin la plus forte, notamment:

  • Plus les données sont éloignées, plus les impacts sur les performances des applications et l'expérience de l'utilisateur sont drastiques. La proximité physique des applications et des services réduit la latence, optimise le débit et facilite la création d'applications performantes par les équipes.
  • Le déplacement des données a un coût. Dans la plupart des cas, il est logique de centraliser les données pour réduire ce coût, ce qui explique pourquoi les données tendent à s'accumuler dans un lieu ou un environnement. Oui, les systèmes distribués permettent aux organisations de partitionner les données de différentes manières à des fins spécifiques – par exemple, clôturer des ensembles de données par des frontières géographiques pour se conformer à la réglementation – mais au sein de ces partitions, un déplacement minimal des données est toujours souhaitable
  • Les efforts visant à numériser les activités, les processus et les modèles commerciaux et organisationnels (souvent qualifiés d '«initiatives de transformation numérique») réussissent ou échouent en fonction de l'efficacité de l'utilisation des données. Si le logiciel est le moteur de la transformation numérique, alors les données sont son combustible

Comme dans le monde réel, plus la masse d'un objet est grande, plus il est difficile de bouger, Cela signifie également qu'une fois que votre masse de données est suffisamment grande, il est également plus difficile (et dans certains cas, presque impossible) de se déplacer. Ce qui rend cela plus important que jamais, c'est le passage au cloud computing. Au fur et à mesure que les entreprises se déplacent vers le cloud, elles doivent prendre une décision qui aura des implications massives sur la ligne – où et comment vont-elles stocker leurs données? Et comment ne pas laisser la gravité des données dans le nuage se transformer en un trou noir de données ?

Il existe plusieurs options pour les organisations qui passent de la construction de leur propre informatique à un service dans le nuage. 19659011] Bases de données tabulaires (relationnelles) propriétaires

Les entreprises qui sous-tendent les bases de données tabulaires propriétaires pénalisent souvent leurs clients pour l'exploitation de ces technologies sur n'importe quelle plate-forme cloud autre que la leur. Cela ne devrait surprendre aucun de nous. Ce sont les mêmes fournisseurs qui comptent depuis des décennies sur la vente de logiciels propriétaires lourds avec des contrats pluriannuels et des frais de maintenance annuels. Le verrouillage des fournisseurs n'est pas nouveau pour eux.

Les organisations qui choisissent d'utiliser des bases de données tabulaires propriétaires dans le nuage conservent également tout le bagage de ces technologies et réalisent peu d'avantages liés au cloud. Ces bases de données évoluent verticalement et ne peuvent souvent pas tirer parti des architectures natives du cloud pour la mise à l'échelle et l'élasticité sans compromis massifs. Si la mise à l'échelle horizontale des données sur plusieurs instances est disponible, elle n'est pas native de la base de données et nécessite des configurations complexes, des modifications côté application et des logiciels supplémentaires.

Le basculement et le déplacement de ces bases vers le cloud

Bases de données tabulaires Open Source

Les choses sont un peu meilleures avec les bases de données tabulaires open source dans la mesure où aucun fournisseur n'applique des tarifs punitifs pour vous garder sur son cloud. Cependant, à l'instar des bases de données tabulaires propriétaires, la plupart de ces technologies sont conçues pour évoluer verticalement; la mise à l'échelle pour réaliser pleinement l'élasticité du cloud est souvent gérée avec des configurations fragiles ou des logiciels supplémentaires.

De nombreuses entreprises qui exploitent ces bases de données dans le cloud s'appuient sur un service géré pour réduire leurs coûts opérationnels. Cependant, la parité des fonctionnalités entre plates-formes cloud est inexistante, ce qui rend les migrations compliquées et coûteuses. Par exemple, les bases de données s'exécutant sur Amazon Aurora exploitent les fonctionnalités spécifiques à Aurora qui ne se trouvent pas sur les autres clouds

Bases de données cloud propriétaires

Avec des bases de données cloud propriétaires, il est très facile d'entrer des données . Ces services de base de données fonctionnent uniquement dans leur cloud parent et fournissent souvent des fonctionnalités de base de données très limitées, ce qui oblige les clients à intégrer des services cloud supplémentaires pour des cas très simples.

Par exemple, de nombreux services Cloud NoSQL propriétaires fonctionnalité de valeur; les utilisateurs ont souvent besoin de transférer des données dans un entrepôt de données cloud pour des requêtes et des analyses plus complexes. Elles ont également tendance à être immatures sur le plan opérationnel, ce qui nécessite des intégrations et des services supplémentaires pour traiter la protection des données et assurer une visibilité adéquate des performances. Et ça ne s'arrête pas là. De nouvelles fonctionnalités sont souvent introduites sous la forme de nouveaux services, et avant que les utilisateurs ne le sachent, au lieu de s'appuyer sur une seule base de données cloud, ils dépendent d'un réseau de services cloud en constante évolution. Cela rend d'autant plus difficile l'extraction de données.

Les principaux fournisseurs de services cloud savent que s'ils sont en mesure d'obtenir vos données dans l'un de leurs services de base de données propriétaires, ils vous dirigent directement. Et bien que certains puissent prétendre que les organisations devraient adopter cette nouvelle forme ultime de verrouillage des fournisseurs pour tirer le meilleur parti du cloud, cela ne laisse pas beaucoup de choix aux clients si leurs exigences ou si les réglementations sur les données changent. Que se passe-t-il si le fournisseur de services cloud que vous n'utilisez pas lance un service de changement de jeu dont vous avez besoin pour supplanter vos concurrents? Que se passe-t-il s'ils ouvrent un centre de données dans une nouvelle région géographique que vous avez priorisée et que la vôtre ne l'a pas sur leur feuille de route? Que se passe-t-il si votre client principal vous dicte de rompre les liens avec votre fournisseur de cloud? C'est arrivé avant .

Ce sont tous des scénarios où vous pourriez bénéficier d'une base de données qui fonctionne de la même manière, partout.

La base de données qui fonctionne de la même manière partout

le nuage, comment vous empêchez la gravité des données de se retourner contre vous et de limiter votre flexibilité est simple – utilisez une base de données qui fonctionne de la même manière dans n'importe quel environnement.

Une option à considérer est MongoDB. En tant que base de données, elle combine la flexibilité du modèle de données documentaire avec l'interrogation sophistiquée et l'indexation requises par un large éventail de cas d'utilisation, allant de la simple valeur-clé aux agrégations en temps réel alimentant l'analyse.

le nuage à son noyau. La redondance pour la résilience, la mise à l'échelle horizontale et la distribution géographique sont natives à la base de données et faciles à utiliser.

Enfin, MongoDB fournit une expérience cohérente, quel que soit l'emplacement de déploiement:

  • cloud, ils peuvent déployer MongoDB dans leurs locaux derrière leurs propres firewalls et gérer leurs bases de données en utilisant outillage opérationnel avancé .
  • Pour ceux qui sont prêts à migrer vers le cloud, MongoDB Atlas fournit la base de données entièrement gérée service dans plus de 50 régions sur AWS, Azure et Google Cloud Platform. L'automatisation intégrée des pratiques éprouvées permet de réduire le nombre de tâches d'administration de base de données dont les équipes sont responsables et d'empêcher les entreprises de migrer leurs tâches opérationnelles vers le cloud. Bien sûr, si vous voulez gérer vous-même MongoDB dans le cloud, vous pouvez le faire.
  • Enfin, pour les équipes qui connaissent bien les services cloud, MongoDB Atlas offre une expérience cohérente sur AWS, Azure et Google. , permettant le développement de stratégies multi-cloud sur une seule plate-forme de données unifiée.

La gravité des données aura sans aucun doute un impact considérable sur la manière dont vos ressources informatiques se fondent et évoluent dans le cloud. Mais cela ne signifie pas que vous devez être pris au piège. Choisissez une base de données qui offre une expérience cohérente dans différents environnements et évitez de dépasser le point de non-retour.




Source link