Fermer

octobre 23, 2018

5 raisons pour lesquelles les lacs de données sont vitaux pour l'analyse de démarrage


Vous ne connaissez peut-être pas encore très bien le terme à la mode «data lake», mais si vous êtes à un stade précoce de démarrage, vous le serez probablement bientôt.

Alors que les entrepôts de données et les dépôts de données ont tendance à forcer les entreprises à paradigmes et silos de données étroits, les Data Lakes mettent en avant une vision plus holistique et plus large de l'analyse. Les Data Lakes offrent une approche plus adaptative de l'analyse des données et mettent l'accent sur la valeur de toutes les informations plutôt que sur des éléments pré-sélectionnés.

La controverse entourant le Big Data sur les Data Lacs tend à se concentrer sur leurs inconvénients perçus. Ils sont trop non structurés, trop volumineux et trop difficiles à gérer. Quoi qu'il en soit, les Data Lakes ont des caractéristiques clés qui les rendent particulièrement utiles, et malgré leur nouveauté relative ils peuvent être particulièrement utiles pour les startups.

En effet, pour une startup, se débarrasser de ses énormes quantités de données peut conduire à une compréhension plus étroite de leur marché et potentiellement ignorer les tendances clés. Au lieu de s'enfermer dans des pratiques de gestion de données rigides, ces cinq raisons montrent pourquoi les lacs de données constituent un élément essentiel du paradigme d'analyse d'une start-up.

Ils permettent de réduire les coûts liés à la mise à l'échelle

Les start-up peuvent démarrer avec moins de flux de données et moins. besoins, mais cela change rapidement quand ils commencent à grandir. Les entrepôts de données sont hautement structurés et nécessitent une maintenance élevée et une surveillance constante par des ingénieurs et des architectes de données dédiés. Cela comprend la création des schémas appropriés pour l'analyse, la modification des modèles d'analyse et même la création des structures appropriées pour le stockage des données épurées.

Des entreprises comme Meta Networks, par exemple, qui propose des outils de réseau en tant que service aux entreprises, collectez des millions de points de données par seconde, chiffres qui augmentent de façon exponentielle à mesure que de nouveaux clients sont intégrés. En construisant des lacs de données avec Upsolver – qui peut reposer sur des systèmes plus facilement évolutifs tels que les serveurs cloud AWS S3 -, la société a pu collecter toutes les données dont elle a besoin sans avoir à pré-construire des structures de schéma et d'entrepôt. .




Source link