Fermer

janvier 11, 2022

Concevoir des entrepôts de données sur Google Cloud Platform – Google Big Query


Le produit Google Big Query est le produit d'entrepôt de données au sein de GCP.
Google Cloud Platform propose plusieurs options de stockage de données.
Il est important de choisir la bonne option, en fonction des exigences relatives à l'ajout de données, aux mises à jour et aux requêtes. .

Options de stockage de données :

La première option dont nous disposons est le stockage en nuage. Il s'agit d'une base de données de stockage d'objets similaire à Amazon S3. Les données sont organisées sous forme de buckets et de fichiers et sont accessibles via une URL globale.

L'option suivante est Cloud SQL. Ce n'est rien d'autre qu'une version gérée de MySQL ou PostgreSQL. Il nous constitue une excellente option pour stocker des données relationnelles de petite ou moyenne taille. Nous avons également Cloud Spanner.

Cloud Spanner est un produit SGBDR natif de GCP qui assure la cohérence des données comme le SGBDR tout en offrant une évolutivité horizontale comme NoSQL. Cependant, Cloud Spanner peut être coûteux, alors soyez prudent.

Vient ensuite Cloud Bigtable, qui est une base de données en colonnes comme Cassandra et HBase. Il prend en charge une interface HBase pour la compatibilité.

Ensuite, il y a Cloud Datastore, qui est une base de données de documents comme MongoDB ou Elasticsearch. Dans Cloud Datastore, les données peuvent être stockées dans des formats JSON flexibles. La prochaine option de stockage de données GCP est Cloud Memory Store, qui est un magasin clé-valeur comme Redis et enfin, il y a Cloud Big Query, qui est un entrepôt de données fournissant une interface SQL.

Google Big Query :

Il est une base de données qui permet de stocker et de récupérer des données à l'aide de SQL. Bien que la définition soit simple, elle possède de grandes capacités qui sont utiles pour configurer des entrepôts de données sur GCP et permettre des compétences pour des analyses capables au sein de l'organisation.

Fonctionnalités clés de Big Query :

Il est fourni avec Google Cloud Scaling et la disponibilité. Il est entièrement géré et sans serveur et il n'est pas nécessaire de provisionner et de gérer des moteurs de calcul ou des régions pour Big Query. Il n'y a pas ou peu de travail de base de données requis pour gérer Big Query et il est sécurisé et hautement disponible par défaut.

Big Query fournit une manipulation et une requête de données basées sur SQL, et il est facile de passer des produits RDMS traditionnels à Big Query et il dispose de plusieurs interfaces pour gérer et interroger les données. Big Query comprend une interface utilisateur Web pour le travail interactif, une ligne de commande pour les scripts interactifs, ainsi qu'une API Rest et un SDK pour la programmation d'applications.

Google Big Query est une excellente option pour stocker et analyser des données sur la plate-forme cloud de Google.




Source link