Fermer

juillet 23, 2019

Chargement de données dans Oracle Autonomous Data Warehouse à l'aide d'OAC20 minutes de lecture

Chargement de données dans Oracle Autonomous Data Warehouse à l'aide d'OAC


Dans cet article de blog, je vais vous montrer quelques fonctionnalités intéressantes disponibles dans Oracle Analytics Cloud (OAC). C'est le type de fonctionnalité que vous voyez rarement dans les plates-formes de génération de rapports et de visualisations front-end, que ce soit avant ou dans le Cloud ou même après l'avènement du Cloud. Il permet aux utilisateurs finaux d’accomplir des tâches de gestion des données avec une assistance informatique quasi inexistante.

Oracle ADW signifie ‘Autonomous Data Warehouse’. ADW est un entrepôt de données en nuage haute performance entièrement géré et basé sur le cloud Oracle qui s’exécute sur des machines de base de données spécialisées Oracle Exadata. Un entrepôt de données ADW peut être configuré en quelques minutes, peut évoluer au niveau des pétaoctets, peut être activé et désactivé par l'utilisateur final et prend en charge le clonage de bases de données entières en quelques minutes.

Dans cet article de blog, je vais vous montrer comment. charger des données dans ADW en utilisant uniquement la fonctionnalité Oracle Analytics Cloud (OAC). Aucun code n'aura besoin d'être écrit. Je n’aurai pas besoin d’utiliser des outils de développement SQL. Je n'aurai même pas besoin de créer la table cible dans ADW. Le CAO le fera pour moi. De plus, je ne charge pas un seul fichier. Je vais charger deux fichiers et les joindre sur une valeur commune avant de les charger dans la table ADW cible (similaire à l'utilisation de vlookup pour joindre deux feuilles Excel sur une valeur commune).

Je le ferai à l'aide des versions d'essai gratuites de Oracle ADW et OAC. Ainsi, toute personne possédant une carte de crédit peut immédiatement essayer elle-même (votre carte ne sera pas automatiquement débitée après la fin de l'essai gratuit. Votre essai expirera au bout de 30 jours sans frais, à moins que vous ne choisissiez de continuer et de payer à l'avenir).

Configurer les versions d'évaluation d'ADW (Autonomous Data Warehouse) et Oracle Analytics Cloud (OAC)

  1. Commençons par nous inscrire aux versions d'évaluation gratuites d'ADW et de OAC. Veuillez vous rendre sur https://cloud.oracle.com/tryit. Cliquez sur "Créer votre compte gratuit". Suivez les instructions pour créer votre compte Oracle Cloud gratuit. Il vous sera demandé de fournir une adresse e-mail et un numéro de carte de crédit (encore une fois, juste pour réitérer, votre carte de crédit ne sera pas débitée). Ce compte vous permettra d'accéder à ADW et à CAO.
  2. Peu de temps après vous être inscrit à votre compte gratuit, vous recevrez un courrier électronique semblable à celui ci-dessous d'Oracle Cloud avec vos informations d'accès et un mot de passe temporaire. Cliquez sur 'Démarrer avec Oracle Cloud' pour définir votre mot de passe permanent et commencer à configurer vos instances ADW et OAC.
  3. Après avoir configuré votre mot de passe permanent, vous accédez à un écran similaire à celui ci-dessous, dans lequel vous pouvez créer votre Instance ADW. Cliquez sur "Entrepôt de données autonome – Créer un entrepôt de données"
  4. Les 4 captures d’écran suivantes incluent tout ce dont vous avez besoin pour définir et créer votre instance ADW. C'est très simple. Dans le premier écran ci-dessous, vous pouvez tout conserver comme paramètre par défaut, à moins que vous ne souhaitiez modifier le nom d'affichage de l'instance ADW (ce que j'ai fait ci-dessous).
  5. Dans l'écran suivant, vous devez vous assurer que 'Entrepôt de données' est vérifié. Vous pouvez configurer la base de données comme vous le souhaitez. Les valeurs par défaut pour le nombre de cœurs de processeur et le stockage (To) sont 1 chacune. En règle générale, cela suffit pour un système d'essai. J'ai changé le nombre de cœurs de processeur en "2" dans la capture d'écran ci-dessous. J'ai également activé la mise à l'échelle automatique, qui est désactivée par défaut. Si c'est quelque chose que vous souhaitez tester, vous devez l'activer.
  6. Sur l'écran suivant, il vous sera demandé de créer le mot de passe pour l'utilisateur ADMIN. C’est important et vous ne devez pas oublier de perdre quelque chose, c’est pourquoi vous devez le documenter dans un endroit sûr.
  7. Sur ce dernier écran de configuration, vous devez choisir ‘Apportez votre propre licence’ comme type de licence. C'est tout. Aucune autre information de configuration n'est requise. Cliquez simplement sur 'Créer une base de données autonome' pour lancer le processus de provisionnement de votre instance ADW.
  8. Tout d'abord, vous obtiendrez un écran comme celui-ci indiquant que votre instance ADW est en cours de provisionnement.
  9. Après une minute ou deux (ou parfois un un peu plus longtemps) le provisioning sera terminé et vous obtiendrez un écran comme celui ci-dessous. C'est ça. Vous disposez maintenant d'une instance d'entrepôt de données autonome Oracle.
  10. Bien que vous disposiez maintenant d'une instance ADW, vous ne pourrez y accéder que si vous disposez des informations d'identification appropriées. Donc, cette prochaine étape est très importante. Dans cette étape, nous allons télécharger un fichier de portefeuille contenant les informations d'identification permettant d'accéder à notre instance ADW. Cliquez sur "Télécharger". Le mot de passe de ces informations d'identification téléchargées est le mot de passe défini pour l'utilisateur ADMIN à l'étape 6.
  11. Enregistrez le fichier zip du portefeuille téléchargé à un emplacement dont vous vous souviendrez. Il n'est pas nécessaire d'extraire les fichiers du fichier zip. C'est tout ce qui doit être fait pour ADW. Nous allons maintenant nous concentrer sur la création de notre instance CAO.
  12. Maintenant que nous avons une instance ADW, il est temps de configurer et de créer notre instance CAO. Allez dans l'onglet 'hamburger' dans le coin supérieur gauche et faites défiler jusqu'à 'Mes tableaux de bord de service' et cliquez dessus.
  13. Dans l'écran ci-dessous, cliquez sur 'Créer une instance'.
  14. Ensuite, sur l'écran ci-dessous, cliquez sur 'Créer 'sur le bouton' Analytics '.
  15. Enfin, sur l'écran ci-dessous, cliquez sur' Créer une instance '. Quelques questions de base vous seront posées pour configurer et configurer votre instance OAC.
  16. Il vous sera demandé de fournir un nom pour votre instance. Choisissez une région proche de vous (par exemple, si vous vous trouvez sur la côte est, choisissez «us-ashburn-1», qui se trouve en Virginie). Pour Edition, sélectionnez "Oracle Analytics Cloud-Enterprise Edition". Pour le jeu de fonctions, sélectionnez ‘Business Intelligence – Modèles de données d’entreprise '. Cliquez sur 'Suivant'.
  17. Passez en revue toutes les informations à l'écran ci-dessous pour vous assurer qu'elles sont exactes, puis cliquez sur 'Créer'.
  18. Vous obtiendrez un écran semblable à celui ci-dessous qui apparaîtra pendant le fonctionnement de votre instance OAC. approvisionné. Vous pouvez actualiser l'écran en cliquant sur l'icône en forme de flèche circulaire située dans le coin supérieur droit.
  19. Lorsque votre instance OAC est prête, vous obtenez un écran semblable à celui ci-dessous, qui affiche le nom de votre instance OAC. Cliquez sur ‘URL Oracle Analytics Cloud’ pour l’ouvrir et accéder à votre instance OAC.

Etablir la connexion entre OAC et ADW

  1. Vous serez amené à l’écran ci-dessous, qui est l’écran d’accueil du CAO. Nous sommes maintenant prêts à démarrer les activités requises pour charger des données dans notre instance Oracle ADW. La première chose à faire est d’établir une connexion entre le CAO et notre instance ADW. Cliquez sur le bouton ‘Créer’ dans le coin supérieur droit, puis sur l’icône ‘Connexion’.
  2. Vous obtiendrez l’écran ci-dessous. Oracle Analytics Cloud peut se connecter à de nombreuses sources de données différentes. Dans ce cas, vous voudrez cliquer sur l’icône intitulée «Oracle Autonomous Data Warehouse Cloud».
  3. Cet écran suivant vous permettra d’établir la connexion à ADW à partir du CAO. Entrez un nom de connexion de votre choix. Pour "Informations d'identification du client", sélectionnez le fichier zip que vous avez téléchargé aux étapes 10 et 11 ci-dessus (il n'est pas nécessaire d'extraire les fichiers du fichier zip. Vous pouvez simplement sélectionner le fichier zip). Le mot de passe sera le mot de passe que vous avez défini pour l'utilisateur ADMIN à l'étape 6. Vous pouvez laisser le nom de service par défaut. Cliquez sur "Enregistrer".
  4. Vous pouvez vérifier l’existence de la connexion en cliquant sur "hamburger" dans le coin supérieur gauche. Cliquez ensuite sur ‘Données’ puis cliquez sur ‘Connexions’. Vous verrez votre connexion listée.

Téléchargez des fichiers Excel du lecteur local vers la zone de stockage de données du CAO

  1. Nous allons ensuite charger deux fichiers Excel de notre lecteur local dans la zone de stockage de données du CAO. Cela dépend de la configuration et de la sécurité par personne, mais le CAO peut stocker environ 250 Go de fichiers. Ce stockage est distinct de ADW. Le stockage des jeux de données du CAO est semblable au stockage sur votre disque dur, sauf dans le Cloud. Après avoir chargé ces deux fichiers Excel dans la zone de stockage du CAO, nous les chargerons ensuite dans ADW pour les stocker et les analyser en permanence. Cliquez sur "Créer" dans le coin supérieur droit, puis sur "Ensemble de données".
  2. Vous obtiendrez l'écran ci-dessous. Cliquez sur "Déposer le fichier de données ici ou cliquez sur pour parcourir" et sélectionnez un fichier Excel à partir de votre lecteur local.
  3. Vous obtiendrez alors un écran qui ressemble à ceci. J'ai sélectionné un fichier Excel à télécharger appelé New Company Sales Data.xlsx. Il comporte deux feuilles et, dans l'écran ci-dessous, je vais télécharger la première feuille du fichier Excel.
  4. Avant de télécharger ces données, je dois effectuer un peu de préparation de données. BASKET_ID et PROD_ID sont des valeurs numériques. Par conséquent, OAC prévoit de les traiter comme des mesures. Cependant, ce sont vraiment des attributs. Je vais donc cliquer sur chacune d’elles, aller sur le côté gauche et changer "Traiter comme" de Mesurer en Attribut. Veuillez analyser l'ensemble de données que vous allez télécharger et assurez-vous que seules les données numériques que vous prévoyez de résumer seront traitées comme une mesure. Toute autre colonne doit être traitée comme un attribut. Cliquez sur "Ajouter" dans le coin supérieur droit pour transférer le fichier au CAO.
  5. Vérifions que le jeu de données a bien été chargé. Pour ce faire, je clique sur le hamburger dans le coin supérieur gauche. Je clique ensuite sur "Données" puis sur "Ensembles de données". Je vois maintenant le fichier que j'ai téléchargé.
  6. Je vais maintenant répéter le même processus de téléchargement pour télécharger une table de mappage qui se trouve sur la deuxième feuille de calcul du même fichier Excel. Si vous ne souhaitez pas essayer la fonctionnalité «rejoindre», vous pouvez ignorer le téléchargement d’un deuxième fichier. Cliquez sur «Créer» dans le coin supérieur droit. Cliquez ensuite sur ‘Data Set’. Vous obtiendrez l’écran ci-dessous.
  7. Je sélectionnerai le même fichier sur mon disque dur, appelé «New Company Sales Data.xlsx», et je téléchargerai la feuille de calcul second dans le fichier. La deuxième feuille de calcul est un tableau de correspondance qui fait correspondre la catégorie de produit au type de produit. Le type de produit n'était pas un attribut dans le premier fichier que j'ai téléchargé, mais je souhaite analyser les ventes par type de produit. J'ai donc besoin d'ajouter le type de produit au fichier avec les données de vente. Pour ce faire, nous utiliserons les fonctionnalités standard du CAO afin d’appliquer la table de mappage Catégorie de produit à Type de produit aux données de vente avant de la charger dans ADW. La table résultante dans ADW aura une colonne pour Type de produit et chaque ligne aura une valeur dans cette colonne. La table de mappage ne nécessite aucune préparation de données avant le téléchargement. Cependant, je dois m'assurer de sélectionner la feuille de calcul appropriée dans le fichier Excel pour le téléchargement. Cliquez sur ‘Ajouter’ pour télécharger la table de mappage dans la zone de stockage du CAO
  8. Nous avons maintenant deux ensembles de données téléchargés dans la zone de stockage du CAO et une connexion configurée entre le CAO et ADW. Nous avons tous les ingrédients dont nous avons besoin pour aller de l'avant et charger ces données dans ADW à partir du CAO. Les écrans ci-dessous affichent les deux ensembles de données téléchargés dans la zone de stockage du CAO et la connexion de CAO à ADW. Cliquez sur ‘Créer’ puis sur ‘Flux de données’.

Configurer et exécuter le flux de données dans CAO pour charger des données dans ADW

  1. Après avoir cliqué sur ‘Flux de données’, l’écran ci-dessous apparaît. Nous allons utiliser les fonctionnalités standard du CAO pour configurer un flux de données afin de joindre les deux fichiers, puis de charger le jeu de données résultant dans une seule table dans ADW. Une fois que nous avons configuré le flux de données, nous devons «exécuter» le flux de données pour charger les données dans ADW (tout ce qui précède l’exécution du flux de données vient d’être configuré). La fonctionnalité de flux de données du CAO est très puissante. Il est possible de créer des flux de données très complexes avec plusieurs branches, agrégations et transformations de données. Le flux de données que nous allons créer sera relativement simple, avec une étape pour joindre les deux fichiers de données sur une clé commune, puis une étape pour charger les résultats dans ADW. La première étape consiste à cliquer sur "Nouvelles données sur les ventes de la société», puis sur "Créer un jeu de données".
  2. Le jeu de données "Nouvelles données sur les ventes de la société" est maintenant ajouté au flux de données, comme indiqué à l'écran. au dessous de. Il est maintenant temps d'ajouter le deuxième ensemble de données au flux de données. Comme vous vous en souviendrez, le deuxième ensemble de données est une table de mappage. Afin d’ajouter le deuxième ensemble de données, nous devons faire glisser l’icône «Ajouter des données» située en haut du menu de gauche, juste en dessous de «Étapes du flux de données», dans la section blanche du flux de données située juste sous l’icône bleue. Nouvelles données sur les ventes de la société.
  3. Après avoir effectué le glisser-déposer de l'option de menu "Ajouter des données", nous obtiendrons un écran semblable à celui ci-dessous. Dans ce cas, je sélectionnerai le deuxième ensemble de données – Catégorie de produit à mapper. Cliquez sur «Ajouter».
  4. Après avoir cliqué sur «Ajouter», l’écran ci-dessous apparaît. Vous pouvez voir le deuxième ensemble de données situé sous le premier ensemble de données dans ce flux de données.
  5. L'étape suivante consiste à associer ces deux ensembles de données sur une valeur commune afin que l'ensemble de résultats contienne le type de produit. Pour ce faire, nous allons faire glisser ‘Joindre’ du menu de gauche vers la partie blanche du flux de données. Après cela, nous aurons l'écran ci-dessous. Le CAO nous indiquera que la jointure est incomplète et suggérera à un nœud sur lequel cliquer pour définir les critères de jointure. Cliquez sur le petit cercle avec le contour bleu clair pour définir les critères de jointure.
  6. Après avoir cliqué sur le cercle bleu clair, vous obtiendrez l'écran ci-dessous. Le CAO aura une première idée sur la correspondance des colonnes entre les deux fichiers. Dans ce cas, la supposition initiale du CAO concernant la correspondance des colonnes est fausse. Il faut changer "BASKET_ID" sur l’entrée 1 pour devenir "PROD_CATEGORY".
  7. Maintenant que nous avons défini avec succès les critères de jointure, le CAO est capable de joindre les deux ensembles de données et d’afficher les lignes résultantes pour nous. Veuillez noter que les lignes résultantes affichées contiennent toutes les colonnes des deux ensembles de données (donc Product_Type est dans l'ensemble de résultats).
  8. Nous en sommes maintenant à une étape très importante. C’est là que le flux de données sera configuré pour enregistrer le résultat de la jointure à ADW. La première étape consiste à faire glisser "Enregistrer le jeu de données" du menu de gauche vers la partie blanche du flux de données au-dessus du signe "+" situé à droite du bouton "Rejoindre". Ensuite, nous allons donner un nom à l’ensemble de données qui résultera de la jointure (nous l’appelons «sales_trans_cust»). Ensuite, il est important de spécifier si le jeu de données doit être sauvegardé dans le stockage de fichiers du CAO (comme les fichiers que nous avons téléchargés) ou dans une connexion à une base de données. Bien sûr, nous devrions sélectionner ‘Connexion à la base de données’. Cliquez ensuite sur ‘Sélectionner la connexion’ qui apparaîtra juste en dessous de ‘Enregistrer les données dans la connexion à la base de données’ après avoir sélectionné Connexion à la base de données.
  9. Après avoir cliqué sur ‘Sélectionner la connexion’, l’écran ci-dessous apparaît. Comme nous n’avons établi jusqu’à présent qu’une seule connexion à la base de données dans cette version d’essai, nous n’en avons qu’une seule à choisir. Sélectionnez la connexion à ADW que nous avons précédemment configurée.
  10. Au cours de cette étape, nous allons effectuer deux tâches très importantes. Nous allons d’abord définir le nom de la table (il devrait être identique au nom du fichier défini à l’étape 39 – c’est-à-dire, sales_trans_cust). Nous déciderons également de remplacer les données existantes lors de l’exécution de ce flux de données ou d’ajouter de nouvelles données aux données existantes. Nous allons sélectionner "Ajouter de nouvelles données aux données existantes". Avant d’exécuter ce flux de données, enregistrez-le. Cliquez sur ‘Sauvegarder’.
  11. Nous allons donner un nom au flux de données et cliquer sur ‘OK’.
  12. Vérifions que le flux de données est bien sauvegardé. Cliquez sur le hamburger dans le coin supérieur gauche. Cliquez sur ‘Données’. Cliquez sur ‘Flux de données’. Vous devriez voir le flux de données dans la liste des flux de données. Cliquez sur votre flux de données pour l'ouvrir.
  13. Il est maintenant temps d'exécuter le flux de données pour charger les données dans ADW. Cliquez sur ‘Run Data Flow’ dans le coin supérieur droit.
  14. Un écran similaire à celui ci-dessous apparaîtra pendant l’exécution du flux de données. Même si les données en cours de chargement représentent près d’un million d’enregistrements, traitement de jointure inclus, le chargement dans ADW a pris moins d’une minute.
  15. Une fois le chargement terminé, vérifions que le chargement des données est correct. Voyons d’abord la zone «Ensemble de données» du CAO. Cliquez sur le hamburger dans le coin supérieur gauche. Cliquez sur ‘Données’. Cliquez ensuite sur ‘Ensembles de données’. Vous verrez un ensemble de données appelé "sales_trans_cust". Il s'agit d'un type de jeu de données CAO différent des fichiers Excel téléchargés. Vous pouvez constater que l’icône est différente pour "sales_trans_cust". Il utilise l’icône ‘connexion’ car les données de ‘sales_trans_cust’ ne sont pas stockées dans la zone de stockage du jeu de données OAC. Les données de "sales_trans_cust" sont stockées dans ADW.

Utilisez OAC pour créer une visualisation de données à l’aide de données dans ADW for Analysis

  1. Créons maintenant un projet de visualisation de données pour analyser les données dans sales_trans_cust dans ADW. Cliquez sur "Créer" puis sur "Projet".
  2. Cliquez sur "sales_trans_cust" comme jeu de données.
  3. Sur l'écran ci-dessous, vous pouvez voir que sales_trans_cust est disponible pour la création de visualisations. Les données sont stockées dans ADW et résultent de la jonction de deux fichiers via le flux de données CAO que nous avons créé. Nous n'avons pas eu à créer la table dans ADW – le CAO l'a fait pour nous.
  4. Pour ceux qui ne savent pas comment créer des visualisations de données dans le CAO, il suffit de glisser-déposer des éléments de données sur le canevas et le CAO suggérera la meilleure visualisation. Maintenez la touche Ctrl enfoncée lorsque vous sélectionnez plusieurs éléments de données à faire glisser sur le canevas. Vous trouverez ci-dessous des visualisations que vous pouvez créer à partir des données chargées dans ADW.
  5. Désormais, uniquement à des fins de preuve, j'ai inclus une copie d'écran à partir d'Oracle SQL Developer, dans laquelle j'interroge directement la table "sales_trans_cust" dans ADW ( c'est-à-dire ne pas interroger par le CAO). Vous pouvez constater que la table existe dans ADW et qu'elle a le même total pour AMOUNT_SOLD que dans le projet de visualisation de données du CAO

ADW et le CAO disposent d'un nombre considérable de fonctionnalités puissantes. Les versions d'évaluation sont un excellent moyen d'essayer la fonctionnalité sans aucune condition. Explorez et amusez-vous!



Source link