Actualisation incrémentielle dans Tableau Prep Builder et ses avantages :

Dans Tableau Prep, il existe généralement deux approches pour actualiser un flux de données, à savoir l'actualisation complète et l'actualisation incrémentielle. L'actualisation de l'ensemble de données signifie que les données d'origine ajouteraient de nouvelles lignes ou modifieraient les données.
L'actualisation complète remplacera les données existantes par de nouvelles données.
Cependant, l'Actualisation incrémentielle utilise uniquement les enregistrements supplémentaires pour mettre à jour l'ensemble de données d'entrée existant, ce qui réduit éventuellement le temps d'exécution du flux, améliore les performances de la base de données et utilise moins de ressources système, car l'actualisation incrémentielle ne traiterait que les données qui n'ont pas été traitées auparavant par Tableau Prep.
Ce type d'actualisation est extrêmement utile chaque fois que nous avons des données qui sont mises à jour quotidiennement (telles que des données transactionnelles) ou dont la taille des données continue d'augmenter progressivement. une option supplémentaire dans l'outil de saisie sous l'onglet Paramètres pour activer l'actualisation incrémentielle. résultat dans un autre ensemble d'options qui doivent être configurées pour éviter d'autres erreurs. Ce sont-
Champ d'entrée : Le champ d'entrée doit être sélectionné de sorte que le champ de données indique qu'il y a de nouvelles données dans la source de données d'entrée.
(Remarque : s'il y a plusieurs entrées dans le flux, l'actualisation incrémentielle doit être configurée séparément pour chaque entrée)
Sortie : Dans le champ de sortie, nous devons spécifier dans quelle sortie il peut trouver un champ pour comparer l'entrée sélectionnée afin d'identifier si une ligne est nouvelle ou non . Ce champ doit être spécifié car un flux peut entraîner plusieurs sorties.
(Dans cet exemple, il y a une seule sortie et il n'est donc pas nécessaire de la renommer par défaut.)
Champ de sortie : Le champ de sortie n'est rien d'autre que le nom du champ correspondant qui est utilisé pour comparer les dernières valeurs traitées dans la sortie du flux avec les valeurs dans l'entrée pour déterminer les nouvelles lignes. Cela est dû au fait que les champs de données peuvent être renommés lorsque nous préparons le flux.
Dans cet exemple, le champ emp_id n'a pas été renommé tout au long du flux et nous avons donc le même champ d'entrée et le même champ de sortie.
Étape 3 : dans cette étape, nous devons définir des options d'écriture pour spécifier comment les nouvelles données seront ajoutées à nos tables.
a. Dans le volet de flux, sélectionnez la sortie que nous voulons configurer.
b. Sous l'onglet Actualisation incrémentielle, nous avons trois options
- Créer une table : Si la table existe déjà, elle sera supprimée et remplacée par de nouvelles lignes uniquement.
- Ajouter à la table : Cette ajoutera des données à une table existante. Si la table n'existe pas, elle est créée lors de la première exécution du flux.
- Remplacer les données : Cela conservera la structure de schéma de la table telle quelle, mais les données existantes seront complètement remplacées par nouvelles données.
Étape 4 : Lors de l'exécution de la sortie, nous pouvons choisir si nous avons besoin d'une actualisation incrémentielle ou d'une actualisation complète
- Dans le volet Sortie, cliquez sur l'option déroulante sur le Bouton Exécuter le flux.
- Dans le volet Flow, cliquez sur le menu déroulant du bouton Run à côté de l'étape Output.
Source link