Fermer

juin 13, 2018

Comment effectuer la détection et la gestion des valeurs éloignées dans Tableau


Outliers sont considérés comme des points uniques qui ne font pas partie de 99% des ensembles de données. Les valeurs aberrantes représentent les choses qui sont présentes en dehors de l'expérience normale. Dans cet article, nous verrons comment détecter ces valeurs aberrantes extrêmes dans Tableau

Étapes de détection des valeurs éloignées dans Tableau:

J'ai utilisé l'ensemble de données Tableau Superstore pour détecter ces valeurs aberrantes. Ici, je vais visualiser les valeurs aberrantes prenant le mois comme le temps, de sorte que n'importe qui peut repérer quel mois contient des valeurs aberrantes par rapport au bénéfice.

  • Première place Date de la commande dans l'étagère colonne, placez ensuite le bénéfice dans l'étagère. Changez l'heure pour représenter le mois continu. Dupliquer la colonne de profit dans l'étagère de ligne. Nous obtiendrons deux diagrammes linéaires représentant le bénéfice pour chaque mois de l'année. Pour le deuxième type de graphique, remplacez le type de graphique par cercle. Remplacez le graphique par un graphique à deux axes, en cliquant avec le bouton droit sur l'axe y et en sélectionnant deux axes. N'oubliez jamais de synchroniser l'axe du graphique à double axe, sinon le graphique aura l'air bizarre.

  • L'étape suivante consiste à mettre en évidence les valeurs aberrantes. Pour ce faire, nous devons d'abord calculer la moyenne des profits en utilisant les fonctions de fenêtre

La prochaine étape est, nous avons besoin de bandes supérieures et inférieures pour identifier les valeurs aberrantes. Tous les cercles qui sont au-dessus de la bande supérieure et inférieure seront considérés comme des valeurs aberrantes

  • Pour calculer la limite supérieure, utilisez la fonction d'écart type de fenêtre (window_stdev)

Tout cercle situé au-dessus de ce champ calculé est aberrant, De même, nous devons calculer nos limites inférieures en utilisant la fonction window_stdev. Tous les points qui apparaissent sous cette limite inférieure sont aberrants.

  • L'étape suivante est, en utilisant ce champ calculé supérieur et inférieur, nous devrions créer notre bande de référence. Nous devrions utiliser ce haut et bas dans les vues, pour cela les déposer dans les détails étagère comme indiqué ci-dessous,

Faites un clic droit sur l'axe des bénéfices et sélectionnez ajouter une ligne de référence. Sélectionnez la bande de référence, cette bande commence à partir du bas et se termine à la partie supérieure.

Chaque cercle de cette bande de référence est une distribution normale pour nos bénéfices. Tous les cercles qui se trouvent en dehors de cette bande de référence sont des valeurs aberrantes que nous devons diviser en deux.

  • La prochaine étape est de mettre en évidence nos valeurs aberrantes. Pour mettre en évidence nos valeurs aberrantes, nous devrions créer un champ calculé booléen

Sélectionnez le type de diagramme circulaire dans l'étagère des marques et placez le champ calculé comme valeur aberrante booléenne dans l'étagère de couleurs. Les cercles de couleur orange sont des valeurs aberrantes et les couleurs bleues sont la distribution normale des bénéfices pour le mois comme le temps. Masquer l'en-tête d'un axe, qui est sur la droite, activer les info-bulles. Lorsque vous consultez les infobulles, si le cercle est aberrant, il sera affiché comme vrai ou il apparaîtra comme faux.




Source link