Fermer

mars 18, 2019

Maine, margarine, Mozzarella: la corrélation n'est pas la causalité


Récemment, ma fille a dit quelque chose de tout à fait logique et de drôlement drôle pour moi. Nous avons vu un ancien basketteur de la NBA plus tôt dans la journée qui mesurait environ 7 pieds 6 pouces, après quoi elle a dit que jouer au basket devait vous faire grandir. À ce stade, son père trop enthousiaste et trop analytique a décidé que c’était un moment propice à l’enseignement et a expliqué que «la corrélation n’est pas une causalité». Jouer au basket ne vous rend pas grand, et être grand ne fait pas de vous un joueur de basket, même si ces deux traits vont souvent ensemble, c'est-à-dire, sont fortement corrélés. Elle hocha la tête. Elle a neuf ans.

Un coefficient de corrélation décrit la relation entre un ensemble de points de données et la ligne qui se rapproche des données. Imaginez une ligne à travers un nuage de points de données. La ligne est simplification: un modèle qui tente de représenter les données pour faciliter leur étude. Les corrélations sont mesurées par la «valeur r» sur une échelle allant de positive (parfaitement corrélée) à négative (parfaitement négativement corrélée). Une valeur supérieure à 0,5 (ou inférieure à -0,5) est nécessaire pour déduire une relation forte

Parfois, les éléments qui semblent être fortement corrélés sont en fait des événements aléatoires sans lien réel. J'ai expliqué cela à ma fille, puis, pour le plaisir, je lui ai montré un site Web contenant une liste de corrélations drôles et fallacieuses . Par exemple, le nombre de personnes qui se sont noyées en tombant dans un pool est en corrélation avec le nombre de films dans lesquels Nicolas Cage est apparu (r = 0,666). Le taux de divorce dans le Maine est en corrélation avec la consommation de margarine par habitant (r = 0,93). De plus, la consommation de mozzarella par habitant est en corrélation avec les doctorats en génie civil décernés (r = 0,959). Elle acquiesça de nouveau. Elle a encore neuf ans.

Comment les corrélations peuvent aider l'analyse des données

Les corrélations peuvent être appliquées de différentes manières pour vous aider à trier des données et à trouver des signaux prédictifs utiles. Une application courante consiste à examiner diverses activités de marketing de l'entreprise – campagnes, promotions ou publicité, en relation avec les ventes à différents niveaux, gamme de produits, canal ou promotion. Les corrélations sont également utiles pour comparer les performances par rapport aux points de repère ou aux pairs. Une régression standard dans un tableur peut aider à déterminer le coefficient de corrélation entre les ensembles de données. Dans une chaîne d'approvisionnement, une entreprise peut rechercher une relation entre une pièce spécifique et des défauts de produit.

Des outils de veille stratégique plus avancés permettent d'accéder à des niveaux de corrélation plus élevés. Par exemple, le regroupement par corrélation examine des ensembles de données tels que les clients ou les attributs de produits et les regroupe en groupes basés sur des caractéristiques similaires. Ces groupes, ou clusters, auront une forte corrélation entre eux, ce qui permettra au marketing de les analyser en tant que groupe et de déterminer le meilleur moyen de répondre à leurs besoins en fonction d'attributs similaires.

L'établissement de corrélations est un travail difficile, et souvent notre la compréhension change avec le temps. Dans chacun des exemples ci-dessus, il pourrait y avoir d'autres facteurs qui obscurcissent la corrélation. Par exemple, il est possible que les ventes augmentent en raison du chevauchement des campagnes publicitaires qui rend difficile l'identification du véritable moteur qui mérite des investissements publicitaires supplémentaires. La performance d'une entreprise peut suivre un point de repère pendant une période, telle que le PIB ou un produit de base, puis changer soudainement pour des raisons de couverture ou idiosyncratiques.

Cause et effet? Vous décidez

Voici quelques exemples d'événements qui, selon les entreprises, ont eu une incidence sur leurs ventes. Vous pouvez décider s’il s’agissait de vrais facteurs ou de corrélations parasites: temps (trop chaud, trop froid, neige); congestion des voies de navigation; la visite du pape aux États-Unis (un restaurant); l'incapacité de créer le cardigan parfait (un détaillant de vêtements décontractés); et la peur superstitieuse du chiffre 13 limitant le nombre de mariages en 2013 (détaillant de vêtements de cérémonie).

Ce type d'exploration de données est un outil extrêmement puissant, et les entreprises doivent bien l'utiliser. Nous devons rechercher des corrélations significatives tout en ne tombant pas simultanément en proie à de fausses corrélations. C'est difficile dans un monde de données imparfaites et imprécises. Pour être au mieux de notre forme, nous devons comprendre nos facteurs opérationnels et examiner les analyses d'un œil critique, voire sceptique, afin de déterminer si les relations existent, si elles sont solides et si elles sont utiles pour prévoir les résultats. Après tout, comme ma fille le sait maintenant, ce ne sont pas toutes les personnes de grande taille qui jouent au basketball.

Vous voulez voir comment FP & A peut mieux fonctionner avec d'autres secteurs d'activité? Pour plus d’informations, consultez le guide de l’AFP « Comment FP & A peut-il devenir un meilleur partenaire commercial »?




Source link