Exécutifs de Mastercard : l'entretien et l'alimentation des modèles d'apprentissage automatique sont la clé du succès

Avec plus de 2,5 milliards de comptes de consommateurs, Mastercard connecte presque toutes les institutions financières du monde et génère près de 75 milliards de transactions par an. En conséquence, l'entreprise a construit au fil des décennies un entrepôt de données qui contient "l'un des meilleurs ensembles de données sur le commerce vraiment n'importe où dans le monde", explique Ed McLaughlin, président des opérations et de la technologie chez Mastercard.
Et la société utilise ces données à bon escient. La partie des activités de Mastercard qui connaît la croissance la plus rapide aujourd'hui sont les services qu'elle propose autour du commerce, déclare McLaughlin.
Derek Hulitzky d'IDG s'est entretenu avec McLaughlin et Mark Kwapiszeski, président des composants partagés et des solutions de sécurité chez Mastercard, pour discuter de la façon dont l'entreprise devient anonyme. et des données agrégées en informations commerciales précieuses et leurs conseils pour obtenir les meilleurs résultats des modèles d'apprentissage automatique.
Vous trouverez ci-dessous des extraits édités de leur conversation. Pour entendre directement McLaughlin et Kwapiszeski et obtenir des informations supplémentaires, regardez la vidéo complète intégrée ci-dessous.
Derek Hulitzky : La plate-forme de gestion des décisions de Mastercard a remporté notre prix CIO 100 en 2020. Et elle utilise l'IA et les données pour la détection des fraudes. Pouvez-vous nous en dire plus sur la plate-forme ?
Mark Kwapiszeski : Nous l'utilisons à plusieurs fins, principalement dans nos produits anti-fraude pour créer des éléments tels que des scores de fraude sur les transactions. Mais ce qui est vraiment excitant à propos de la plate-forme, c'est juste la taille, l'échelle et la portée de ce qu'elle fait. Il repose sur environ 900 serveurs de produits de base et traite environ 1,2 milliard de transactions par jour à un rythme d'environ 65 000 transactions par seconde, le tout en 50 millisecondes environ par transaction.
Il utilise de nombreuses technologies et techniques d'IA différentes ; il utilise environ 13 algorithmes différents, y compris des éléments tels que les réseaux de neurones, le raisonnement basé sur des cas et l'apprentissage automatique. Mais il ne s'agit pas seulement d'exécuter un modèle à la fois. Nous avons en fait construit des couches, où il peut exécuter plusieurs modèles en même temps, afin qu'il puisse analyser toutes sortes de variables différentes au sein de cette transaction.
Derek Hulitzky : Vous avez décrit comment vos modèles d'analyse ne sont pas statiques et que vous les surveillez en permanence pour comprendre ce qui se passe avec une transaction et pourquoi cela s'est produit. Pouvez-vous décrire ce que vous entendez par là ?
Mark Kwapiszeski : Quand vous considérez chaque transaction que nous voyons, chaque interaction, cela pourrait être une fraude ou une mère essayant d'acheter des médicaments pour leur enfant. Chaque transaction compte. Ainsi, nous devons toujours savoir non seulement ce qui s'est passé, mais aussi le pourquoi derrière ce qui s'est passé.
Et bien que les mannequins aient tendance à faire les gros titres dans des conversations comme celle-ci, pour moi, ce sont toutes ces choses autour du mannequin qui deviennent vraiment intéressantes quand on y pense : comment savoir non seulement ce qui s'est passé, pourquoi c'est arrivé, et puis comment regardez-vous cela au fil du temps pour surveiller des choses comme la dérive du modèle.
L'un des meilleurs moyens de voir si vous avez un modèle qui dérive, c'est de mettre un modèle challenger et de le regarder sur une période de temps. Et, en fait, nous l'avons fait pendant des périodes allant jusqu'à un an auparavant, en regardant un modèle, en le comparant à un autre, de sorte que vous obtenez vraiment le meilleur modèle et les meilleurs résultats possibles.
Derek Hulitzky : Alors Mark, vous avez parlé de dérive. Pouvez-vous nous parler un peu, Ed et Mark, de la façon dont vous résolvez cela, comment vous y réagissez ?
Ed McLaughlin : Je pense que souvent les gens utilisent presque la mauvaise métaphore lorsqu'ils parler d'IA et de modélisation. Ils utilisent davantage une métaphore de code, où vous le construisez, vous l'exécutez, et il reste assez statique jusqu'à ce que vous finissiez par le mettre en fin de vie à un moment donné. Alors que nous voyons plus avec ces modèles qui doivent être constamment surveillés et surveillés.
Mark Kwapiszeski : Oui, cela se manifeste de deux manières. Nous avons un environnement analytique complet qui est vraiment dédié à quels sont ces extrants et quels ont été les résultats ? Et puis nous cherchons à associer cela avec le résultat final réel d'une transaction, car souvent, nous ne saurons pas si une transaction approuvée s'avère être une fraude avant un certain temps.
Ainsi, nos scientifiques des données prennent ensuite ces informations sur la fraude et les signaux que nous recevons, les comparent à ces informations analytiques de ce que le DMP [Decision Management Platform] reporte dans les scores de fraude que nous avons, puis ils cherchez constamment à peaufiner ces deux choses afin de trouver le bon équilibre. pour être clair sur vos concepts. Vous vous souvenez probablement, en tant que consommateur, en tant que titulaire de carte, il y a des années, beaucoup de refus, beaucoup de règles très brutales étaient en vigueur, car l'accent était mis sur la lutte contre la fraude. Maintenant, ce que nous disons, c'est que… [make] il est certain qu'autant de bonnes choses passent que possible, pendant que vous combattez la fraude simultanément.
Source link