Fermer

septembre 18, 2021

La vision par ordinateur peut aider à détecter les cybermenaces avec une précision surprenante


Cet article fait partie de nos revues d'articles de recherche sur l'IA une série de publications qui explorent les dernières découvertes en matière d'intelligence artificielle.

L'intérêt croissant de la dernière décennie pour l'apprentissage en profondeur ] a été déclenchée par la capacité prouvée des réseaux de neurones dans les tâches de vision par ordinateur. Si vous entraînez un réseau de neurones avec suffisamment de photos étiquetées de chats et de chiens, il sera capable de trouver des motifs récurrents dans chaque catégorie et de classer les images invisibles avec une précision décente.

Que pouvez-vous faire d'autre avec un classificateur d'images ?

En 2019, un groupe de chercheurs en cybersécurité s'est demandé s'ils pouvaient traiter la détection des menaces de sécurité comme un problème de classification d'images. Leur intuition s'est avérée bien placée et ils ont pu créer un modèle d'apprentissage automatique capable de détecter les logiciels malveillants à partir d'images créées à partir du contenu des fichiers d'application. Un an plus tard, la même technique a été utilisée pour développer un système d'apprentissage automatique qui détecte les sites Web de phishing.

La combinaison de la visualisation binaire et de l'apprentissage automatique est une technique puissante qui peut apporter de nouvelles solutions à d'anciens problèmes. Il est prometteur en matière de cybersécurité, mais il pourrait également être appliqué à d'autres domaines.

Détection des logiciels malveillants grâce à l'apprentissage en profondeur

La façon traditionnelle de détecter les logiciels malveillants consiste à rechercher dans les fichiers des signatures connues de charges utiles malveillantes. Les détecteurs de logiciels malveillants maintiennent une base de données de définitions de virus qui incluent des séquences d'opcode ou des extraits de code, et ils recherchent de nouveaux fichiers pour la présence de ces signatures. Malheureusement, les développeurs de logiciels malveillants peuvent facilement contourner ces méthodes de détection en utilisant différentes techniques telles que l'obscurcissement de leur code ou l'utilisation de techniques de polymorphisme pour muter leur code à l'exécution.

Les outils d'analyse dynamique tentent de détecter les comportements malveillants pendant l'exécution, mais ils sont lents et nécessitent le configuration d'un environnement sandbox pour tester les programmes suspects.

Ces dernières années, les chercheurs ont également essayé une gamme de techniques d'apprentissage automatique pour détecter les logiciels malveillants. Ces modèles de ML ont réussi à progresser sur certains des défis de la détection des logiciels malveillants, notamment l'obscurcissement du code. Mais ils présentent de nouveaux défis, notamment la nécessité d'apprendre trop de fonctionnalités et un environnement virtuel pour analyser les échantillons cibles.

La visualisation binaire peut redéfinir la détection des logiciels malveillants en la transformant en un problème de vision par ordinateur. Dans cette méthodologie, les fichiers sont exécutés via des algorithmes qui transforment les valeurs binaires et ASCII en codes de couleur.

Dans un article publié en 2019des chercheurs de l'Université de Plymouth et de l'Université du Péloponnèse ont et les fichiers malveillants ont été visualisés à l'aide de cette méthode, de nouveaux modèles émergent qui séparent les fichiers malveillants des fichiers sûrs. Ces différences seraient passées inaperçues avec les méthodes classiques de détection des logiciels malveillants.