Fermer

août 23, 2018

Cet algorithme de détection de fausses nouvelles surpasse les humains


Lorsque des chercheurs travaillant sur le développement d’un outil d’apprentissage automatique pour détecter les fausses informations ont réalisé qu’il n’y avait pas assez de données pour former leurs algorithmes, ils ont fait la seule chose rationnelle:

L'algorithme, développé par des chercheurs de l'Université du Michigan et de l'Université d'Amsterdam, utilise le traitement du langage naturel ( NLP ) pour rechercher des modèles spécifiques ou des indices linguistiques spécifiques L'article est une fausse nouvelle. Ceci est différent d'un algorithme de vérification des faits qui recoupe un article avec d'autres éléments pour voir s'il contient des informations incohérentes – cette solution d'apprentissage automatique pourrait automatiser complètement le processus de détection.

Aimez-vous les bons gadgets? gadgets cool?

Mais ce n'est pas la partie cool. Pas d’offensive pour l’équipe Michigan / Amsterdam, mais la construction d’un algorithme NLP pour analyser la structure des phrases et affiner les mots-clés n’est pas exactement le travail d’intelligence artificielle qui laisse tomber les mâchoires. Le faire pour détecter les fausses nouvelles mieux que les autres, cependant.

Le problème, c'est qu'il n'y a pas assez de données. Vous ne pouvez pas simplement télécharger Internet et demander à un algorithme de comprendre les choses: les machines ont besoin de règles et d'exemples. Les ensembles de données couramment disponibles pour ce type de formation comprennent un ensemble de données appelé Buzzfeed qui a été utilisé pour former un algorithme permettant de détecter les fausses nouvelles hyperpartisanes sur Facebook pour un article de Buzzfeed. D'autres ensembles de données se concentrent principalement sur l'entraînement d'une IA contre la satire, comme The Onion – malheureusement, cette méthode tend à transformer un algorithme en un détecteur de satire.

Les premières choses étant les premières, les chercheurs ont dû décider des fausses nouvelles. Pour ce faire, ils se sont tournés vers les «exigences relatives à un faux corpus de nouvelles» mis au point par une équipe de chercheurs de l’Université Western Ontario.

Ces neuf exigences indiquent essentiellement qu’un algorithme de détection de fausses -fake news, vérification de la vérité et prise en compte de facteurs tels que le développement de nouvelles et d'interprétations linguistiques et culturelles. Vous pouvez en savoir plus à ce sujet dans le livre blanc de l'équipe de l'Ontario ici .

En fin de compte, les fausses nouvelles, malgré ce que les gens avec qui vous discutez sur Twitter pourraient prétendre, sont intentionnellement faux (appelé fabrication grave), canulars (créés dans le but de devenir viraux sur les médias sociaux) ou articles conçus comme de l'humour ou de la satire.

Pour être clair, aucun scientifique que nous connaissons ne travaille à CNN ou Fox News pour couvrir les histoires que vous souhaitez leur faire ou pour les couvrir comme vous le souhaitez. Ce n'est pas un problème de fausses nouvelles – à moins qu'un article particulier ne tombe également dans l'une des catégories susmentionnées.

Les chercheurs ont trouvé leur base de données en demandant aux employés d'Amazon Mechanical Turk de réinterpréter 500 nouvelles réelles sous forme de fausses nouvelles. Les participants à l'étude ont été invités à imiter le style journalistique de l'article original, mais à truquer suffisamment les faits et les informations pour s'assurer que le résultat était manifestement faux

les fausses nouvelles et les vraies nouvelles à l'algorithme et il s'est appris comment faire la distinction entre les deux. Une fois la formation terminée, l'équipe l'a alimentée directement à partir d'un jeu de données contenant à la fois des informations réelles et fausses directement sur le Web et elle a fait mieux que les humains pour déterminer laquelle était la.

Un des chercheurs du projet, Rada Mihalcea, a déclaré à Michigan News : [en anglais] 19659018] Vous pouvez imaginer autant d'applications que ce soit sur le front ou l'arrière d'un site d'actualités ou de médias sociaux. Il pourrait fournir aux utilisateurs une estimation de la fiabilité des récits individuels ou de tout un site de nouvelles. Ou ce pourrait être une première ligne de défense à l'arrière d'un site de nouvelles, signalant des histoires suspectes pour un examen plus approfondi. Un taux de réussite de 76% laisse une marge d'erreur assez importante, mais il peut néanmoins fournir des informations précieuses lorsqu'il est utilisé avec des humains.

La communauté mondiale est au cœur de ce que les historiens ère. "Il est probable que ce problème ne sera pas résolu simplement en faisant en sorte que les écrivains ne mentent jamais et que les consommateurs vérifient toujours tout ce qu’ils lisent avec des sources multiples.

Une solution plus élégante , l'agrégation et le niveau de la plate-forme – et jusqu'à ce que tout soit complètement automatisé, nous continuerons à voir le flux de fausses informations provenant de points de vente peu recommandables.

Au moins, selon le livre blanc de l'équipe de recherche Nous avons atteint un plateau de performance où les modèles informatiques les plus performants sont «comparables à la capacité humaine de détecter les faux contenus». Nous ne savons pas si cela est suffisant pour éliminer problème entièrement, mais c'est un bon début.

Lire la suite:

Voici notre premier bon aperçu de la V40 à 5 caméras de LG




Source link