L’IA est peut-être la réponse à vos problèmes de données, mais pas à tous

Il est important d’utiliser le bon outil pour le travail, compte tenu de tout le battage médiatique autour de l’IA générative.. « Beaucoup de gens essaient de profiter de cette technologie, qui semble pouvoir tout faire », dit-il, « mais cela ne veut pas dire qu’il faut l’utiliser pour tout. »
Ainsi, par exemple, ABBYY dispose déjà d’un outil capable de convertir une seule image en centaines d’images synthétiques à utiliser comme données d’entraînement. S’il y a des enregistrements en double, la technologie de correspondance par logique floue est idéale pour vérifier s’ils proviennent de la même personne. Mais s’il existe un article sur Onion qui recommande de manger une pierre chaque jour, ou un poste de Reddit sur la mise de la colle sur la pizza, sont-ils des sources d’informations crédibles qui devraient faire partie d’un ensemble de données de formation ?
« Cela nécessite en fait que la technologie puisse déterminer si les gens mettent habituellement de la colle sur la pizza », explique Vermeir. « C’est une tâche intéressante pour un grand modèle linguistique, qui doit raisonner sur une grande quantité d’informations. Ce cas d’utilisation est donc très utile. En fait, ABBYY propose quelque chose de similaire : découvrir si des informations spécifiques, ajoutées à un ensemble de données d’entraînement, amélioreront les performances d’un modèle en cours d’entraînement.
Source link