La génération AI peut-elle être la réponse aux problèmes de données ? Oui, mais pas dans tous les cas

Il est important d’utiliser le bon outil pour le travail à accomplir, compte tenu de tout le battage médiatique entourant la génération AI. « Beaucoup de gens essaient de profiter de cette technologie, qui semble pouvoir tout faire », dit-il, « mais cela ne veut pas dire qu’il faut l’utiliser pour tout. »
Ainsi, par exemple, ABBYY dispose déjà d’un outil capable de transformer une seule image en centaines d’images synthétiques à utiliser comme données d’entraînement. S’il y a des enregistrements en double, la technologie de correspondance par logique floue est idéale pour vérifier s’il s’agit de la même personne. Mais un article de The Onion recommandant de manger une pierre tous les jours, ou un article sur Reddit sur la mise de la colle sur la pizza, peuvent-ils être considérés comme des sources d’informations crédibles qui devraient faire partie d’un ensemble de données d’entraînement ?
« Cela nécessite que la technologie puisse déterminer si les gens mettent ou non de la colle sur la pizza », explique Vermeir. C’est une tâche intéressante à confier à un grand modèle linguistique, qui doit raisonner sur une grande quantité d’informations. » Nous étudions donc un cas d’utilisation très utile. » ABBYY travaille sur quelque chose de similaire : comprendre si une information particulière, ajoutée à un ensemble de données d’entraînement, améliorera les performances d’un modèle en cours d’entraînement.
Source link