Fermer

mars 31, 2025

Révolutionner la découverte de produits chimiques avec une IA générative (Genai) et une génération auprès de la récupération (RAG)

Révolutionner la découverte de produits chimiques avec une IA générative (Genai) et une génération auprès de la récupération (RAG)


Introduction

L’industrie chimique est une partie importante de l’économie car elle produit et fournit des matières premières pour divers ingrédients et cas d’utilisation. Il existe des milliers de produits sur le marché, qui ont tous des compositions, des propriétés techniques et des exigences différentes pour leur utilisation. La bonne sélection de produits est donc compliquée et très longue.

Les méthodes de recherche basées sur les mots clés, combinées à la sélection manuelle des produits, ne fournissent pas de résultats efficaces et précis. Cela se produit en raison des détails techniques complexes, de la terminologie complexe et des exigences spécifiques de chaque utilisateur. Pour cette raison, la sélection des produits devient extrêmement longue et inefficace, car de grandes quantités de connaissances du domaine associées à un filtrage de force brute sont nécessaires.

Ce blog décrit un système de recherche et de recommandation basé sur l’IA basé sur l’extraction d’intention, l’IA générative (Gen AI,) et la méthode de génération augmentée (RAG) de récupération agentique qui améliore la découverte de produits en se concentrant sur les intentions des utilisateurs et les dimensions clés, qui sont extraites des requêtes utilisateur. Contrairement aux moteurs de recherche traditionnels, qui effectuent uniquement la correspondance des mots clés et la récupération, ce système traite les requêtes en langage naturel pour identifier les produits pertinents et les affiner davantage avec un juge LLM.

Les limites des systèmes de recherche traditionnels

Les produits de l’industrie chimique sont très larges et chaque produit a des compositions différentes, des exigences techniques et des utilisations spécifiques. La sélection manuelle et la recherche traditionnelle de mots clés sont très inexactes pour suggérer des produits en raison de certains défis clés, tels que:

  • Requêtes ambiguës et non structurées: Les utilisateurs ont tendance à utiliser leurs propres mots, ce qui conduit à des résultats erronés.
  • Volume écrasant de données: Le nombre de mélanges chimiques disponibles et leurs spécifications le rend ingérable.
  • Manque de compréhension contextuelle: Les moteurs de recherche traditionnels utilisent des phrases et des mots clés exacts pour trouver des informations, en les empêchant de comprendre l’intention des utilisateurs et d’autres facteurs de produit importants.
  • Informations dispersées et non structurées: Les informations sur les produits sont réparties sur diverses sources telles que les bases de données, les PDF et les feuilles techniques, ce qui rend la recherche d’informations difficile.

Les raisons énumérées ci-dessus rendent la recherche de produits très inefficaces, longs et invasifs car une très grande connaissance du domaine est nécessaire pour passer par des solutions possibles. Il existe un besoin clair d’une solution compatible AI qui peut interpréter l’intention d’un utilisateur et comprendre les détails techniques pour fournir efficacement les produits chimiques pertinents.

Gen AI et Rag: une approche plus intelligente de la découverte de produits

Pour relever ces défis, une approche axée sur l’IA est utilisée qui tire parti de l’architecture Genai et de Rag Agent. Cela fonctionne en se concentrant sur la compréhension de l’intention de l’utilisateur. Les dimensions du produit sont extraites de la requête de l’utilisateur. Les dimensions sont – la nature, l’application, les performances et les propriétés. Le Retriever est ensuite utilisé pour extraire les produits tombant sous ces dimensions. Cela garantit que les résultats ne sont pas seulement pertinents mais très spécifiques aux besoins de l’utilisateur.

Comment cela fonctionne: le pouvoir de l’agentique Rag and Judge LLM

Diagramme d'architecture de la solution alimentée à Genai pour la découverte de produits chimiques

Diagramme d’architecture de la solution alimentée à Genai pour la découverte de produits chimiques

Le système utilise une approche en plusieurs étapes pour garantir que la recherche de produits est à la fois efficace et fiable.

Prétraitement

Recherche basée sur BMX:

Les données du produit sont d’abord organisées en paires de valeurs clés. Une fois les informations structurées, les index BMX sont créés. Ces index sont comme une table de recherche à grande vitesse, nous permettant d’effectuer des recherches de similitude rapides.

Recherche sémantique:

Pour les données du produit:

1. Nous commençons par nettoyer les données, en supprimant les incohérences et les détails étrangers.
2. Ensuite, nous avons divisé les données nettoyées en segments plus petits et riches en contexte en utilisant un set récursif.
3. Chaque segment est ensuite converti en un vecteur numérique avec notre modèle de texte-3-3, et ces vecteurs sont stockés dans une base de données vectorielle pour une récupération rapide.

Pour les données de solution:

1. Le processus est similaire: nettoyez les données, divisez-les en morceaux gérables, générez des intégres et stockez tout dans la base de données vectorielle.

Gestion des requêtes utilisateur:

Lorsque vous soumettez une requête, le système entre en marche en déterminant d’abord si votre question concerne un produit ou une solution.

Requêtes de produit:

  1. Les requêtes précédentes sont vérifiées pour maintenir une conversation et un contexte en douceur.
  2. Ensuite, les spécificités sont analysées – si la requête comprend des nombres, nous appliquons une tolérance de ± 5% pour tenir compte des légères variations. Pour des termes vagues comme «faible» ou «élevé», ces descriptions sont cartographiées à des valeurs plus structurées.
  3. Les attributs clés du produit sont ensuite extraits, tels que la nature, l’application, les performances et les propriétés. Si la «nature» du produit est mentionnée, alors trois sous-requêtes sémantiquement similaires sont générées pour couvrir tous les angles possibles.
  4. Enfin, plusieurs recherches sont effectuées (Sémantique, MMR, BMX et BM25), et un juge LLM passe en revue les résultats pour s’assurer que tout s’adapte parfaitement. Si des détails cruciaux sont manquants, le système est par défaut une réponse plus large.

Requêtes de solution:

  1. Pour les questions liées aux solutions, le processus est rationalisé. Le système utilise simplement un Retriever de recherche sémantique pour récupérer les résultats les plus pertinents et les plus riches en contexte de la base de données vectorielle.

Génération de réponses:

Dans la dernière étape, le système génère les produits les plus pertinents.

  • Pour les requêtes de produit, les résultats de différentes sous-requêtes sont réduits à une réponse, qui est ensuite transmise au juge LLM.
  • Pour les requêtes de solution, la recherche sémantique fournit une réponse pertinente.

Cette approche garantit que la requête de l’utilisateur est gérée avec la méthode appropriée et que les réponses sont exactes et pertinentes.

Applications du monde réel: un changeur de jeu pour les secteurs chimiques

L’industrie chimique connaît les avantages de ce système de découverte de produits alimentés par l’IA. L’intégration des recommandations de récupération et de contexte basées sur l’intention a considérablement réduit le temps passé à rechercher des produits, permettant ainsi des processus de prise de décision plus rapides et des décisions plus éclairées. Ce système aide l’utilisateur à obtenir des produits pour ses besoins spécifiques.

Conclusion: une recherche de produits chimiques plus intelligente, plus rapide et plus efficace

L’avenir de la recherche de produits chimiques est brillant avec l’intégration de la génération générative de l’IA et de la génération d’agentique de la récupération. Cette solution augmente non seulement la précision des recommandations de produits, mais rationalise également les processus de prise de décision pour les industries qui s’appuient sur des produits chimiques complexes. Avec les progrès continus dans l’IA, cette approche continuera de révolutionner la façon dont les gens recherchent et sélectionnent des produits chimiques, ce qui rend le processus plus intelligent, plus rapide et plus efficace.

Alors que l’industrie chimique continue d’évoluer, l’adoption de solutions dirigés par l’IA sera essentielle pour rester compétitif et stimuler l’innovation dans la découverte de produits.

Vous avez trouvé cela utile? PARTAGEZ-LE






Source link