Fermer

août 9, 2021

Tirer parti de l'IA pour les référentiels de connaissances et la conservation de contenu en sciences de la vie


–Ruby Lin et Nicolas Frantzen ont contribué à ce blog.

Aperçu

Dans les sciences de la vie, comme dans de nombreuses autres industries, la connaissance c'est le pouvoir. Historiquement, le principal défi a été de rechercher, d'organiser et de faire émerger de manière significative ces connaissances. Pour résoudre ce défi, il faut rechercher des moyens innovants et évolutifs, tels que l'IA, de trouver et d'organiser une grande variété d'informations provenant de sources internes et externes.

Un référentiel de connaissances intelligent qui fournit des informations pertinentes et précises aux consommateurs. , en particulier pour les informations liées aux drogues, nécessitera différentes couches de modèles d'IA capables de produire des résultats prévisibles et précis tout en s'adaptant rapidement à la nature complexe de l'information.

La nature dynamique du contenu d'aujourd'hui signifie que nous devons travailler avec des contenus à la fois structurés ou des données non structurées. Les données non structurées (documents, articles, sites Web, newsletters, blogs, etc.) présentent un défi supplémentaire dans la mesure où elles ne sont pas facilement consommables par les systèmes (autres que le texte libre, la recherche par mot-clé, etc.). Nous devons d'abord extraire l'information et l'organiser. Pour ce faire, nous devons organiser et structurer ces données avant qu'elles puissent être stockées dans le référentiel de connaissances, plus précisément, un graphe de connaissances. et maintenir les relations entre les éléments de données. Une fois les informations organisées, vous pouvez utiliser des modèles d'IA spécialisés par rapport à votre graphique de connaissances pour trouver des modèles intéressants et prédire les relations entre les informations stockées.

Bien que la liste des applications potentielles pour ce type de solution soit vaste, voici plusieurs utilisations. cas spécifiques à l'industrie des sciences de la vie :

  • Obtenir les exigences réglementaires spécifiques à un pays pour soumettre un produit à l'approbation de commercialisation dans une région géographique spécifique
  • Rechercher et récupérer la documentation requise pour la rédaction d'un document
  • Comprendre l'état de la recherche actuelle et les essais cliniques
  • Surfacing real-world evidence (RWE) data
  • Répondre à une demande de produit d'un fournisseur de soins de santé

Et la liste est longue.

Bien que ces cas d'utilisation décrivent des cas réels et complexes. défis, il existe des modèles de solutions facilement disponibles qui peuvent être utilisés pour rationaliser l'extraction d'informations.

Plongeons plus loin dans les détails. o le processus de conservation du contenu et de stockage des informations dans un référentiel de connaissances.

Sciences de la vie - Comment l'intelligence artificielle peut améliorer le processus d'examen et de nettoyage des données cliniques

Sources de contenu

La première considération est l'emplacement des sources de contenu . Le contenu peut être interne ou externe à l'entreprise. Les sources pourraient être des documents internes sur les produits, des données provenant de systèmes internes, des documents de littérature médicale, des documents réglementaires provenant de sites Web d'autorités sanitaires, des renseignements provenant d'associations commerciales, etc. les médicaments et produits médicaux. Il s'agit de contenus pré-sélectionnés, et l'entreprise peut numériser et organiser les informations dans un référentiel de connaissances approprié.

Deuxièmement, s'il existe un contenu existant, celui-ci peut nécessiter une conservation supplémentaire avant de l'intégrer dans le référentiel. Les organismes de réglementation communs, les associations commerciales et la littérature médicale fourniraient des sources d'informations précieuses.

En raison du volume de documents externes, les robots d'indexation Web et d'autres solutions automatisées doivent être exploités (voir comment Perficient a résolu ce défi avec Handshake ) pour rechercher automatiquement les documents et les exécuter via un pipeline NLP qui enrichira et organisera les informations extraites.

Exemple de référentiel de connaissances : ontologie

Vous trouverez ci-dessous un exemple de la manière dont le contenu structuré et non structuré (c'est-à-dire , documents d'exigences réglementaires) peuvent être stockés sous la forme d'un référentiel de graphes.

Comme ces documents peuvent provenir de différentes autorités de santé, l'ontologie comprend les coordonnées de la source (autorité de réglementation dans cet exemple). Une structure hiérarchique est définie pour stocker les documents, et leurs sections et une hiérarchie récursive conservent les sections dans les sections.

Chaque section est classée par sujet, définition, associée à une exigence spécifique. Au fur et à mesure que les documents sont organisés, l'ontologie peut également être automatiquement améliorée pour garantir que les documents peuvent être organisés et stockés à l'aide de l'ontologie. Une fois l'ontologie créée, les documents extraits peuvent être stockés suivant l'ontologie.

Un modèle d'IA peut ensuite être formé pour organiser automatiquement les documents, sur la base de l'ontologie définie, afin de rechercher et de comprendre les concepts importants et les éléments d'information nécessaires. pour organiser et stocker les documents dans le référentiel de connaissances.

Ontologie" width="800" height="318" srcset="https://i2.wp.com/blogs.perficient.com /files/Ontology.png?resize=800%2C318&ssl=1 800w, https://i2.wp.com/blogs.perficient.com/files/Ontology.png?resize=300%2C119&ssl=1 300w, https :/ /i2.wp.com/blogs.perficient.com/files/Ontology.png?resize=1024%2C407&ssl=1 1024w, https://i2.wp.com/blogs.perficient.com/files/Ontology.png? resize=768%2C305&ssl=1 768w, https://i2.wp.com/blogs.perficient.com/files/Ontology.png?resize=1536%2C611&ssl=1 1536w, https://i2.wp.com/ blogs.perficient.com/files/Ontology.png?resize=2048%2C814&ssl=1 2048w, https://i2.wp.com/blogs.perficient.com/files/Ontology. png?resize=750%2C298&ssl=1 750w, https://i2.wp.com/blogs.perficient.com/files/Ontology.png?resize=600%2C239&ssl=1 600w, https://i2.wp. com/blogs.perficient.com/files/Ontology.png?resize=640%2C255&ssl=1 640w, https://i2.wp.com/blogs.perficient.com/files/Ontology.png?resize=500%2C199&ssl =1 500w, https://i2.wp.com/blogs.perficient.com/files/Ontology.png?resize=1280%2C509&ssl=1 1280w, https://i2.wp.com/blogs.perficient.com /files/Ontology.png?resize=1920%2C764&ssl=1 1920w" tailles="(max-width: 800px) 100vw, 800px" data-recalc-dims="1"/></a><strong>Arabie Saoudite IB as a Knowledge Graph</strong></p><p>Le diagramme ci-dessous montre un exemple de document – Saudi Arabia's Investigators Brochure (IB) – stocké sous forme de graphe de connaissances à l'aide de l'ontologie définie dans la section précédente.</p><p><a href=Exemple Ib In Knowledge GraphConclusion

Bien que la création de l'ontologie soit la clé du succès de la curation du contenu, les modèles AI/ML peuvent être entraînés pour lire n'importe quel document et le stocker comme un graphe de connaissances une fois l'ontologie définie. Amazon Neptune, neo4j, Apache Cassandra sont quelques exemples de bases de données graphiques actuellement disponibles. En combinant ces bases de données graphiques avec un pipeline d'IA (composé de plusieurs modèles ML et NLP), vous pouvez créer une solution évolutive et efficace pour rechercher et organiser les informations.

Avec des connaissances correctement organisées, il est possible de s'attaquer à la seconde moitié de l'équation : faire émerger des informations et récupérer ces informations efficacement pour les utilisateurs finaux. Recherchez très bientôt un autre article de blog sur ce sujet !

À propos de l'auteur

Prabha Ranganathan est directrice de livraison chez Perficient et est responsable de la fourniture de solutions d'entreposage de données et d'analyse pour diverses sociétés de sciences de la vie et de soins de santé. Prabha travaille en étroite collaboration avec ses clients en leur fournissant des conseils stratégiques sur les flux de données cliniques, la révision et le nettoyage des données à l'aide des derniers outils et solutions technologiques. Prabha a de l'expérience dans la création et la publication de produits du concept à la publication chez Oracle, dans divers rôles de chef de produit, d'architecte et de développeur principal. Pendant la majeure partie de sa carrière, elle a travaillé sur des produits d'entreprise traitant de gros volumes de données provenant de diverses sources qui doivent être examinées, nettoyées et analysées. Avec une compréhension claire des affaires et de solides connaissances techniques, elle apporte un ensemble de compétences unique pour résoudre des problèmes complexes. Elle est titulaire d'un MBA du Babson College et d'une maîtrise en informatique de l'Illinois Institute of Technology.

En savoir plus sur cet auteur




Source link