Fermer

janvier 11, 2021

Développez votre recherche à l'aide des services natifs AWS pour identifier, comprendre et stocker des documents en toute sécurité.


La débâcle des documents

Les entreprises continuent de se battre contre le problème séculaire: les documents papier. S'adapter à la modernisation des documents pour étendre la capacité de recherche, de catalogage et de protection des données HIPAA PII est primordial. Perficient continue d'aider les entreprises à accélérer le temps nécessaire pour numériser des documents en vue d'une intégration plus poussée dans d'autres secteurs. Dans cet article, nous verrons comment Perficient peut aider à intégrer un pipeline sans serveur dans AWS pour lutter contre la débâcle du document!

Scénario

Dans l'architecture de solution ci-dessous, nous couvrirons les données migrées en toute sécurité depuis un site local centre de données vers le cloud AWS. Les composants réseau tels qu'AWS Direct Connect sont utilisés pour garantir que les données traversent en toute sécurité la structure réseau jusqu'à leur destination. L'hypothèse que les données sont dans un format de style de rapport, texte brut, Adobe PDF ou basé sur une image (.PNG, .JPG). Cette solution peut être mise en œuvre comme une utilisation ponctuelle d'un chariot élévateur de données ou comme système de réplication par lots au fil du temps.

L'utilisateur final n'a pas besoin de se préoccuper du processus de conversion des données, car le serveur -less pipeline gère toutes les données ETL (extraction, transformation et chargement). Elasticsearch, lorsqu'il est associé à Kibana, offre un outil extrêmement puissant pour rechercher de grands ensembles de données. Il est basé sur le moteur Apache Lucene et convient aux capacités d'indexation et de recherche de documents volumineux.

Présentation de la solution

 Présentation de la solution DocSearch

Composants [19659010] Les données résident sur site et sont dans un format pris en charge pour la conversion. AWS DataSync est déployé sur un système d'exploitation conventionnel et est imposé pour exporter les données en toute sécurité.
  • Les données traversent un AWS Direct Connect pour garantir que le transit reste privé et ne traverse pas l'espace Internet public.
  • Le point de terminaison du VPC est l'entrée point du VPC, facilitant le chemin sécurisé.
  • Le service Amazon DataSync est configuré, avec des agents s'exécutant dans des sous-réseaux privés au sein du VPC. L'agent DataSync recevra les données et les traitera. Dans ce cas, elles seront envoyées au compartiment Amazon S3 de destination pour traitement.
  • Les données sont envoyées dans le VPC (en privé) au compartiment Amazon S3. Un point de terminaison Amazon S3 est utilisé pour garantir que le trafic ne quitte pas le VPC. Les objets sont chiffrés en cours de vol définis par la stratégie de compartiment Amazon S3, tandis que les objets de compartiment S3 stockés sont chiffrés à l'aide du chiffrement AWS KMS au repos.
  • Une ou plusieurs fonctions Amazon Lambda s'exécutent pour traiter les données par lots, qui ont a atterri dans le compartiment Amazon S3. Plusieurs composants AWS facilitent l'analyse des données.
  • Une ou plusieurs fonctions Amazon Lambda s'exécutent pour extraire les données par lots, désormais envoyées à partir de la fonction précédente. Plusieurs composants AWS facilitent l'extraction des données.
  • Le service Amazon ElasticSearch stocke les données extraites dans un index chiffré (au repos et en transit). Ces données peuvent désormais être utilisées pour être recherchées en interne à l'aide de l'API Elasticsearch ou de Kibana. Amazon Cognito est utilisé pour sécuriser le processus de connexion, ainsi que pour intégrer SSO si nécessaire.
  • Kibana est utilisé pour superposer Elasticsearch et fournit des expressions de recherche, des tableaux de bord et des outils conviviaux. 🔍 Les employés peuvent désormais récupérer des enregistrements et des documents bien plus encore.
  • Êtes-vous prêt à renforcer l'expérience de recherche de documents de votre organisation?

    Perficient est fier d'être un partenaire de conseil avancé dans le réseau des partenaires Amazon. Nos architectes de solutions sont des experts en la matière dans les domaines de la recherche et de la découverte. Nous sommes là pour vous aider à alléger le fardeau de la transformation numérique des documents tout en augmentant la capacité de recherche.

    Contactez-nous dès aujourd'hui pour découvrir comment Perficient peut vous aider à tirer le meilleur parti de la recherche de documents!

    À propos l'auteur <! -: tdieter, Architecte de solutions ->

    Troy est un architecte de solutions passionné spécialisé dans le groupe AWS Cloud Platform Solutions chez Perficient. Troy est fier d'une architecture de solutions bien documentée, du rêve à la livraison. Il est un fervent défenseur des logiciels Open Source, membre de AWS Community Builders (Storage Specialty) et ambassadeur AWS APN.
    Consultez ses certifications AWS ici: https://www.youracclaim.com/users/troy-dieter/badges[19659026unityPlusdecetauteur




    Source link