Fermer

octobre 2, 2020

Les sept exigences essentielles pour une collecte de données moderne


Dans un blog antérieur j'ai discuté des tendances nécessitant une approche moderne des collectes de données pour soutenir l'évaluation précoce des cas, les enquêtes et l'eDiscovery: une main-d'œuvre de plus en plus éloignée, de nouvelles sources d'informations stockées électroniquement (ESI), y compris des données éphémères, et une augmentation des mandats de conformité réglementaire et des litiges, pour n'en nommer que quelques-uns.

Ce blog examine les sept exigences essentielles pour que les logiciels de collecte soient efficaces dans l'environnement actuel, à l'échelle requise pour aborder le nouveau monde de données.

1. Exhaustivité

Les logiciels modernes de collecte de données doivent être complets pour collecter des données de toutes les sources pertinentes. Cela inclut les sources de points de terminaison physiques telles que les ordinateurs portables et les ordinateurs de bureau, les référentiels de contenu sur site et basés sur le cloud et les systèmes de messagerie, y compris les fichiers PST archivés. Les logiciels médico-légaux modernes incluent des connecteurs robustes vers toutes ces sources de données ainsi que des agents distants pour collecter des données à partir des points finaux.

2. Rapidité et efficacité

Les logiciels de collecte de données doivent fonctionner rapidement et efficacement. Il doit utiliser un filtrage de recherche avancé pour éliminer les données au point de collecte et dédupliquer et déNIST automatiquement les ensembles de données pour limiter la taille des collections. Cela minimise la sur-collecte coûteuse dans le contexte de l'eDiscovery où le coût de l'examen est souvent proportionnel au volume de données à examiner. Une collecte de données efficace aide également les organisations à identifier les informations concluantes aussi rapidement que possible pour les enquêtes où le temps presse.

3. Facilité d'utilisation et perspicacité

Les logiciels modernes de collecte de données doivent explorer plusieurs sources cibles en parallèle pour accélérer le temps de collecte et permettre la modélisation et l'automatisation des critères fréquemment utilisés. De plus, les collections doivent être granulaires pour pouvoir cibler des sources spécifiques. Par exemple, des dossiers individuels au sein de structures de dossiers à plusieurs niveaux devraient pouvoir être sélectionnés discrètement pour éviter de collecter des données non pertinentes.

Un logiciel de collecte de données sophistiqué permet de mieux comprendre le sujet et le contenu des données elles-mêmes. Grâce aux analyses de pré-collecte, les utilisateurs peuvent rapidement comprendre l'étendue des données avant qu'elles ne soient collectées, tandis que la recherche avancée permet d'extraire les données spécifiques d'intérêt à partir de grands volumes de données non pertinentes. Les collectes devraient également pouvoir être menées en parallèle afin que les données puissent être analysées au fur et à mesure que les travaux individuels sont terminés, au lieu d'attendre la fin des processus entiers.

4. Fonctionnement discret

La collecte de données doit s'exécuter silencieusement en arrière-plan. Cela évite de monopoliser les ressources du système et d’interrompre le fonctionnement normal du dépositaire de l’appareil et des applications sur lesquelles il compte pour exécuter son travail.

5. Mesures de sécurité

Avec des données dispersées, la connectivité sporadique est une réalité. Les solutions de collecte de données doivent conserver des journaux de leurs processus réussis et tenter à nouveau automatiquement toute collecte qui échoue, par exemple lorsqu'un appareil abandonne un réseau. Les solutions avancées de collecte de données médico-légales communiquent avec des agents distants pour surveiller les tentatives de connexion et exécuter automatiquement les tentatives jusqu'à ce que les périphériques réapparaissent sur les réseaux et que les collectes soient terminées.

6. Processus et résultats défendables

La collecte de données ne doit pas modifier les métadonnées ni compromettre la chaîne de contrôle. Tant le processus que les résultats doivent être défendables et judicieux. Les méthodes de collecte de données doivent générer des formats de sortie légalement sanctionnés tels que LEF (Logical Evidence File) d'EnCase eDiscovery.

7. Résultats facilement transférables

L'un des principaux objectifs de la collecte de données est de permettre un examen ultérieur des données, de sorte que les données doivent être collectées dans un format standard qui peut être facilement transféré vers des plates-formes d'analyse et d'examen standard de l'industrie . La rationalisation de l'effort requis pour charger les données dans les plates-formes d'examen rend l'accès aux données plus rapide et plus facile afin que l'examen puisse commencer sans délai.

Pris ensemble, ces sept critères indiquent une approche moderne de la collecte de données à grande échelle qui répond à toutes les exigences critiques pour l'efficience, l'efficacité et la défendabilité.

Pour plus d'informations, lisez le livre blanc « Modern Data Collection: New Imperatives and Critical Requirements ».




Source link