Fermer

octobre 25, 2023

L’eDiscovery pour aujourd’hui : gérer les données modernes

L’eDiscovery pour aujourd’hui : gérer les données modernes


Beaucoup d’entre nous en première ligne de l’eDiscovery ont remarqué à quel point les données ont changé au cours de la dernière décennie. Dans le passé, il était inhabituel de recevoir une demande de traitement des données de chat. Et depuis la COVID, l’afflux de demandes de traitement de fichiers audio/vidéo (« a/v ») a augmenté de façon exponentielle. En fait, les données non structurées représentent désormais 80 à 90 % de toutes les nouvelles données et leur croissance est trois fois plus rapide que les données structurées. D’ici 2025, elle devrait atteindre 175 zettaoctets, soit cinq fois la taille de 2018 ! [1]

Que sont exactement les données non structurées ? La définition technique désigne toute information qui n’est pas organisée selon un modèle ou un schéma de données prédéfini. En termes simples, si les données ne sont pas organisées de manière à faciliter leur traitement, elles ne sont pas structurées. Des exemples de données non structurées incluent le contenu des réseaux sociaux, les données de chat, le contenu créé avec un logiciel collaboratif, les médias riches et les données générées par machine.

Défis

Les données structurées sont généralement très simples à traiter. Il contient des métadonnées claires et identifiables qui peuvent être capturées et son contenu peut être affiché dans une visionneuse de documents standard. Ce n’est pas le cas des données non structurées. Vous trouverez ci-dessous les quatre principales raisons pour lesquelles les données non structurées présentent des défis évidents dans le monde de la découverte électronique :

  1. Même si les données ont une structure interne quelconque, elles ne peuvent généralement pas s’intégrer dans un modèle de données prédéfini. Cela rend très difficile la collecte, le traitement et la présentation avec les logiciels eDiscovery les plus courants.
  2. Les données non structurées contiennent généralement des milliards d’éléments qui nécessiteront non seulement une définition, mais aussi un moyen de pré-filtrer et de gérer d’une manière cohérente avec les besoins du projet sans chercher à faire bouillir l’océan.
  3. Les éléments collaboratifs courants des données non structurées nécessitent un traitement spécial pour garantir la préservation de leur contenu, de leur créateur/éditeur, de leur historique de versions et d’autres informations de suivi.
  4. Les données non structurées sont généralement mises à jour avec du nouveau contenu qui peut nécessiter des collectes répétées au cours du processus de découverte d’un projet.

À titre d’exemple courant des défis ci-dessus, pensez à ce fil de discussion que vous avez eu au cours des trois dernières années : quelques jours ou une semaine peuvent s’écouler sans activité, et puis paf ! Les mêmes joueurs reprennent cette conversation pour fournir des mises à jour sur le même sujet ou pour évoquer un élément nouveau mais similaire. Ou peut-être s’agit-il d’une conversation en équipe qui couvre de nombreux sujets différents. Maintenant, quelle partie de cette discussion est liée à votre projet eDiscovery ? Où est le point de coupure ? Quelle quantité de ce fil souhaitez-vous afficher par enregistrement dans votre base de données ? Comment suivre les membres du chat qui sont ajoutés et quand, et qui sont supprimés et quand ? Tous ces défis nécessitent un plan de match, quel qu’il soit. Ci-dessous, nous passerons en revue quelques scénarios qui démontrent comment les logiciels de découverte électronique de pointe comme Texte ouvertMT AccélérerMT relève ces défis.

Données de discussion

Les fonctionnalités d’Axcelerate Chat prennent en charge les données de chat de :

  • Bloomberg
  • Mou
  • Équipes Microsoft
  • Collectes d’appareils mobiles utilisant :
  • Formats XML

Les données de chat peuvent être ingérées dans Axcelerate à partir d’une exportation ou directement depuis l’application Chat en utilisant l’un des connecteurs compatibles Axcelerate (voir la section « Autres données structurées et connecteurs » ci-dessous). Aucun fichier de discussion natif n’est associé à ce type de données – ils ne sont pas exportés comme les fichiers MSG vers un conteneur de messagerie. Ces données sont principalement un flux d’informations codées de manière à devoir être réassemblées pour une visualisation facile (voir les exemples ci-dessous).

[Example 1:  Axcelerate Near Native view]

[Example 2:  Axcelerate Text view]

Pour éviter de longs documents de discussion, plusieurs options peuvent être appliquées. La valeur par défaut est de diviser les discussions par jour. Mais le système ne sépare jamais les messages de discussion en canaux de leurs réponses, même si elles s’étendent sur plusieurs jours. Il existe également une option permettant d’utiliser le fractionnement adaptatif des discussions qui divise les discussions en fonction des intervalles identifiés dans les dates du fil de conversation. Le fractionnement du chat peut également être désactivé, par exemple, si l’équipe chargée du dossier souhaite produire un chat complet sous la forme d’un seul document.

Quelle que soit l’option sélectionnée, la localisation de tous les documents de discussion appartenant au même chat dans Axcelerate se fait facilement grâce au filtre intelligent de l’historique des discussions. D’autres filtres spécifiques au chat incluent la plate-forme de chat, le type d’événement de chat et le nombre de chats. Le type d’événement de discussion est particulièrement utile pour identifier le moment où de nouveaux participants sont ajoutés ou supprimés.

Visionneuse de discussion

La visionneuse de chat Axcelerate en option possède des fonctionnalités supplémentaires pour permettre un processus de révision de chat plus simple. Cette fonctionnalité inclut la possibilité de mettre en évidence certains contributeurs de chat à l’aide de la liste des membres (voir l’exemple ci-dessous).

[Example 3: Chat Viewer: Near Native]

Lors de la visualisation d’un document de discussion dans Chat Viewer, les utilisateurs ont la possibilité de sélectionner des messages spécifiques dans le fil de discussion lui-même à des fins de rédaction et de production. Après avoir sélectionné les messages souhaités dans Chat Viewer, les utilisateurs peuvent ensuite passer à la vue Rédaction qui affichera uniquement les messages sélectionnés pour ce document. Les utilisateurs peuvent ensuite procéder à la rédaction et au balisage de cette vue du document et le préparer pour la production. Cela simplifie le processus de production uniquement des messages pertinents dans un fil de discussion sans rédiger manuellement les parties non pertinentes. Pour en savoir plus sur les fonctionnalités de chat d’Axcelerate, jetez un œil à cette courte vidéo YouTube.

Prise en charge audio/vidéo

Axcelerate CE a désormais déployé la prise en charge des fichiers audio et vidéo (« A/V ») dans sa version 23.4. Comme les fichiers A/V ne sont pas intrinsèquement consultables, il existe désormais une fonction de transcription qui générera rapidement du texte à partir de vos médias. Et cette version comprend également un lecteur audio-vidéo pour permettre une lecture facile. Les utilisateurs peuvent même synchroniser la lecture avec la transcription du média (voir exemple ci-dessous).

[Example 4: Audio-Video Player]

OpenText prévoit de continuer à étendre cette nouvelle fonctionnalité pour inclure de nombreuses autres options de prise en charge A/V, notamment :

  • Possibilité de rédiger des fichiers A/V et/ou leurs transcriptions par sélection de chronologie ou d’horodatage
  • Génération d’un menu de liste de rédaction pour d’autres options de navigation
  • Possibilité d’attribuer des raisons de rédaction à chaque balisage
  • Production native de fichiers A/V expurgés

Cette nouvelle fonctionnalité est abordée plus en détail dans un document séparé Article de blog.

Autres données structurées et utilisation de connecteurs

Un autre excellent moyen par lequel Axcelerate prend en charge d’autres types de données non structurées consiste à utiliser des connecteurs de données. Ces connecteurs permettent aux données d’être ingérées directement dans Axcelerate à partir du système source d’origine. Cela permet non seulement de gagner du temps, en n’ayant plus à gérer les données exportées, mais cela peut également être utilisé pour un transfert transparent d’autres données non structurées à partir de systèmes tels que Box, Atlassian Confluence, Google Drive et plus encore. Actuellement, Axcelerate dispose de plus de 40 connecteurs.

En plus des fonctionnalités de chat d’Axcelerate, de la nouvelle prise en charge A/V pour le Cloud et des connecteurs de données, cette plate-forme propose de nombreuses autres options pour traiter les données non structurées. Par exemple, il existe des analyseurs permettant d’ingérer de manière transparente des images médico-légales sans monter les données. Et l’édition Cloud d’Axcelerate dispose d’une visionneuse Excel native spéciale pour un examen transparent des gros fichiers Excel. Pour plus d’informations, veuillez consulter le Présentation du produit Axcelerate.


[1] Voir Article de Researchworld.com « Possibilités et limites des données non structurées ».




Source link

octobre 25, 2023