Lorsque j’étais parajuriste spécialisé dans les litiges, il était toujours difficile d’essayer de rechercher dans des enregistrements dans une base de données eDiscovery des termes comprenant des chiffres et des symboles – un problème qui revenait assez fréquemment. La recherche de valeurs monétaires, de numéros de produits, de numéros de série, de numéros de brevet, etc., est courante. Comment votre Logiciel de découverte électronique gérer la recherche de chiffres et de caractères spéciaux ?
J’ai vu une variété d’approches avec différentes applications logicielles. Certains ignorent les caractères spéciaux ; certains les traitent comme un espace dont il faut tenir compte dans votre recherche ; et certains permettent d’indexer les caractères spéciaux au cas par cas. Cela rend très difficile la recherche de nombres contenant des caractères tels que des virgules, des points-virgules ou des symboles de dollars.
Des applications logicielles plus sophistiquées comme Texte ouvertMT Examen et analyse AxcelerateMT (« Axcelerate ») incluent automatiquement la possibilité de rechercher de nombreux caractères spéciaux. Axcelerate ajoute même un peu d’analyse aux recherches de caractères associés à des valeurs numériques. Plus d’informations à ce sujet ci-dessous.
Ponctuation et autres caractères spéciaux
Dans Axcelerate, de nombreux personnages sont toujours entièrement consultables. Ces caractères sont indexés séparément et avec leurs termes adjacents les plus proches. Cela permet une expérience de recherche entièrement fonctionnelle qui comprend :
- Recherche de valeurs monétaires ($, ¥, etc.)
- Nombres associés à des caractères spéciaux (par exemple, =, +, -, %, etc.)
- adresses mail
- Chemins de dossiers
- Marque déposée, droit d’auteur et autres symboles déposés courants
- Noms d’entreprises qui incluent des caractères spéciaux (par exemple, Edward & Jones)
Mais vous pouvez toujours rechercher ces mêmes termes sans les symboles et les résultats incluront les deux variantes. Par exemple, la recherche de « Edward & Jones » renverra uniquement les résultats incluant le symbole esperluette, mais la recherche de « Edward Jones » localisera à la fois « Edward Jones » et « Edward & Jones » dans ses résultats.
Ponctuation dans le corps du texte
De plus, certaines ponctuations peuvent être recherchées lorsqu’elles sont trouvées dans le corps d’un terme. sans espaces (c’est-à-dire introuvable au début ou à la fin d’un mot). Cela inclut les caractères suivants :

Ponctuation trouvée dans le corps du terme
Les caractères spéciaux qui servent également de fonctions Axcelerate devront être saisis avec des guillemets autour d’eux pour les différencier de leur objectif fonctionnel (par exemple, le symbole # utilisé pour indiquer une recherche radicale lorsqu’il est placé au début d’un mot peut également être recherché comme un caractère s’il est contenu entre guillemets, tel que « # »).
Caractères monétaires et correspondance symétrique
La correspondance symétrique utilise des analyses pour localiser les caractères monétaires adjacents (par exemple, $, ¥, etc.) ou les codes ISO de devises (par exemple, USD, CNY, etc.), quel que soit le côté où le caractère/code apparaît à côté du nombre (par exemple, avant le numéro ou après). Vous trouverez ci-dessous quelques exemples de requêtes et les résultats attendus :
Correspondance symétrique
D’autres symboles numériques recherchés avec une correspondance symétrique incluent :
Symboles associés
Caractères séparateurs numériques
Selon le pays d’origine, les nombres sont souvent affichés avec des caractères représentant les millièmes séparateurs. Les caractères les plus courants sont les virgules, les points et les apostrophes. Il est également courant d’afficher des séparateurs décimaux avec des points ou des virgules. Dans Axcelerate, l’utilisateur peut créer une recherche radicale (en utilisant le mode Stem ou en insérant # avant le terme de recherche) pour rechercher des valeurs numériques quels que soient les séparateurs utilisés. Par exemple, vous trouverez ci-dessous les résultats attendus pour la recherche #12345675 :
Recherche radicale de séparateurs numériques
Stratégie de recherche plus étendue
L’utilisation tactique de termes de recherche numériques et caractères avec la fonctionnalité ci-dessus nous offre, aux utilisateurs d’eDiscovery, la flexibilité d’être plus chirurgicaux ou plus étendus dans nos stratégies de recherche. J’ajoute cela à ma liste de fonctionnalités que j’aurais aimé avoir lorsque j’étais parajuriste, sachant combien de temps cela m’aurait permis de gagner en recherchant cette demande de brevet ou une série de numéros de modèle de produit.
Source link