Fermer

novembre 25, 2022

Salles blanches de données de nouvelle génération avec Delta Sharing


Les entreprises axées sur les données trouvent de plus en plus de cas d’utilisation où leurs données internes pourraient être complétées par des ensembles de données externes pour offrir plus de valeur commerciale. Dans le même temps, il existe des préoccupations légitimes en matière de confidentialité des données qui doivent être résolues, en particulier parmi les entreprises réglementées du secteur financier et de la santé. Il existe ici des opportunités pour une plate-forme où les informations sensibles peuvent être partagées entre les participants de manière sécurisée, régie et préservant la confidentialité. Une salle blanche de données est un modèle architectural qui pourrait répondre à ce besoin et Databrick Partage delta la technologie offre une mise en œuvre viable.

Salles blanches de données

Google a présenté Hub de données publicitaires en 2017. Ads Data Hub a fourni aux annonceurs des informations sur le niveau d’impression de partenaires dans le commerce de détail, l’édition, les agences de publicité, etc. de manière sécurisée, respectueuse de la vie privée et régie. Ce modèle était appelé une salle blanche de données. Une salle blanche de données est un environnement sécurisé et réglementé où les organisations partenaires peuvent apporter leurs données sensibles, qui peuvent contenir des PII (informations personnellement identifiables) ou des PHI (informations personnelles sur la santé), à analyser avec d’autres données privées. Les organisations membres de Cleanroom ont un contrôle total sur leurs données et peuvent décider avec qui les partager, sans exposer aucune information confidentielle.

Databrick Open source Partage delta permet aux entreprises de partager en toute sécurité des données en direct, que leurs systèmes de données soient sur site, basés sur le cloud ou hybrides et qu’elles utilisent ou non Databricks. Avec Delta Sharing, les fournisseurs de données peuvent partager des données en direct à l’aide du format Apache Parquet ou Delta Lake sans répliquer ni déplacer les données vers un autre système. Delta Sharing permet à plusieurs organisations de partager des données en toute sécurité, tout en permettant un système de gestion centralisé (Catalogue d’unité) qui audite facilement toutes les informations partagées. Une gouvernance précise est essentielle au succès de la mise en œuvre des salles blanches.

Opportunités

Data Intelligence - L'avenir du Big Data
L’avenir des mégadonnées

Avec quelques conseils, vous pouvez créer une plate-forme de données adaptée aux besoins de votre organisation et tirer le meilleur parti de votre capital de données.

Obtenir le guide

Les organisations qui établissent des partenariats de partage de données autour des salles blanches de données peuvent commencer à prendre une longueur d’avance sur trois grands vecteurs émergents : les réglementations en matière de confidentialité, les écosystèmes de consommation fragmentés et les opportunités de monétisation.

Les réglementations relatives à la confidentialité des données, telles que le RGPD et le CCPA, ainsi que les fluctuations des mesures tierces telles que le cadre de transparence du suivi des applications d’Apple, ont considérablement modifié la manière dont les organisations traitent les données. Par exemple, les éditeurs, les annonceurs et les plates-formes de publicité numérique passent à Unified ID 2.0 en réponse au plan de Google visant à supprimer les cookies tiers dans Chrome d’ici 2023. Fournir des mécanismes significatifs et efficaces pour joindre les données client entre les organisations partenaires deviendra plus complexe à mesure que les lois et pratiques en matière de confidentialité évoluent et les salles blanches de données offrent une solution fonctionnelle.

Les consommateurs ont de plus en plus d’options pour interagir avec les services et le contenu, qu’il s’agisse de visites médicales en ligne ou en cabinet ou d’utilisation de plusieurs appareils pour interagir avec un fournisseur de contenu. Cette fragmentation est mieux gérée par une collaboration sécurisée et centrée sur la confidentialité. La création d’une vue unique d’un client nécessite désormais une salle blanche de données.

Il existe ici des opportunités pour les entreprises qui souhaitent rechercher de nouveaux mécanismes de monétisation des données. Il existe un besoin largement insatisfait sur le marché d’un accès conforme à la confidentialité aux sources de données externes pour l’analyse de données volumineuses sans avoir à accéder directement aux données ou à déplacer les données.

Conclusion

L’augmentation des réglementations sur la confidentialité, la fragmentation des données et les attentes des consommateurs entraînent l’adoption de salles blanches de données dans de nombreux secteurs. La Plate-forme Databricks Lakehouse fournit tout le nécessaire pour construire, servir et déployer une salle blanche de données évolutive et flexible qui respecte vos exigences en matière de confidentialité et de gouvernance des données. Partage delta permet aux participants aux données de salle blanche de partager des données en toute sécurité avec d’autres sans reproduire aucune des informations. Vos données restent sous votre contrôle et vous n’êtes pas bloqué sur une plate-forme spécifique. Étant donné que toutes les requêtes sont exécutées sur un ordinateur sécurisé hébergé par Databricks, les participants n’auront jamais accès aux données brutes, protégeant ainsi les informations des utilisateurs. Avec Catalogue d’unité, les organisations peuvent contrôler qui voit quelles données et respecter les exigences de confidentialité. Avec Databricks, les utilisateurs ne sont pas seulement limités à SQL ; vous pouvez également exécuter des calculs et des charges de travail complexes dans des langages populaires tels que R, Scala et Python.






Source link