En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des contenus et services adaptés à vos centres d’intérêts. En savoir plus et gérer ces paramètres. OK X
 
 

 

 

Actualité des entreprises

Commentaire de Sergio Gago (Cloudera) sur les données synthétiques

Publication: 29 janvier

Partagez sur
 
Data Privacy Day...
 

« Avec l’essor des LLM et des agents, les entreprises exploitent de plus en plus de données sensibles pour entraîner et tester leurs modèles. Même lorsque les équipes ont la ferme intention de respecter la confidentialité, les champs sensibles peuvent facilement glisser dans les corpus d’entraînement, les ensembles d’évaluation ou les bibliothèques de prompts, en particulier lorsqu’elles agissent rapidement pour créer et développer des cas d’usages d’IA.

Les données synthétiques constituent alors une solution pratique : générées par des algorithmes, elles sont conçues pour refléter les ensembles de données, sans reproduire les enregistrements réels. Bien utilisées, elles permettent le réglage fin des modèles d’IA, leur évaluation à grande échelle et la curation de données pour les agents, tout en réduisant les risques liés à la confidentialité.

Toutefois, ces données ne sont pas une solution miracle. Mal générées, elles peuvent toujours divulguer des informations sensibles si elles conservent des combinaisons d’attributs rares ou reflètent trop fidèlement des exemples réels. Pour être réellement efficaces, les données synthétiques doivent être traitées comme une discipline d’ingénierie, avec des contrôles, plutôt que comme une solution de dernier recours. Ainsi, les organisations doivent d’abord définir pour quel(s) usage(s) elles ont besoin de ces données, ce qui déterminera ensuite la manière dont les données doivent être générées. Les données synthétiques ne peuvent pas remplacer universellement les données réelles et ne suppriment pas la nécessité d’une gouvernance

À l’occasion de la Journée européenne de la protection des données, j’invite les entreprises à considérer les données synthétiques comme un levier pour innover en toute sécurité, à condition qu’elles soient correctement générées, encadrées et intégrées dans une gouvernance solide pour protéger la confidentialité tout au long du cycle de vie de l’IA. »

Suivez MtoM Mag sur le Web

 

Newsletter

Inscrivez-vous a la newsletter d'MtoM Mag pour recevoir, régulièrement, des nouvelles du site par courrier électronique.

Email: