Starburst, acteur de référence des plateformes data et IA, annonce le renforcement de son approche de lakehouse hybride et fédéré pour répondre aux défis critiques de souveraineté des données auxquels font face les entreprises européennes.
Chaque jour, plus de 403 millions de téraoctets de données sont créés dans le monde. Une grande partie de ces données appartient à des entreprises européennes, mais une part significative n’est pas stockée en Europe. Selon l’IFRAP, environ 70 % des données des Français étaient encore hébergées hors du territoire national en 2023. Même si ce chiffre a partiellement évolué depuis, la structure du marché du cloud, dominé à plus de 65 % par AWS, Microsoft Azure et Google Cloud, maintient une dépendance structurelle à des fournisseurs soumis au Cloud Act américain et expose concrètement les entreprises à des risques d’accès non autorisé à leurs données.
Dans ce contexte, Starburst propose une approche lakehouse hybride et fédérée, articulée autour de Stargate, sa technologie de fédération inter-clusters conçue pour les environnements multicloud, multi-régions et hybrides. Répondre aux défis de la souveraineté et de l’hybridation
La souveraineté des données n’est plus un débat théorique. En 2024, plus de 2 milliards d’enregistrements ont été compromis en Europe, et les amendes infligées au titre du RGPD dépassent désormais 4,5 milliards d’euros. Pour les entreprises, le coût de l’inaction est réel et croissant.
Le problème est structurel : la quasi-totalité des organisations opèrent aujourd’hui dans des environnements hybrides et multicloud, avec des données réparties entre plusieurs fournisseurs, régions et infrastructures. Les déplacer pour les exploiter (l’approche traditionnelle) génère non seulement des coûts élevés de migration mais aussi des risques de conformité et des délais incompatibles avec les exigences de l’analytique moderne.
« Les entreprises ne peuvent plus se permettre de déplacer massivement leurs données pour les exploiter. La souveraineté impose de traiter les données là où elles résident, tout en garantissant performance et gouvernance », explique Pascal Gasp, Senior Solutions Architect chez Starburst.
C’est précisément à cette problématique que Stargate s’adresse. Plutôt que de centraliser les données, la technologie de fédération inter-clusters de Starburst permet de les interroger directement à leur source, sans déplacement ni duplication. Les requêtes sont exécutées localement, les métadonnées unifiées sans être dupliquées, et la conformité aux exigences de résidence des données maintenue de bout en bout.
Contrairement aux architectures traditionnelles, souvent limitées par la latence réseau et le coût des transferts inter-cloud, Stargate permet de réduire les mouvements de données et améliore les performances grâce à une exécution locale des requêtes. La nouvelle version, Stargate Parallel, introduit des capacités de parallélisation des requêtes offrant des gains de performance allant jusqu’à 67 % sur certains workloads analytiques intensifs, notamment les jointures entre clusters géographiquement distribués, historiquement pénalisées par la latence réseau inter-cloud.
Stargate est particulièrement adapté aux secteurs où la résidence des données est non négociable. SOPHiA GENETICS, acteur de la médecine fondée sur les données, en est l’illustration la plus documentée publiquement. L’organisation interroge des données de patients réparties dans plusieurs pays sans les déplacer, dans le respect des contraintes RGPD applicables à chaque juridiction, avec une augmentation de 10 à 15 % de la disponibilité des données pour les équipes analytiques. Plus largement, Starburst est déployé en France auprès des principaux établissements bancaires, d’acteurs majeurs des télécoms et de la logistique, de mutuelles de santé, d’opérateurs de jeux, ainsi que d’organismes publics gérant des données de santé à l’échelle nationale, des environnements où la fédération sans mouvement de données n’est pas une option architecturale, mais une contrainte réglementaire imposée.
Au-delà de la souveraineté, l’accès unifié aux données constitue aujourd’hui le prérequis silencieux de toute stratégie d’intelligence artificielle. Les modèles ne valent que par la qualité et la complétude des données qu’ils ingèrent : des données fragmentées, cloisonnées ou déplacées au fil des pipelines ETL sont autant de frictions qui ralentissent les projets IA avant même leur démarrage. En fédérant l’accès à l’ensemble du patrimoine de données, multicloud, multi-régions, on-premise, sans duplication ni mouvement, Starburst transforme cette couche d’accès en véritable carburant pour les pipelines IA/ML et l’analytique en temps réel. La sécurité n’y est pas un frein : gouvernance granulaire, masquage des données et audit des requêtes sont embarqués nativement, ce qui permet aux équipes data science d’accéder aux données sensibles dans un cadre contrôlé, sans contournement ni copie non gouvernée.
Le Data Act européen est entré en application le 12 septembre 2025. L’obligation d’accès aux données dès la conception s’imposera à tous les nouveaux produits connectés en septembre 2026, et la suppression des frais d’egress inter-cloud est programmée pour janvier 2027. Dans ce calendrier désormais contraignant, une architecture de fédération n’est plus un avantage compétitif optionnel, c’est une réponse opérationnelle à des obligations déjà opposables.