Les défis jumelés de la complexité et de la centralisation : Koch Industries, comme beaucoup de grandes entreprises, comprend que la complexité de son réseau mondial est un obstacle majeur à la transformation numérique.
Koch est l’une des plus grandes entreprises à capitaux privés au monde, avec un chiffre d’affaires estimé autour de 115 milliards de dollars et des intérêts dans des domaines comme la chimie, les biocombustibles, le pétrole et le gaz, les minéraux, l’électronique, les logiciels et l’analyse de données, pour n’en citer que quelques-uns.
La diversité de son activité et plusieurs grosses acquisitions ont abouti à un héritage informatique complexe, qui comprend sept réseaux mondiaux couvrant 700 sites et 120 000 employés dans 70 pays, des milliers d’applications, des milliers de routeurs et de pare-feux, des dizaines de milliers de points d’accès et des centaines de milliers de ports de commutation.
Matt Hoag, directeur de la technologie chez Koch Business Solutions, la branche services informatiques, est chez Koch depuis plus de 20 ans, au cours desquels l’entreprise a dépensé presque 120 milliards de dollars en croissance et en amélioration, dont presque 30 milliards rien qu’en investissements technologiques au cours des six dernières années.
« En tant que CTO, ma tâche consiste à coordonner cette complexité mondiale, et notamment la sécurité des données et le fonctionnement des applications dont dépendent l’activité et les clients » explique-t-il. « J’ai vu beaucoup de changements depuis que je suis chez Koch, mais rien de comparable au rythme d’évolution et à l’impact sur l’activité que nous voyons aujourd’hui. »
Au fur et à mesure que le cloud est parvenu au centre de la stratégie commerciale de l’entreprise, il est devenu de plus en plus clair que la complexité et l’architecture centralisée du réseau étaient des obstacles au changement.
Il y a dix ans, Koch avait un réseau MPLS traditionnel ancré dans ses data centers avec un débit limité vers la plupart des sites et tout l’accès Internet centralisé.
« La vie était simple et, pour beaucoup de nos utilisateurs, assez lente » développe Matt Hoag.
Puis est arrivé l’impératif de transformation. Matt Hoag a constitué une équipe chargée de mettre en place les technologies fondamentales pour les activités numériques en croissance rapide. « Nous avons élaboré des plans ascendants et descendants pour la pile technologique, visant à découpler nos activités du data center et à implémenter des fonctions cloud-natives qui pourraient être déployées et adaptées au rythme de l’entreprise, et non plus à la vitesse traditionnelle de l’informatique » explique-t-il.
La première étape fut d’implémenter un SD-WAN mondial. Cela a permis de franchir un pas en termes de performances du réseau, avec une multiplication par sept du débit pour 500 des sites de l’entreprise. La plupart de ces sites ont également obtenu un accès direct à Internet, avec une connectivité filaire et sans fil améliorée dans les centres de production.
Toutefois, après avoir porté son choix sur AWS comme environnement cloud public de prédilection, Matt Hoag a réalisé que de simples connexions VPN n’allaient pas suffire. « Si nous voulions mettre en place des liaisons à haut débit pour la production, il allait nous falloir un meilleur plan pour la résilience et la redondance ».
Matt Hoag et son équipe élaborèrent un concept de « bretelles d’accès » au cloud qu’ils nommèrent hubs de transport. Elles seraient implémentées en trois phases :
1. Raccordement physique au cloud pour les data centers ;
2. Hubs virtuels pour améliorer les performances offertes aux sites distants et aux utilisateurs finaux
3. Hubs de transport en tant que service qui pourraient être déployés rapidement à l’échelle.
Les hubs de la version 1 fournissaient des connexions haut débit à AWS pour les data centers, mais l’approbation, l’installation et le test prenaient 18 mois. Et ces hubs coûtaient plus de 2 millions de dollars à mettre en place. Le projet avait atteint son objectif de donner aux équipes des applications commerciales la possibilité d’utiliser de nouvelles fonctions cloud, mais le réseau restait basé dans le data center.
« Pour pouvoir rompre les liens avec le data center et améliorer les performances des applications et l’expérience des utilisateurs, il nous fallait reproduire nos hubs de transport physiques virtuellement dans le cloud et permettre aux utilisateurs et aux sites d’accéder aux applications via le SD-WAN » commente Matt Hoag.
La version 2 du hub de transport ne demandait plus qu’environ six mois, un gros progrès par rapport aux hubs de data center. « Une grande partie de ce temps était consacrée à comprendre les concepts réseau d’AWS et à surmonter certaines de leurs limitations » confie Matt Hoag.
Toutefois, le déploiement des hubs version 2 à travers l’entreprise restait compliqué. Du fait de la structure de l’activité de Koch et des limitations de la mise en réseau cloud, chaque réseau avait besoin de son propre hub, distinct pour chaque région. Rien qu’aux Etats-Unis, l’entreprise était à cheval sur deux régions AWS. L’extension du réseau à l’échelle mondiale nécessitait de multiples hubs, et lorsque Koch voulait se connecter à d’autres clouds publics, le nombre de hubs commençait à grimper.
« Malgré les connaissances acquises avec AWS, l’extension vers d’autres clouds demandait des mois de travail dans chaque cas » commente Matt Hoag.
« Ainsi, bien que nous ayons résolu ces problèmes commerciaux et technologiques, nous avons constaté que nous avions créé un ensemble de solutions très complexe, si complexe en fait que seuls quatre ou cinq de nos ingénieurs réseau étaient pleinement reliés à toute l’architecture. D’autre part, nous n’avions toujours qu’un seul cloud et aucun plan pour étendre la solution à d’autres clouds. Et en plus de tout cela, nous n’avions aucune idée de comment parvenir au hub de transport 3, qui dans notre vision était le hub de transport en tant que service » ajoute-t-il.
A la mi-2018, Matt Hoag entendit parler d’une start-up nommée Alkira, fondée par les frères Amir et Atif Khan, après la vente de leur société de SD-WAN Viptela à Cisco.
La plateforme de cloud réseau d’Alkira, Cloud Services Exchange (CSX), semblait offrir toutes les possibilités que Matt Hoag et son équipe recherchaient :
Une connectivité transparente,
L’intégration complète des services de haut niveau,
Une visibilité et une gouvernance de bout en bout,
Une haute disponibilité avec reprise sur incident et services de suivi intégrés.
Toute l’année suivante, Matt Hoag et son équipe familiarisèrent l’équipe Alkira avec l’environnement Koch, lui expliquèrent les scénarios d’utilisation et les attentes en matière de performances, et l’aidèrent à affiner la version bêta de son logiciel.
A l’automne 2019, Koch eut entre les mains une version en avant-première de la plateforme Alkira.
Matt Hoag fut enthousiasmé par ce qu’il vit. « Ce qui nous avait demandé plus de deux ans à mettre au point dans nos déploiements des hubs de transport version 1 et version 2, nous pouvions le recréer avec le logiciel Alkira en une seule après-midi » explique-t-il. « Nous étions passé d’une masse de complexité et de mois de travail à un tableau de bord qui vous permettait facilement de dessiner votre réseau et de le déployer en quelques heures. »
Résultat : des coûts d’exploitation réduits et une agilité commerciale accrue Koch vise à remplacer dix hubs de transport existants par juste deux Cloud Exchange Points (CXP) Alkira.
« Cela va réduire grandement la quantité d’infrastructure virtuelle que nous utilisons, gérons et payons. Cela devrait également simplifier les opérations dans l’environnement de mise en réseau cloud : non seulement Alkira fournit ces fonctions à un éventail beaucoup plus large de responsables informatiques, mais elle le fait en tant que service avec une équipe d’ingénieurs par derrière » analyse Matt Hoag.
En plus de rationaliser l’infrastructure existante, la solution Alkira permet à Koch de s’étendre au-delà d’AWS et de se connecter au service cloud Azure de Microsoft. La construction d’une bretelle d’accès à Azure prête pour la production aurait demandé de trois à six mois avec les hubs de transport de la précédente architecture système de Koch. « Avec Alkira, nous avons pu la créer en un jour » raconte Matt Hoag.
« Koch pense que la plateforme de mise en réseau cloud réduira les coûts d’exploitation de son réseau mondial de 40 %, fera passer les délais de mise à disposition pour les besoins réseau futurs de plusieurs mois à quelques minutes, et éliminera le surdimensionnement des systèmes et services. Et par-dessus tout, » explique Matt Hoag, « l’équipe de mise en réseau n’est plus la traînarde qui empêche l’avancement des plans de transformation numérique de Koch. »
« Nous utilisons des réseaux parce que nous le devons, et non parce que nous en tirons de l’argent. Nous pouvons maintenant utiliser de nouvelles fonctions dans le cloud réseau, à la vitesse de notre activité et non à celle de l’informatique traditionnelle. »