En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des contenus et services adaptés à vos centres d’intérêts. En savoir plus et gérer ces paramètres. OK X
 
 

 

 

Dossiers

Comment éviter les interruptions de service

Par Stéphane Estevez, Product Marketing Director EMEA, IT Markets chez Splunk

Publication: 5 novembre

Partagez sur
 
À l’heure de l’explosion du e-commerce et autres services de livraison express, les clients exigent désormais une expérience en ligne aussi fluide que transparente...
 

Leurs attentes évoluent, ils souhaitent pouvoir disposer d’applications et de sites internet leur offrant des performances optimales, quotidiennement et sans interruption. Lorsqu’une organisation fait le choix d’innover avec un nouveau modèle numérique afin de satisfaire ces demandes, il a certainement fallu en amont explorer ce que l’intelligence artificielle et les capacités prédictives pouvaient apporter au service informatique ainsi qu’aux fonctions métier. Un des principaux enjeux est donc de pouvoir offrir au personnel informatique une technologie permettant de garantir aisément la performance et la disponibilité des services et des applications, pour les employés comme pour les clients. Et si cette démarche d’innovation n’est pas encore enclenchée, le service informatique de l’entreprise peut être un précurseur dans l’utilisation des capacités prédictives et montrer la voie à toute une entreprise.

L’approche réactive face aux incidents des services informatiques appartient au passé

Les approches traditionnelles de supervision ont toujours eu vocation à être réalisées manuellement et de façon réactive, qu’il s’agisse de surveiller des applications, le cloud, des bases de données ou du stockage. Ce type de workflow comprend les événements générés par des alertes basées sur des règles et des seuils devant sans cesse être mis à jour. Sans une enquête manuelle, ces éléments sont considérés comme des incidents et ralentissent ainsi l’activité, la performance et la disponibilité du service concerné. L’enquête est donc une étape importante au sein de processus afin de mobiliser les équipes dans le dépannage et la correction du problème. Cette étape peut prendre du temps, des heures qui pourraient être allouées à d’autres activités à plus forte valeur ajoutée. A la fin de ce processus, les incidents sont analysés et corrélés afin de comprendre la cause profonde, et de trouver une solution temporaire ou définitive au disfonctionnement.

Ce type de processus se veut relativement lent, peu productif et a un impact négatif sur l’expérience client. Par ailleurs, ces dispositifs sont parfois sources de reproches provenant des parties prenantes internes, en particulier si l’interruption engendre une perte financière pour l’entreprise.

Grâce aux avancées technologiques en la matière, ce dispositif contraignant n’est plus une fatalité. En effet, il est désormais possible de prédire une panne afin que les équipes techniques en charge des services informatiques puissent intervenir en amont pour empêcher les incidents de parvenir jusqu’au support technique.

Une nouvelle approche se voulant prédictive et préventive

Aujourd’hui, il est primordial de pouvoir accéder aux informations permettant de prendre des décisions sur des questions sensibles, de manière rapide et précise. Les services informatiques ne font pas exception à la règle. Les équipes ont besoin d’informations pour déterminer la cause profonde d’un incident afin de le résoudre aussi vite que possible, de façon à ce que la panne ait le minimum d’impact sur l’entreprise et ses clients. L’analyse prédictive fait son apparition à ce moment précis, afin d’obtenir des informations avant même qu’un incident ne survienne. L’équipe d’assistance est alors prévenue en amont, et peut sans attendre prendre toutes les mesures nécessaires pour éviter qu’il ne se produise. Cette stratégie prédictive engendre de nombreux avantages tels que le maintien d’une expérience client constante en évitant pannes et en préservant la qualité de l’expérience client, la protection des revenus, et une productivité accrue en donnant aux équipes internes plus de temps à consacrer aux initiatives bénéfiques pour l’entreprise.

La réussite de la mise en place de l’analyse prédictive et préventive dans un service informatique passe notamment par la préparation et le tri de toutes les données. Cependant, il faut également une solution offrant une IA sophistiquée afin d’utiliser le machine learning sur les données et d’en extraire ces renseignements prédictifs.

Les données : le fondement d’une intelligence artificielle et d’une analyse prédictive réussie

Les données sont le fondement indispensable de toute solution réussie d’intelligence artificielle. En effet, une grande quantité de données est nécessaire pour comprendre le passé, afin de prédire ce qui va le plus probablement se dérouler dans le futur. Il devient indispensable d’obtenir des renseignements sur les états antérieurs des systèmes et de corréler ces enseignements avec la situation actuelle, pour corriger les erreurs de manière proactive, éviter les interruptions et optimiser l’efficacité. Pour y parvenir, les entreprises doivent assimiler et exploiter un très large éventail de types de données, générées autant par des humains que par des machines. L’accès aux données de l’ensemble des silos informatiques à partir d’un lieu unique est indispensable pour en avoir une visibilité complète. Il est essentiel de comprendre les données sous-jacentes sur lesquelles reposent les services et applications d’une entreprise, et de définir des indicateurs clés de performance (KPI) pour décrire leur état de santé. En dépassant l’agrégation de données, les recherches et les visualisations pour surveiller et dépanner les services informatiques, le machine learning joue un rôle clé en vue d’étendre l’analyse prédictive et l’automatisation.

L’association des données et du machine learning au service de l’analyse prédictive

Pour faire de l’analyse prédictive, il ne suffit pas de disposer de données et de pouvoir les héberger. Il est important de soumettre ces données en temps réel, et ce grâce à l’utilisation du machine learning pour prédire les événements futurs à haute probabilité. La puissance du machine learning permet d’utiliser les données d’événements tout en effectuant des analyses pour réduire le bruit, les fausses alertes et la maintenance de règles complexes afin d’identifier facilement les incidents potentiels à fort impact devant être traités en priorité ; de détecter les anomalies en examinant les données, en établissant des références opérationnelles et en utilisant des mesures statistiques pour déterminer des motifs de variabilité des seuils ; et d’adapter dynamiquement les seuils initialement en place aux changements de comportement et aux activités anormales.

Le machine learning permet d’adopter une approche véritablement plus prédictive et préventive des services informatiques, le tout à travers une plateforme capable d’examiner ces tendances, de distinguer ce qui est normal de ce qui ne l’est pas et d’avertir en cas d’anomalie.

L’intelligence artificielle dédiée aux opérations informatiques (AIOps) est souvent évoquée. Les plateformes AIOps sont des systèmes logiciels combinant d’important volumes de données (le « Big Data ») et l’intelligence artificielle pour améliorer et remplacer en majeure partie le processus et le tâches informatiques, et notamment la surveillance de la disponibilité et de la performance, la corrélation et l’analyse des événements, la gestion des services IT ainsi que l’automatisation.

L’automatisation et le remplacement de ces tâches prédisent les pannes imminentes et les empêchent de se produire en combinant les données machine et l’application de l’intelligence artificielle sur les données.

L’analyse prédictive et préventive permet de réduire à la fois le temps moyen de détection, d’investigation et de résolution et tout en augmentant le temps moyen entre deux pannes.

En bout de ligne, l’analyse prédictive permet de réduire les tâches manuelles associées à la détection et à la résolution des problèmes. Le temps gagné en évitant les étapes d’un long processus est finalement utilisé à des fins plus utiles pour le service informatique et plus généralement pour l’entreprise. Cette nouvelle approche vis-à-vis des événements rencontrés, évite les incidents qui auraient pu autrement avoir un impact négatif, ce qui fait non seulement économiser du temps mais également le coût potentiel d’une interruption de service pour l’entreprise. L’expérience client quant à elle reste intacte, voire s’améliore grâce au maintien de la disponibilité tout en répondant l’objectif principal de l’entreprise qui est de conserver la fluidité de fonctionnement et l’accessibilité des services et des applications utilisés par les clients.

http://www.splunk.com/

Suivez MtoM Mag sur le Web

 

Newsletter

Inscrivez-vous a la newsletter d'MtoM Mag pour recevoir, régulièrement, des nouvelles du site par courrier électronique.

Email: