Abonnez-vous Identifiez-vous

Identifiez-vous

Vos codes d'accès sont erronés, Veuillez les saisir à nouveau. Mot de passe oublié ?

Le big data pour anticiper les pannes à la SNCF

Ridha Loukil ,

Publié le

Le groupe expérimente un système destiné à prédire les pannes sur les rames du Transilien. Il devrait entrer en service en octobre.

Le big data pour anticiper les pannes à la SNCF
L’état du réseau Transilien devrait être suivi quasiment en temps réel grâce aux algorithmes.
© SNCF Médiathèque / Christophe Recoura

Après le télédiagnostic, la maintenance préventive. En faisant appel aux technologies du big data, la SNCF veut connaître très tôt les pannes qui se produisent sur les trains du Transilien, mais aussi les anticiper. De quoi éviter les problèmes sur les rames en circulation. C’est tout l’enjeu du projet mené avec le cabinet de conseil et d’ingénierie en mégadonnées Quantmetry. « Nous voulons avoir des trains qui fonctionnent et qui restent opérationnels en service à un coût raisonnable », lance Philippe de Laharpe, chef de projet télédiagnostic à la direction du matériel à la SNCF. Le Transilien, qui dessert la banlieue parisienne, se met peu à peu à l’heure de l’internet des objets. Le réseau comporte déjà 180 rames connectées, fournies depuis 2009 par Bombardier. Et le parc connecté s’étend au fur et à mesure du remplacement du matériel roulant.

Auparavant, les données issues des rames connectées étaient analysées de façon manuelle par une dizaine d’agents pour identifier les pannes et déclencher les opérations de maintenance correctives. « C’était un travail itératif, long et fastidieux, note Philippe de Laharpe. La croissance du volume de données obligeait à faire le tri pour ne traiter d’abord que les informations les plus critiques, comme les signaux de défaillance. » La première phase du projet big data vise à automatiser ces tâches de façon à avoir en temps réel une vision précise et complète de l’état du matériel. « Nous passons d’une maintenance corrective classique à une maintenance connectée, explique Philippe de Laharpe. Nous pouvons ainsi avoir une démarche proactive de maintenance en choisissant le bon technocentre où vont s’effectuer les réparations et en mobilisant les techniciens et moyens les mieux adaptés à cet effet. »

Le potentiel du machine learning

La SNCF recourt à un moteur d’analyse prédictive fondé sur le machine learning (apprentissage automatique). L’objectif est d’anticiper les défaillances en détectant les signaux faibles, annonciateurs de pannes à venir. Son potentiel a déjà été prouvé sur un démonstrateur. L’heure est à l’expérimentation pilote pour peaufiner le système avant sa mise en production, prévue en octobre. Le projet s’appuie sur la plate-forme big data de VSC Technologies, l’entité informatique de Voyages-sncf.com. Plusieurs algorithmes open source de machine learning ont été essayés. Le choix s’est porté sur celui des « forêts aléatoires » (« random forests »), paramétré pour coller aux besoins de l’application.

Selon Philippe de Laharpe, l’analyse de données ne prend qu’une ou deux minutes. La visualisation de l’état du matériel sur les consoles de supervision et l’envoi des alertes à la flotte de maintenance s’effectue quasiment en temps réel. « Ce qui est long, c’est la phase d’apprentissage, souligne-t-il. Nous devons entraîner le modèle de prédiction pour qu’il n’envoie pas de fausses alertes et pour qu’il ne laisse pas passer des pannes sans détecter. » Pour cela, la prise en compte des règles métier est primordiale. Le système va être entraîné à apprendre les scénarios de défaillance des trains en croisant les données de fonctionnement et celles de l’exploitation.

Avec quelle avance les pannes devront être anticipées ? La question reste posée. « Plus on a d’avance, mieux c’est pour la maintenance. Mais plus le taux d’erreurs est important, indique Héloïse Nonne, datascientist senior de Quantmetry. Il faudra trouver le bon compromis. » C’est l’un des enjeux de la phase d’expérimentation.

Le Transilien en chiffres

  • 6 200 trains
  • 3,2 millions de voyageurs par jour
  • 70 000 informations collectées par mois par rame
  • 40 000 variables suivies

Une analyse en moins de deux minutes

  • Toutes les trente minutes, les rames transmettent au serveur de la SNCF, par le réseau mobile, les données de fonctionnement, soit un volume d’environ 10 Go par mois.
  • Ces données sont croisées avec celles de l’exploitation, de la maintenance et de la météo, représentant un volume d’environ 24 Go.
  • L’ensemble est déversé dans un lac de données qui comprend un historique d’environ 200 Go. Le tout est ensuite analysé en moins de deux minutes pour détecter les pannes à venir.

Réagir à cet article

Créez votre compte L’Usine Connect

Fermer
L'Usine Connect

Votre entreprise dispose d’un contrat
L’Usine Connect qui vous permet d’accéder librement à tous les contenus de L’Usine Nouvelle depuis ce poste et depuis l’extérieur.

Pour activer votre abonnement vous devez créer un compte

Créer votre Compte
Suivez-nous Suivre Usine Nouvelle sur Facebook Suivre Usine Nouvelle sur Twitter RSS Usine Nouvelle

Les cookies assurent le bon fonctionnnement de nos sites et services.
En utilisant ces derniers, vous acceptez l’utilisation des cookies.

En savoir plus