Comment Owkin entraîne des modèles d'IA sans transférer les données avec le federated learning
Faire voyager les modèles d'intelligence artificielle plutôt que les données. C'est le principe du federated learning, ou apprentissage fédéré, qui protège ainsi la confidentialité des données. Surtout exploré dans le monde de la recherche, ce type de machine learning rentre peu à peu dans l'industrie. La start-up Owkin, spécialisée dans l’intelligence artificielle, en a fait son cœur de métier.
Owkin Connect, le logiciel de federated learning développé par la start-up, permet de relier sur une même plateforme différents partenaires. Depuis leurs propres interfaces, les data scientists vont pouvoir entraîner leurs modèles à partir de données auxquels ils n’ont pas accès. « Concrètement, un modèle va être initié, puis partagé avec tous les participants. Chacun va recevoir le modèle et procéder à un entraînement local, expose Sebastian Schwarz, responsable de stratégie produit chez Owkin. Une fois cette étape finie au sein des infrastructures et derrière les pare-feu, les paramètres des modèles locaux vont être envoyés à un agrégateur central – qui peut être l’un des centres ou Owkin – pour effectuer un moyennage. On aura alors un modèle qui sera une fusion des résultats locaux. »
Des données qui restent confidentielles
Ce processus va être répété une vingtaine de fois, renvoyant un modèle de plus en plus élaboré aux participants, jusqu’au modèle final. « Les participants obtiennent un modèle qu’il aurait été impossible d’avoir seul, plus prédictif et plus performant, affirme Romain Goussault, chef de produit. Par exemple, si le CHU de Nantes souhaite entraîner un modèle pour différencier les grains de beauté des tumeurs de la peau, mais ne le fait que sur des patients nantais, il lui manquera de nombreux types de peau plus clairs ou plus bronzés, et cela ne sera pas généralisable. »
Le fait de ne pas faire transiter les données représente un atout, notamment pour le traitement d’informations lourdes, qui peuvent donc rester sur place, mais surtout pour préserver la confidentialité des données. « Une de nos équipes tente de savoir s’il est possible de reconstituer une information à partir du modèle, mais pour l’instant c’est impossible. », assure Sebastian Schwarz.
Partenariats entre hôpitaux
Idéal donc pour mettre en place des partenariats entre des hôpitaux qui ne peuvent pas divulguer les informations de leurs patients, ou pour les entreprises qui souhaitent faire de la coopétition. Deux consortiums ont pour l’instant souscrit à ce système : HealthChain, un réseau d’hôpitaux et Melloddy, le regroupement de dix entreprises pharmaceutiques (dont AstraZeneca, Bayer, GSK ou encore l’institut de recherches Servier).
Owkin se concentre donc sur le domaine médical et le développement de technologies associées. HealChaine travaille par exemple sur un modèle capable de prédire la réponse à la chimiothérapie d’une patiente atteinte du cancer du sein à partir de lame de prélèvement. D’autres plateformes de federated learning sont en route, comme FATE (Federated AI Technology Enabler), conçue par le chinois Webank AI, axée sur la finance, mais les exemples d'applications sont encore rares.
« Le federated learning un sujet de recherche actif, qui reste très expérimental et, pour l’instant, assez décorrélé de l’industrie, confirme Sébastian Schwarz. Mais on peut aussi dire que c’était le cas du machine learning jusqu’à ces dernières années. »
SUR LE MÊME SUJET
- « Les systèmes de vision intelligents sont devenus indissociables de la robotique industrielle », pointe Hervé Henry, PDG de Siléane
- Des millions de modèles de machine learning pour accélérer le contrôle qualité chez Volkswagen
- Préhenseur biomimétique, capteurs autonomes, vision embarquée… Les Global Industries Awards dessinent l’industrie de demain
Comment Owkin entraîne des modèles d'IA sans transférer les données avec le federated learning
Tous les champs sont obligatoires
0Commentaire
Réagir