AI for Health - Un domaine florissant au domaine de la santé
L’intelligence artificielle appliquée au domaine de la santé est un domaine florissant et de nombreux acteurs du domaine s’étaient donné rendez-vous ce mardi 10 novembre 2020 pour présenter, partager et échanger sur leur travail, leur projet, leur recherche. Au cours des dernières années, des collaborations, voire des écosystèmes, se sont organisés pour tenter de répondre à des problématiques médicales par la data science. D’après le think tank de l’EIT, dont certains rapporteurs du projet ont donné une interview lors de cette conférence, la maitrise de la pluridisciplinarité est la clé de la réussite dans ce domaine, et cette maitrise est conditionnée par une intense collaboration entre médecins et ingénieurs. Les data scientists ne peuvent pas résoudre les problèmes seuls, et doivent rester humbles face à la complexité des problèmes. Les médecins, quant à eux, doivent mettre toute leur expertise au service de cette collaboration.
D’une part, tout projet d’intelligence artificielle requière des données et la mise en place d’environnements de collecte et de gestion des données. Les enjeux actuels à ce niveau concernent la complémentarité et l’interopérabilité des données. En effet, pouvoir mixer les sources et les types de données provenant de différents domaines médicaux promet d’améliorer la pertinence des modèles d’IA. Cependant, exploiter un maximum de données, avec une grande diversité de source géographique et médicale, nécessite d’uniformiser les bases et les systèmes de gestion afin d’améliorer l’interopérabilité des données à l’échelle nationale, européenne... voire mondiale ?
D’autre part, la mise sur le marché des outils développés reste souvent un défi considérable car cela requiert des moyens techniques pour le déploiement des solutions. Pour que ces coûts soient consentis par les pouvoirs publics ou les entreprises de santé, les cliniciens doivent être convaincus de l’intérêt et de la justesse du modèle. L’explicabilité et l’interprétabilité des modèles et de leurs prédictions est un des grands enjeux actuels pour gagner la confiance des médecins et qu’ils considèrent les modèles développés comme des aides à la décision fiables et bénéfiques à leur pratique. Chaque maillon de la chaîne de la réalisation d’un projet d’IA appliquée à la santé constitue donc un défi à relever et cette conférence a montré de beaux exemples de gestion, collaboration et innovation qui donnent du sens à l’IA et sont aussi inspirants les uns que les autres.
Recenser, collecter, structurer et sélectionner les individus et les variables nécessaires au développement de modèles d’IA sont les premières étapes de tout projet et s’avèrent souvent être les plus complexes et les plus chronophages. Diversifier les types de données consiste à exploiter tant des données structurées (tabulaires) que des données non structurées (champs texte) et des images. De véritables écosystèmes se développent afin de collecter des données provenant de différents hôpitaux, à l’image du lymphoma data hub XP présenté par Salim Kanoun (IUCT Oncopole) visant à récolter des images de lymphomes pour améliorer le traitement du cancer du sang, 7ème cancer le plus répandu dans le monde existant sous plus de 80 formes. Aussi, la communauté s’accorde à dire que 80% de l’information concernant les patients est contenue dans des champs textes, correspondant à des prises de notes de médecins et infirmiers. Les projets de traitement du langage fleurissent pour structurer ces données afin de pouvoir les exploiter. Lucien Roquette, présentant l’application Dr Warehouse, indique notamment que les résultats d’études peuvent différer considérablement selon si on considère les données des champs texte ou non. L’extraction automatique des informations est également au cœur de l’activité du groupe Docgestio et du développement de sa solution Synthèse-IA. Selon cette équipe, la fouille et l’extraction doivent rester basiques et générales pour automatiser des tâches médico-administratives alors qu’il faut effectuer une extraction ciblée et identifier en amont les paramètres recherchés lorsqu’on se place dans le cadre d’applications spécifiques. Sélectionner les paramètres pertinents est la problématique qui émerge après avoir collecté et consolidé les données. Cette problématique est aujourd’hui bien gérée avec des images; le deep learning a permis d’automatiser l’identification des pixels importants et discriminants d’une image, d’où l’essor des applications d’IA dans l’imagerie médicale ces dernières années. Nous sommes même arrivés à l’étape de la démocratisation du deep learning pour la vision par ordinateur comme en témoigne le développement de l’application IMJOY par l’institut Pasteur présentée durant cette conférence. Ces méthodes sont aujourd’hui appliquées à toutes les échelles de l’imagerie médicale, de la radiographie d’un organe entier à l’étude de cellules en passant par l’imagerie de vaisseaux sanguins. En revanche, dans le cadre de données tabulaires, la problématique est différente et les data scientists se retrouvent souvent face à des “fat data”, contenant beaucoup plus de variables que d’individus, plutôt que les “big data” qui leur étaient promises. Chloé Agathe Azencott (CBIO – Mines Paris) nous a montré que cela représente un véritable sujet de recherche dans le cadre académique et Claire Behar (Excelya), décrivant un projet concret, nous a montré que la sélection des variables importantes apporte précision et interprétabilité à un modèle de machine learning.
Le problème de la disponibilité des données réglé, il convient de définir une problématique clinique claire et d’identifier ce que l’IA doit apporter. Les applications de l’IA à la santé sont variées et on peut distinguer 4 types d’applications pouvant aider à différents moments clés du parcours de soin d’un patient pour fournir :
1. une aide à la compréhension d’une maladie,
2. une aide à la décision, au diagnostic,
3. une aide à la prescription d'un traitement personnalisé,
4. un outil de monitoring et de prédiction d’événements.
L’aide au diagnostic se développe beaucoup grâce à la vision par ordinateur, notamment dans le diagnostic des cancers, mais également pour des malades immunodéficients via l’analyse d’images de cellules, comme nous l’a présenté Mickael Ménager (Institut des maladies génétiques) qui exploite les méthodes de clustering pour identifier des sous-groupes de cellules et donc de patients.
Concernant la personnalisation du traitement, Claire Behar (Excelya) et Karissa Lozenski (Bristol Myers Squibb) nous ont convaincu que le machine learning et les bio-statistiques offrent deux approches complémentaires permettant de mieux comprendre l’adéquation d’un patient avec un traitement de l’arthrite rhumatoïde, maladie auto-immune affectant plus de 20 millions de personnes dans le monde, afin de prescrire le traitement le plus adapté au patient. Pour la médecine générale, Clément Goehrs (Synapse Medicine) nous a présenté un outil permettant d’accompagner les médecins dans la rédaction de leurs prescriptions, en contrôlant les contre-indications entre médicaments prescrits en même temps, et en vérifiant l’adéquation du profil du patient aux médicaments prescrits. Ces outils peuvent éviter des erreurs qui pourraient être fatales au patient et permettent de gagner du temps pour trouver le traitement efficace.
Enfin, les cas d’usage concernant la surveillance et la prédiction d’événements dans le suivi d’une maladie sont également nombreux et on peut citer le développement de chatbots vocaux par Amazon pour monitorer l’évolution de la bronchopneumopathie chronique obstructive, le monitoring des signaux enregistrés chez des patients épileptiques pour prédire les crises (Predilepsy), ou encore le suivi d’un greffon de rein et la prédiction de rejet à long terme (Cibiltech).
La conférence IAforHealth ne manquait pas de présentations de démarches innovantes, et de belles collaborations médecins-data scientists et partenaires publics-privés. C’était un événement inspirant, source d’espoir, et communiquer sur ces applications de l’IA utilisée à bon escient ne peut que susciter des vocations chez des ingénieurs en devenir ou accomplis. Dans le contexte de l’UTC, l’IA appliquée au domaine médical pourrait susciter l’intérêt des étudiants et diplômés des filières fouille de données et décisionnel de la branche informatique, ou biomédical de la branche biologique. Si l’on est encore loin de l’avatar digital du patient et de modèles nourris et réentraînés de façon automatique et continue par des données issues d’objets personnels connectés, le domaine de l’IA appliquée à la santé est en effervescence, tant au regard des progrès techniques et scientifiques que des évolutions juridiques et des régulations. Pour ne jamais perdre de vue le sens de ces innovations, considérer les enjeux éthiques doit être au cœur des préoccupations de chacun, et devrait peut-être devenir plus présent dans la formation des acteurs de ce domaine.