Décider quand arrêter l’immunothérapie chez des patients ayant un mélanome avancé avec maladie contrôlée (réponse partielle, complète ou stable)

Prof. Céleste LEBBÉ
Mise en ligne :
Développement d'un régime de traitement dynamique individualisé à partir de données de vie réelle
Les inhibiteurs des checkpoint immunitaires (ICI) (Nivolumab, Pembrolizumab, Ipilimumab+Nivolumab) ont révolutionné la prise en charge des patients atteints de mélanome avancé. Cependant, une utilisation prolongée expose les patients à des risques importants de toxicité et cela représente un coût pour la société. Nous souhaitons ainsi définir une règle dynamique d’arrêt de traitement en développant une stratégie individualisée d’arrêt chez des patients traités par ICI. Nous utiliserons un modèle d’apprentissage par renforcement (Renforcement learning).

La population étudiée comprend tous les patients atteints de mélanome avancés de MelBase, traités par ICI en première ligne. Pour chaque patient, un ensemble de variables de bases sera pris en compte, ainsi que des variables dépendantes du temps (réponse au traitement, décision d’arrêter ou poursuivre le traitement).
Pour identifier un régime de traitement dynamique optimal, une procédure récursive d’apprentissage est utilisé (Q-learning) afin d’estimer la décision de traitement optimal à chaque temps t défini (t= 6,12,18,24 mois après le début du traitement) en fonction des co-variables. L’approche consiste à débuter par le dernier point de décision (24 mois) et de trouver la règle optimale pour l’arrêt du traitement à ce temps.
La méthode récursive d’apprentissage permet ensuite de trouver les règles optimales aux temps précédents. L’algorithme utilisé permet d’obtenir pour chaque temps d’intérêt un ensemble de règles optimales grace à un modèle de régression basé sur les forêts aléatoires. Pour chaque temps, nous obtenons un modèle de régression en appliquant l’algorithme Random Forest, qui se base sur l’assemblage d’arbres de décisions afin de permettre de prédire la survie selon les co-variables les plus importantes. Chaque arbre contient une liste de décisions de traitement optimal spécifique selon les caractéristiques des patients : les règles changeant en fonction du moment, il s’agit d’une politique de traitement dynamique.
L’étape finale consiste donc à simplifier cette modélisation en obtenant un arbre de décision unique qui représentera une règle stationnaire, c’est à dire une règle qui applique les mêmes critères à tout moment donné. Cet arbre permet ainsi de classer la décision optimale d’arrêt selon les caractéristiques du patient et de sa réponse. La validation interne sera faite en émulant un essai cible pour comparer la stratégie individualisée à des stratégies non individualisées (arrêt du traitement à des temps fixes). De façon plus informative, nous proposerons surtout une validation externe de la stratégie dynamique sur les données d’une autre base (EUMELAREG).



Fiche du projet
Appel d’Offre |
Appel d’Offres Semestriel de la Société Française de Dermatologie Septembre 2024 |
Porteur du projet | Céleste LEBBÉ |
Attribution | 49,877 € |
Thématique |
Cancer cutané (principale thématique de recherche) Mélanome Traitement |
Structure(s) de recherche | |
Situation (Ville) | Oncodermatologie - AP-HP Hôpital Saint-Louis |