Modélisation et analyse des parcours de soins dans le Système National des Données de Santé (SNDS) – Article de Jules Chassetuillier (stève consultants)

Le Système National des Données de Santé (SNDS) constitue une source d’information très importante et d’une grande valeur pour l’étude des parcours de soins des patients. Les parcours des patients sont complexes et incluent de nombreuses consommations de soins, notamment les hospitalisations, consultations, dispensations de traitements et de dispositifs médicaux, actes médicaux et biologiques, qui sont toutes disponibles dans les données du SNDS. L’étude des parcours de soins est un enjeu majeur et peut avoir de nombreux objectifs, par exemple comprendre et optimiser la prise en charge de patients atteints d’une pathologie chronique ou décrire les modalités de prise en charge thérapeutique de certains patients.

La mise en œuvre de méthodes issues de l’Intelligence Artificielle (IA) permet de caractériser et visualiser les parcours de soins et ainsi obtenir des données interprétables.

Pour cela, 2 étapes sont nécessaires :

Etape 1 : modéliser les parcours de soins des patients, c’est-à-dire utiliser des méthodes pour synthétiser l’information afin d’avoir une représentation commune et comparable entre les patients

Etape 2 : analyser et classifier les parcours de soins par des méthodes de clustering et les représenter graphiquement

stève consultants intègre fréquemment ce type d’analyse dans ses projets RWE à partir notamment des données du SNDS. Nous proposons ici de présenter deux approches de modélisation des parcours de soins, ainsi que des méthodes de clustering et visualisation de ces parcours de soins. Elles peuvent être utilisées de façon concomitante, ou séparément en fonction des besoins et des objectifs de l’étude.

Etape 1 : Modélisation des parcours de soins

L’objectif est de trouver des parcours de soins qui caractérisent une population.

Plus les parcours de soins contiennent des types de consommation de soins différents (hospitalisations, consultations, dispensation d’un médicament, etc.), plus ils sont variés ; il est donc difficile de trouver des parcours de soins « types ». Différentes approches peuvent alors être envisagées.

Modélisation MCSA (Multichannel Sequence Analysis)

Les différentes consommations de soins peuvent être étudiées séparément pour extraire par exemple des séquences de traitement d’une population, ou des séquences de consultations médicales. On peut ainsi obtenir des séquences caractéristiques d’une population en fonction de différentes consommations de soins. C’est ainsi que fonctionne la méthode MCSA.

Cette méthode assimile les parcours de soins à des séquences de consommations de soins sur une période de suivi commune à tous les patients. Chaque séquence correspondant à une consommation de soins d’intérêt (hospitalisations, consultations, etc.).

Illustration

La figure ci-dessous représente la modélisation MCSA chez deux patients (A et B), en considérant :

  • quatre types de consommation de soins (hospitalisations, consultations, traitements d’intérêt et dispositifs médicaux d’intérêt)
  • un découpage du temps (6 mois au total) par période de 1 mois

Interprétation : plus la couleur est soutenue, plus la consommation de soins est importante le mois considéré, le gris représentant l’absence de consommation.

Exemple de parcours de soins – modélisation MCSA

Modélisation MSV (Modélisation en Séquences de Visites)

Les différentes consommations de soins (hospitalisations, consultations, etc.) peuvent être étudiées conjointement, à des moments précis du parcours (à chaque occurrence d’une consommation de soins par exemple), comme dans la méthode MSV.

Cette méthode permet d’étudier l’enchaînement de différentes consommations de soins au cours de la période d’étude.

À la différence de la modélisation MCSA, les consommations de soins d’un patient sont regroupées dans une seule séquence appelée « séquence de visites ». En raison de la diversité des parcours de soins des patients, les séquences de visites peuvent être très différentes d’un patient à l’autre, tant par la nature et que par le nombre de consommations de soins au cours de la période d’étude.

L’étude de l’évolution conjointe des consommations de soins au cours de la période d’étude permet de déterminer des parcours de soins caractéristiques de la population. Cette méthode apporte une vraie précision sur la nature des consommations de soins étudiées, et permet de visualiser l’évolution de ces consommations. Elle nécessite cependant un travail préalable de catégorisation des consommations de soins (étude qualitative), et demande des temps d’exécution important liés à la diversité des parcours de soins. Seul l’enchaînement des différentes consommations de soins est étudié. Cette méthode ne prend pas en compte l’intervalle de temps entre ces consommations de soins.

Illustration

La figure ci-dessous représente le parcours de soins de deux patients (A et B), à travers la modélisation MSV. Quatre consommations de soins sont considérées ici, et étudiées simultanément.

Exemple de parcours de soins – modélisation MSV

En résumé

La méthode MCSA permet de visualiser facilement l’évolution des différentes consommations de soins au cours du temps. Elle manque cependant de précision sur la nature des consommations de soins quantifiées par période de temps. Chaque consommation de soins est étudiée séparément, par conséquent il n’y a pas de vision globale du parcours de soins des patients.

La méthode MSV apporte une précision sur les consommations de soins étudiées, et permet de déterminer des profils d’enchaînements de consommations chez les patients. Elle ne prend néanmoins pas en compte l’évolution temporelle des consommations de soins.

Etape 2 : Clustering et visualisation des parcours de soins

Deux types d’informations sont souvent recherchées lors de l’analyse de parcours de soins :

  • Y-a-t ’il des patients qui ont des parcours de soins similaires ?
  • Existe-t-il un parcours de soins « type » chez les patients considérés ?

Pour répondre à ces problématiques, des méthodes de clustering et de visualisation sont mises en oeuvre.

Clustering des parcours de soins

Les analyses de type clustering ont pour but d’obtenir une partition en regroupant les parcours de soins similaires au sein du même cluster.

On souhaite obtenir une partition au sein de laquelle les parcours de soins d’un cluster sont proches les uns des autres, et éloignés des parcours de soins des autres clusters. La notion de similarité des parcours de soins est centrale dans les analyses de clustering.

De nombreuses méthodes de clustering peuvent être utilisées dans le cadre d’une étude de parcours de soins (classification hiérarchique, algorithme des k-médoides…). Le choix d’une méthode dépend de la problématique rencontrée. Les clusters obtenus sont ensuite représentés selon différentes approches.

Visualisation des parcours de soins

De nombreuses représentations graphiques permettent de visualiser les clusters de parcours de soins.

Sunburst

La représentation sunburst par exemple permet de visualiser les séquences constitutives de chaque cluster, et d’apprécier certaines tendances.

Les différents clusters issus d’une analyse des dispensations d’un traitement d’intérêt à différentes doses au cours du temps sont représentés ci-dessous :

Dispensations au cours du suivi (sunburst)

On peut noter que les patients du premier cluster ont des séquences de traitement courtes, qui se terminent souvent par un arrêt de traitement. Les patients du cluster 5 ont des séquences de traitement plus longues, et à des doses élevées (> 150 mg pour la plupart).

Chronogramme

Les chronogrammes permettent de représenter, à chaque unité de temps en abscisse (ou à chaque consommation de soins), la proportion cumulée des différentes consommations de soins. Il permet d’étudier l’évolution des différentes consommations au cours de parcours de soins.

Le chronogramme ci-dessous représente l’évolution des doses dispensées d’un traitement d’intérêt par cluster.

Dispensations au cours du suivi (chronogramme)

Cette représentation permet de constater que les arrêts de traitement apparaissent essentiellement dans le groupe 1, et sont peu fréquents dans les autres groupes. On observe que les patients du groupe 5 ont des proportions de doses élevées (> 150mg) importantes tout au long de leurs dispensations. Les patients du groupe 4 ont en revanche une majorité de doses faibles (< 60mg).

On constate sur ce genre de représentation qu’au bout d’un certain nombre de dispensations, les nombre de patients devient de plus en plus faible car leur séquence de traitement s’achève et les graphiques deviennent plus difficiles à interpréter. Par exemple, on voit pour le groupe 3 qu’à partir d’environ 40 dispensations, le graphique devient moins précis. Il convient en général de n’interpréter ou représenter qu’une partie du chronogramme.

Parcours de soins caractéristiques

Il est également possible de représenter les parcours de soins caractéristiques de différents clusters.

Par exemple, les parcours de soins caractéristiques de 3 clusters d’une population, obtenus avec la méthode MSV sont représentés ci-dessous.

Parcours de soins caractéristiques (séquences de visite)

On peut voir que les patients du Cluster 1 vont enchaîner deux consultations médicales, parfois avec un séjour hospitalier intercalé, puis vont avoir deux dispensations de traitement d’intérêt puis une délivrance de dispositif médical.

Les diagrammes de Sankey permettent de visualiser les flux, et sont donc utiles pour visualiser l’évolution des parcours de soins au cours du temps.

Par exemple, des parcours de soins de patients insuffisants cardiaque par un diagramme de Sankey sont représentés ci-dessous :

Parcours de soins de patients insuffisants cardiaques (Diagramme de Sankey)

Ces différentes méthodes de visualisation sont des outils simples à mettre en œuvre qui peuvent être combinés. Elles permettent d’obtenir des représentations des parcours de soins caractéristiques des patients considérés à partir de méthodes de clustering.

Conclusion

L’étude des parcours de soins nécessite de définir précisément la nature des consommations de soins considérées, et de modéliser les parcours de soins en accord avec la problématique considérée.

Les outils issus de l’Intelligence Artificielle (IA) permettent d’analyser les parcours de soins, tout en intégrant leur complexité, afin de mieux les comprendre  et d’améliorer la prise en charge des patients.

Article rédigé par Jules Chassetuillier, Statisticien/Data scientist chez stève consultants.

Partager cet article :