Logo réduit OCTOPIZE - pictogramme

Pression Systolique

Les données appréhendées dans ce cas d’usage couvrent le contexte très particulier de l’anonymisation de séries temporelles.

Type de données

Dans le cas Pression Systolique, les données utilisées sont des données de pression artérielle systolique artificielle. L’ensemble des mesures sont réalisées sur 20 patients sur une cinquantaine de timepoint et forment des séries temporelles. Il s’agit d’un type de donnée spécifique impliquant une dépendance entre les différentes valeurs. Les séries temporelles sont fréquemment utilisées notamment dans le domaine de la santé. Leur caractéristique temporelle les rend sujet à une ré-identification par individualisation.
  • 20 patients
  • 25 mesures / patient

Objectifs de l'anonymisation

  1. Dans un premier temps, le but est de rendre impossible la ré-identification des individus du jeu de données : objectif de protection des données personnelles.
  2. Dans un second temps, l’anonymisation des données de pression artérielle systolique devra conserver l’utilité des données en préservant les tendances, les patterns et éventuelles saisonnalités propres aux séries temporelles.
Les données de référence produites ont volontairement été séparées de façon bimodale pour s’assurer de la conservation de cette information à l’issue de la transformation en séries temporelles avatarisées.
Après transformation en avatars, on superpose les séries temporelles générées aux séries de références. Cette représentation permet de visualiser la qualité de l’information conservée en termes de clustering et de tendance.

Autre cas d'usage

Pathologie Cardiaque

Ce cas d’usage correspond à un exercice de classification. Le but étant de prédire une valeur bimodale, ici la présence de maladie cardiaque chez le patient, en fonction des autres paramètres renseignés dans le jeu de données.

Masse Graisseuse

Ce cas d’usage illustre une problématique d’apprentissage supervisé : la prédiction d’une valeur continue, ici le pourcentage de masse graisseuse, en fonction des autres paramètres du jeu de données.

Taxi New-Yorkais

Le cas d’usage « Taxi New-Yorkais » présente un contexte d’anonymisation de données spatio-temporelles. La difficulté réside dans la nature particulière de ces données dont la combinaison des dimensions spatiales et temporelles accentue le risque de ré-identification.
© Octopize 2021
crossmenuchevron-down