Dans ce cas d’usage, les données personnelles utilisées représentent un échantillon de 1 451 721 courses de taxi réalisées à New-York en 2016.
Le jeu de données, initialement pseudonyme, présente un risque de ré-identification élevé représenté par la combinaison d’informations spatiales (coordonnées GPS de départ et d’arrivée) et temporelles (heures de départ et d’arrivée). Dans ce contexte la possibilité pour un attaquant d’inférer le lieu de résidence d’un individu à partir des informations à sa disposition représente un risque.
Dans ce cas d’usage, on identifie plusieurs objectifs.
Ces informations doivent pouvoir être conservées dans le respect de la vraisemblance topographique des données d’origine. En effet les avatars ne doivent pas pouvoir prendre de coordonnées GPS impossibles telles que le bras de l’East River ou Central Park.