Données et services géolocalisées respectueux de la vie-privée
Published in UQAM, 2021
Contexte
Le monde d’aujourd’hui qui fait face à une explosion de la quantité de données générées, et collectées. Ce dernier point n’a échappé à personne et l’engouement pour l’intelligence artificielle y contribue largement. Malheureusement les thématiques non-fonctionnelles que sont la sécurité et vie privée sont trop souvent laissées de côté. Pourtant, il est essentiel de trouver un compromis entre protection et utilisation des données personnelles, utilité et confidentialité des modèles. En effet, la société et les individus qui la composent ont tout à gagner à une utilisation respectueuse des données individuelles : meilleurs services, investissements sociétaux plus efficaces, vie privée et démocratie protégées. Le sujet présenté ici repose sur l’usage de techniques de chiffrement homomorphe, de calcul multipartite sécuritaire et de confidentialité différentielle pour répondre à ces enjeux et cherche à appliquer ces avancées le champ applicatif de la mobilité.
Mobilité et données géolocalisées
L’avènement des dispositifs personnels équipés de capacités avancées de positionnement, tels que les téléphones intelligents, a conduit à la collecte à large échelle de données de mobilité individuelles. Ces données ont une valeur importante, pour la recherche scientifique, pour la société en général et pour l’économie. De plus, le mouvement d’ouverture des données amène les organisations publiques à ouvrir l’accès à ces grandes masses de données de mobilité, ce qui soulève des problématiques importantes en termes de respect de la vie privée. En effet, apprendre la localisation d’un individu est l’une des plus grandes menaces contre sa vie privée, car il est possible de dériver beaucoup d’autres informations personnelles concernant cet individu à partir de celle-ci.
Les résultats issus de cette Maitrise alimenteront directement ce domaine applicatif, par exemple en permettant d’offrir des services géolocalisés équivoques, utilisant un chiffré de la position de l’utilisateur ; ou encore en offrant la possibilité de synthétiser une base de donnée de mobilité avant de l’ouvrir au public pour assurer qu’aucune fuite de localisation d’utilisateurs réels ne surviendra. Il est important de reprendre le contrôle de ces données, que ce soit grâce à des géo-services homomorphes ou à des bases de données synthétisées ouvertes.
Cryptographie, Sécurité et Confidentialité
Un schéma de chiffrement homomorphe (HE) permet de calculer une fonction (ou un circuit) arbitraire sur des données chiffrées. De pure vue de l’esprit, le HE est devenu, ces dernières années, grâce notamment aux avancées concernant le calcul sur les réseaux Euclidiens, un outil utilisable en pratique, même si son efficacité en terme de temps de calcul n’est pas encore satisfaisante. En particulier, des schémas de chiffrement partiellement homomorphe, dont le nombre d’opération dans le monde des chiffrés est paramétré, ont permis des avancées notables dans le monde des mécanismes pour la protection de la vie privée.
Les techniques du calcul multipartite sécuritaire (MPC) reposent quant à elles sur l’utilisation d’outils cryptographiques (tels que le partage de clé secrète, les transferts inconscients, ou encore du HE). Le principe sous-jacent est que plusieurs participants calculent une fonction de leurs entrées secrètes et n’en apprennent que le résultat. Le MPC est également utile pour construire des primitives de protection de la vie privée.
La confidentialité différentielle (DP), quant à elle, est un modèle de vie privée qui propose une métrique qui mesure l’anonymisation de données ainsi que des mécanismes qui permettent d’introduire du bruit dans les données, et ce afin d’atteindre un certain niveau de cette métrique. Jusqu’à il y a peu de temps, cette technique a été essentiellement réservée aux bases de données, afin d’empêcher les attaques de ré-identification, mais son utilisation dans le cadre de mécanismes de protection en-ligne commence à être envisagée.
Objectifs de la Maitrise
Ces techniques sont à la pointe de la recherche actuelle en protection de la vie privée. Dans cette maitrise, il s’agit de les étudier, de les développer et de les utiliser conjointement afin de lever les verrous de la protection de la vie privée, en général mais aussi en particulier appliquée au domaine des données géolocalisées.
Contact
Me contacter (killijian.marc-olivier.2@uqam.ca) par courriel pour discuter de ce sujet et de vos intérêts.