[Thèse / Phd 2020/ Pesto] Protection de la vie privée dans les réseaux sociaux par ML antagoniste

Mots clés : Réseaux sociaux, Vie privée, Attaques par inférence, Machine Learning (ML).

– Contexte :
La divulgation d’informations personnelles peut avoir de graves conséquences sur les utilisateurs des réseaux sociaux. Ces informations peuvent être exploitées pour effectuer des attaques de spam personnalisées, de vol d’identité, de clonage ainsi que des attaques Sybil. Elles pourraient causer de graves dommages aux entreprises telles que la dégradation de la réputation, la violation du droit d’auteur, la perte de propriété intellectuelle, etc. Les réseaux sociaux fournissent plusieurs solutions afin de préserver la vie privée des utilisateurs. Cependant, leurs principales lacunes sont généralement dues à des politiques de confidentialité compliquées, non uniformes, mises à jour périodiquement et inintelligibles, des chartes utilisateur longues et ambiguës et des interfaces de gestion de la confidentialité non ergonomiques. Bien que la plupart des réseaux sociaux proposent des services similaires (création de profils, pages et groupes, établissement de liens et interactions), leur gestion de la visibilité et la définition des liens (symétriques, non symétriques) sont différentes. Ces différences de conception peuvent être une source de confusion pour les utilisateurs de plusieurs réseaux sociaux qui ne se soucient pas de vérifier les paramètres de chaque réseau. De plus, les paramètres par défaut favorisent la diffusion publique mais augmentent le risque de fuite d’informations sensibles. Plus important encore, les réseaux sociaux ne protègent pas contre l’inférence d’informations implicites. Dérivées en corrélant différents attributs publics et / ou différents profils publics, comme dans la recommandation collaborative, ces informations sont en fait la principale source de profit du modèle commercial des réseaux sociaux car elles peuvent être exploitées pour la publicité ciblée. Par conséquent, les connaissances accumulées par les réseaux sociaux sur les utilisateurs vont au-delà de ce qui est publié et peuvent constituer une menace pour leur vie privée.

Description :
L’objectif est de concevoir un outil permettant aux utilisateurs d’auditer leurs profils dans les réseaux sociaux en matière de risques sur la vie privée. L’outil simulera des attaques par inférence sur des attributs sensibles. L’approche s’appuiera sur des représentations des données collectées dans des espaces vectoriels et des techniques d’apprentissage automatique. Un algorithme d’échantillonnage rapide et sélectif doit être utilisé afin de guider le collecteur vers les données les plus pertinentes et d’accélérer le processus afin que les audits puissent être effectués en temps réel. Les attaques par inférence d’attribut obtenues par simulation devraient également fournir des éléments explicatifs, de sorte que certaines contre-mesures adéquates soient finalement dérivées et mises en œuvre pour les utilisateurs.

Bibliographie :

1. Younes Abid, Abdessamad Imine, Amedeo Napoli, Chedy Raïssi, Michaël Rusinowitch: Online Link Disclosure Strategies for Social Networks. CRiSIS 2016: 153-168.

2. Younes Abid, Abdessamad Imine, Amedeo Napoli, Chedy Raïssi, Michaël Rusinowitch: Two-Phase Preference Disclosure in Attributed Social Networks. DEXA (1) 2017: 249-263.

3. Younes Abid, Abdessamad Imine, Michaël Rusinowitch: Sensitive Attribute Prediction for Social Networks Users. EDBT/ICDT Workshops 2018: 28-35.

4. Bizhan Alipour, Abdessamad Imine, Michaël Rusinowitch: Gender Inference for Facebook Picture Owners. TrustBus 2019: 145-160

Compétences recherchées :

Bac + 5 ou Master en Informatique.
Fort intérêt et bonne connaissances en algorithmique des graphes, probabilités et statistiques, et la fouille de données.
Programmation (python, java, …)

Contacts :

Abdessamad Imine (abdessamad.imine@loria.fr)

Michaël Rusinowitch (michael.rusinowitch@inria.fr)

Logo d'Inria