Comment nos données personnelles sont-elles exploitées ?

Vous le savez peut-être, à l’Observatoire, nous accordons une importance fondamentale à la pratique de la collecte des données dans le monde numérique. Ce sujet a été longuement abordé dans le livre « Faire face à l’addiction aux écrans », et vous pouvez vous y reporter pour un exposé plus exhaustif.

Nous considérons que cette collecte est à la base des dérives que l’on peut constater aujourd’hui sur internet en général, et sur les réseaux sociaux en particulier.

L’ironie de l’Histoire, c’est que jusqu’à la fin des années 90, ces données personnelles n’intéressaient personne. On les appelait alors les « surplus comportementaux ». Et c’est Google qui, en premier, en a compris l’importance.

Pendant très longtemps, nos données personnelles ont été pillées et exploitées dans l’indifférence la plus complète ; et lorsque nous avons commencé à en prendre conscience, nous n’en avons pas immédiatement compris l’enjeux. Nous n’avons pas compris à quel point ces informations personnelles pouvaient avoir de la valeur.

Pourtant, depuis 2018 et l’entrée en vigueur de la loi RGPD qui vise à protéger nos données personnelles, on perçoit l’étendue du vol dont nous avons été victimes durant des années. Cette règlementation impose en effet à chaque site internet de solliciter l’accord de l’internaute pour installer des cookies sur son ordinateur et pour collecter ses données personnelles. Certains sites vous refuseront l’accès à leur contenu si vous refusez ces cookies et ils vous proposeront alors un accès payant en compensation, montrant bien que l’exploitation de vos données personnelles peut être (et a vraisemblablement été) une source de revenu.

Alors, comment sont exploitées ces données et que disent elles de nous ? Difficile de le savoir exactement, mais la masse incroyable de données collectées depuis 25 ans permet aujourd’hui aux géants du numérique de dresser des profils psychologiques de nous d’une extrême précision.

C’est ce qu’avait montré un chercheur, Michal Kosinsky, en utilisant des données collectées via Facebook. C’est d’ailleurs les recherches de Kosinsky qui semblent être à l’origine de manipulations de masse comme celles révélées lors du scandale lié à Cambridge Analytica.

Kosinsky, a travers une série d’expériences passionnantes, nous montre les informations qui peuvent être tirées de nos traces numériques. Notons que ces expériences ont déjà quelques années et que ces résultats sont probablement largement dépassés.

« A partir de 70 likes, les réseaux sociaux nous connaissent mieux que nos amis, à partir de 300 likes, ils nous connaissent mieux que nous-mêmes ». C’est une des premières conclusions de Kosinsky.

Le chercheur a montré que vos traces numériques permettent de prédire à 95% si vous êtes caucasien ou afro-américain, à 93% votre sexe, à 88% si vous êtes gay, à 85% si vous êtes républicain ou démocrate, à 82% chrétien ou musulman, à 75% si vous êtes lesbienne.

Aimer certains groupes, sujets ou objets sociaux permet de prédire votre personnalité : avoir « liké » des publications contenant les mots « orages » ou « science » est un témoin d’un quotient intellectuel élevé alors qu’avoir manifesté un intérêt positif pour « Séphora » ou pour le groupe « j’aime être mère » reflète plutôt une faible intelligence. Avoir « liké » la page du Wu-Tang Clan (un groupe de rap) ou celle de « Shaq » (un ex-basketteur américain) est prédicteur d’hétérosexualité masculine.

Par ailleurs, l’analyse de nos photos permet de déterminer à 81% pour les hommes et 71% pour les femmes leur orientation sexuelle. La taille du front, de la mâchoire et du nez, ainsi que la position des sourcils en seraient la raison.

Le vocabulaire que vous employez dans vos publications est également riche de renseignements : les personnes agréables utilisent beaucoup d’articles, les introvertis et les personnes peu consciencieuses aiment manifester leur différence, et les individus ayant un haut niveau de névrosisme utilisent préférentiellement des mots relatifs à des émotions négatives. Ces derniers ainsi que les personnes agréables utilisent davantage de pronoms personnels à la première personne du singulier, tandis que les extravertis emploient des mots significativement plus longs.

D’autres auteurs avaient montré auparavant que les femmes employaient plutôt la première personne du singulier, se référaient aux interactions sociales et adoptaient un langage volontiers déictique. Quant aux hommes, leurs propos sont riches d’articles, d’affirmations, ainsi que de mots formels et informationnels. Les personnes âgées usent volontiers de pronoms pluriels, du futur, témoignent davantage d’émotions positives, emploient peu la première personne du singulier et peu de négations.

Concernant l’âge des participants, certains mots en semblent évidemment les témoins, tels que « collège », « lycées », « semestre », « fac », « fils » ou fille », mais d’autres expressions moins attendues en sont révélatrices comme « ivre » très employé entre 19 et 22 ans et « bière » principalement utilisé entre 23 et 29 ans.

On le comprend, poster une publication ou une photo sur les réseaux sociaux, montrer son intérêt pour un groupe, une marque ou un évènement, faire défiler son fil d’actualité plus ou moins vite, c’est donner beaucoup d’informations aux plateformes du numérique sans que nous en soyons conscients.

Ces données sont ensuite exploitées pour réaliser des publicités ciblées, extrêmement performantes, mais cela fera l’objet d’un autre article…

Pour en savoir plus :  Un Monde 5 Étoiles – France TV