[Invité] – Big data, big money : qui profite de l’explosion des données ?
Est-ce réel ?
Bernard Goldbach/Flickr, CC BY
Jérôme DA-RUGNA, Pôle Léonard de Vinci – UGEI et Gaël CHAREYRON, Pôle Léonard de Vinci – UGEI
Nous en sommes certains : la data va révolutionner le monde, mais qui va vraiment en profiter ? En 2011, la société de conseil Gartner indiquait : « Les informations sont le pétrole du XXIe siècle, et l’analytique en est le moteur à combustion ». Filant cette métaphore, chacun se pose légitimement la question de qui seront demain les tycoons de la donnée… Plus encore, quelles seront les méthodes des géants d’aujourd’hui et de demain : seront-elles, comme les géants du pétrole en leur temps, à la limite de la légalité ? Aura-t-on des marées noires de data ? Il y aura-t-il collusion avec nos politiques ?
Le pétrole du XXIe siècle
Notre société, notre économie, nos modes de vie vont être profondément modifiés par la data qui porte aujourd’hui une bonne partie de la croissance des pays occidentaux. En ce sens, il s’agit bien du pétrole du XXIe siècle. Mais là où un propriétaire s’enrichissait grâce à un puits de pétrole sur ses terres, qu’en est-il de nos données ? Quelle est leur valeur ? Va-t-elle nous revenir ? Chaque jour, chaque instant même, chacun d’entre nous génère de nombreuses données personnelles ou professionnelles, données appartenant à lui-même, à son entreprise ou encore publiées sur Internet ou récoltées par des entreprises tierces.
Les outils pour protéger la vie privée, la propriété, le droit à les connaître, modifier, supprimer sont multiples : propriété intellectuelle, CNIL, droit français, droits internationaux… Mais qu’en est-il de la valeur de ces données ? Les informations issues de votre montre connectée, de votre smartphone mais aussi vos photographies, vidéos, vos factures numériques, les rendez-vous de votre agenda parlent de vous à votre place. Elles définissent, bien plus que vous ne le pensez, ce que vous êtes, recherchez, appréciez…
Vos relations et commentaires sur Facebook permettent d’inférer de nombreux traits de votre personnalité… Y compris votre orientation sexuelle. Plus vous êtes présents sur la toile, plus le profil dont disposent les entreprises sera précis et ciblera vos attentes. Votre profil n’est pas seulement ce que vous entrez dans vos informations personnelles : il est le fruit d’algorithmes complexes élaborés par des experts du machine learning et du big data. Ainsi, certains articles affirment que votre banque peut prédire votre divorce avant même que vous n’ayez entamé des démarches ! Il est évident aujourd’hui que nos données sont aujourd’hui la valeur principale des entreprises de l’Internet.
La valorisation à tout prix et la tentation de tricher
C’est pourquoi de nombreuses sociétés vous proposent des services gratuits de mail, de partage de données. La donnée n’a en effet de valeur que si elle est massive. Disposer de services permettant une collecte mondiale des usages des internautes est vital pour les GAFAM – Google, Apple, Facebook, Amazon et Microsoft – passés maîtres dans la valorisation et la monétisation de nos données personnelles.
Dans cette course effrénée, les algorithmes qui personnalisent et améliorent nos services préférés peuvent être parfois considérés comme discutables d’un point de vue déontologique, voire contraire à la loi. Dans le contexte de Machine Learning appliqué à des données personnelles, les entreprises sont en effet systématiquement confrontées à de sérieuses questions éthiques et de législation. De nombreux exemples démontrant la complexité de contrôler et de faire respecter le droit. Citons par exemple l’enquête lancée en mai 2017 contre Uber et son algorithme Greyball lui permettant de détecter les policiers et d’ainsi échapper aux contrôles. On pourrait aussi citer les expérimentations menées en grand secret par Facebook et les collisions Facebook-Tinder malvenues. La justice et la police se retrouvent confrontées aux algorithmes et sont encore aujourd’hui démunies face à ces dossiers complexes défiant les règles traditionnelles de nos sociétés.
De futures marées noires de données
Si les data sont le nouveau pétrole, que se passe-t-il lorsque les données s’échappent ? Que ce soit l’œuvre de pirates qui volontairement dérobent des données ou qu’il s’agisse de fuites accidentelles, nul n’est à l’abri. L’actualité regorge de révélations d’incidents de grande ampleur. On peut citer le vol de 412 millions de comptes du site de rencontre AldultFriendFinder en 2016 ou alors une erreur qui a permis la dispersion d’informations confidentielles sur les membres du G20. On pourrait encore évoquer d’autres exemples pour illustrer ces fuites massives mais un danger bien plus grand guette les utilisateurs.
Ainsi, nombre de sites font commerce de vos données de connexion mais, au-delà de la vente, les informations sont agrégées à partir de différentes sources afin de les rendre plus pertinentes pour les pirates. Les règles élémentaires de sécurité dictent aux utilisateurs de ne pas utiliser le même identifiant de connexion et mot de passe sur différents sites. Mais honnêtement ne vous est il pas arrivé de déroger à cette règle ?
Si tel est le cas, des pirates ont pu récupérer différentes informations à partir de plusieurs leaks (fuites) afin de reconstruire votre(vos) identité(s) numérique(s). Ces informations peuvent permettre de pénétrer dans d’autres systèmes d’information ou d’utiliser vos identifiants pour tromper vos relations personnelles ou professionnelles.
Au-delà des leaks connus, combien d’entreprises n’ont pas communiqué sur les fuites de données ou, plus grave encore, combien ne savent pas que leurs données sont compromises ? Les entreprises peuvent être victimes de tentatives de rançon. En mars 2017, un groupe de hackers a affirmé pouvoir compromettre des centaines de milliers de comptes iCloud si une rançon n’était pas versée. Bluff ou réalité ? Apple n’a communiqué ni sur ce sujet ni sur le versement ou non de la rançon. Et, bien sûr, il y a eu l’affaire WannaCry.
Les marées noires sont visibles sur nos plages, les fuites de données ne le sont pas et sont souvent cachées au grand public. À l’heure où vous lisez ces lignes, il n’est pas impossible que des pirates regardent vos photos de vacances sur Google Drive en écoutant votre playlist de Deezer (rassurez-nous, ce n’est pas le même mot de passe…) Tel un oiseau qui essaie de s’extirper du pétrole dans lequel il est englué, serez-vous capable de survivre à la fuite de toutes vos données ?
Un enjeu géopolitique fort
Ne soyons pas naïfs : maîtriser la donnée est un enjeu géopolitique primordial. On a souvent tendance, et les grands groupes y participent, à croire qu’Internet, le cloud et tous les outils autour de la data échappent à toute notion de nationalité. Or, à regarder de plus près, les États-Unis, et la Californie en particulier, sont hégémoniques sur nos données. En caricaturant à l’extrême, à la question « Qui profite de l’explosion de nos données ? », une réponse pourrait être : la Silicon Valley.
Pour se convaincre de l’aspect géopolitique des données, notons par exemple la décision de la justice américaine, confirmée en appel le 19 avril dernier, d’obliger Google à fournir les données stockées en dehors des États-Unis. La Chine l’a aussi bien compris en menant une politique de protectionnisme déterminée qui a permis aux BATX (Baidu, Alibaba, Tencent et Xiaomi) de prospérer face aux GAFAM. Les BATX, fortement soutenus par l’État chinois, ont maintenant pour objectif de conquérir le marché international et l’Europe en particulier.
OPEP de la data
Cette dernière semble quant à elle coincée dans une vision désuète de l’informatique et de l’Internet. Certes, les bénéficiaires de l’explosion des données seront nombreux en Europe : les opérateurs téléphoniques et les ESN (entreprises de services du numérique) : ils profiteront de cette révolution. Et nous n’oublierons pas les nombreuses start-up qui émergent autour de l’Internet des objets et de l’analyse des data. Mais, ne nous y trompons pas, les seuls et véritables bénéficiaires de l’explosion des données seront ceux qui les posséderont au sein de leurs data-centers ! Les GAFAM et autres BATX créeront-ils, grâce à leurs infrastructures, l’OPEP de la data qui fixera le cours de vos données sur les marchés mondiaux ?
Jérôme DA-RUGNA, Directeur adjoint de l’ESILV – Ecole Supérieure d’Ingénieurs Léonard de Vinci, Pôle Léonard de Vinci – UGEI et Gaël CHAREYRON, Responsable du département d’enseignement et de recherche Informatique, Big Data et Objets connectés de l’Ecole Supérieure d’Ingénieurs Léonard de Vinci, Pôle Léonard de Vinci – UGEI
La version originale de cet article a été publiée sur The Conversation.