Menu

Adrien Basdevant (E12), auteur de L’Empire des données : « Contre le coup data, engageons une transformation numérique vertueuse »

None © Lysias

Avocat au Barreau de Paris, Adrien Basdevant (E12) co-signe L’Empire des données, ouvrage dénonçant l’opacité des algorithmes qui régissent une part croissante de nos existences et bouleversent les rapports de force entre États, entreprises, consommateurs et citoyens. Entretien fleuve autour d’un véritable sujet de société.

ESSEC Alumni : Comment votre parcours vous a-t-il mené à vous intéresser au sujet du big data ?

Adrien Basdevant : J’ai toujours été passionné par l’innovation et la défense des libertés individuelles. Le numérique présentait à mes yeux des défis inédits, à la croisée de ces deux chemins. À l’ESSEC, j’ai découvert un article de Lawrence Lessig, professeur de droit à Stanford, s’intitulant « Code is law ». Il expliquait comment le code informatique pourrait remplacer le code juridique. Ça m’a profondément marqué et incité à lire les travaux des chercheurs du Harvard Berkman Center on Cyberlaw. Depuis, je me suis spécialisé en droit des nouvelles technologies. Avocat, je défriche quotidiennement les questions liées au data, à l’intelligence artificielle et à leur impact sur la société. Ce qui m’intéresse, c’est réfléchir à l’élaboration d’une norme en devenir. Le numérique offre de nombreux champs d’exploration pour lesquels il y a encore peu ou pas de précédents.

EA : Vous ouvrez votre livre avec une brève histoire des data, qui nous rappelle que les citoyens font l’objet de divers recensements depuis longtemps. Pourquoi est-il important de revenir à l’étude des statistiques ?

A. Basdevant : En étudiant l’histoire des data, on observe comment les humains se sont collectivement remis, depuis des siècles, aux chiffres pour établir des lois. Du simple dénombrement du bétail, on a commencé à recenser les populations, puis les richesses des territoires. On compte et on dénombre pour mieux gouverner. Comme le résumait le philosophe Francis Bacon : « Le savoir, c’est le pouvoir ». En effet, l’art de conduire les masses supposait une connaissance parfaite de l’état d’un pays et de sa population. L’histoire de la statistique, c’est la croyance dans l’harmonie par le calcul. C’est important d’y revenir pour comprendre comment elles ont permis de mieux organiser nos sociétés et quantifier les phénomènes de masse liés à la mondialisation, plus seulement pour décrire une situation mais prescrire des solutions.

EA : Qu’est-ce qu’il y a de nouveau dans la situation actuelle du big data par rapport aux statistiques traditionnelles ?

A. Basdevant : La statistique était initialement destinée au gouvernement, au souverain, pour connaître l’étendue de son territoire, et réagir aux famine, guerre et autre épidémie. La naissance de la statistique est ainsi corrélée à la création de l’État moderne que Hobbes appelait – ce n’est pas anodin – l’« homme artificiel ».  Nous vivons désormais à l’ère de « l’intelligence artificielle », où des algorithmes se nourrissent d’une quantité exponentielle de données. La grande nouveauté du big data, c’est de détecter les signaux faibles qui nous échappaient auparavant. Là où la statistique raisonnait à partir d’échantillon, le big data prend tout en compte, indistinctement, même les données les plus anodines. On collecte tout le réel, et on induit des décisions par corrélation. Cette fois-ci, les applications ne sont pas uniquement destinées aux gouvernements, mais accessibles et destinées aux individus.

EA : Vous êtes critique sur le big data. Vous affirmez notamment que les données anonymes n’existent pas… Pouvez-vous nous expliquer ce point ?

A. Basdevant : Le big data est porteur de grandes opportunités qui pourraient nous être profitables à tous. Nous devons veiller à rendre cette transformation aussi vertueuse que possible. Sans verser dans le scepticisme, il faut provoquer la réflexion. Un des écueils de l’exploitation exponentielle des données, c’est qu’il est aujourd’hui algorithmiquement impossible de rester anonyme. Par essence les « données massives » sont « big », on arrive ainsi à identifier presque tout le monde grâce à des recoupements de données provenant de sources très variées. En 2007 déjà, deux chercheurs de l’Université du Texas ont réussi à identifier des personnes à partir des données anonymisées mises à disposition par la société Netflix, dans le cadre d’un concours que l’entreprise organisait pour améliorer son moteur de recommandation. Comment ? En reliant et recoupant les notes de films données par ses utilisateurs de Netflix, supposés anonymes, avec les notations de films disponibles sur IMDB (base de données sur le cinéma mondial en accès sur Internet). La vie privée serait donc devenue le privilège de quelques technophiles éclairés.

EA : Vous ajoutez qu’on a tendance à se focaliser sur la question des données personnelles quand les données publiques posent tout autant problème…

A. Basdevant : Les données constituent la nouvelle matière du XXIème siècle. La comparaison avec le pétrole est fréquemment utilisée. Ces données ne sont pas forcément personnelles. Prenez l’exemple des données de transport. Leur détention donne accès à une quantité extraordinaire d’informations. D’où l’apparition de nombreux litiges. Par exemple, la RATP qui a longtemps refusé à l’application CityMapper d’avoir accès aux données sur les horaires de bus, les retards en temps réel, etc. Ce qui peut poser des questions critiques de concurrence : accès à un marché, coût d’entrée pour un nouvel arrivant, situations d’oligopole.

EA : Dans l’ensemble, quelles sont les données qu’on collecte aujourd’hui plus ou moins massivement, et dont l’exploitation peut s’avérer problématique ?  

A. Basdevant : Toutes les données sont collectées massivement. LinkedIn détient plus de données sur le marché du travail que Pôle Emploi, et Apple que la Sécurité Sociale. Quant à savoir à partir de quel moment cela devient problématique, voici la question qu’il faut collectivement se poser ! Certaines plateformes pourraient devenir à terme des facilités essentielles, c’est-à-dire des points d’entrée incontournable pour accéder à un marché. Cela doit donc inviter chaque organisation à se poser la question de la gestion de ses données. Y compris l’ESSEC qui conclut des accords permettant à des géants du numérique d’avoir accès aux données des étudiants de son école…

EA : Qui possède légalement toutes ces données ? Et qui a le droit de les utiliser ?

A. Basdevant : Cela dépend de quelles données on parle et dans quelle zone géographique. En France, on a introduit le principe de l’open data. Depuis 2016, toutes les collectivités territoriales de plus de 3 500 habitants ont l’obligation de mettre leurs données publiques à disposition de tous les habitants. Concernant les données personnelles, la France a aussi été précurseur. Nous sommes un des premiers pays à s’être doté d’une réglementation, dès 1978. C’est la fameuse loi informatique et liberté, qui sera remplacée à partir du 25 mai 2018 par le règlement européen sur les données personnelles (RGPD). Ces textes encadrent les collectes de données, notamment selon des principes de loyauté et de proportionnalité.

EA : Pourrions-nous imaginer un monde où chacun serait maître et propriétaire de ses données personnelles ?

A. Basdevant : C’est possible, mais ça ne serait pas souhaitable. Un droit de propriété suppose une exclusivité. On aboutirait rapidement à des situations absurdes. Si je suis propriétaire de la donnée personnelle « Adrien », alors personne n’aurait plus le droit d’utiliser mon prénom. On devrait me payer une licence pour ne pas être poursuivi pour usurpation d’identité. Ça n’aurait pas de sens ! C’est justement la circulation et l’usage des données qui en créent la valeur. Une donnée brute, une donnée qui n’est pas mise en rapport avec d’autres n’a que très peu de valeur en soi. La question de l’attribution d’un droit de propriété est d’autant plus délicate que les concepts de propriété sont très différents d’un continent à l’autre. En France, nous avons une approche personnaliste : les individus ont des droits sur leurs données personnelles. Cela ne se réduit donc pas à la protection d’une simple valeur économique. Enfin, un individu serait incapable de fixer la valeur de ses données. Combien coûterait un code génétique ? Combien seraient vendus nos goûts musicaux ? On serait rapidement victime d’une asymétrie informationnelle, qui nous conduirait à vendre nos données pour trois fois rien. À considérer qu’une donnée, tout comme un rein ou un poumon, serait une émanation de notre personne, on pourrait même voir cela comme un risque de marchandisation des attributs de notre personnalité.

EA : Plus largement, vous dénoncez le caractère normatif et discriminatoire des algorithmes. Mais quelle différence fondamentale entre un logiciel décrétant par exemple votre éligibilité à un crédit et une personne humaine décidant du même sujet ? Au final, la machine comme l’individu appliquent une grille de critères prédéfinis… Et l’individu est connu pour avoir des biais !

A. Basdevant : On évoque souvent les algorithmes comme des « boîtes noires » dont le fonctionnement nous échapperait. Et vous avez raison de le souligner, on pourrait considérer que le cerveau humain constitue l’ultime boite noire. La différence toutefois, c’est qu’on peut connaître les motifs des décisions humaines et si nécessaire les contester. Un algorithme par nature distingue, encore faut-il s’assurer que cela soit réalisé sur la base de critères acceptables et contestables, à l’abri de l’établissement de listes d’exclusion. Et pour cela il faut pouvoir vérifier les process en œuvre. Je vous donne quelques exemples pour l’illustrer concrètement. Une société de cartes de crédit peut-elle s’autoriser à augmenter le taux d’intérêt d’un couple parce qu’il consulte un conseiller matrimonial ? Le prix du billet d’avion qui vous est proposé peut-il différer en fonction de la marque de l’ordinateur que vous utilisez, ou de votre historique de navigation ? Une banque peut-elle diminuer les plafonds d’un de ses clients à partir de l’analyse effectuée sur d’autres clients fréquentant les mêmes supermarchés et ayant de mauvais historiques de remboursement ? Nous devons avoir une discussion éthique sur les critères utilisés par les algorithmes.

 

2018 03 26 - Adrien Basdevant 3.jpg

 

EA : Êtes-vous d’accord pour dire que le problème ne tient pas tant aux données collectées, qu’à l’usage qui en est fait ou peut en être fait ?

A. Basdevant : Tout à fait. Une donnée n’est pas bonne ou mauvaise en soi, tout comme la collecte de données n’est pas une opération qui pose en soi problème. Tout dépend de l’usage qu’on en fait : la détection de pathologies, la prédiction d’individu à risque terroriste, la recommandation de biens culturels, l’éducation personnalisée, la maintenance prédictive, le calcul des chances de succès judiciaire. S’il s’agit de données personnelles, il faut en plus s’assurer que celles-ci sont collectées loyalement, par exemple après avoir obtenu le consentement des personnes concernées, et pour la finalité annoncée lors de cette collecte. Contrairement à l’affaire Facebook / Cambridge Analytica où on vous annonce qu’on vous soumet à une enquête de personnalité, alors qu’en réalité on utilise vos données et celles de vos amis, sans aucune autorisation, à des fins de profilage pour une campagne électorale.

EA : Quels usages actuels et / ou futurs vous préoccupent-ils ?

A. Basdevant : Il y a des domaines plus sensibles que d’autres, comme la santé. Mais ce qui me préoccupe en premier lieu, c’est le risque de piratage. Toute notre société se numérise. Par essence, quel que soit votre secteur d’activité : l’agriculture, l’industrie, la banque, l’éducation, votre entité sera reliée à un système informatique et donc à un risque sérieux d’intrusion et de faille de sécurité. Demain, la cybercriminalité va se démocratiser, tout sera hackable.

EA : Vous dites notamment que la lutte passe avant tout par l’éducation : il faut apprendre à comprendre et à questionner la statistique. Qui faut-il former, et comment ?

A. Basdevant : C’est avant tout une question de conduite du changement. Si on ne comprend pas les mécanismes sous-jacents et qu’on ne peut pas les interroger, on ne peut pas les contester. Il faut que le codeur devienne éthicien et le juge statisticien. Cela passe par l’hybridation des connaissances, en formant à l’éthique ceux qui conçoivent les algorithmes, et à la culture algorithmique ceux qui les interprètent. L’éducation demain devra mêler sciences dures et sciences humaines. On aura besoin de deux versants, en communication et en partage l’un avec l’autre. Le but est aussi d’éduquer la société civile pour qu’elle s’implique dans cette révolution et s’approprie les sujets. Il faut aussi créer des instituts de recherche pluridisciplinaires. Il nous manque une couche culturelle sur les questions Internet et société. On ne peut pas se contenter d’avoir Station F, il faut promouvoir une nouvelle génération de défricheurs. Faire du numérique un sujet de société, que les sociologues, philosophes, ingénieurs, biologistes, historiens, entrepreneurs en débattent, publiquement. C’est d’ailleurs la raison pour laquelle j’ai choisi comme sous-titre du livre : « Un essai sur la société et les algorithmes ». Aux États-Unis, de tels instituts de recherche existent depuis longtemps, à Harvard, à Stanford, créé par Lawrence Lessig justement. En Europe, ils commencent à émerger. 2018 est l’année où le débat commence à s’imposer. La France devrait prendre des initiatives dans ce sens.

EA : Sur le plan politique, comment passer de l’empire des données à une république ou une démocratie des données ?

A. Basdevant : Il y a la peur que toutes les données soient concentrées dans les mains de quelques acteurs, cela revient aux enjeux de pouvoir et de concurrence précédemment abordés. Il y a également la peur que la technologie échappe au contrôle démocratique. On assiste à la crainte que des algorithmes exécutent spontanément des actions, hors de tout contrôle humain. Typiquement, c’est le cas d’un smart contract, dans une blockchain, qui permet la désintermédiation. Dans ces conditions, il faut se poser la question de la gouvernance de systèmes décentralisés, de protocoles informatisés qui permettent d’organiser une société de manière programmable.

EA : Justement, que pensez-vous de la blockchain ?

A. Basdevant : La blockchain pourrait constituer une rupture majeure. Tout comme l’a été Internet dans les années 90. L’attention est pour l’instant focalisée sur les cryptomonnaies, comme le bitcoin, qui ne constitue qu’une application parmi d’autres. L’impact de cette technologie sera bien plus considérable. La blockchain proposera de nouveaux modes d’organisation de nos sociétés.

EA : Pour l’heure, vous dénoncez un véritable « coup data ». Que voulez-vous dire exactement par cette formule ?

A. Basdevant : Les données sont aujourd’hui les nouvelles clefs du pouvoir. Aujourd’hui, on gouverne par les données. Les data alimentent des algorithmes qui déterminent notre quotidien – de l’information à laquelle nous accédons sur nos tablettes et les réseaux sociaux jusqu’au taux de crédit qui nous est proposé, en passant par le processus de recrutement de notre prochain emploi, par la valorisation de notre prime d’assurance, par la répartition des étudiants dans les filières universitaires à l’issue de leur baccalauréat, ou encore par nos probabilités de récidive. Le « coup data », c’est le renversement du pouvoir par les données ; le renversement du règne de la loi au profit de la gouvernance par les algorithmes. J’explique en détails ce concept dans mon livre. Si je devais le résumer, je dirais que cela renvoie principalement à deux aspects. D’une part, ceux qui possèdent les données détiennent le pouvoir. D’autre part, les algorithmes dictent de plus en plus les lois de notre quotidien, sans que nous ayons accès à leur code. On en vient à gouverner à partir d’une expression statistique de la réalité qui ne s’intéresse plus aux causes, aux intentions, ce qui revient à gouverner à partir de profils et à gommer l’existence même des personnes, ce qui fait de nous des êtres irréductiblement humains et capables d’inattendu. En voulant nous préserver de l’incertitude, cette logique évacue toute différence. Le coup data ne signifie pas forcément la fin de l’État de droit, mais pourrait le devenir si dans le futur, on en venait à être gouverné par des algorithmes dont on ne pourrait plus comprendre, et contester les mécanismes de fonctionnement.

EA : Quelles sont les principales pistes pour lutter contre les dérives et abus potentiels que vous pointez du doigt ?

A. Basdevant : J’estime qu’il est très important de comprendre la nouvelle géopolitique qui est sous-jacente et de réfléchir à la manière d’éviter que nous soyons déterminés par nos datas sans avoir notre mot à dire. On assiste à une mise en concurrence des normes : le code informatique des plateformes concurrence le code juridique des États-nations. Droit à l’oubli, fake news, lutte contre l’endoctrinement djihadiste en ligne… Il faut continuer collectivement à débattre de ces sujets, et ne pas s’en remettre au code informatique pour régler et réguler ces phénomènes. Si « Code is law », qui contrôle le code ? De quels recours aux tribunaux, aux lois et aux procédures disposerons-nous face à ces capteurs qui sondent toute activité humaine en temps réel, face à ces algorithmes qui peuvent déterminer avec précision les probabilités de nos actions ?

EA : Et qui sont les acteurs de ce « coup data » ? Les entreprises, les gouvernements ? Concrètement, qui est l’« ennemi » ?

A. Basdevant : Il n’y a pas d’ennemi. Je ne crois pas à la conspiration ou aux théories du complot. En voulant pointer du doigt quelques acteurs seulement, comme c’est le cas en France avec les GAFA, on appauvrit le débat. En réalité, les politiques ont trop longtemps ignoré les problématiques numériques. C’est donc avant tout à eux de réinvestir les questions de démocratie numérique et permettre aux citoyens de ne pas tomber dans des nouvelles formes de servitude volontaire. C’est ensuite aux citoyens, sensibilisés et munis de leurs droits, de réoccuper la place qui est la leur. C’est cela, le contrat social des données : permettre aux citoyens de réinvestir le débat.

EA : Êtes-vous confiant dans l’avenir ?

A. Basdevant : Enthousiaste et réaliste. Enthousiaste car je suis convaincu qu’il faut s’impliquer dans ces questions déterminantes pour l’avenir de notre société. Il faut un engagement citoyen fort pour comprendre et débattre de ces enjeux. Le numérique doit faire l’objet d’une appropriation et d’un débat par tous. Si nous ne le faisons pas, cela revient à subir les décisions que d’autres acteurs nous imposeront. C’est pour cela qu’il s’agit d’une question de démocratie. Réaliste, car je constate que la rare littérature existante sur ces sujets sombre trop souvent dans deux positions caricaturales. Les techno-sceptiques qui s’alarment devant toute nouveauté et prophétisent qu’il faut avoir peur du monde qui vient. Les techno-optimistes qui prédisent que les technologies vont résoudre tous les problèmes de la société. Sur ces questions, il faut avoir une approche critique et constructive.

EA : Y a-t-il des acteurs qui se mobilisent et s’organisent déjà aujourd’hui, des contrepouvoirs efficaces ?

A. Basdevant : Il y a des acteurs qui se mobilisent. C’est le cas de Max Schrems, étudiant autrichien qui a gagné son action contre Facebook, et fait invalider après 7 ans de procédure le Safe Harbor, l’accord de transfert de données entre l’Europe et les US. C’est remarquable et à la fois complétement fou. Si un citoyen, pratiquement seul contre tous, est parvenu à renverser une législation, ce type d’initiative isolée, demandant des sacrifices considérables de temps, ne pourront suffire. Il faut donc que des contre-pouvoirs plus efficaces s’organisent. Schrems a monté une ONG, None of Your Business, destinée à soutenir au niveau européen les actions en justice relative aux données personnelles. Nous devrions développer et promouvoir d’autres ONG de protection des libertés à l’ère du numérique, sur le modèle de l’EFF (Electronic Frontier Foundation).

EA : Au fond, aspirez-vous à une mise en échec du big data, ou à l’avènement d’un big data vertueux ?

A. Basdevant : Nous devons encourager l’innovation. Cela n’aurait pas de sens de vouloir s’y opposer par peur ou par paresse, sauf à répéter les vaines révoltes luddites du début du XIXème siècle… Les canuts lyonnais avaient entrepris de détruire les machines qui se substituaient à leurs métiers à tisser. Leur révolte aurait légué au vocabulaire le mot « sabotage », car ils jetaient leurs sabots sur les machines pour les mettre hors d’état de marche, comme les tisseurs à bras en Angleterre. Non, il ne faut pas saboter l’innovation, mais la promouvoir, de sorte qu’elle soit respectueuse des droits de chacun, la plus inclusive possible, et fondamentalement éthique.

 

Propos recueillis par Louis Armengaud Wurmser (E11)

 

En savoir plus :

www.lempiredesdonnees.com

 

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies destinés à vous proposer des services ou offres adaptés à vos centres d'intérêts et à réaliser des statistiques de visites. En savoir plus et paramétrer les cookies.

x