Le règlement européen « Internet ouvert » a presque dix ans : la neutralité du Net est en danger

Entre les IA génératives qui rêvent de remplacer les moteurs de recherche et les opérateurs télécoms qui militent pour une taxe sur les Gafam utilisant leurs réseaux, la neutralité d’Internet est plus que jamais menacée. Les régulateurs résisteront-ils à la pression des « telcos » et des « big tech » ?

La neutralité d’Internet est prise en étaux entre l’intelligence artificielle et les opérateurs télécoms. Il y a dix ans, la notion de « neutralité de l’Internet » était adoptée pour la première fois en séance plénière, lors d’un vote en première lecture de la proposition de règlement établissant des mesures sur le marché unique européen des communications électroniques. Deux amendements retenus introduisaient la définition de « neutralité de l’Internet [comme étant] le principe selon lequel l’ensemble du trafic Internet est traité de façon égale, sans discrimination, limitation ni interférence, indépendamment de l’expéditeur, du destinataire, du type, du contenu, de l’appareil, du service ou de l’application » (1).

A l’Internet ouvert, un « Internet fermé »
Après des années de tabou puis de débats voire de polémiques sur le sujet (2), le principe de la neutralité d’Internet était enfin sur le point d’être gravée dans le marbre de la législation européenne. Mais finalement, alors même que le lobby des opérateurs télécoms était vent debout contre cette obligation de « neutralité du Net » et défendant becs et ongles leur droit à pratiquer la « gestion de trafic » et à proposer des « services gérés » (3), cette proposition de règlement n’avait pu être votée avant les élections européennes de mai 2014. C’était il y a dix ans. Là où la Commission européenne de Jean-Claude Juncker s’apprêtait à consacrer la neutralité de l’Internet, ce fut celle de Ursula von der Leyen (photo) – chrétienne-démocrate conservatrice, plutôt hostile à Internet (4) – qui proposera un règlement. Mais celui-ci ne parlera pas explicitement de « neutralité » d’Internet mais d’un Internet « ouvert ».

A l’ère de l’IA et de la data, la gestion collective des droits d’auteur veut devenir plus « intelligente »

Le 26 juin, lors de l’AG de la SCPP, organisme de gestion collective des droits des producteurs de musique, a été adopté le projet d’une filiale commune avec l’Adami (artistes et interprètes). Objectif : faire « données communes », notamment face à l’IA. La SPPF veut aussi les rejoindre.

Voilà qui devrait aller dans le sens de la Cour des comptes : un mouvement de rapprochement en France entre les organismes de gestion collective (OGC) des droits d’auteur et des droits voisins. Cette mise en commun concerne d’abord leurs systèmes d’information pour mieux moderniser leur « Big Data » et se mettre en ordre de bataille face à la déferlante de l’intelligence artificielle. Les magistrats du palais de Cambon, présidés par Pierre Moscovici (photo), ne cesse de prôner un tel rapprochement dans le rapport annuel de la commission de contrôle des OGC.

Rationaliser en faisant « Big Data » commun
Lors de l’assemblée générale annuelle de la Société civile des producteurs phonographiques (SCPP), le 26 juin, une résolution validant la création d’une « filiale commune paritaire » avec l’Adami (Administration des droits des artistes et musiciens interprètes) a été adoptée. Le premier OGC collecte et répartit les droits d’auteur gérés collectivement pour le compte des producteurs de musiques enregistrées, dont les trois majors que sont Universal Music, Sony Music et Warner Music. Le second OGC collecte et répartit les droits d’auteurs pour le compte des artistes interprètes de la musique et de l’audiovisuel.
La SCPP est le bras armé financier du Syndicat national de l’édition phonographique (Snep) et compte plus de 4.500 producteurs de musique membres, tandis que l’Adami est au service de près de 100.000 artistes-interprètes. Improbable par le passé, ce rapprochement entre les deux organismes a été annoncé le 27 mai dernier (1) et va se concrétiser par « une mise en commun, à travers la création d’une filiale commune et paritaire, de leurs bases de données respectives et de leurs outils de répartition pour les droits à rémunération que sont la rémunération pour copie privée et la rémunération équitable ». Une étude de faisabilité est en train d’être menée pour savoir comment sera mise en œuvre opérationnelle cette répartition, et pour adopter des règles communes d’affectation « par phonogramme » – comprenez par musique enregistrée où le streaming domine désormais.

Entraînement de modèles d’IA grâce aux données collectées par web scraping : les règles à suivre

Les plaintes à l’encontre de fournisseurs de systèmes d’IA se multiplient, que ce soit pour violation des droits de propriété intellectuelle ou pour manquements en matière de données à caractère personnel, notamment en lien avec leurs pratiques de collecte de données en ligne (web scraping).

Par Sandra Tubert et Laura Ziegler avocates associées, Algo Avocats

Afin de développer un système d’intelligence artificielle (IA) performant, il est nécessaire d’entraîner en amont les modèles qui le composent au moyen de vastes ensemble de données. Constituer ces ensembles de données d’entraînement représente donc un enjeu majeur pour les fournisseurs de systèmes d’IA. Plusieurs alternatives s’offrent à eux : utiliser les bases de données dont ils disposent en interne ; obtenir des licences auprès de titulaires de droits de propriété intellectuelle sur des contenus pertinents ; ou recourir au web scraping pour récupérer des données accessibles en ligne sur différents sites Internet.

Exception de Text and Data Mining
Cette troisième option, le web scraping (« moissonnage des données »), a connu un essor important ces dernières années. Pour autant, bon nombre d’acteurs récupèrent des données en ligne pour entraîner leurs modèles sans appréhender tous les enjeux et problématiques qui y sont attachés. Alors que plusieurs plaintes ou enquêtes d’autorités visent des fournisseurs de modèles d’IA à usage général pour des allégations de violation des droits de propriété intellectuelle ou de manquements au règlement général sur la protection des données (RGPD), l’entrée en vigueur prochaine du règlement européen sur l’intelligence artificielle – l’AI Act dont le texte final (1) a été signé le 13 juin 2024 – pourrait mettre en évidence les problématiques entourant les sources de données utilisées pour entraîner les modèles.

Robots, crawlers, IA, … levée de boucliers en ligne

En fait. Le 18 juin, la société Clipeum a annoncé avoir le premier quotidien régional Ouest-France comme nouveau client de son outil Botscorner qui permet d’identifier robots, crawlers et IA génératives pour les faire payer. Selon nos informations, le CFC n’y fait plus appel, lui préférant Human Security.

En clair. Après avoir annoncé le 23 mai la signature avec Le Monde pour l’utilisation de son outils Botscorner destiné à repérer et à cartographier les robots de crawling (aspirateurs de sites web destinés à exploiter leurs contenus), la société Clipeum – dont le nom veut dire « bouclier » en latin – a annoncé le 18 juin un nouvel accord avec, cette fois, Ouest-France. Ces deux nouveaux clients rejoignent ainsi les nombreux éditeurs de presse en ligne en France – Le Figaro, Le Parisien, L’Equipe, Le Point, Challenges, L’Usine nouvelle, Libération ou encore L’Express – qui ont opté pour ce type de solutions – Botscorner, DataDome, Human Security (ex-White Ops), … – capables d’analyser le trafic entrant et d’identifier les robots (bots) absorbant leurs articles.
Selon les informations de Edition Multimédi@, le Centre français d’exploitation du droit de copie (CFC), qui a lancé en 2018 son « outil de régulation des robots de crawling » (ORRC), ne s’appuie plus sur Botscorner depuis fin 2023 mais sur Human Security, une société newyorkaise. Objectif pour l’éditeur de presse en ligne : analyser les logs des bots et crawlers arrivant sur leurs sites web et proposer des licences d’autorisation rémunératrices aux sociétés qui activent ces robots de crawling.

L’ex-secrétaire d’Etat au Numérique Cédric O fait toujours polémique avec son « Mistral gagnant »

Le lobbying dans l’IA de l’ancien secrétaire d’Etat au Numérique, Cédric O, continue de faire polémique sur fond de soupçons de conflits d’intérêts. La Haute autorité pour la transparence de la vie publique (HATVP) avait exprimé des réserves en juin 2022. Et depuis ?

(Le 11 juin 2024, soit le jour suivant la publication de cet article dans le n°323 de Edition Multimédi@, Mistral AI annonçait une levée de fonds de 600 millions d’euros, et, le 17 juillet, la HATVP nous a indiqué qu’elle venait de « procéder au contrôle du respect des réserves » formulées en 2022 et qu’ « aucun élément ne permet de conclure que ces réserves auraient été méconnues », mais aucune communication officielle n’est prévue)

Cédric O, cofondateur et actionnaire de la start-up Mistral AI via sa propre société de conseil Neopunteo, estil juge et partie – voire en conflits d’intérêts – vis-à-vis du gouvernement dont il fut secrétaire d’Etat au Numérique (mars 2019 à mai 2022) ? La question est lancinante mais légitime puisque cela concerne l’ancien secrétaire d’Etat au Numérique. Contactée par Edition Multimédi@, la Haute autorité pour la transparence de la vie publique (HATVP), présidée par Didier Migaud, nous a assuré qu’elle s’était bien prononcée dans sa délibération du 14 juin 2022 sur la demande que lui avait soumise Cédric O (photo) concernant notamment sa société Neopunteo.

Neopunteo, société de conseil au bras long
« Cédric O a créé le 11 juillet 2022 Neopunteo, qui a notamment pour objet social la prise de participation, directe ou indirecte, dans toutes opérations financières, immobilières ou mobilières ou entreprises commerciales ou industrielles pouvant se rattacher à l’objet social, notamment par voie de création de sociétés nouvelles, le tout directement ou indirectement, pour son compte ou pour le compte de tiers », nous a précisé un porte-parole de la HATVP. Et celui-ci de nous confirmer en outre : « C’est la société Neopunteo qui a souscrit des parts au capital de la société Mistral AI ». C’est ainsi que l’ancien secrétaire d’Etat au Numérique a pu affirmer auprès de l’AFP en décembre dernier qu’« [il] respect[ait] toutes les obligations demandées par la HATVP ». Cédric O a investi dans la start-up Mistral AI, créée le 28 avril 2023, dont il est coactionnaire et « conseiller-cofondateur » via sa société Nopeunteo qui était encore à l’état de projet au moment du rendu de l’avis contraignant du gendarme de la transparence de la vie publique.
Comme Cédric O a occupé ses fonctions ministérielles du 31 mars 2019 au 20 mai 2022, il avait en effet l’obligation – dans les trois ans suivant la cessation de ses fonctions à Bercy, soit jusqu’en mai 2025 – de saisir la HATVP avant de s’engager professionnellement. La haute autorité se prononce sur la compatibilité ou pas de l’exercice d’une activité rémunérée au sein d’une entreprise avec les fonctions de membre du gouvernement exercées au cours des trois années précédant le début de l’activité. Objectif : éviter le risque de prise illégale d’intérêts, laquelle relève d’une infraction pénale passible de trois ans d’emprisonnement et d’une amende de 200.000 euros. Il s’agit aussi de lutter contre tout conflit d’intérêt et d’édicter éventuellement des mesures à respecter pour prévenir les risques déontologiques. Depuis que Cédric O a quitté Bercy, la HATVP a publié quatre délibérations le concernant. La première délibération est celle datée de juin 2022 et concerne France Asie et Sista, ainsi que le projet de « créer une entreprise afin de réaliser des prestations de conseil » (1), Nopeunteo. Dans ses « réserves », la haute autorité a demandé à Cédric O de « respecter les règles déontologiques », de ne pas « faire usage ou de divulguer des documents ou renseignements non publics dont il aurait eu connaissance », et lui « suggère » de la saisir « avant de prendre pour client un organisme ou de prendre une participation dans une entreprise appartenant au secteur du numérique ».