Le Syndicat national de l’édition (SNE) n’arrive pas à venir à bout du site pirate Z-Library

Z-Library reste encore accessible malgré deux jugements obtenus en France par le Syndicat national de l’édition, le 12 septembre 2024 et le 25 août 2022, pour tenter de bloquer les noms de domaine et sites miroirs de cette « bibliothèque mondiale » accusée de piratage de livres numériques.

« Le tribunal ordonne aux sociétés Bouygues Telecom, Free, SFR, SFR Fibre et Orange de mettre en œuvre et/ou faire mettre en œuvre, toutes mesures propres à empêcher l’accès au site Z-Library, à partir du territoire français, […] par tout moyen efficace, et notamment par le blocage des noms de domaine et sous-domaines associés […], au plus tard dans un délai de 15 jours suivant la signification du présent jugement et pendant une durée de 18 mois à compter de la mise en œuvre des mesures ordonnées », a décidé le tribunal judiciaire de Paris, précisé ce jour-là par Anne-Claire Le Bras (photo).

Blocage d’ici le 30 septembre 2024
Selon ce second jugement rendu le 12 septembre 2024 dans le cadre d’une procédure accélérée, les fournisseurs d’accès à Internet (FAI) – du moins les quatre principaux en France – ont ainsi l’obligation de faire barrage au site Z-Library en bloquant pas tout moyens en ligne près de 100 nouveaux noms de domaine donnant encore accès à ce que le Syndicat national de l’édition (SNE) désigne comme l’« une des plus vastes bibliothèques numériques clandestines (ou « shadow library »), accessible depuis la France, et ce, par le biais d’une multitude de noms de domaine régulièrement renouvelés ».
Le premier jugement, datant du 25 août 2022, le même tribunal judicaire de Paris avait déjà ordonné aux mêmes FAI le blocage de plus de 200 noms de domaine. Dans les deux cas, le SNE avait fait établir un nouveau procès-verbal par un agent assermenté de l’Association pour la protection des programmes (APP), qui, basée à Paris et présidée par Philippe Thomas, se présente comme un « tiers de confiance » en matière de protection numérique et propose à ses clients dont le SNE – membres d’APP ou non – de faire appel à ses agents assermentés pour une demande de constat sur Internet. « Le constat en ligne automatique est un outil reconnu par les tribunaux pour détecter et documenter les contrefaçons sur les sites Internet. Il offre une preuve numérique incontestable de la présence de contrefaçons, permettant aux requérants de prendre les mesures nécessaires pour faire valoir leurs droits », assure l’APP (1). Cela suppose qu’il y ait préalablement un mandat écrit du titulaire de droits ou de son mandataire (avocat, conseil en propriété intellectuelle, etc.). Pour faire ses constats en ligne et dresser son procès-verbal, l’agent assermenté de l’APP télécharge un échantillon de livres contenant des œuvres littéraires éditées par des éditeurs membres du SNE tels que Albin Michel, Hachette Livre (dont les éditions Albert René), Dalloz, Gallimard, Dunod, etc. Ainsi, pour la dernière décision, le procès-verbal de l’APP pour le SNE « constat[e] que la plateforme Z-Library continuait son activité contrefaisante, et ce par l’intermédiaire de 98 nouveaux noms de domaine », parmi lesquels go-tozlibrary.se, singlelogin.se, booksc.eu, cn1lib.is ou encore zlibrary-africa.se – pour ne citer qu’eux d’une longue liste à la Prévert établie dans la décision elle-même (2).

Le démantèlement des Big Tech comme Google n’est plus tabou, ni aux Etats-Unis ni en Europe

L’étau de la régulation antitrust américaine se resserre sur Google, filiale d’Alphabet. Le département de la Justice (DoJ) n’exclut aucun remède en faveur de la concurrence, y compris l’arme absolue du démantèlement (breakup). En Europe, cette menace ultime est aussi sur la table.

Le numéro un mondial des moteurs de recherche, Google, sera-t-il le premier Gafam à être démantelé aux Etats-Unis ? La filiale du groupe Alphabet, présidé depuis près de cinq ans par Sundar Pichai (photo), est la cible de deux procès antitrust historiques aux EtatsUnis. Le premier procès, qui s’est ouvert en septembre 2023, s’est soldé le 5 août 2024 par un jugement qui condamne Google pour abus de position dominante sur le marché des moteurs de recherche où il est en situation de quasi-monopole. La firme de Mountain View a fait appel de cette décision. Le second procès, qui s’est ouvert le 9 septembre 2024, concerne cette fois ses outils de monétisation publicitaires.

Vendre Android, AdWords et/ou Chrome ?
Dans ces deux affaires, la menace ultime de l’antitrust américaine est le démantèlement, ou breakup, de Google. Le Département de la Justice (DoJ) y songe sérieusement, d’après une information de l’agence Bloomberg publiée le 13 août dernier (1). Pour casser le monopole illégal de Google constitué par son moteur de recherche au détriment de la concurrence, cette option ultime n’est pas exclue. Elle pourrait consister par exemple à obliger Google à céder son système d’exploitation Android (2) et/ou son activité publicitaire AdWords devenue Google Ads (3), voire aussi de se délester de son navigateur web Chrome (4). Si ce n’est pas le démantèlement pur et simple, les autres remèdes pourraient être de forcer Google à partager ses données avec ses concurrents et à faire en sorte que ses comportements monopolistiques ne se reproduisent pas dans l’intelligence artificielle (IA).
Dans son verdict du 5 août, le juge a d’ailleurs pointé le fait que Google a payé 26,3 milliards de dollars en 2021 pour maintenir la domination de son moteur de recherche en devenant – par ses accords anticoncurrentiels signés avec Apple et des fabricants de smartphones sous Android comme Samsung, d’une part, et des navigateurs web tels que Firefox de Mozilla d’autres part – le search engine par défaut au niveau mondial. Rien qu’aux Etats-Unis, Google Search s’arroge près de 90 % de part de marché. « Par défaut » : là est le nœud du problème, lorsque la filiale d’Alphabet impose aussi « par défaut » sur des terminaux son navigateur web Chrome, sa boutique d’applications Play Store ou d’autres de ses services.

Tournant judiciaire aux Etats-Unis en faveur du droit d’auteur d’artistes contre des IA génératives

Dans la torpeur de l’été, le juge d’un tribunal de Californie a donné raison à des artistes qui ont porté plainte contre des IA génératives – Stable Diffusion de Stability AI en tête – qui utilisent leurs images sans autorisation et au mépris du copyright. Ce jugement constitue une étape majeure.

C’est une première victoire des artistes aux Etats-Unis contre les IA génératives qui utilisent des milliards d’images pour répondre aux requêtes de millions d’internautes dans le monde. Le juge fédéral américain William Orrick (photo), officiant au tribunal du district nord de la Californie, a décidé le 12 août 2024 que les plaintes des artistes – contre les sociétés Stability AI (avec son IA générative Stable Diffusion), Midjourney (avec son IA générative du même nom), Runway AI (IA génératives multimédias à l’aide de DreamUp) et DeviantArt (réseau social de créatifs) – étaient recevables.

Stability, Midjourney, Runway, DeviantArt
Dans son ordonnance de 33 pages (1), le juge Orrick reconnaît qu’il y a violation du droit d’auteur et de marques déposées dès lors que les IA génératives ont été construites – lors de leur entraînement – sur des milliards d’images protégées et sans l’autorisation de leurs auteurs et artistes. La plainte examinée a été déposée l’an dernier et se focalise sur la grande base de données LAION – Large-scale Artificial Intelligence Open Network (2) – qui a été constituée à partir de 5 milliards d’images, lesquels auraient été récupérées sur Internet et exploitées par Stability AI, Midjourney, Runway AI et DeviantArt.
Les artistes à l’origine de la plainte affirment que « l’ensemble des données “LAION-5B” contient seulement des URL d’images d’entraînement, et non pas les images réelles d’entraînement ». Par conséquent, affirment-ils, « quiconque souhaite utiliser LAION-5B pour former son propre modèle d’apprentissage automatique doit d’abord acquérir des copies des images de formation réelles à partir de ses URL en utilisant l’ensemble de données ‘’img2dataset’’ ou un autre outil similaire ».

Pourquoi le Conseil constitutionnel a censuré le délit d’« outrage en ligne » dans la loi SREN

La loi du 21 mai 2024 visant à sécuriser et à réguler l’espace numérique (SREN) a été publiée le lendemain au Journal Officiel, après avoir été expurgé des articles censurés par le Conseil constitutionnel. Les sages de la République ont jugé le délit d’outrage en ligne d’inconstitutionnel.

Par Antoine Gravereaux, avocat associé*, FTPA Avocats

En invalidant cinq articles de la loi, dont le délit d’« outrage en ligne » (1), le Conseil constitutionnel – par décision du 17 mai 2024 (2) – a contraint le législateur à revoir son approche de la régulation de l’espace numérique. La loi visant à sécuriser et à réguler l’espace numérique (SREN) introduisait le délit d’outrage en ligne, qui aurait été puni d’un an d’emprisonnement et de 3.750 euros d’amende forfaitaire en cas de diffusion en ligne de tout contenu portant atteinte à la dignité d’une personne ou présentant un caractère injurieux, dégradant, humiliant, ou créant une situation intimidante, hostile ou offensante.

Un délit qui manquait d’objectivité
Le Conseil constitutionnel, qui avait été saisi par deux groupes de députés différents (respectivement les 17 et 19 avril 2024), a jugé que les faits réprimés par cette nouvelle infraction étaient déjà couverts par des qualifications pénales existantes, y compris lorsque ces abus sont commis en ligne. Ainsi par exemple, les sages de la République ont relevé que la diffamation et l’injure sont réprimées par les articles 32 et 33 de la loi du 29 juillet 1881 sur la liberté de la presse (3), les violences psychologiques par le code pénal (4), et le harcèlement par le code pénal également (5).
Rappelons que la diffamation se définit comme toute allégation ou imputation d’un fait portant atteinte à l’honneur ou à la considération de la personne auquel le fait est imputé, lorsqu’elle est commise publiquement. Tandis que l’injure se définit comme toute expression outrageante, termes de mépris ou invective qui ne renferme l’imputation d’aucun fait, lorsqu’elle est proférée publiquement. En outre, le Conseil constitutionnel a relevé que cette nouvelle infraction de délit d’« outrage en ligne » manquait d’objectivité et créait un climat d’incertitude attentatoire à la liberté, en nécessitant une appréciation subjective du ressenti de la personne visée (« incertitude sur la licéité des comportements incriminés »). « Les dispositions contestées font dépendre la caractérisation de l’infraction de l’appréciation d’éléments subjectifs tenant à la perception de la victime. Elles font ainsi peser une incertitude sur la licéité des comportements réprimés », estime notamment le Conseil Constitutionnel. Il a donc jugé que cette disposition portait atteinte à la liberté d’expression et de communication de manière non nécessaire, non adaptée et disproportionnée.

Entraînement de modèles d’IA grâce aux données collectées par web scraping : les règles à suivre

Les plaintes à l’encontre de fournisseurs de systèmes d’IA se multiplient, que ce soit pour violation des droits de propriété intellectuelle ou pour manquements en matière de données à caractère personnel, notamment en lien avec leurs pratiques de collecte de données en ligne (web scraping).

Par Sandra Tubert et Laura Ziegler avocates associées, Algo Avocats

Afin de développer un système d’intelligence artificielle (IA) performant, il est nécessaire d’entraîner en amont les modèles qui le composent au moyen de vastes ensemble de données. Constituer ces ensembles de données d’entraînement représente donc un enjeu majeur pour les fournisseurs de systèmes d’IA. Plusieurs alternatives s’offrent à eux : utiliser les bases de données dont ils disposent en interne ; obtenir des licences auprès de titulaires de droits de propriété intellectuelle sur des contenus pertinents ; ou recourir au web scraping pour récupérer des données accessibles en ligne sur différents sites Internet.

Exception de Text and Data Mining
Cette troisième option, le web scraping (« moissonnage des données »), a connu un essor important ces dernières années. Pour autant, bon nombre d’acteurs récupèrent des données en ligne pour entraîner leurs modèles sans appréhender tous les enjeux et problématiques qui y sont attachés. Alors que plusieurs plaintes ou enquêtes d’autorités visent des fournisseurs de modèles d’IA à usage général pour des allégations de violation des droits de propriété intellectuelle ou de manquements au règlement général sur la protection des données (RGPD), l’entrée en vigueur prochaine du règlement européen sur l’intelligence artificielle – l’AI Act dont le texte final (1) a été signé le 13 juin 2024 – pourrait mettre en évidence les problématiques entourant les sources de données utilisées pour entraîner les modèles.