Entraînement de modèles d’IA grâce aux données collectées par web scraping : les règles à suivre

Les plaintes à l’encontre de fournisseurs de systèmes d’IA se multiplient, que ce soit pour violation des droits de propriété intellectuelle ou pour manquements en matière de données à caractère personnel, notamment en lien avec leurs pratiques de collecte de données en ligne (web scraping).

Par Sandra Tubert et Laura Ziegler avocates associées, Algo Avocats

Afin de développer un système d’intelligence artificielle (IA) performant, il est nécessaire d’entraîner en amont les modèles qui le composent au moyen de vastes ensemble de données. Constituer ces ensembles de données d’entraînement représente donc un enjeu majeur pour les fournisseurs de systèmes d’IA. Plusieurs alternatives s’offrent à eux : utiliser les bases de données dont ils disposent en interne ; obtenir des licences auprès de titulaires de droits de propriété intellectuelle sur des contenus pertinents ; ou recourir au web scraping pour récupérer des données accessibles en ligne sur différents sites Internet.

Exception de Text and Data Mining
Cette troisième option, le web scraping (« moissonnage des données »), a connu un essor important ces dernières années. Pour autant, bon nombre d’acteurs récupèrent des données en ligne pour entraîner leurs modèles sans appréhender tous les enjeux et problématiques qui y sont attachés. Alors que plusieurs plaintes ou enquêtes d’autorités visent des fournisseurs de modèles d’IA à usage général pour des allégations de violation des droits de propriété intellectuelle ou de manquements au règlement général sur la protection des données (RGPD), l’entrée en vigueur prochaine du règlement européen sur l’intelligence artificielle – l’AI Act dont le texte final (1) a été signé le 13 juin 2024 – pourrait mettre en évidence les problématiques entourant les sources de données utilisées pour entraîner les modèles.

L’industrie du livre est appelée à mieux rémunérer les auteurs à l’ère du numérique et de l’IA

Le Syndicat national de l’édition (SNE) a tenu le 27 juin 2024 son assemblée générale annuelle. L’industrie du livre dans les Vingt-sept, dont la France, va passer sous les fourches caudines de la Commission européenne qui a lancé – via sa DG Connect – une enquête sur les contrats d’auteur.

Ce n’est pas anodin à l’ère du numérique et en pleine déferlante de l’intelligence artificielle : la DG Connect – direction générale des réseaux de communication, du contenu et de la technologie de la Commission européenne – a lancé jusqu’au 21 juin une « enquête sur les pratiques contractuelles touchant le transfert du droit d’auteur et des droits voisins ». Si cette démarche porte sur le secteur de la création et de la culture en général au regard des artistes, elle concerne en particulier les maisons d’édition et leurs contrats avec les auteurs.

Papier, ebook, audio, streaming, IA, …
Cette enquête menée en ligne (1) s’est adressée d’abord directement aux auteurs et aux artistes des industries culturelles et créatives en Europe. Mais leurs organisations professionnelles et représentatives (2) ont pu y répondre aussi. L’objectif de cette étude est notamment de « recueillir des données et des preuves concernant les arrangements contractuels liés au transfert du droit d’auteur ou des droits voisins, et évaluer leurs effets, en particulier sur la capacité des créateurs à recevoir une rémunération équitable et la capacité des producteurs à utiliser efficacement leurs droits à long termes ». Les contrats d’édition posent problèmes et le partage de la valeur entre les éditeurs de livres et les auteurs laisse à désirer. A l’occasion du troisième anniversaire de l’entrée en vigueur de la directive européenne « Droit d’auteur et droits voisins dans le marché unique numérique » de 2019, le Conseil des écrivains européens – European Writers’ Council (EWC) basé à Bruxelles – a publié début juin un rapport sur « les clauses contractuelles dans les accords d’édition dans le secteur du livre européen » (3).

Droit de la consommation, propriété intellectuelle et droit pénal : les enjeux juridiques du métavers

Les défis juridiques posés par les métavers ne sont pas inédits. Mais la clé pour instaurer un climat de confiance dans le monde virtuel réside dans une adaptation proactive du cadre réglementaire actuel pour faciliter l’intégration harmonieuse et sécurisée du métavers dans notre société.

Par Arnaud Touati, avocat associé, et Dany Sawaya, juriste, Hashtag Avocats.

Le métavers est un environnement fictif en 3D, interactif et immersif, qui combine le monde réel avec des mondes virtuels. A l’intérieur, les individus peuvent incarner des avatars et interagir avec d’autres personnes ou avec des objets numériques. Imaginons un immense jeu vidéo multijoueur en ligne, regroupant divers univers de jeu où il est possible de naviguer librement. Une illustration saisissante de cette vision a été présentée dans le film « Ready Player One » de Steven Spielberg, sorti en 2018.

L’avatar, sujet de droit indépendant ?
Le métavers suit une trajectoire similaire aux enjeux soulevés par le Web, et plus récemment par la blockchain (chaîne de blocs, en français). Il est indéniable que, même dans un monde virtuel, la règle de droit continue à s’appliquer. Le métavers, tout comme la blockchain et Internet de manière générale, revêt une dimension intrinsèquement internationale. Le métavers est également un terrain de jeu fertile pour l’innovation et le développement. La France, consciente de cette opportunité, cherche à faire du métavers une priorité et envisage d’utiliser les Jeux Olympiques de 2024 à Paris (du 26 juillet au 11 août 2024) comme catalyseur pour rassembler les acteurs français des métavers. Toutefois, le développement du métavers soulève des questions juridiques complexes dans divers domaines tels que le droit de la consommation, la propriété intellectuelle, et le droit pénal. L’anticipation et l’encadrement juridique du métavers sont indispensables pour instaurer un climat de confiance et garantir une utilisation responsable et sécurisée de cette nouvelle frontière numérique. Défis et considérations juridiques du métavers en matière de consommation. Le métavers pose des défis inédits en matière de droit de la consommation. Par exemple, comment qualifier les contrats conclus entre avatars ? La capacité juridique de l’avatar repose-t-elle dans celle de l’utilisateur qui se trouve « derrière » ou l’avatar peut-il être reconnu comme un sujet de droit indépendant ? Dans ce monde virtuel, les règles de vente et de prestation de services ne sont pas encore clairement définies. Bien que le code de la consommation reconnaisse l’absence de présence physique simultanée des parties contractantes et l’utilisation de « techniques de communication à distance » pour qualifier un contrat à distance (1), la question se pose de savoir si cela est suffisant pour appréhender une transaction dans le métavers. On peut envisager que la capacité juridique de l’avatar repose dans celle de l’utilisateur qui le contrôle, faisant de l’avatar une extension légale de l’utilisateur, ou que l’avatar soit reconnu en tant que sujet de droit indépendant. La validité des contrats conclus entre avatars soulève également des interrogations quant à leur qualification juridique. Concernant la qualification du contrat comme « à distance », cela implique l’absence de présence physique simultanée des parties et « le recours exclusif à une ou plusieurs techniques de communication à distance jusqu’à la conclusion du contrat », cette qualification peut être appliquée dans le contexte du métavers. Ainsi, on peut envisager que les avatars qui recourent à un mode virtuel de communication au sein du métavers représentent une autre forme de « technique de communication à distance ». Quant à la qualification du contrat comme « hors établissement », qui repose sur l’exigence de « la présence physique simultanée des parties »soit au lieu de la conclusion soit au lieu de la sollicitation, elle n’est évidemment pas transposable dans le métavers.

L’encrage à l’extrême droite du Parlementeuropéen hypothèque la réforme des télécoms

Les dernières élections européennes, donnant la part belle aux nationalistes, rendent incertaine la prochaine déréglementation des télécoms dans les Vingt-sept, alors que la Commission européenne doit réviser le code européen des communications électroniques d’ici décembre 2025.

Au plus tard le 21 décembre 2025, et tous les cinq ans par la suite, la Commission européenne est tenue de réexamine le fonctionnement de la directive de 2018 établissant le code des communications électroniques européen (CCEE). De même, d’ici cette même échéance, et tous les cinq ans là aussi, elle doit aussi réexaminer la portée du service universel, en vue de proposer la modification ou la redéfinition du champ d’application.

Déréglementer le marché des télécoms ?
A cela s’ajoute le projet de règlement télécoms, le Digital Networks Act (DNA) que pousse l’actuel commissaire européen au Marché intérieur, Thierry Breton (photo), pour la prochaine mandature. Autant dire que la prochaine Commission européenne, qui prendra ses fonctions fin 2024 en tenant compte de l’extrême-droitisation du Parlement européen depuis juin, pourrait faire de la réforme des télécoms l’un de ses priorités. Rappelons que le code des communications électroniques européen, adopté en 2018 (1), a modifié et regroupé quatre directives préexistantes adoptées en 2002 et modifiées en 2009, à savoir les directives « cadre », « autorisation », « accès » et « service universel ». Cette directive du code des télécoms est censée avoir été transposée par chacun des Vingt-sept au plus tard le 21 décembre 2020.
Or, selon les constatations de Edition Multimédi@, il y a encore à mi-2024 des trous dans la « raquette » européenne des télécoms : l’Italie, le Luxembourg, la Grèce et la Bulgarie sont les quatre Etats membres qui n’ont quasiment pas transposé la directive du code des communications électroniques européen, avec respectivement seulement deux, deux, deux et une mesure(s) prise(s) en compte au niveau national (2). En plus de ces mauvais élèves européens, force est aussi de constater que bon nombre d’autres Etats membres n’ont que partiellement transposé la directive du code des télécoms. Dès le 4 février 2021, la Commission européenne avait engagé une procédure d’infraction contre 24 Etats membres, dont la France pour défaut de transposition du code des communications électroniques (3), suivie le 23 septembre 2021 d’un avis motivé adressé à 18 d’entre eux (4). Puis, le 6 avril 2022, la Commission européenne a saisi la Cour de justice de l’Union européenne (CJUE) d’un recours contre dix Etats membres pour défaut de transposition complète dans le droit national du code des communications électroniques (5).

Qui est Voodoo, la licorne désormais propriétaire de BeReal racheté 500 millions de d’euros

La licorne française Voodoo, éditeur de jeux mobiles, entame sa seconde décennie d’existence sur les chapeaux de roue en s’emparant du réseau social BeReal (40 millions d’utilisateurs) pour un demi-milliard d’euros. Cette diversification lui permet de trouver des relais de croissance nécessaires.

L’annonce du rachat de BeReal a été faite le 11 juin dernier par Alexandre Yazdi (photo), PDG cofondateur de la société française Voodoo, connue pour ses jeux sur smartphone tels que « Helix Jump » (800 millions de téléchargements depuis sa création), « Paper.io » (280 millions), « Aquapark.io » (271 millions), « Crowd City » (237 millions) « Color Road » (101 millions) et bien d’autres titres parmi un catalogue de plus de 200 jeux mobiles (1), totalisant ensemble à ce jour plus de 7 milliards de téléchargements et 150 millions de « joueurs occasionnels » (appelés aussi en anglais casual games, voire hypercasual games).

Second souffle au-delà du casual gaming
Ces jeux pour smartphone ont vocation à s’adresser au grand public et leurs utilisateurs recherchent avant tout une prise en main facile et rapide du jeu sans forcément y passer des heures, contrairement aux gamers sur des jeux vidéo. Le marché du casual gaming (voire de l’hypercasual gaming) est en pleine expansion : des labyrinthes, des circuits de billes virtuelles, des jeux de cartes, des puzzles de type Tetris, … Ils sont souvent minimalistes, aux graphismes attrayants et sans fin, ce qui les rend souvent addictifs. Les deux ans de pandémie de covid-19 et le télétravail ont donné un coup de fouet à ces mini-jeux gratuits financés par de la publicité et par des achats dans l’applications (in-app). Les grands éditeurs de ces petits jeux pour mobile s’appellent Zynga – acquéreur en 2020 de Rollic et propriété depuis 2022 de Take-Two interactive (2) –, Kwalee ou encore Ketchapp, tous des rivaux de Voodoo.