A propos Charles de Laubier

Rédacteur en chef de Edition Multimédi@, directeur de la publication.

Entraînement de modèles d’IA grâce aux données collectées par web scraping : les règles à suivre

Les plaintes à l’encontre de fournisseurs de systèmes d’IA se multiplient, que ce soit pour violation des droits de propriété intellectuelle ou pour manquements en matière de données à caractère personnel, notamment en lien avec leurs pratiques de collecte de données en ligne (web scraping).

Par Sandra Tubert et Laura Ziegler avocates associées, Algo Avocats

Afin de développer un système d’intelligence artificielle (IA) performant, il est nécessaire d’entraîner en amont les modèles qui le composent au moyen de vastes ensemble de données. Constituer ces ensembles de données d’entraînement représente donc un enjeu majeur pour les fournisseurs de systèmes d’IA. Plusieurs alternatives s’offrent à eux : utiliser les bases de données dont ils disposent en interne ; obtenir des licences auprès de titulaires de droits de propriété intellectuelle sur des contenus pertinents ; ou recourir au web scraping pour récupérer des données accessibles en ligne sur différents sites Internet.

Exception de Text and Data Mining
Cette troisième option, le web scraping (« moissonnage des données »), a connu un essor important ces dernières années. Pour autant, bon nombre d’acteurs récupèrent des données en ligne pour entraîner leurs modèles sans appréhender tous les enjeux et problématiques qui y sont attachés. Alors que plusieurs plaintes ou enquêtes d’autorités visent des fournisseurs de modèles d’IA à usage général pour des allégations de violation des droits de propriété intellectuelle ou de manquements au règlement général sur la protection des données (RGPD), l’entrée en vigueur prochaine du règlement européen sur l’intelligence artificielle – l’AI Act dont le texte final (1) a été signé le 13 juin 2024 – pourrait mettre en évidence les problématiques entourant les sources de données utilisées pour entraîner les modèles.

L’industrie du livre est appelée à mieux rémunérer les auteurs à l’ère du numérique et de l’IA

Le Syndicat national de l’édition (SNE) a tenu le 27 juin 2024 son assemblée générale annuelle. L’industrie du livre dans les Vingt-sept, dont la France, va passer sous les fourches caudines de la Commission européenne qui a lancé – via sa DG Connect – une enquête sur les contrats d’auteur.

Ce n’est pas anodin à l’ère du numérique et en pleine déferlante de l’intelligence artificielle : la DG Connect – direction générale des réseaux de communication, du contenu et de la technologie de la Commission européenne – a lancé jusqu’au 21 juin une « enquête sur les pratiques contractuelles touchant le transfert du droit d’auteur et des droits voisins ». Si cette démarche porte sur le secteur de la création et de la culture en général au regard des artistes, elle concerne en particulier les maisons d’édition et leurs contrats avec les auteurs.

Papier, ebook, audio, streaming, IA, …
Cette enquête menée en ligne (1) s’est adressée d’abord directement aux auteurs et aux artistes des industries culturelles et créatives en Europe. Mais leurs organisations professionnelles et représentatives (2) ont pu y répondre aussi. L’objectif de cette étude est notamment de « recueillir des données et des preuves concernant les arrangements contractuels liés au transfert du droit d’auteur ou des droits voisins, et évaluer leurs effets, en particulier sur la capacité des créateurs à recevoir une rémunération équitable et la capacité des producteurs à utiliser efficacement leurs droits à long termes ». Les contrats d’édition posent problèmes et le partage de la valeur entre les éditeurs de livres et les auteurs laisse à désirer. A l’occasion du troisième anniversaire de l’entrée en vigueur de la directive européenne « Droit d’auteur et droits voisins dans le marché unique numérique » de 2019, le Conseil des écrivains européens – European Writers’ Council (EWC) basé à Bruxelles – a publié début juin un rapport sur « les clauses contractuelles dans les accords d’édition dans le secteur du livre européen » (3).

Parmi les dix milliardaires qui possèdent des médias en France, Daniel Kretinsky est le seul non-Français

Sur la dizaine de milliardaires qui font la pluie et le beau temps sur les médias en France, en tant qu’actionnaires – situation unique au monde –, un seul n’est pas Français : le Tchèque Daniel Kretinsky. Ce pro-Macron, conservateur, libéral et Européen, investit tous azimuts sur le marché français.

(Le 2 juillet 2024, soit huit jours après la parution de cet article dans Edition Multimédi@ n°324, l’armateur CMA CGM du milliardaire Rodolphe Saadé a finalisé l’acquisition d’Altice Media)

Plus que jamais, des pans entiers du paysage médiatique français sont aux mains de dix milliardaires (1), qui bénéficient en outre des aides d’Etat à la presse. Tous ont la nationalité française, sauf un : Le milliardaire Vincent Bolloré (groupe Bolloré) est Français et possède Vivendi/Canal+ /C8/CNews, Havas, Prisma Media/Voici/ Capital/Femme actuelle, et Lagardère/Europe 1/JDD/Hachette Livre. Le milliardaire Rodolphe Saadé (groupe CMA CGM) est FrancoLibanais et détient La Provence/Corse Matin, M6, Brut, et La Tribune/La Tribune Dimanche, et rachète Altice Media/BMFTV/RMC. Le milliardaire Bernard Arnault (groupe LVMH) est Français et contrôle Le Parisien/Aujourd’hui en France, Les Echos, Radio Classique, Challenges/Sciences et Avenir, OpinionWay et bientôt Paris Match. Le milliardaire Patrick Drahi (groupe Altice) est Franco-Israélo-Portugais et possède Altice Média/BFMTV/RMC qu’il est en train de vendre au milliardaire Rodolphe Saadé, après avoir vendu L’Express à Alain Weill (ex-PDG de Next RadioTV/BFMTV/ RMC) et Libération cédé à Presse Indépendante. Le milliardaire Xavier Niel (groupe Iliad-Free) est Français et est copropriétaire du groupe Le Monde/Le Monde/Télérama/ Le Nouvel Obs/Télérama/La Vie/Le Monde diplomatique/Courrier international/ LeHuffPost.fr, du groupe Nice-Matin/Nice-Matin/Var-Matin et Bestimage.

Bolloré, CMA CGM, LVMH, Bouygues, Fiducial, …
La famille milliardaire Dassault (groupe Dassault/GIMD) est Française (Olivier Dassault est décédé en mars 2021) et possède le groupe Le Figaro/Le Figaro/Le Figaro Magazine/Le Figaro TV, Le Journal du Net/L’Internaute, Gala, TV Magazine. Le milliardaire Martin Bouygues (groupe Bouygues) est Français et possède TF1/TMC/TFX/TF1 Séries Films/LCI/Ushuaia TV/Histoire TV/TV Breizh, TF1+ (ex-MyTF1) et TFou Max. Le milliardaire François Pinault (holding Artémis dirigé par son fils François-Henri Pinault et détenteur de Kering/Yves Saint Laurent/Gucci et Christie’s) est Français et possède Le Point, Point de Vue, Le 1 hebdo et Tallandier Editions. Le milliardaire Christian Latouche (groupe Fiducial) est Français et possède Sud Radio, Lyon Capitale, Lyon TV (2). Quant au milliardaire Daniel Kretinsky (groupe EP/CMI), il est le seul de nationalité étrangère, à savoir Tchèque. Européen convaincu, il fêtera ses 49 ans le 9 juillet prochain, soit une semaine avant qu’« il » ne soit auditionné – le 16 juillet – par l’Arcom dans le cadre de l’appel aux candidatures pour l’édition de services nationaux de la TNT, et pour lesquels le régulateur entendra les 25 « candidats recevables » du 8 juillet au 17 juillet (3).

Kretinsky lorgne la TNT, L’Opinion et Delcourt
La filiale CMI France a en effet déposé un dossier pour espérer lancer une chaîne nationale – « RéelsTV » – sur l’une des 15 fréquences de la TNT remises en jeu. Contacté par Edition Multimédi@ pour savoir s’il sera aux côtés de Denis Olivennes, président de CMI France, pour défendre ce projet, Daniel Kretinsky (photo de Une) ne nous a pas répondu. Dernier arrivé dans le désormais « Club des Dix » milliardaires des médias en France, l’homme d’affaire tchèque est le plus actif du moment. Il s’apprête à prendre 49 % du capital de la société Bey Médias, éditeur de L’Opinion et de L’Agefi, fondée par Nicolas Beytout. C’est ce dernier qui a annoncé le 13 juin être entré en négociation exclusive avec CMI France. Le quotidien « libéral, pro-business et européen » (4) a été créé en tant que « bimédia » en 2013 par l’ex-directeur de la rédaction du quotidien économique Les Echos et ancien PDG du groupe Les Echos au début de l’ère « Bernard Arnault/LVMH » actuelle. Tandis que L’Agefi, site financier et bi-hebdo papier, a été racheté en 2019 par Bey Médias auprès du milliardaire François Pinault (Artémis).

TV5Monde, la chaîne publique de la francophonie, est aussi une plateforme à succès grâce à Yves Bigot

Chaîne internationale reconnue de la francophonie, détenue et financée par six Etats que sont la France, la Suisse, le Canada, le Québec, la Belgique et Monaco, TV5Monde comptait ouvrir son capital et sa gouvernance à des pays africains. Mais son PDG Yves Bigot a été lâché par le gouvernement.

La décennie « Yves Bigot » aura été profitable à la chaîne francophone internationale TV5Monde. Ce journaliste avait pris ses fonctions de président-directeur général à 58 ans le 7 janvier 2013 en succédant à Marie-Christine Saragosse (1). Il quittera TV5Monde à 69 ans le 30 juin prochain (soit cinq mois avant la fin de son mandat), sa démission – surprise – ayant été annoncée en interne le 28 mai par le secrétaire général de la chaîne Thomas Derobe (2), alors que Yves Bigot était lui-même en mission à Washington (3) pour l’entreprise après avoir remis la veille sa lettre de démission au conseil d’administration présidée depuis août 2015 par Delphine Ernotte (4). Trois femmes sont candidates à sa succession, dont l’ex-ministre Elisabeth Moreno, selon La Lettre (5). Cette démission intervient après que la ministre de la Culture Rachida Dati lui ait signifié le 19 avril dernier : « On n’a rien à vous reprocher, votre bilan est impeccable, mais on ne vous renouvellera pas ». A Télérama le 28 mai, Yves Bigot a justifié son départ précipité : « Je ne suis pas fonctionnaire et il faut que je trouve un job. […] Si on m’avait proposé de continuer, je l’aurais fait volontiers » (6) En 40 ans d’existence, et surtout durant ces onze dernières années sous sa direction générale, TV5Monde (ex-TV5) est devenu l’un des plus grands groupes audiovisuels d’envergure mondiale et le premier éditeur international de chaînes francophones, diffusées à la fois par voies hertziennes et numériques.

A quand TV5Monde sur la TNT en France ?
Le bouquet TV5Monde (dix chaînes) est ainsi présent sur les TNT nationales de pays africains, par satellite, par câble, sur les box d’opérateurs télécoms ainsi qu’en streaming par Internet ou sur application mobile. A propos de la TNT, une porte-parole du groupe a apporté à Edition Multimédi@ la précision suivante : « TV5Monde est disponible sur la TNT au Bénin, au Sénégal, aux Seychelles, à l’Ile Maurice et au Rwanda. Concernant notre présence sur la TNT en France, elle n’est pas au programme. Nous sommes évidemment pour y être disponible un jour mais c’est une décision qui revient à l’Arcom ». Et ce n’est pas faute de lui avoir demandé : en 2009, l’ancienne directrice générale Marie-Christine Saragosse avait déjà sollicité le CSA pour « réfléchir à une fréquence de TV5Monde sur la TNT ». Mais cela n’avait pas abouti. Contactée sur ce point, l’Arcom ne nous a pas répondu. « Cette éventuelle présence sur la TNT en France aurait également un coût très important qui n’est pas à la portée de TV5Monde », nous a en outre indiqué la porte-parole du groupe télévisé francophone.

L’ex-secrétaire d’Etat au Numérique Cédric O fait toujours polémique avec son « Mistral gagnant »

Le lobbying dans l’IA de l’ancien secrétaire d’Etat au Numérique, Cédric O, continue de faire polémique sur fond de soupçons de conflits d’intérêts. La Haute autorité pour la transparence de la vie publique (HATVP) avait exprimé des réserves en juin 2022. Et depuis ?

(Le 11 juin 2024, soit le jour suivant la publication de cet article dans le n°323 de Edition Multimédi@, Mistral AI annonçait une levée de fonds de 600 millions d’euros, et, le 17 juillet, la HATVP nous a indiqué qu’elle venait de « procéder au contrôle du respect des réserves » formulées en 2022 et qu’ « aucun élément ne permet de conclure que ces réserves auraient été méconnues », mais aucune communication officielle n’est prévue)

Cédric O, cofondateur et actionnaire de la start-up Mistral AI via sa propre société de conseil Neopunteo, estil juge et partie – voire en conflits d’intérêts – vis-à-vis du gouvernement dont il fut secrétaire d’Etat au Numérique (mars 2019 à mai 2022) ? La question est lancinante mais légitime puisque cela concerne l’ancien secrétaire d’Etat au Numérique. Contactée par Edition Multimédi@, la Haute autorité pour la transparence de la vie publique (HATVP), présidée par Didier Migaud, nous a assuré qu’elle s’était bien prononcée dans sa délibération du 14 juin 2022 sur la demande que lui avait soumise Cédric O (photo) concernant notamment sa société Neopunteo.

Neopunteo, société de conseil au bras long
« Cédric O a créé le 11 juillet 2022 Neopunteo, qui a notamment pour objet social la prise de participation, directe ou indirecte, dans toutes opérations financières, immobilières ou mobilières ou entreprises commerciales ou industrielles pouvant se rattacher à l’objet social, notamment par voie de création de sociétés nouvelles, le tout directement ou indirectement, pour son compte ou pour le compte de tiers », nous a précisé un porte-parole de la HATVP. Et celui-ci de nous confirmer en outre : « C’est la société Neopunteo qui a souscrit des parts au capital de la société Mistral AI ». C’est ainsi que l’ancien secrétaire d’Etat au Numérique a pu affirmer auprès de l’AFP en décembre dernier qu’« [il] respect[ait] toutes les obligations demandées par la HATVP ». Cédric O a investi dans la start-up Mistral AI, créée le 28 avril 2023, dont il est coactionnaire et « conseiller-cofondateur » via sa société Nopeunteo qui était encore à l’état de projet au moment du rendu de l’avis contraignant du gendarme de la transparence de la vie publique.
Comme Cédric O a occupé ses fonctions ministérielles du 31 mars 2019 au 20 mai 2022, il avait en effet l’obligation – dans les trois ans suivant la cessation de ses fonctions à Bercy, soit jusqu’en mai 2025 – de saisir la HATVP avant de s’engager professionnellement. La haute autorité se prononce sur la compatibilité ou pas de l’exercice d’une activité rémunérée au sein d’une entreprise avec les fonctions de membre du gouvernement exercées au cours des trois années précédant le début de l’activité. Objectif : éviter le risque de prise illégale d’intérêts, laquelle relève d’une infraction pénale passible de trois ans d’emprisonnement et d’une amende de 200.000 euros. Il s’agit aussi de lutter contre tout conflit d’intérêt et d’édicter éventuellement des mesures à respecter pour prévenir les risques déontologiques. Depuis que Cédric O a quitté Bercy, la HATVP a publié quatre délibérations le concernant. La première délibération est celle datée de juin 2022 et concerne France Asie et Sista, ainsi que le projet de « créer une entreprise afin de réaliser des prestations de conseil » (1), Nopeunteo. Dans ses « réserves », la haute autorité a demandé à Cédric O de « respecter les règles déontologiques », de ne pas « faire usage ou de divulguer des documents ou renseignements non publics dont il aurait eu connaissance », et lui « suggère » de la saisir « avant de prendre pour client un organisme ou de prendre une participation dans une entreprise appartenant au secteur du numérique ».