Le chinois TikTok séduit l’édition avec son BookTok

En fait. Le 28 novembre, les 23ès Assises du numérique, organisées à Paris par le Syndicat national de l’édition (SNE), accueilleront TikTok France, filiale du chinois ByteDance, pour parler de sa communauté BookTok. TikTok Allemagne a été partenaire de la Foire du Livre de Francfort. Bientôt au Festival du livre de Paris 2023 ?

En clair. Un peu plus d’un mois après avoir été partenaire pour la première fois du Salon du livre de Francfort, qui s’est déroulé du 19 au 23 octobre derniers, TikTok va continuer de faire la promotion de sa communauté BookTok mais cette fois à Paris aux Assises du livre numérique qui se tiennent le 28 novembre. Organisées par le Syndicat national de l’édition (SNE) avec le soutien de la Société française des intérêts des auteurs de l’écrit (Sofia) et du Centre français d’exploitation du droit de copie (CFC), cette journée fera intervenir une représentante de TikTok France : Elodie Ricquier Veybel, jusqu’alors responsable des partenariats contenus, promue en novembre responsable « modes de vie et formation » (1).
La filiale française du chinois ByteDance (2) veut montrer comment la communauté BookTok de lecteurs et de lectrices contribue au succès de livres et de leurs auteurs grâce à la recommandation sur sa plateforme de partage de vidéos. Rien qu’en France, où TikTok compte selon Médiamétrie un peu moins de 20 millions de visiteurs uniques par mois, plus de 375.900 vidéos totalisant 1,6 milliard de vues ont été publiées sur les neuf premiers mois de cette année par les « BookTokeurs » qui se manifestent via le hashtag #booktok pour parler littérature. Mais c’est au niveau mondial, où TikTok totalise quelque 1 milliard d’utilisateurs actifs, que BookTok tend à devenir un « phénomène » (dixit TikTok) incontournable pour la promotion de l’édition : ce bouche-à-oreille virtuel et viral incite notamment les « adolécrans » à lire de la littérature pour jeunes adultes (3).
« Créateurs, auteurs et amateurs de lecture se réunissent sur TikTok tous les jours pour partager leur passion pour les livres. Avec plus de 73 milliards de vues dans le monde, #BookTok a donné une nouvelle vie aux titres classiques et a contribué à attirer de nouveaux auteurs et livres à un public de millions de personnes », s’était félicité Tobias Henning, directeur général de TikTok Allemagne et Europe de l’Est et centrale, au début de la Foire du livre de Francfort. Au 18 novembre, le compteur de #BookTok a grimpé à 90,4 milliards de vues (4). A la suite du mot dièse local #GermanBookTok, est apparu aussi #BookTokFrance. Par exemple, l’auteur suisse Joël Dicker, du bestseller « La Vérité sur l’affaire Harry Quebert », en a profité. De même que le Français Stéphane Ribeiro, pour son « Tout sur nous ». @

Différence entre les blocages de TeamAlexandriz (2021) et de Z-Library (2022) : le rôle de l’Arcom

Prise le 25 août 2022 par le tribunal judiciaire de Paris, la décision de blocage des adresses Internet de Z-Library – vaste bibliothèque en ligne – est applaudie par les maisons d’édition en France. Mais le piratage d’ebooks, avec ses sites miroirs désormais listés par l’Arcom, est sans frontières.

Orange, Bouygues Telecom, SFR et Free sont obligés rendre inaccessible sur l’Hexagone la bibliothèque en ligne Z-Library, condamnée pour contrefaçon de livres numériques. Edition Multimédi@ a constaté que le blocage sur les « box » de ces fournisseurs d’accès à Internet (FAI) était effectif : « Désolé, impossible d’accéder à cette page », nous a confirmé le navigateur en voulant par exemple aller sur « fr.z-lib.org » ou sur « http://z-lib.org ». Le jugement du 25 août 2022, que nous nous sommes procurés (1), liste 209 noms de domaine de Z-Library à rendre inaccessibles « pendant une durée de 18 mois ». Sont ainsi neutralisés autant de sites dits « miroirs » permettant jusqu’alors d’entrer dans cette bibliothèque parallèle géante, qui est une des multiples déclinaisons de Library Genesis d’origine russe.

Listes noires des sites et des miroirs
Le Syndicat national de l’édition (SNE) et une douzaine de maisons d’édition (Actes Sud, Albin Michel, Cairn, Editis, Hachette Livre, Humensis, Lefebvre-Sarrut, LexisNexis, Madrigall, Maison des Langues, Odile Jacob, et les Presses de Science Po) avaient attaqué le 29 juin 2022 le site web Zlibrary devant le tribunal judiciaire de Paris, dans le cadre d’une procédure accélérée au fond. Vingt-cinq jours après le rendu de la décision de blocage (le temps que la signification du jugement aux FAI soit faite aux interressés), le SNE s’est notamment félicité des « nouvelles prérogatives confiées à l’Arcom en matière d’extension du blocage à tout lien redirigeant vers une réplique de site bloqué ».
Et pour cause, l’Autorité de régulation de la communication audiovisuelle et numérique (née de la fusion entre le CSA et l’Hadopi) se retrouve aux avant-postes de la lutte contre le piratage en ligne. Et ce, depuis la promulgation il y a presqu’un an de la loi du 25 octobre 2021 « relative à la régulation et à la protection de l’accès aux œuvres culturelles à l’ère numérique » (2). C’est cette loi « Anti-piratage » qui a porté sur les fonts baptismaux législatifs l’Arcom – présidée par Roch-Olivier Maistre (photo) jusqu’en janvier 2025 – en lui attribuant de nouveaux pouvoirs de régulation, notamment en la chargeant de constituer « une liste » – surnommée, hors texte de loi, « liste noire » – des « services porta[n]t atteinte, de manière grave et répétée, aux droits d’auteur ou aux droits voisins ». En outre, l’Arcom a le pouvoir supplémentaire de « lutte contre les sites miroirs ». Ainsi, la loi « anti-piratage » a rajouté une disposition « sites miroirs » dans le code de la propriété intellectuelle (CPI) qui permet à « un titulaire de droits partie à la décision judiciaire » – par exemple l’un des douze maisons d’édition dans l’affaire « ZLibrary » – de saisir l’Arcom pour lui demander de mettre à jour la décision de blocage avec les nouvelles adresses Internet des sites miroirs. En l’occurrence, le blocage à effectuer par les FAI devra suivre l’évolution de la liste noire qui dépassera sûrement les 209 noms de domaine initialement identifiées. Pour l’heure, dans l’affaire « Z-Library », la décision de justice a été rendue le 25 août 2022 : il ne reste plus qu’à un ayant droit concerné de saisir l’Arcom en s’appuyant sur l’article L. 331-27 du CPI. Que dit-il ? « Lorsqu’une décision judiciaire passée en force de chose jugée a ordonné toute mesure propre à empêcher l’accès à un service de communication au public en ligne en application de l’article L. 336-2 [du CPI, nous y reviendrons, ndlr], l’Autorité de régulation de la communication audiovisuelle et numérique [Arcom], saisie par un titulaire de droits partie à la décision judiciaire, peut demander à toute personne visée par cette décision (…) d’empêcher l’accès à tout service de communication au public en ligne reprenant en totalité ou de manière substantielle le contenu du service mentionné par ladite décision ». Bref, toute nouvelle apparition d’un site miroir lié de près ou de loin à la plateforme pirate condamnée devra faire aussi l’objet d’un blocage de la part non seulement des quatre principaux opérateurs télécoms français mais aussi des moteurs de recherche ou des annuaires de référencement (si le juge le décide).
Pour ce faire, c’est l’Arcom qui communiquera « précisément » à tous ces acteurs « les données d’identification du service en cause » à bloquer et à déréférencer. La loi « anti-piratage » prévoit même que l’Arcom passe des accords avec« les ayants droit et toute personne susceptible de contribuer à remédier aux atteintes aux droits d’auteur et droits voisins en ligne » pour déterminer notamment les conditions d’« information réciproque » sur l’existence de tout site miroir.

Saisines « L. 336-2 » et « L. 331-27 »
L’Arcom peut en outre – « en cas de difficulté » – demander aux services de communication au public en ligne de se justifier. En lisant la fin de l’article L. 331-27 du CPI, l’on comprend implicitement que l’Arcom peut saisir, « en référé ou sur requête », l’autorité judiciaire pour « ordonner toute mesure destinée à faire cesser l’accès à ces services ». Cette saisine-là peut se faire « sans préjudice de la saisine prévue à l’article L. 336-2. ». Il y a donc deux types de saisine des tribunaux pour faire bloquer et déréférencer des sites web pirates d’œuvres ou d’objets protégés par le droit d’auteur : la saisine « L. 336-2 » par des titulaires de droits, leurs ayants droit, des organismes de gestion collective, des organismes de défense professionnelle, ou même par le CNC – le Centre national du cinéma et de l’image animée (3) ; la saisine « L. 331-27 » par l’Arcom (bien que cela ne soit pas clairement spécifié dans le texte de loi) lorsqu’elle-même est saisie par un titulaire de droits concerné par la décision judiciaire rendue à l’issue de la première saisine. Cette justice à deux détentes (liste noire initiale des sites web à neutraliser, liste noire mise à jour avec les sites miroirs) tend vers le black-out – total ? – de la plateforme incriminée. Prochains : Pirate Library Mirror, Bookys, … « Ce succès collectif vient conclure l’expérimentation inédite de cette procédure pour le livre, et ouvre la voie à de nouvelles actions – des éditeurs et du SNE – de blocage et de déréférencement, rapides et systématiques, contre des sites web proposant des contenus illicites violant le droit d’auteur », a prévenu le syndicat présidé par Vincent Montagne (PDG du groupe franco-belge Média-Participations).
Autant lors de la précédente affaire « Team Alexandriz », dont les responsables ont été condamnés au pénal en mai 2021 au bout de dix ans de procédure judiciaire (4), les sites miroirs passaient sous les radars, autant depuis la loi « Anti-piratage » d’octobre 2021 permet aux ayants droit et à l’Arcom d’agir devant la justice contre la résurgence de sites miroir dans une même affaire de type « Z-Library ». « Se présentant “comme une bibliothèque gratuite depuis 2009”, mais proposant un modèle payant d’accès aux œuvres contrefaites, le site Z-Library accessible via de multiples adresses, proposait un accès à plus de 8 millions de livres – tous secteurs éditoriaux confondus – et 80 millions d’articles piratés », précise le SNE qui compte 700 éditeurs français adhérents. Le site Z-Library (ex-BookFinder ou BookFi, alias B.ok.cc), affichait, lui, avant d’être blacklisté, un catalogue de 11,1 millions de livres et plus de 84,8 millions d’articles. Quelques jours avant d’être bloqué par Orange, SFR, Bouygues Telecom et Free, cette « plus grandes bibliothèques en ligne dans le monde » lançait une « campagne de collecte » jusqu’au 1er octobre 2022 en guise d’« appel de fonds à tous ceux qui veulent contribuer encore plus au soutien et au développement de notre projet » (5). Certains internautes avisés peuvent contourner le blocage-filtrage par nom de domaine mis en place par les FAI (les DNS étant retirés de leurs répertoires d’adresses IP) et les principaux moteurs de recherche (déréférencement).
La précédente affaire « Team Alexandriz » avait été enclenchée il y a dix ans, avec là aussi la plainte du SNE, déposée en novembre 2012 avec six grands éditeurs français – Hachette, Editis, Gallimard, Albin Michel, La Martinière et Actes Sud. Le site qui se revendiquait comme le « n°1 sur les ebooks FR » avait cessé de fonctionner dès fin août 2013 mais la procédure judiciaire a continué pour s’éterniser près de dix ans (6), jusqu’à la condamnation pour contrefaçon de neuf des douze prévenus avec « circonstance aggravante de bande organisée ». Entre mai 2010 et juin 2013, était-il précisé, ce fut plus de 23.942 livres qui avaient été piratés, qu’il s’agisse de livres numériques sur lesquels les mesures de protection avaient été retirées ou de livres imprimés illégalement numérisés et corrigés (7). Certains responsables de Team Alexandriz ont écopé de peines d’emprisonnement avec sursis et le tribunal a condamné les neuf à « 10.000 euros de dommages et intérêts pour chaque éditeur et pour le SNE, en réparation du préjudice subi ». C’est relativement peu au regard de la peine maximale qu’ils encouraient : trois ans d’emprisonnement et de 300 000 euros d’amende, selon l’article L335-4 du CPI (8).
Avec la loi « Anti-piratage » et le renfort de l’Arcom dans les actions judiciaires en « procédure accélérée », le SNE et les maisons d’éditions disposent désormais d’un double-levier procédural à leur disposition. A qui le tour : à Pirate Library Mirror ? Ce site web déclare : « Nous violons délibérément la loi sur le droit d’auteur dans la plupart des pays. (…) Miroir – Nous sommes strictement un miroir des bibliothèques existantes. (…) La première bibliothèque que nous avons reflétée est Z-Library. C’est une bibliothèque populaire (et illégale). Ils ont pris la collection Library Genesis et l’ont rendue facilement consultable » (9). Ou bien à Bookys ? Ce site web le reconnaît : « En rendant le téléchargement gratuit, Bookys enfreint les règles de protection des droits d’auteurs » (10).
Reste que la portée de ces condamnations au pénal pour contrefaçon a ses limites puisque celles-ci ne s’appliquent qu’en France. Alors que les sites et de leurs sites miroirs présumés pirates sont sans frontières. Le règlement européen sur les services numériques – le DSA (Digital Services Act) – est sur le point d’entrer en vigueur. Il prévoit lui aussi le blocage mais sur décision d’un juge. Ce ne seront ni les FAI, ni les plateformes numériques, ni les régulateurs qui peuvent bloquer d’eux-mêmes les contenus piratés.

Frontières : vers un blocage européen
L’affaire « Z-Library » apparaît comme un marqueur dans l’histoire de la lutte contre le piratage de contenus protégés. Du moins en France, en attendant des actions au niveau européen lorsque le DSA sera pleinement applicable. Si les livres numériques sont concernés par cette décision de blocage du 25 août 2022, à laquelle l’Arcom contribue devant la justice avec la mise à jour de sa liste des sites miroirs et d’éventuels nouveaux recours, le nouvel arsenal judicaire est à la disposition de toutes les industries culturelles : livre mais aussi musique, cinéma, retransmissions sportifs, ou encore jeux vidéo. @

Charles de Laubier

Maisons d’édition : le livre audio risque de cannibaliser les livres numériques et imprimés

« En mai, écoute le livre qui me plait ! ». En France, mai 2022 est « le mois du livre audio ». Qu’ils soient sur support physique (CD) ou en ligne (en streaming ou en téléchargement), les livres audio sont de plus en plus écoutés. Mais il y a un risque de cannibalisation des ventes de livres à lire.

A pousser le livre audio comme jamais elles ne l’ont fait pour le livre numérique, les maisons d’édition ne sont-elles pas en train de se tirer une balle dans le pied ? Elles pourraient accélérer le déclin de leur industrie du livre. Non seulement éditer un livre audio ne relève plus de la planète Gutenberg, contrairement aux éditions imprimées et par extension numériques, mais, en plus, considérer l’écoute d’un livre audio comme de la lecture constitue un abus de langage dont les utilisateurs ne sont pas dupes. Ecouter n’est pas lire, et vice-versa. Le livre audio, c’est en quelque sorte de la lecture par procuration.

L’audiobook grignote d’abord l’ebook
A trop vouloir « mettre les livres sur écoute », en se diversifiant parfois eux-mêmes dans l’audiovisuel – comme Hachette Livre et Albin Michel qui détiennent respectivement 60 % et 40 % de la société Audiolib –, les maisons d’édition prennent-elles le risque de cannibaliser leur propre coeur de métier historique ? Lizzie du groupe Editis (Vivendi). Gallimard Audio/Ecoutez Lire du groupe Madrigall, Actes Sud Audio, … Nombreux sont les membres du Syndicat national de l’édition (SNE), représentant notamment les majors françaises de l’industrie du livre, qui ont décidé de donner de la voix à leur catalogue en faisant lire des oeuvres par des acteurs et comédiens plus ou moins célèbres. « Je ne pense pas qu’on puisse parler de “cannibalisation”, qui suppose qu’une pratique remplace l’autre. En tous cas, pas pour le livre imprimé qui a des usages très larges. En revanche, que le livre audio apporte d’autres adeptes à la lecture, ou intensifie la lecture, et qu’il progresse plus vite que le livre numérique – voire le dépasse en nombre –, c’est tout à fait possible. Une fois que l’offre sera élargie, la pratique de lecture audio s’installera durablement pour les générations les plus jeunes – ce sont déjà les trentenaires et moins qui l’adoptent », nous a répondu Valérie Lévy-Soussan (photo), PDG d’Audiolib chez Hachette Livre (groupe Lagardère) depuis près de dix ans (1) et présidente depuis mars 2019 de la commission « livre audio » du SNE (2).
Selon l’institut Médiamétrie pour le 12e baromètre sur les usages du livre numérique et audio, publié fin avril lors du 1er Festival du Livre de Paris par le SNE avec les sociétés d’auteurs Sofia et SGDL, sur 48,1 millions de lecteurs en France en 2021 (3), 47,7millions sont « lecteurs » de livres imprimés, 13,5 millions de livres numériques, et 9,9 millions sont « auditeurs » de livres audio. Où l’on voit que les audiobooks sont en passe de se hisser au même niveau que les ebooks, en termes d’utilisateurs. « Seuls 52 % des auditeurs de livres audio physiques [sur support CD, ndlr] en ont écouté un il y a moins d’un an, ce qui traduit vraisemblablement le début d’un véritable basculement du livre audio physique au profit du livre audio numérique », souligne ce baromètre. L’an dernier, le nombre d’auditeurs de livres audio physiques a reculé d’un point à 7,9 millions pendant que celui des livres audio numériques a progressé d’un point à 6,6 millions. Sans parler de la notoriété des audiobooks qui gagne du terrain par rapport aux ebooks. Si cannibalisation il y a de la part de l’écoute au détriment de la lecture, elle se fait par grignotement qui touche en premier lieu le livre numérique. Le livre broché (imprimé) semble moins impacté (4). C’est une aubaine pour les éditeurs puisque le livre audio numérique est, en vente à l’acte, à peu près au même prix que celui de son équivalent papier.
Une quinzaine de membres du SNE composent la commission « livre audio » du SNE, soit seulement 2 % de l’ensemble des 720 maisons d’édition que représente le syndicat. C’est justement cette commission qui a décrété le mois de mai 2022 « Mois du livre audio », une première. « Dans notre monde hyperconnecté, c’est de sens, plus encore que de silence, dont nous avons besoin », assure Valérie Lévy-Soussan, à l’heure où la lecture a été déclarée par le président de la République « grande cause nationale » jusqu’à l’été prochain. Après un Festival du Livre de Paris qui a privilégié le papier, le libre audio s’est fait entendre jusqu’au 11 mai au Festival du Livre audio organisé à Strasbourg par l’association La plume de Paon (5), laquelle assure la promotion du livre audio (6).

Des festivals du livre audio à gogo
La plume de Paon a organisé dans la foulée pour les professionnels, les 13 et 14 mai, toujours à Strasbourg, les Rencontres francophones du livre audio (7). Puis, à Paris cette fois et le 22 mai, le Festival Vox – « du livre audio et de la lecture à voix haute » – organise un marathon de lecture à la Maison de la poésie (8). Quant à la commission « livre audio » du SNE, elle a prévu le lancement d’ici fin mai d’un nouveau site Internet entièrement consacré au livre audio. Baptisé « Lire ça s’écoute ! », il sera doté de ressources professionnelles et d’un catalogue exhaustif de titres des éditeurs membres. @

Charles de Laubier

L’intelligence artificielle s’immisce dans l’industrie du livre, assise sur un tas d’or : ses données

La 22e édition des Assises du livre numérique, organisées le 6 décembre par le Syndicat national de l’édition (SNE), a pour thème « l’application de l’intelligence artificielle (IA) dans l’édition de livres ». Avec comme « invité inaugural » : Tom Lebrun, co-auteur en 2020 d’un livre blanc sur l’IA.

Ce n’est pas la première fois que les Assises du livre numérique (1) traitent de la question de l’intelligence artificielle (IA) dans l’industrie du livre. Déjà en 2017, lors de l’édition de 2017, une table-ronde avait été consacrés à ce sujet et avait fait l’objet d’une synthèse (2). Celle-ci relevait plus d’un défrichage de la part de la commission numérique que préside depuis plus de sept ans Virginie Clayssen (photo) au sein du Syndicat national de l’édition (SNE), elle-même étant par ailleurs directrice du patrimoine et de la numérisation chez Editis (groupe Vivendi).

Apprivoiser les data de l’IA
Quatre ans après cette table-ronde, le SNE muscle son approche de l’IA en lui consacrant pour la première fois – le 6 décembre pour cette 22e édition et « uniquement en distanciel » – la totalité du programme de ses Assises du livre numérique. « Comment l’intelligence artificielle peut-elle intervenir dans les différentes étapes de la chaîne du livre, de la traduction à la diffusion en passant par la fabrication ? », s’interrogent l’industrie du livre. Un invité inaugural de cette journée doit répondre à la question plus sensible : « Comment l’intelligence artificielle peut-elle transformer le monde de l’édition ? ». Cet intervenant est Tom Lebrun (photo page suivante), juriste et doctorant à l’université Laval (UL), au Québec (Canada), spécialiste en droit et intelligence artificielle, ainsi que co-auteur avec René Audet du livre blanc « L’intelligence artificielle dans le monde de l’édition » publié en septembre 2020 sous licence libre creative commons (3). Tom Lebrun est spécialisé en droit du numérique et en droit d’auteur. Ses travaux de recherche portent actuellement sur la question de « la génération de textes par intelligence artificielle ». Il publie régulièrement sur les questions de droit d’auteur, de culture numérique et de rapport entre droit et IA. Ses recherches sont financées par un fonds québécois (4). « L’intelligence artificielle fait l’objet de fantasmes et de craintes souvent irraisonnées. Elle trouve à s’insérer dans toutes les sphères de notre société : consommation, médecine, industrie, vie quotidienne, … Pourtant, encore peu de travaux ont été consacrés à sa mobilisation par les différents acteurs de l’écosystème du livre. Ce manque est d’autant plus critique que les grands acteurs du numérique – Amazon en tête – s’engouffrent très largement dans cette voie depuis un certain nombre d’années », font justement remarquer Tom Lebrun et René Audet dans l’introduction de leur livre blanc d’une trentaine de pages et mis en ligne gratuitement (5). Contacté par Edition Multimédi@, Tom Lebrun indique que depuis sa parution il y a un an, « les différences sont mineures et strictement quantitatives ». Et aujourd’hui, « les systèmes sont simplement plus performants et plus convaincants ». Les deux auteurs relèvent que le monde de l’édition – habitué jusqu’alors à la « rétroaction entre ses différents acteurs (le libraire informant le diffuseur, ce dernier informant l’éditeur, etc.) » – évolue désormais dans « un contexte de pressurisation économique croissante provoquée par la mainmise de quelques acteurs de la vente en ligne, particulièrement Amazon ». Aussi, la raison d’être de ce livre blanc est d’esquisser pour l’écosystème du livre « une possible piste à suivre », à savoir « l’idée d’une concertation de certains de ses acteurs sur l’utilisation d’IA (voire l’éventuelle mise en commun des données collectées) ». Dans leur conclusion, les deux auteurs québécois appellent toute la filière du livre (maisons d’édition, distributeurs, librairies, plateformes, …) à investir dans les technologies IA si elle n’a pas déjà commencé à le faire car « face à cette concurrence [des acteurs comme Amazon], chacun des acteurs de la chaîne du livre doit se demander comment faire face à ce mouvement de fond, qui s’apprête à modifier en profondeur de nombreux métiers du livre ». Le mieux pour l’introduction d’IA dans les différents maillons de la chaîne est, d’après eux, d’exploiter les différentes « données déjà disponibles et que ne possède pas la concurrence, quitte à nouer des accords asymétriques entre les différents acteurs intéressés pour y accéder ».

La chaîne du livre impactée
D’autant que ces données existent – statistiques centralisées des distributeurs, données des éditeurs ou encore celles collectées par les bibliothèques et les libraires – et sont des actifs précieux que tous les acteurs du milieu du livre possèdent, en particulier dans les bibliothèques, car « diversifier ses ressources en données peut constituer une stratégie payante ». Ces data constituent en tant que telles des ressources stratégiques considérables. Cela suppose que les maisons d’édition et l’ensemble des acteurs qui gravitent autour d’elles se mettent à « récolter » de façon optimale la data du livre, y compris les données qui ne sont pas « moissonnées » car, rappellent les auteurs du livre blanc de l’Université Laval, « le fonctionnement des applications d’IA [est] lié au volume et à la qualité des données disponibles ». Le succès des solutions d’IA dépendra surtout de la compatibilité des données entre elles. Pour ce faire, les auteurs recommandent d’« établir un protocole de normalisation des données en accord avec tous les acteurs concernés est un préalable nécessaire, sur lequel les pouvoirs publics ont un rôle à jouer ».

L’IA se met à écrire livres et articles !
Encore faut-il « catégoriser et étiqueter les données en fonction des objectifs visés », sans quoi, préviennent-ils, « les données collectées sont à peu près inutiles sans cette étape fondamentale de préparation des données ». Cela passe aussi par des chantiers communs entre des acteurs de la filière du livre, y compris avec des plateformes numériques, ainsi que par la mobilisation d’institutions et d’acteurs gouvernementaux pour contribuer au financement du développement de prototypes ou d’éléments logiciels partagés.« La mise en commun de données appelle une concertation, notamment dans le développement de ressources logicielles (aussi rendu possible par la création d’un cadre réglementaire favorable) », est-il souligné. Mais qui dit data dit cyberattaque : la cybersécurité des données « livrées » va devenir primordiale pour l’industrie du livre jusqu’alors épargnée par sa matière première historique qu’est le papier. La dématérialisation des ouvrages en tout genre fait basculer les maisons d’édition, parfois centenaires, dans le nuage informatique et ses fléaux.
Même si le livre blanc n’aborde pas le sujet du nuage informatique liés à l’IA, le cloud va pourtant permettre à l’industrie du livre de créer elle aussi des « lacs de données », des « Data Lake », à savoir le stockage des données dans leurs formats originaux ou peu modifiés, et à partir duquel leur analyse et leur valorisation peuvent s’opérer sous plusieurs formes révolutionnaires pour l’édition : data mining, text and data mining, marchine learning, business intelligence, cognitive search, master data management, etc. Encore fautil que l’industrie du livre sache ce qu’elle veut faire de cet « or noir du XXIe siècle » : des algorithmes de recommandation de livres ? de la traduction automatique d’ouvrage pour l’international (comme avec DeepL, l’IA utilisée par l’éditeur scientifique Springer) ? de l’animation de robots conversationnels (chatbots) pour interagir avec les lecteurs à la place de l’auteur et/ou de l’éditeur ? des réseaux de neurones artificiels afin par exemple de connaître les lecteurs d’un livre ? de la fouille intelligente de textes numérisés ? ou encore de la génération de romans ou d’essais à l’aide d’une IA créative ? Sur cette dernière possibilité, le juriste Tom Lebrun travaille justement en ce moment sur la question de la génération de textes par intelligence artificielle. « Au-delà du fantasme, beaucoup d’outils actuels permettent déjà d’écrire », écrit-il dans le livre blanc. La maîtrise du langage naturel – « et donc de l’écriture » – ne relève plus de la science-fiction. Et le livre blanc de mentionner la société OpenAI qui, cofondée par le milliardaire sud-africano-canadoaméricain Elon Musk il y a six ans, a développé en 2019 une IA nommée « GPT-2 » – devenue le 18 novembre dernier « GPT-3 » (6) – et capable de générer des textes de fiction ou de journalisme. Si la bêta 2 donnait des résultats « à peu près crédibles pour une lecture rapide et superficielle », la bêta 3 devrait avoir appris de ses erreurs. Et du livre à la presse, il n’y a qu’un pas : « L’écriture générée par IA est également utilisée dans le journalisme. Environ un tiers des dépêches publiées par [l’agence de presse] Bloomberg est ainsi générée par des machines », affirment les auteurs. Tom Lebrun signale à EM@ un modèle de génération de texte francophone développé par la société suisse Coteries et appelé Cedille, en version bêta (7). Le livre blanc aurait pu évoquer Dreamwriter, un algorithme conçu par le chinois Tencent, qui avait même écrit un article financier reproduit ensuite sans autorisation par un tiers. Un tribunal de Shenzhen en Chine avait reconnu fin 2019 et pour la première fois que Dreamwriter pouvait bénéficier de la protection du droit d’auteur (8). « L’IA pourrait conduire à développer des assistants créatifs personnifiés, de façon à aider à écrire ou même de dessiner “à la manière” d’un auteur, par exemple », estiment Tom Lebrun et René Audet. Tout au long de la vie d’un livre, de son écriture à sa lecture en passant par son édition, l’intelligence artificielle est amenée à y mettre son grain de sel, voire plus si affinités. Dans son roman « Exemplaire de démonstration » (Fayard, 2002), son auteur Philippe Vasset imaginait Scriptgenerator, un logiciel rédacteur de best-sellers, personnalisable par l’éditeur en fonction d’un public lecteur cible (9).

Encore beaucoup de progrès à faire
« Le risque d’une écriture entièrement algorithmisée existe bel et bien, mais pas exactement de la manière dont on l’imagine. Les auteurs de nouvelles strictement informatives, de récits tenant du divertissement, ont peutêtre effectivement du souci à se faire », ont déjà prévenu Tom Lebrun et René Audet dans une interview accordée en octobre 2020 à la Faculté des lettres et des sciences humaines (FLSH). Mais d’ajouter : « A l’inverse, celles et ceux qui pratiquent du journalisme d’investigation, celles et ceux qui travaillent à un art littéraire (…), en bref, toutes celles et ceux qui proposent un rapport critique et construit au texte, celles et ceux-là entrent dans une catégorie de production textuelle que la machine a encore du mal à investir » (10). Ouf ! @

Charles de Laubier

DSA & DMA : compromis numérique en vue entre les Etats membres, à défaut de consensus

Les deux propositions de règlement, l’un pour un « marché unique des services numériques » (DSA) et l’autre sur les « marchés contestables et équitables dans le secteur numérique » (DMA), entrent dans leur dernière ligne droite législative. La Commission européenne en a été l’initiatrice il y a un an.

L’issue des tractations et des lobbyings autour des deux propositions de règlement DSA (Digital Services Act) et DMA (Digital Markets Act) va maintenant se jouer entre l’actuelle présidence slovène de l’Union européenne (jusqu’au 31 décembre) et la prochaine présidence française (du 1er janvier au 30 juin 2022). Une réunion des Etats membres des Vingt-sept est prévue le 25 novembre – « Rue de la Loi », dans les locaux de la Commission européenne à Bruxe l le s – s o u s le thème de « Compétitivité » dans le marché intérieur et l’industrie.

Pays d’origine ou de destination ?
Si la présidence du Conseil de l’Union européenne (UE) est tournante, au rythme semestriel, la présidence de la Commission européenne – actuellement Ursula von der Leyen et son bras armé digital Margrethe Vestager (photo) – poursuit son mandat de cinq ans jusqu’à fin 2024 (renouvelable une fois). L’exécutif européen entend bien être doté d’ici-là de pouvoirs pour veiller à la bonne application des deux propositions de règlement – DSA et DMA – qu’elle avait présentées le 15 décembre 2020, il y a près d’un an. Dans le projet de compromis du DSA daté du 18 novembre, que Edition Multimédi@ s’est procuré (1), il est prévu que « la Commission [européenne] dispose des pouvoirs de supervision et d’application des obligations applicables aux très grandes plateformes en ligne ou aux très grands moteurs de recherche en ligne ». Ce projet de texte sur le « marché unique des services numériques » sera soumis, comme celui sur les « marchés contestables et équitables dans le secteur numérique », aux gouvernements des Etats membres qui se réunissent donc le 25 novembre pour tenter d’adopter une position commune sur la régulation de l’Internet. Sont aussi prévues, à l’ordre du jour (2), des délibérations législatives sur le projet de compromis du DMA, daté lui du 5 novembre et que nous sommes également procurés (3).
L’un des points de divergence entre les Etats européens portait sur le principe du pays d’origine, qui, dans la proposition initiale de la Commission européenne, donne compétence transfrontalière au pays où l’entreprise numérique est établie, contrairement au principe du pays de destination. Des pays, dont la France, ont milité contre ce principe du pays d’origine, préféré par des pays comme l’Irlande ou le Luxembourg où de nombreuses Big Tech ont leur siège social européen. Par exemple, Google/ YouTube, Facebook, Microsoft et Apple ont leur quartier général européen respectif en Irlande (à la fiscalité super attractive de 12,5 %) – les trois premiers à Dublin et le dernier à Cork. Mais une dizaine de pays de l’UE emmenés par l’Irlande justement ont fait barrage à la France en estimant que le principe du pays de destination avancée par celle-ci présentait des risques de fragmentation du marché unique numérique et risquait de devenir une usine à gaz administrative pour les plateformes digitales concernées.
« Nous défendons l’idée que la Commission [européenne] puisse jouer un rôle plus important dans la régulation directe », avait déclaré le président de la République française, Emmanuel Macron, le 22 octobre dernier à l’issue du sommet européen (4). Par la suite, de façon à limiter le principe du pays d’origine (à défaut d’avoir eu gain de cause sur le principe du pays de destination), la France a proposé que l’exécutif européen ait « une autorité exclusive » sur les très grandes plateformes en ligne transfrontalière – ce que l’on désigne à Bruxelles par le sigle VLOP (Very Large Online Platforms), pour ne pas dire GAFAM. L’idée de la présidence slovène – à laquelle adhère la France et d’autres Etats membres soucieux d’éviter les blocages et les impasses (5) – est de donner les pleins pouvoirs à la Commission européenne – et notamment à son actuelle vice-présidente Margrethe Vestager – pour ne pas laisser faire des pays comme l’Irlande si le principe du pays d’origine était appliqué dans la mise en œuvre des futurs règlements DSA et DMA.

Compromis de la présidence slovène
C’est le 26 octobre dernier que le gouvernement français a formalisé sa proposition à travers des amendements portant sur le pouvoir de régulation de la Commission européenne sur le marché unique numérique. Finalement, la France s’est ralliée au compromis de la présidence slovène : maintenir le principe du pays d’origine, renoncer à la compétence exclusive de la Commission européenne sur les VLOP, mais en revanche « il faudrait au moins trois Etats membres pour demander à l’autorité dirigeante d’un autre pays d’ouvrir une enquête » à l’encontre d’une plateforme numérique. Et dans le cas où un Etat membre (via son autorité de la concurrence ou celle de la protection des données par exemple) serait en désaccord avec au moins un autre pays européen, ou à l’inverse ne prenait aucune mesure, la Commission européenne serait en droit de reprendre la main sur l’affaire. « Les conclusions préliminaires de l’enquête seraient ensuite communiquées au conseil d’administration des “coordonnateurs des services numériques” [ou Digital Services Coordinators (DSC), ndlr], qui rendra son avis à la Commission européenne qui en tiendra compte dans sa décision finale ». Après cette procédure d’enquête, l’exécutif européen devra faire part – dans un délai de deux mois – de sa décision contraignante pour l’autorité nationale concernée.

Pouvoirs de la Commission européenne
La Commission européenne pourrait devenir un super régulateur vis-à-vis des GAFAM, en ayant à trancher sur des différends portant sur les contenus circulant sur les grandes plateformes transfrontalières (contenus illicites, fausses informations, œuvres piratées, violations de la vie privée, etc.). La modération des échanges sur les réseaux sociaux tels que Facebook, Twitter, TikTok ou Snapchat pourrait par exemple être délicate pour l’exécutif européen, chargé de s’assurer que les contenus illicites et les cyberhaines sont bannis, car cela pourrait heurter dans certains cas les sensibilités nationales et porter atteinte à la liberté d’expression. Egalement délicats à réguler, les « deepfake » seront, eux, dans le viseur du futur règlement Artificial Intelligence Act (lire p. 4). Quant à la lutte contre les fake news, la désinformation et aux rumeurs non fondées, elle ne s’appuiera pas directement sur le règlement DSA mais sur le code de bonnes pratiques lancé en 2018 par la Commission européenne avec Google, Facebook, Twitter, Microsoft, Mozilla et TikTok, ainsi qu’avec des entreprises du secteur de la publicité. Ce « Code européen de bonnes pratiques contre la désinformation » a été revisité en mai dernier (6) après qu’il ait été jugé insuffisant par une autre vise-présidente de la Commission européenne, Véra Jourová, (chargée, elle, des valeurs et de la transparence), et par la Cour des comptes européenne dans un rapport publié en juin dernier (7). Ce dispositive d’auto-régulation est en train d’être durci avec les plateformes et acteurs concernés afin qu’une nouvelle version renforcée soit opérationnelle début 2022. Du côté des industries culturelles cette fois, les attentes sont élevées et les actions de lobbying aussi (8). Pour elles – musique, audiovisuel, presse, livre, photo, télévision, sports, jeux vidéo, etc. –, le projet de règlement DSA est déjà « une occasion manquée et un pas en arrière ». Plus d’une vingtaine d’organisations culturelles les représentant l’ont fait savoir directement à la présidence slovène, à la rapporteure du DSA au Parlement européen, Christel Schaldemose (9), ainsi qu’aux Etats membres, dans une « lettre ouverte » datée du 26 octobre dernier (10). « Si les propositions, dans leur forme actuelle, étaient approuvées, le DSA affaiblirait le régime actuel de responsabilité [des plateformes numériques ou hébergeur, ndlr] et aurait un effet néfaste sur les normes et les bonnes pratiques existantes en matière de traitement des contenus et activités illégaux, y compris les violations en ligne du droit d’auteur et des droits voisins », mettent en garde les industries culturelles. Parmi les signataires de cette missive, il y a par exemple l’IFPI pour les producteurs de musique enregistrée (dont fait partie le Snep en France), la FEP pour les éditeurs de livre (dont est membre le SNE en France), Eurocinema pour les producteurs cinématographiques et audiovisuels (dont font partie l’UPC, le SPI ou l’ARP en France), ou encore la Gesac pour les sociétés d’auteurs et de compositeurs (donc la Sacem). En revanche, la presse n’est curieusement pas représentée. Dans leur « signal d’alarme », les industries culturelles s’en prennent à la « sphère de sécurité » (safe harbour) aménagée pour les moteurs de recherche qui bénéficient, selon elles, d’« une immunité large et injustifiée » – alors qu’ils sont tenus par ailleurs de supprimer promptement et efficacement les contenus illicites. « Nous sommes également très préoccupés par les propositions prévoyant que les services intermédiaires puissent continuer à bénéficier des privilèges du safe harbour », ajoutent les signataires. Ils fustigent aussi « l’introduction de délais spécifiques (même supérieurs) pour la suppression de contenu illicites [qui] affaiblirait considérablement l’obligation actuelle de prendre des mesures “expéditives” ». « Pas assez », disent les industries culturelles Les industries culturelles préconisent au contraire « le “retrait rapide” autrement dit “le plus rapidement possible” pour tout le contenu [illicites ou piratés, ndlr], et même “immédiatement” pendant la diffusion en direct [de retransmission d’événements sportifs par exemple, ndlr] et pour le contenu qui a une sensibilité particulière au temps ». Dernier grief : la vingtaine d’organisations culturelles demandent à ce « que le champ d’application des obligations soit étendu pour assurer la traçabilité des utilisateurs professionnels (Know Your Business Customer) afin de s’attaquer au grave problème des opérateurs illégaux agissant à l’échelle commerciale et se cachant derrière de fausses identités ». A suivre. @

Charles de Laubier