Robots, crawlers, IA, … levée de boucliers en ligne

En fait. Le 18 juin, la société Clipeum a annoncé avoir le premier quotidien régional Ouest-France comme nouveau client de son outil Botscorner qui permet d’identifier robots, crawlers et IA génératives pour les faire payer. Selon nos informations, le CFC n’y fait plus appel, lui préférant Human Security.

En clair. Après avoir annoncé le 23 mai la signature avec Le Monde pour l’utilisation de son outils Botscorner destiné à repérer et à cartographier les robots de crawling (aspirateurs de sites web destinés à exploiter leurs contenus), la société Clipeum – dont le nom veut dire « bouclier » en latin – a annoncé le 18 juin un nouvel accord avec, cette fois, Ouest-France. Ces deux nouveaux clients rejoignent ainsi les nombreux éditeurs de presse en ligne en France – Le Figaro, Le Parisien, L’Equipe, Le Point, Challenges, L’Usine nouvelle, Libération ou encore L’Express – qui ont opté pour ce type de solutions – Botscorner, DataDome, Human Security (ex-White Ops), … – capables d’analyser le trafic entrant et d’identifier les robots (bots) absorbant leurs articles.
Selon les informations de Edition Multimédi@, le Centre français d’exploitation du droit de copie (CFC), qui a lancé en 2018 son « outil de régulation des robots de crawling » (ORRC), ne s’appuie plus sur Botscorner depuis fin 2023 mais sur Human Security, une société newyorkaise. Objectif pour l’éditeur de presse en ligne : analyser les logs des bots et crawlers arrivant sur leurs sites web et proposer des licences d’autorisation rémunératrices aux sociétés qui activent ces robots de crawling.

Divisée face aux Gafam, la presse française ne favorise pas la transparence sur les droits voisins

Carine Fouteau, nouvelle présidente et directrice de la publication Mediapart, pointe la non transparence de Google sur les sommes dues au titre des droits voisins de la presse. Mais elle s’en prend aussi « aux médias qui ont fait le choix du chacun pour soi en signant des accord individuels ».

C’est le premier coup de gueule de Carine Fouteau (photo), cette journaliste qui a succédé en mars 2024 à Edwy Plenel à la présidence de la Société éditrice de Mediapart. La nouvelle directrice de la publication de Mediapart a dénoncé fin avril « l’opacité des Gafam » en général et « l’absence de transparence » de Google en particulier. Le média d’investigation reproche notamment « les clauses de confidentialité imposées par Google » dans le cadre de l’accord que ce dernier a signé en octobre 2023 avec la Société des droits voisins de la presse (DVP).

L’Autorité de la concurrence a déjà sévi
Ce premier « accord majeur » de la Société DVP avec Google porte sur l’exploitation des contenus de presse par Google Actualités, Google Search et Google Discover sur la période allant d’octobre 2019 à décembre 2022. Le montant total ainsi collecté – pour le compte des 305 éditeurs (dont Edition Multimédi@) et agences de presse membres de cet organisme de gestion collective – n’a pas été divulgué. Et pour cause, Google impose à la Société DVP des clauses de confidentialité qui l’empêche de publier l’enveloppe globale obtenue dans le cadre de cet accord contractuel. La nouvelle patronne de Mediapart (1), dont la société éditrice est membre du conseil d’administration de la Société DVP, pointe ce défaut de transparence. Les sommes correspondantes à cette première période ont été versées en mars aux éditeurs membres, tandis que le média fondé par Edwy Plenel a décidé de ne pas encaisser la « substantielle somme » lui revenant. « La rétribution ne retourne pour autant pas à l’envoyeur (Google) : elle reste en réserve dans l’organisme de gestion collective, en attendant que le voile sur les chiffres soit levé », a précisé Carine Fouteau sur le site d’investigation.

Le Monde en France, El País en Espagne, Die Welt en Allemagne : OpenAI séduit la presse au cas par cas

OpenAI a réussi à convaincre de grands titres de presse en Europe – Le Monde, El País et Die Welt – et, aux Etats-Unis, l’agence de presse AP et l’American Journalism Project pour que son IA générative ChatGPT soit plus au fait de l’actualité dans des langues différentes. Le New York Times, lui, a préféré un procès.

Le directeur des opérations d’OpenAI, Brad Lightcap (photo), n’est pas peu fier d’avoir décroché des accords pluriannuels avec les grands quotidiens européens Le Monde en France, El País en Espagne et Die Welt en Allemagne. « En partenariat avec Le Monde et Prisa Media [éditeur d’El País], notre objectif est de permettre aux utilisateurs de ChatGPT du monde entier de se connecter à l’actualité de façon interactive et pertinente », s’est-il félicité le 13 mars dernier lors de l’annonce des deux accords noués pour plusieurs années avec respectivement le groupe français Le Monde pour son quotidien éponyme et le groupe espagnol Prisa Media pour son quotidien El País, de même que pour son quotidien économique et financier Cinco Días et son site d’actualités El Huffpost (1). Trois mois auparavant, ce même Brad Lightcap annonçait un premier partenariat avec le groupe allemand Axel Springer pour son quotidien Die Welt, et son tabloïd Bild, ainsi que pour ses sites d’information Politico (édition européenne) et Business Insider (économie et finances). « Ce partenariat avec Axel Springer aidera à offrir aux gens de nouvelles façons d’accéder à du contenu de qualité, en temps réel, grâce à nos outils d’IA. Nous sommes profondément engagés à nous assurer que les éditeurs et les créateurs du monde entier bénéficient de la technologie avancée de l’IA et de nouveaux modèles de revenus », avait alors assuré le directeur des opérations d’OpenAI (2).

ChatGPT, polyglotte et informé : merci la presse
Ces « partenariats mondiaux d’information » permettent à ChatGPT d’européaniser un peu plus ses capacités d’informer en mettant à contribution trois premiers quotidiens du Vieux Continent, de trois langues différentes (français, espagnol et allemand). Et ce, après avoir largement entraîné en anglais ses grands modèles de langage « Generative Pre-trained Transformer » (GPT, GPT-2, GPT-3 et l’actuel GPT-4, en attendant GPT-5 en cours de développement). Avant les groupes européens Le Monde, Prisa Media et Axel Springer, OpenAI avait conclu aux Etats-Unis deux partenariats signés en juillets 2023 avec respectivement l’agence de presse américaine Associated Press (AP) et l’association de soutien à l’information locale American Journalism Project (AJP).

Sur fond de plainte du New York Times
« Nous sommes impatients d’apprendre d’AP [et de savoir] comment nos modèles d’IA peuvent avoir un impact positif sur l’industrie de l’information. L’accès à ses archives de textes factuels de haute qualité, aideront à améliorer les capacités et l’utilité des systèmes d’OpenAI », avait alors dit Brad Lightcap, lors de l’annonce le 13 juillet 2023 du partenariat avec l’agence de presse américaine (3). Depuis près d’une décennie, AP utilise la technologie de l’IA pour automatiser certaines tâches routinières et libérer les journalistes pour faire des reportages plus fouillés. Elle va même jusqu’à publier des dépêches automatisées prévisualisant et récapitulant certains événements sportifs, élargissant ainsi son offre de contenu.

L’après-Edwy Plenel a déjà commencé pour le site de presse d’investigation Mediapart lancé en 2008

Fabrice Arfi, journaliste d’investigation reconnu de Mediapart et parfois surnommé « fils spirituel » voire « frère d’armes » d’Edwy Plenel, succèdera-t-il à ce dernier ? Le cofondateur du site de presse en ligne cède le 14 mars 2024 la présidence de l’entreprise qu’il a fondée il y a 16 ans.

S’il y a bien un journaliste de la rédaction de Mediapart qui aurait toute la légitimité pour succéder à Edwy Plenel (photo de gauche), président cofondateur du site de presse d’investigation lancé le 16 mars 2008, c’est bien Fabrice Arfi (photo de droite). Ayant intégré l’équipe dès le début, il est même qualifié de « fils spirituel » ou « frère d’armes » d’Edwy Plenel, tant pour avoir été tout de suite à ses côtés au service « Enquête » de Mediapart que pour avoir affronté les difficultés en révélant des affaires qui ont fait date (Bettencourt, Karachi, SarkozyKadhafi ou encore Cahuzac). Des révélations, certaines affaires d’Etat, qui sont devenues la marque de fabrique de ce journal en ligne par abonnement. Un modèle.

Fabrice Arfi, un successeur de fait
Bien sûr, rien ne dit – à l’heure où nous mettons sous presse – que Fabrice Arfi succèdera à Edwy Plenel, lequel a tenu à ne pas révéler le nom de son successeur ou de sa successeure en annonçant – le 12 février dans l’émission « Affaires Sensibles » de France Inter (1) – qu’il passera la main le 14 mars. C’est ce jour-là que l’on connaîtra le nom du nouveau patron de Mediapart. L’ancien directeur de la rédaction du quotidien Le Monde (où il a travaillé durant vingt-cinq ans de 1980 jusqu’à sa démission en septembre 2005) continuera cependant d’écrire pour Mediapart qu’il quitte comme patron de presse à 71 ans – alors qu’il espérait partir « avant [ses] 70 ans » (2).
C’est en novembre 2007, il y a plus de 16 ans, qu’il avait présenté une sorte de version bêta de son site de média « participatif » et payant sur Internet. Le coup s’envoi du site d’investigation sera donné quatre mois après, grâce au succès d’une campagne d’appel à contributions et à abonnements.

L’affiliation publicitaire croît, notamment grâce à la presse pratiquant le « content-to-commerce »

Les articles de presse publicitaires sont de plus en plus nombreux sur les sites de presse en ligne (Le Figaro, Le Parisien, Le Point, 20 Minutes, Ouest-France, …) grâce aux liens d’affiliation. C’est une pratique éditoriale de vente en ligne en plein boom. Les journaux prennent des airs de boutiques.

Cette pratique marketing de plus en plus courante, qui consiste pour un éditeur de site web – presse en ligne en tête – de publier des articles qui promeuvent – en échange d’une commission perçue par lui sur les ventes générées par son intermédiaire – des produits ou des services. Lorsque le lecteur de cet article de presse – sans forcément d’ailleurs savoir qu’il s’agit d’un contenu éditorial de type publirédactionnel pour telle ou telle marque – clique sur le lien d’affiliation et va jusqu’à acheter le bien (souvent en promotion alléchante), le journal perçoit des royalties commerciales.

Près de 4 % du marché de l’e-pub
En France, de nombreux médias – et parmi les grands titres de presse (Le Figaro, Le Parisien, Le Point, 20 Minutes, Ouest-France, Le Monde, …) ou de l’audiovisuel (Europe 1, …) – se sont entichés de cette nouvelle forme de publicité éditoriale, quitte à rependre à l’identique l’habillage des articles écrits par leur rédaction de journalistes. A ceci près qu’il est parfois indiqué dans les articles d’affiliation la mention, par exemple, « La rédaction du Figaro n’a pas participé à la réalisation de cet article » ou « La rédaction du Parisien n’a pas participé à la réalisation de cet article ».
Les médias ne sont pas les seuls à pratiquer l’affiliation publicitaire, mais ils sont en première ligne étant donné leurs fortes audiences susceptibles de générer du « CPA ». Ce « coût par action » (Cost Per Action) est à l’affiliation ce que le « coût pour mille » (Cost Per Thousand) est au nombre de 1.000 « impressions » (affichages) d’une publicité mise en ligne, ou au « coût par clic » (Cost Per Click) lorsque le lecteur va cliquer sur une annonce publicitaire. Les prestataires d’affiliation se sont multipliés ces dernières années, notamment en France où l’on en compte de nombreux tels que : Awin, CJ Affiliate, Companeo, Effinity, Kwanko, Rakuten, TimeOne, Tradedoubler ou encore Tradetracker.