Robots, crawlers, IA, … levée de boucliers en ligne

En fait. Le 18 juin, la société Clipeum a annoncé avoir le premier quotidien régional Ouest-France comme nouveau client de son outil Botscorner qui permet d’identifier robots, crawlers et IA génératives pour les faire payer. Selon nos informations, le CFC n’y fait plus appel, lui préférant Human Security.

En clair. Après avoir annoncé le 23 mai la signature avec Le Monde pour l’utilisation de son outils Botscorner destiné à repérer et à cartographier les robots de crawling (aspirateurs de sites web destinés à exploiter leurs contenus), la société Clipeum – dont le nom veut dire « bouclier » en latin – a annoncé le 18 juin un nouvel accord avec, cette fois, Ouest-France. Ces deux nouveaux clients rejoignent ainsi les nombreux éditeurs de presse en ligne en France – Le Figaro, Le Parisien, L’Equipe, Le Point, Challenges, L’Usine nouvelle, Libération ou encore L’Express – qui ont opté pour ce type de solutions – Botscorner, DataDome, Human Security (ex-White Ops), … – capables d’analyser le trafic entrant et d’identifier les robots (bots) absorbant leurs articles.
Selon les informations de Edition Multimédi@, le Centre français d’exploitation du droit de copie (CFC), qui a lancé en 2018 son « outil de régulation des robots de crawling » (ORRC), ne s’appuie plus sur Botscorner depuis fin 2023 mais sur Human Security, une société newyorkaise. Objectif pour l’éditeur de presse en ligne : analyser les logs des bots et crawlers arrivant sur leurs sites web et proposer des licences d’autorisation rémunératrices aux sociétés qui activent ces robots de crawling.

Après ChatGPT, les robots conversationnels se bousculent sur le marché de l’IA générative

Les chatbots conversationnels se bousculent au portillon, dans le sillage de ChatGPT. La concurrence s’organise sur marché mondial qui annonce des chamboulements colossaux dans les moteurs de recherche sur Internet, encore dominés par Google. Plus pour longtemps. Après ChatGPT que la start-up américaine OpenAI – dirigée par son cofondateur Sam Altman (photo) – a lancé le 30 novembre 2022 (1) avec un succès médiatique sans précédent, Bard tente de se lancer à sa poursuite après avoir été annoncé le 6 février dernier par Google mais réservé encore quelques semaines à un nombre limité de happy few testeurs (2). Le lendemain, Microsoft – qui a investi des milliards de dollars dans OpenAI – a annoncé la mise en test dans son moteur de recherche Bing (3) du modèle de traitement du langage naturel utilisé par ChatGPT (Generative Pre-trained Transformer). Et ce n’est pas fini. La bataille des IA génératrices fait rage Le 24 février, c’est au tour de Meta de lancer son LLaMA – à des fins de tests également (4). Trois jours après, il est question que Elon Musk – lequel a été un des cofondateurs d’OpenAI – se lance lui aussi dans la course à l’IA générative (5). Au même moment, à savoir le 27 février, Snap y va aussi de son robot conversationnel (chatbot) qui répond au nom de « My AI », également disponible à titre expérimental (6). Toutes ces initiatives ne sont que la face émergée de l’intelligence artificielle conjuguée aux traitements de langage naturel et à l’exploitation de mégabases de données, lorsque que l’IA générative n’est pas aussi connectée au Web (7). Il existe bien d’autres IA créatrices, telles que : Dall.E 2, développée par OpenAI, pour créer des images et des œuvres d’art originales et réalistes à partir d’une description textuelle ; Stable Diffusion, développée par Stability AI, en tant que modèle d’apprentissage automatique (deep learning), permettant de générer des images numériques réalistes à partir de descriptions en langage naturel ; Midjourney, développée par le laboratoire de recherche éponyme, aussi une IA générative conçue pour générer des images à partir de texte ; Cedille, un modèle de génération de texte francophone développé par la société suisse Coteries (8). Pour conforter son avance, OpenAI a lancé le 1er mars une interface de programmation (API) pour faciliter partout l’intégration de ChatGPT et de Whisper (voix à texte). Textes, photos, vidéos, musiques, … Les IA génératrices s’immiscent dans tous les domaines et cela ne date pas d’hier. Par exemple, la nouvelle musique « des Beatles » baptisée « Daddy’s Car » avait fait sensation en septembre 2016 sur YouTube (9). Or, en réalité, ce titre a été composé par l’équipe « Musique et IA » du laboratoire Sony CSL (10). Il a été créé dans le style des Beatles par le scientifique François Pachet et le musicien Benoît Carré akaSkygge (« ombre » en danois) à l’aide de Flow Machines, une IA « mélomane » (11). Avec elle, ils ont créé en 2018 un album intitulé « Hello World ». François Pachet est aujourd’hui directeur chez Spotify en charge du « développement de la prochaine génération d’outils de composition musicale assistée par IA ». L’industrie musicale va être bousculée, tout comme l’industrie de l’édition (livre et presse). Le cinéma n’y échappera pas non plus (scénarios et séries). Toutes les industries culturelles et créatives seront impactées, avec les questions de droit d’auteur et de propriété intellectuelle que cela soulève. Par exemple, l’agence photo américaine Getty Images (également banque d’images) a annoncé le 17 janvier porter plainte contre Stability AI (l’éditeur de Stable Diffusion) pour lui avoir « illégalement copié et traité des millions d’images protégées par le droit d’auteur et les métadonnées associées » (12). Plus récemment, le 21 février, le Copyright Office américain a conclu que les images de la bande dessinée « Zarya of the Dawn » créées par l’IA Midjourney, ne peuvent pas être protégées par le droit d’auteur (13). Quant aux « deepfake », ces vidéos hyperréalistes truquées à l’IA, elles commencent pour certaines à poser problème (14). La Chine vient de les interdire (15). La justice commence à faire bouger les lignes (16) et l’Union européenne s’apprête à promulguer son règlement « Artificial Intelligence Act » (17) pour réguler les systèmes d’IA « à haut risque ». Cela irait dans le sens de Brad Smith, président de Microsoft, pour qui « une réglementation efficace en matière d’IA devrait être axée sur les applications les plus à risque ». Aussi pour des entreprises plus « intelligentes » Il y a encore peu d’études sur cette vague innovante de création automatique de contenus. Le marché mondial de l’IA générative pourrait être multiplié par dix d’ici la décennie en cours, pour dépasser en 2030 les 100 milliards de dollars. « D’ici 2025, nous nous attendons à ce que plus de 30 % – contre zéro aujourd’hui – de nouveaux médicaments et de nouveaux matériaux soient systématiquement découverts à l’aide de techniques d’IA génératives. Et ce n’est là qu’un des nombreux cas d’utilisation par l’industrie », prévoit Brian Burke, vice-président de la recherche en innovation technologique au sein du cabinet d’études Gartner. @

Charles de Laubier

Tout en justifiant son soutien à la directive « Copyright », Qwant prépare une grosse levée de fonds et vise la Bourse

Slogan de Qwant : « Le moteur de recherche qui respecte votre vie privée » – … « et le droit d’auteur », rajouteraiton depuis que son PDG Eric Léandri soutient la directive « Droit d’auteur » – adoptée le 26 mars. Mais il se dit opposé au filtrage du Net. Côté finances, le moteur de recherche veut lever 100 millions d’euros et vise la Bourse.

Qwant, société franco-allemande dont le capital est détenu majoritairement par son PDG fondateur Eric Léandri (photo), à 20 % par la CDC et à 18,4 % par le groupe de médias allemand Axel Springer (1), cherche d’abord à lever 30 millions d’euros de cash dans les deux mois. Objectif : accélérer le développement de ses plateformes. « Nous sollicitons des investisseurs, tandis que nos actionnaires CDC et Axel Springer nous suivent. Ensuite, nous irons vers une vraie belle augmentation de capital d’ici la fin de l’année ou début 2020, avec une levée de fonds à 100 millions d’euros », indique Eric Léandri à Edition Multimédi@. Avec une introduction en Bourse à cette occasion ? « Allez savoir… Rien n’est fermé ! Pour cela, vous avez des obligations d’être propre au niveau comptable », nous a-t-il confié. Concernant le financement de 25 millions d’euros consenti par la Banque européenne d’investissement (BEI) en octobre 2015, le solde a finalement été entièrement versé en 2018. Le renforcement financier de Qwant prend du temps, l’explication de son soutien à la directive européenne « Droit d’auteur dans le marché unique numérique » aussi ! Eric Léandri ne cesse de devoir justifier son choix – mais en assurant qu’il est contre les robots de filtrage automatisé que permet l’article 13 (devenu 17) de cette directive adoptée le 26 mars.

Rêve de Robots

Aujourd’hui est un jour particulier au boulot. Une matinée consacrée à l’accueil d’un nouveau collaborateur. En principe, pas de quoi se relever la nuit. Sauf que cette fois-ci, je ne suis pas le seul à être sur les dents. La curiosité de toute l’équipe est, depuis des semaines, mise à rude épreuve car notre nouveau collègue est un robot.
Un robot de bureau multi-tâches venant épauler notre petite entreprise, autant pour nous aider dans les tâches répétitives que pour les travaux d’experts qu’il maîtrise, qu’il apprend ou qu’il acquiert sur le réseau. Et le soir, quand tout le monde est parti, il continue de travailler tout en assurant la télésurveillance de notre bâtiment. Je vous dois de préciser que nous sommes loin d’être des pionniers et que notre investissement, bien réfléchi, s’inscrit dans un mouvement d’équipement des entreprises qui adoptent de plus en plus ces assistants d’un nouveau genre. Nous voici partie prenante de cette nouvelle phase majeure du développement de la robotique professionnelle, qui, avec la « cobotique », conduit de nombreuses entreprises à faire cohabiter humains et robots. Quel chemin parcouru depuis Unimate, ce premier robot industriel intégré aux lignes d’assemblage de General Motors en 1961. Les robots ont rapidement colonisés les sites industriels à partir des années 1980, jusqu’à représenter un parc de plus de 1 million de machines dans le monde dès 2012. La plupart sont issus des lignes de production des leaders ABB, Fanuc Robotics, Kuka ou Motoman, destinés à doper la productivité des usines. Ce qui n’a pas été sans provoquer d’importantes tensions sur l’emploi des ouvriers confrontés à cette concurrence, alors même qu’il fallait se battre sur le front des bas salaires des économies émergentes.

« Ce peuple de machines intelligentes trône
désormais au sommet d’une nouvelle espèce
composée de myriades d’objets communicants. »