La bataille des IA génératives d’images et de vidéos s’exacerbe, avec les Etats-Unis en force

Après deux ans de bataille des IA génératives textuelles, déclenchée fin novembre 2022 par ChatGPT d’OpenAI, l’année 2025 s’annonce comme celle des IA génératives d’images et de vidéos. Edition Multimédi@ passe en revue une sélection de concurrents, tous d’origine américaine. Mais les chinois sont en embuscades.


Grok
Pays d’origine : Etats-Unis
Propriétaire : xAI (Elon Musk)
Lancement : novembre 2023
Générateur de textes et d’images
https://x.ai/grok, https://x.com/i/grok
Disponibilité : gratuit depuis le 14-12-24
Accessible en France : oui
Remarque : Grok est développé par la start-up xAI créé en juillet 2023 par le milliardaire Elon Musk (cofondateur d’OpenAI qu’il a quitté en 2018). En plus de générer du texte, Grok peut aussi faire de même en créant des images réalistes grâce à son modèle text-to-image Aurora.


Sora
Pays d’origine : Etats-Unis
Propriétaire : OpenAI (Sam Altman)
Lancement : février 2024
Générateur de vidéo ultraréalistes
https://openai.com/sora, https://sora.com
Disponibilité : payant dans ChatGPT Plus et Pro
Accessible en France : non
Remarque : Sora est un modèle de type text-to-video développé par OpenAI, déjà à l’origine de ChatGPT, lequel intègre Sora depuis début décembre 2024 via les abonnements payants ChatGPT Plus et ChatGPT Pro. Sora signifie en japonais « ciel » (potentiel illimité). (suite)

La « French Tech » a eu du mal à lever des fonds en 2024, plafonnant à environ 7,2 milliards d’euros

S’il n’y avait pas eu le demi-milliard de la société française Mistral AI, la chute des levées de fonds par les start-up françaises aurait été plus prononcée en 2024 (-18 % sans, contre 12 % avec). Cette baisse des investissements, à environ 7,2 milliards d’euros, est inquiétante au regard des besoins.

Les premiers calculs sur les levées de fonds enregistrées sur l’année 2024 par les start-up de la « French Tech » font état d’un total d’environ 7,2 milliards d’euros. C’est plus ou moins un milliard de moins que l’année précédente, et bien loin des quelque 15 milliards d’euros levés en 2022 au sortir de la crise sanitaire, pour ne pas dire moitié moins que ce record. Cette chute de – 12 % sur un an des capitaux investis dans les jeunes pousses innovantes, bien qu’amortie, est paradoxale au regard de la révolution de l’intelligence artificielle (IA), des besoins en mobilité ou encore de l’essor de la fintech.

Mistral AI, Poolside AI et Electra en tête
Cette moindre performance devrait interpeller la ministre déléguée chargée de l’Intelligence artificielle et du Numérique, Clara Chappaz (photo), nommée par l’éphémère gouvernement Barnier sous la houlette du ministère de l’Enseignement supérieur et de la recherche (1), et maintenue par le gouvernement Bayrou, mais cette fois auprès du ministre de l’Economie, des Finances et de la Souveraineté industrielle et numérique – en l’occurrence Eric Lombard (exCDC). Ancienne dirigeante de la mission French Tech d’octobre 2021 à septembre 2024, Clara Chappaz garde un œil sur le microcosme des jeunes pousses dont elle est issue (Zalora, Lullaby, Lyst, Vestiaire Collective). « En 2025, il nous faudra plus que jamais rassembler nos forces pour que la France et l’Europe restent dans la course au numérique et à l’IA », at-elle prévenu lors de ses vœux début janvier (2).
Or, selon les relevés de la mission French Tech justement, basés sur les données collectées par la plateforme néerlandaise Dealroom.co que Edition Multimédi@ a consultées, les fonds levés (suite)

Rodolphe Saadé, PDG de l’armateur CMA CGM, a investi 2 milliards d’euros dans les médias français

L’armateur marseillais et logisticien maritime CMA CGM, que dirige depuis 2017 le milliardaire Rodolphe Saadé (fils du fondateur), est devenu en deux ans un géant des médias français. Selon les calculs de Edition Multimédi@, le Franco-Libanais a déjà investi 2 milliards d’euros via sa filiale CMA Media.

En deux ans, Rodolphe Saadé (photo) s’est fait une place de choix dans le club très fermé des dix milliardaires qui possèdent à eux seuls la majeure partie des médias en France (1). En un peu plus de deux ans, la cinquième fortune française – avec un patrimoine familial de 32 milliards d’euros, d’après Challenges (2) – s’est emparée de plusieurs actifs médiatiques de l’Hexagone, et non des moindres : La Provence et sa filiale Corse-Matin en août 2022 (pour 81 millions d’euros), La Tribune/La Tribune Dimanche en juillet 2023 (pour un montant estimé à 35 millions d’euros), BFM et RMC en juillet 2024 (en acquérant la totalité d’Altice Media pour 1,55 milliard d’euros).
A ces emplelles dignes d’un magnat de la presse et de la télévision, le Franco-Libanais a aussi investi, en tant qu’actionnaire minoritaire cette fois, dans : M6 à partir de fin 2022 pour atteindre 10,25 % du capital en avril 2023 (valorisés à l’époque 126,4 millions d’euros (3)), le média vidéo Brut en avril 2023 pour 15 % du capital (alors valorisés 6 millions d’euros (4)), et, bien que cela ne soit pas un média à proprement parler mais une école de journalisme, l’ESJ Paris (5) en novembre 2024 pour quelques centaines de milliers d’euros (sur un tour de table d’environ 3 millions d’euros (6)). Selon les calculs de Edition Multimédi@, CMA Media (ex-Whynot Media, anciennement CMA CGM Médias) – la holding médias du géant mondial du transport maritime de conteneurs et de la logistique portuaire – a donc injecté un total de 2 milliards d’euros à ce jour.

Médias, y compris école, formation et IA
Car aux presque 1,8 milliard d’euros (7) que totalisent les différents investissements directs dans les actifs médiatiques mentionnés, il faut ajouter d’autres dépenses de la maison mère qui concernent aussi en partie ses différents médias : l’intelligence artificielle, en cofondant notamment en novembre 2023 la start-up Kyutai (100 millions d’euros injectés), et l’innovation et la formation via la création cette année de son propre centre baptisé Tangram (plusieurs millions d’euros). Ce qui, si l’on affecte aux médias concernés une quote-part de ces derniers investissements, nous amène à 2 milliards d’euros environ. (suite)

Commission européenne « 2024-2029 » depuis le 1er décembre : le numérique parmi ses priorités

La Commission « von der Leyen II » est en fonction depuis le 1er décembre 2024, et jusqu’au 31 octobre 2029. Parmi les 27 membres du collège, dont la présidente, il y a Henna Virkkunen et Ekaterina Zaharieva : pour rattraper le retard européen dans le numérique et l’innovation.

Ursula von der Leyen entame depuis le 1er décembre son second mandat de cinq ans (2024-2029) à la présidence de la Commission européenne, dont le collège composé de vingt-sept membres – y compris elle-même (1) – a été approuvé par les eurodéputés le 27 novembre dernier, par 370 pour, 292 contre et 36 abstentions. Cette Commission « von der Leyen II » (2) a été officiellement nommée par décision du Conseil européen datée du 28 novembre, publiée au Journal officiel de l’Union européenne (3) et entrée en vigueur le 1er décembre.

Deux femmes pour accélérer dans la tech
Ursula von der Leyen (« UVDL ») a déclaré qu’elle suivra, au cours de son second quinquennat, « une boussole pour la compétitivité » en s’appuyant sur « les trois grands piliers qui se dégagent du rapport Draghi ». C’est le premier d’entre eux qui nous intéresse ici, puisqu’il s’agit d’innover et de combler « le retard technologique », comme le pointait Mario Draghi, ancien président de la Banque centrale européenne (BCE), dans son rapport remis le 9 septembre à UVDL (4). « Le premier [pilier] consiste à combler l’écart qui nous sépare des Etats-Unis et de la Chine en matière d’innovation, a déclaré la présidente de la Commission européenne devant les eurodéputés à Strasbourg le 27 novembre. La part de l’Europe dans les demandes de brevets à l’échelle mondiale est comparable à celle des Etats-Unis et de la Chine. Cependant, seul un tiers de ces brevets sont exploités commercialement ». (suite)

La start-up californienne World Labs livre un aperçu de l’avenir de l’IA générative en 3D

Le 2 décembre, la start-up World Labs — devenue en septembre une licorne avec sa levée de fonds de 230 millions de dollars — a présenté en ligne les premiers résultats de son IA générative capable de générer des mondes en 3D, où les utilisateurs peuvent interagir directement.

Imaginez : vous soumettez une de vos photos ou images à une IA générative et celle-ci va créer pour vous un monde en trois dimensions (3D) où vous pourrez évoluer à partir du navigateur de votre ordinateur ou de votre smartphone. Bienvenus dans l’« intelligence spatiale ». C’est cet exploit technologique de génération d’une géométrie en 3D que promet de généraliser prochainement la jeune pousse cofondée en janvier 2024 par la chercheuse et professeure Fei-Fei Li (photo), sa PDG, Ben Mildenhall (ex-Google), Justin Johnson (ex-Meta) et Christoph Lassner (ex-Meta).

Films, jeux, … révolution « GenAI 3D »
Pour l’instant, des aperçus navigables par tous ont été mis en ligne depuis le 2 décembre (1), tandis que seulement « quelques créateurs » peuvent expérimenter l’IA générative 3D. Les autres doivent s’inscrire sur une liste d’attente (2), en prévision du prochain lancement. « Nous travaillons dur pour mettre cette technologie entre les mains des utilisateurs dès que possible ! », a assuré World Labs dans sa présentation du 2 décembre. « A partir d’une image d’entrée, notre système estime la géométrie 3D, remplit les parties invisibles de la scène, invente de nouveaux contenus pour que vous puissiez vous retourner, et génère une grande variété de types de scènes et de styles artistiques », explique-t-elle. Et de préciser : « Nos scènes 3D peuvent être rendues en temps réel dans le navigateur avec un contrôle total de la caméra. Cela signifie que vous pouvez les explorer avec une caméra en mouvement libre comme dans un jeu vidéo, ou même simuler des effets de caméra 3D comme une faible profondeur de champ ou un zoom chariot » (3). Une fois dans son navigateur, l’utilisateur évolue en temps réel dans le nouveau monde 3D, comme avec une caméra virtuelle, à l’aide de ses touches « WASD » sur un clavier Qwerty, ou avec les touches « ZQSD » pour un clavier Azerty à la française : Z pour avancer, Q pour aller à gauche, S pour reculer, D pour aller à droite. Avec la souris, il suffit de cliquer et de faire glisser pour regarder autour. (suite)