Les assistants vocaux s’apprêtent à bouleverser l’accès aux contenus informationnels et culturels

Google Assistant, Amazon Alexa, Microsoft Cortana, Apple Siri, … Les assistants vocaux vont redonner la main aux utilisateurs dans leurs recherches de contenus (musiques, films, infos, livres, jeux vidéo, …). Recommandations et marketing vont se retrouver court-circuités.

Les internautes vont donner de la voix, tandis que les industries culturelles risquent
de rester sans voix ! Les assistants vocaux virtuels – au premier rang desquels l’on retrouve Assistant (Google), Alexa (Amazon), Cortana (Microsoft), Siri (Apple) ou encore Bixby (Samsung) – vont non seulement transformer nos vies numériques
et nos objets du quotidien, mais aussi et surtout nous permettre d’aller directement
à l’essentiel et de façon explicite dans nos choix de contenus et de services en ligne.
Et ce, sans surfer sur le Web ni ouvrir moultes applis mobiles, et sans être la cible de publicités « ciblées » ou de recommandations « personnalisées » à tout-va.

Le glas sonore du Web et des applis ?
Notre voix et sa reconnaissance vocale deviennent la nouvelle interface avec Internet : exit le clavier (exigeant du doigté), la souris (fini le scrolling) et l’écran caviardé de suggestions et de promotions plus ou moins intempestives (adieu le surf). Est-ce la fin du Web et des applis mobiles ? Les métadonnées et les cookies – qui puisent leur force de persuasion dans les algorithmes pour nous influencer, voire nous détourner de notre besoin initial, dans le cadre d’opérations marketing ou de campagnes publicitaires – n’ont qu’à bien se tenir. Si les assistants vocaux font autant parler d’eux, c’est que ces systèmes à reconnaissance vocale de plus en plus fiables commencent à s’immiscer progressivement dans nos différents appareils familiers et dotés eux aussi de la voix pour nous répondre : smartphones, haut-parleurs connectés, téléviseurs, réfrigérateurs, équipements à domicile (1), voitures, … Mais c’est dans l’accès aux contenus culturels que le bouleversement pourrait être plus profond et non sans conséquences pour les industries culturelles.
Car l’intelligence artificielle (IA) d’un assistant vocal virtuel sera capable de nous trouver précisément la musique, le film, le livre, le jeu vidéo ou encore l’article de presse que nous recherchons à un instant T. Imaginez Netflix n’obéissant qu’à la voix de son maître (vous l’abonné) pour nous apporter la série et uniquement la série souhaitée (et rien d’autre) : c’est ainsi toute son architecture de recommandations à l’écran basée sur
des métadonnées et algorithmes qui devient… inutile. La conjugaison de l’IA et de l’interface vocale redonne le pouvoir aux internautes et mobinautes dans l’accès aux contenus culturels. Grâce au deep learning, ou apprentissage automatique, la recherche vocale court-circuiterait même de nombreux intermédiaires : moteurs de recherche, médias, éditeurs, prescripteurs, ou encore applications mobiles. Les assistants vocaux pourraient mettre en relation directement le consommateur et le producteur, le mélomane et le musicien, le lecteur et l’auteur, voire toute personne avec la source de l’information recherchée, etc. Ce serait un changement complet de paradigme pour le ecommerce en général (voice shopping) et les industries culturelles en particulier. Cette entrée de la maison et de la voiture dans l’ère du conversationnel n’en est qu’à ses tout débuts. Pour la recherche d’une chanson, par exemple, la reconnaissance musicale de nos enceintes connectées nous trouvera le bon morceau, à l’instar de Shazam, le moment voulu – comme le propose Siri d’Apple et bientôt Google Assistant. Les enceintes connectées Amazon Echo (leader du marché des haut-parleurs intelligents et multifonctions (2)), Google Home ou encore Apple HomePod, en attendant Samsung « Bixby Home », répondent déjà au doigt et à l’œil, … comprenez à votre voix !
Les films, séries et vidéos seront eux aussi commandés de vive voix, comme avec l’écran connecté Echo Show d’Amazon lancé en juin dernier. Le géant du e-commerce s’en est d’ailleurs pris en septembre à Google, accusé d’empêcher d’y regarder YouTube. Selon la société newyorkaise Future Today Institute, c’est en 2023 que la moitié des interactions des utilisateurs avec les contenus multimédias et services numériques se feront par la voix. Ne pas se préoccuper de ce nouvel écosystème à commande vocale pourrait être fatal aux industries culturelles. Par exemple, dans son étude « 2018 Tech Trends for Journalism and Media » publiée début octobre, cet institut parle même de « menace existentielle pour l’avenir du journalisme » (3).

La presse et la radio se mettent à l’audio
En France, le groupe Amaury a annoncé l’arrivée de L’Equipe sur Google Assistant pour smartphones et enceintes connectées. Le quotidien gratuit 20 Minutes (Schibsted) donne, lui, de la voix sur Amazon Echo. En audio : flash infos, jeux et podcasts. Le groupe Radio France, déjà partenaire sur Google Home, est tenté par l’audio d’Amazon Echo. Pour l’heure, ces écosystèmes vocaux sont incompatibles entre eux, exceptés pour Alexa et Cortana suite à un accord Amazon-Microsoft (lire EM@177, p. 2). La bataille du vocal débouchera-t-elle sur un standard international, gage d’interopérabilité pour que tout le monde se parle ? @

Charles de Laubier

Comment le « Frenchie » Jean-Philippe Courtois est devenu le 2e dirigeant le mieux payé de Microsoft

C’est le Français le plus en vue de l’empire Microsoft : Jean-Philippe Courtois, entré en 1984 comme commercial dans l’entreprise fondée par Bill Gates, va gagner cette année presque autant que l’actuel patron de la firme de Redmond. Grâce à lui, Microsoft est devenu un « GAFAM » qui a su s’imposer dans le cloud – mais pas dans le mobile.

Au titre de la dernière année fiscale de Microsoft qui s’est achevée le 30 juin dernier, Jean-Philippe Courtois (photo) va toucher un total de 18,2 millions de dollars. C’est la première fois qu’un Français empochera la deuxième plus grosse rémunération de la firme de Redmond (Etat de Washington), après celle du PDG – Satya Nadella depuis 2014. Ce dernier
va en effet être rétribué 20 millions de dollars. Le « Frenchie » recevra ainsi la même somme que le patron Indo-américain obtenait il y a deux ans, après que celui-ci eut succédé à Steve Ballmer. Entré il y a 33 ans comme ingénieur commercial chez Microsoft France, dont il sera directeur général en 1994, Jean-Philippe Courtois est devenu le numéro deux de la multinationale américaine depuis sa nomination en juillet 2016 comme vice-président exécutif et président des ventes, du marketing et des opérations de Microsoft au niveau mondial (1). A cette fonction, pour le dernier exercice, il a ainsi perçu un salaire fixe de « seulement » 751.054 dollars mais a été récompensé en actions à hauteur de 14,7 millions de dollars (dont 8,6 millions de dollars en actions reçus lors de sa promotion), soit le « stock awards » le plus élevé du groupe devant celui du patron (11,4 millions de dollars). Ce à quoi il faut ajouter 2,7 millions de dollars d’intéressement au rendement, sans parler de 45.214 dollars reçus comme autres compensations.

Naissance en Algérie, consécration aux Etats-Unis
La rémunération de Jean-Philippe Courtois comme celles de ses quatre autres collègues du comité exécutif de Microsoft seront entérinées par l’assemblée générale des actionnaires qui se tiendra à Washington le 29 novembre. Avant d’être promu à la tête des 122 filiales du groupe dans le monde, Jean-Philippe Courtois était président de Microsoft International depuis juin 2005, après avoir été directeur général de la région EMEA (Europe, Moyen-Orient et Afrique) dont il s’est occupé durant cinq ans.
Ce Français né en Algérie (57 ans), à Maison-Carrée dans la banlieue d’Alger, est par ailleurs président de l’école de commerce Skema Business School, d’où il avait obtenu à Nice son diplôme (2), juste avant d’être recruté par la PME de l’époque fondée par
Bill Gates, ainsi que membre du conseil d’administration de Positive Planet (ex-PlaNet Finance) de Jacques Attali (né lui aussi en Algérie et ancien conseiller spécial de François Mitterrand).

Succès et échecs du « M » de GAFAM
C’est Jean-Philippe Courtois qui incarne le mieux la globalisation du groupe Microsoft, lequel affiche pour son dernier exercice – clos le 30 juin – un chiffre d’affaires tutoyant les 90 milliards de dollars (3), en hausse de 5 % sur un an, pour un bénéfice net bondissant de plus de 26% à 21,2 milliards de dollars. La capitalisation boursière de Microsoft a dépassé les 600 milliards de dollars. Dans la notice et déclaration publiée le 16 octobre dernier en vue de la prochaine assemblée générale, Microsoft ne tarit pas d’éloges pour son top dirigeant français qui a réalisé « un exercice financier annuel fort, dépassant les objectifs de contribution à la marge (du groupe) et à la croissance de 4 % de l’Executive Incentive Plan (EIP) ». De plus, poursuit le patron Satya Nadella cosignataire du document remis au gendarme de la Bourse américaine (la SEC (4)), Jean- Philippe Courtois « a mené avec succès la transformation de l’organisation globale de nos ventes ». A son palmarès, il y a aussi « la croissance de 99 % du chiffre d’affaires d’Azure [services de cloud pour les développeurs et professionnels de l’informatique, ndlr], accélérant plus avant les capacités des forces de vente dans la stratégie de cloud » pour mieux rivaliser avec le numéro un mondial des nuages, Amazon Web Services (AWS).
A son actif, il a aussi « renforcé l’expérience client et l’expérience partenaire » ou encore « il a été l’avocat de la diversité et de l’inclusion ». Après le décès de son fils Gabriel à 22 ans, en 2015, Jean-Philippe Courtois a par ailleurs créé l’association
Live for Good pour aider à la création d’entreprises sociales. Enfin, il a été félicité pour avoir appliqué les principes « One Microsoft » édictés en 2013 par Steve Ballmer dans le but de casser les silos des divisions commerciales et marketing, avec à la clé des synergies entre activités, faisant ainsi de la firme de Redmond un seul et même interlocuteur vis-à-vis de ses clients. Néanmoins, Microsoft a confirmé début juillet que cela n’ira pas sans la suppression de milliers d’emplois dans le monde (jusqu’à 5.000 personnes selon des médias), à commencer chez les commerciaux. En creux, cette réorganisation que le Frenchie a menée a contribué à mettre en ordre de bataille le groupe Microsoft face à la nouvelle concurrence des « GAFA » – sigle auquel il ambitionne d’apposer son « M ». Or, l’appellation « GAFAM » a du mal à percer dans les mondes de l’Internet et des mobiles. Et pour cause, Microsoft n’a pas su s’imposer comme géant du Net, notamment avec son portail MSN (pourtant pionnier en 1995), ancêtre de Windows Live devenu aujourd’hui Office 365. Avec Windows, son système d’exploitation (OS) qui constitue encore une position dominante sur le marché des ordinateurs personnels, et Office 365 qui dématérialise dans le cloud la suite des logiciels Word, Excel, Powerpoint ou encore Outlook, Microsoft s’est constitué avec
ces deux activités une rente de situation. La moitié des ventes d’Office 365 en 2017 (5) se fait dans les nuages. Résultat, les segments d’activité « Productivity and Business Processes » (Office 365, LinkedIn, Dynamics, …) et « More Personal Computing » (Windows, Surface, Xbox, Bing, …) génèrent à eux deux 77 % du chiffre d’affaires du groupe, mais surtout plus de 90 % de sa marge opérationnelle. Windows et Office sont ainsi les deux « vaches à lait » de la firme de Redmond. Pour l’instant… Car l’érosion des revenus du segment « Windows » se poursuit ; elle a été de – 4 % pour l’exercice 2016/2017 passant sous la barre des 40 milliards de dollars (à 38,7 précisément). C’est que Microsoft subit là de plein fouet le déclin continu du PC, qui a fait son heure de gloire et la fortune de Bill Gates devenu l’homme le plus riche du monde (6).
Le problème est que, dans le même temps, Microsoft a échoué dans le mobile : après avoir acquis à prix d’or l’activité de fabrication de téléphones portables du finlandais Nokia en 2013 pour 7,5 milliards de dollars, l’opération initiée par Steve Ballmer fut un échec cuisant. Après les « Nokia » sous Windows Phone, la greffe des Lumia n’a pas pris sur un marché dominé par Google (Android) et Apple (iOS). En juillet dernier, Microsoft a annoncé qu’il abandonnait son OS mobile lancé sept ans plus tôt mais n’ayant pas dépassé les 0,2 % de parts de marché au niveau mondial (Windows Phone 8.1, dernière version de l’OS sortie en 2014, n’est plus mis à jour depuis juillet 2017). Cependant, la stratégie « mobile first, cloud first » de Satya Nadella montre que la firme de Redmond garde un pied dans le mobile avec Windows 10 Mobile, déclinaison de son OS 10 disponible depuis 2015 sur PC.

Intelligence artificielle et assistants vocaux
A l’image des trois principaux thèmes de l’événement eMicrosoft Experiences, qui
s’est déroulé début octobre à Paris, la multinationale veut imprimer sa marque dans l’intelligence artificielle (IA), la confiance numérique et la « collaboration innovante ». C’est dans ce sens que toutes les filiales, dont la française à Issy-les-Moulineaux
dotée d’un nouveau patron (7), doivent œuvrer. L’IA passe par les objets connectés du quotidien, dont les assistants vocaux. Microsoft ne peut manquer cet eldorado. Satya Nadella a donc parlé avec Jeff Bezos, le patron d’Amazon : ensemble, ils ont annoncé fin août que l’assistant vocaux virtuel Cortana (Microsoft) interagira avec son homologue Alexa (Amazon) et vice versa (8). Et plus si affinités ? @

Charles de Laubier

Livre : entre impression et intelligence artificielle

En fait. Le 11 septembre, le Syndicat national de l’édition (SNE) a annoncé que les 18èmes Assises du livre numérique se tiendront le 23 novembre. De son côté, le Bureau d’analyse sociétale pour une information citoyenne (Basic) a publié le 12 septembre une étude sur les impacts environnementaux de l’édition en France.

L’intelligence artificielle pour l’accès aux contenus : une révolution à risque pour les industries culturelles

« La plateformisation générale des médias fait que l’accès à leurs contenus dépend d’algorithmes et d’intelligence artificielle sur lesquels ils n’ont pas la main », s’est inquiété Bruno Patino, directeur éditorial d’Arte. De plus, l’IA pousse à la répétition des comportements. La diversité risque d’y perdre.

« Allez voir sur YouTube “Daddy’s Car” (1) qui est une chanson composée non pas par François Pachet, le directeur du laboratoire de recherche de Sony à Paris [Sony-CSL, ndlr], mais par une intelligence artificielle qu’il
a développée “dans l’esprit” des Beatles. La musique est composée par une IA mais est interprétée par de vrais artistes chanteurs. Cela montre que les métiers de la création seront impactés par l’intelligence artificielle », a prévenu Bertrand Braunschweig, directeur du centre de recherche à Saclay de l’Inria (2), lors du colloque NPA-Le Figaro le 16 mai dernier.

Flow Machines, Google Magenta, IBM Watson Beat
« Daddy’s Car » a été posté par Sony CSL sur YouTube il y a huit mois et a été vu et écouté depuis plus de 1,5 million de fois. Cette création musicale d’un nouveau genre a été entièrement composée automatiquement par le logiciel maison Flow Machines (3), lequel a aussi produit depuis « Mr Shadow » dans l’esprit de Gershwin. D’autres outils d’IA et de Machine Learning tentent aussi de réinventer la musique : Google Magenta (qui lance un synthétiseur neuronal NSynth (4)), IBM Watson Beat (dont l’IA musicale est testée par le groupe américain Phony PPL), Aiva (compositeur automatique de musique classique), ou encore Orb Composer (développé par la start-up française Hexachords). La puissance de calcul informatique associée au Deep Learning et aux réseaux de neurones artificiels permet d’obtenir des oeuvres qui n’ont parfois rien à envier à certains compositeurs, lesquels risquent de se faire « ubériser » par l’IA. L’université de technologie de Delft aux Pays-Bas n’a-t-elle pas, avec l’IA de Microsoft, peint un Rembrandt (5) plus vrai que nature ?
La production audiovisuelle ou cinématographique va elle aussi être impactée par l’exploitation massive des données et de l’apprentissage profond. Le réalisateur Oscar Sharp et le chercheur Ross Goodwin ont confié l’an dernier à un réseau neuronal, Benjamin, l’écriture d’un court-métrage de science-fiction baptisé « Sunspring ». La création automatique de scénarios, voire de films, pourrait bousculer à l’avenir les César, les Oscars et le Festival de Cannes. Mais pour Bruno Patino (photo), directeur éditorial d’Arte, l’IA dans l’audiovisuel n’en est qu’à ses débuts : « Dans la conception de contenus, on est encore loin. Pour les télévisions, on entrevoit une politique de création d’auteur qui va devoir s’accompagner d’outils de reproduction, de distribution et de recommandation faits par l’intelligence artificielle. La mauvaise nouvelle, je crois, c’est que l’on est très peu d’acteurs à avoir les capacités pour le faire et pour le comprendre. Face à nous, il y a un marché technologique ou de développeurs qui
est hors de portée financièrement pour beaucoup d’acteurs médiatiques aujourd’hui. C’est le mur qui est face à nous », a-t-il expliqué au colloque NPA. Cette barrière technologique doit être franchie, non pas forcément en maîtrisant la production d’intelligence artificielle, « car c’est très compliqué », mais en tout cas en en connaissant la grammaire. Et Bruno Patino de poursuivre : « La plateformisation générale des médias fait que l’accès à leurs contenus dépend d’algorithmes et d’intelligence artificielle sur lesquels ils [les médias] n’ont pas la main. Les télévisions, les câblo-opérateurs ou des journaux comme le Washington Post essaient de maîtriser cette intelligence artificielle, leurs algorithmes de distribution, afin de rester indépendants par rapport à Facebook ou Google. Dans un monde d’hyper-offre, il faut hyper-produire et l’intelligence artificielle peut aider ». Mais il admet qu’il y a encore du chemin à faire pour la conception de contenus à partir d’IA. Les médias et les industries culturelles vont dans un premier temps être confrontés à de très nombreux systèmes d’intelligence artificielle qu’il leur faudra arriver à maîtriser et à connaître. « Mais cela aura un coût induit élevé fort. On a beaucoup de systèmes d’intelligence artificielle à comprendre, sauf à être pieds et poings liés avec un acteur. », estime le directeur éditorial d’Arte.

Une atteinte à la liberté d’être déçu ?
Il y a cependant un dilemme qui se présente aux télévisions et aux médias : l’intelligence artificelle pousse à la répétition des comportements – ce qui va à l’encontre de la diversité : « Dans cette démarche-là, vous privez le téléspectateur
de la liberté d’être déçu. En outre, les bien culturels étant des biens d’expérience dont le consommateur ne connaît pas l’utilité avant de l’avoir consommé, toute cette intelligence artificielle vise à rendre prédictif l’utilité de biens culturels pour le consommateur final. Or si l’on connaît l’utilité par avance d’un bien culturel qui va être consommé, alors on réduit la production de ces biens culturels ». C’est un risque pour toutes les industries culturelles. @

Charles de Laubier