Snippet or no snippet? La directive Copyright de 2019 comme cristallisation des enjeux de la modularisation éditoriale
Table des matières
FRANCK REBILLARD
En se déployant sur internet, journaux et magazines ont vu leur unité éditoriale se déstructurer dans des proportions croissantes. La Une, devenue page d’accueil (home page) sur le web, ainsi que plus généralement la maquette et ses rubriques, ont été en grande partie supplantées par un accès direct aux articles ou à leurs seuls titres, descriptifs et illustrations, via les moteurs de recherche ou les réseaux sociaux numériques.
Il est proposé ici de revenir sur ce changement d’ampleur pour l’information d’actualité qu’est la programmation de sa modularisation éditoriale. La circulation des articles de journaux en journaux n’est bien entendu pas une nouveauté en soi. Elle a existé bien avant qu’on ne qualifie le phénomène de viral1. L’histoire de la presse regorge d’exemples de cette transtextualité en actes, qui a pu s’exercer directement à coups de ciseaux et de façon totalement délibérée dans le cas des journaux voleurs du XIXe2. Les développements plus contemporains présentent toutefois des particularités à cette aune : la circulation en ligne des textes — de surcroît non limités à l’écrit ou à l’image fixe, mais pouvant intégrer la vidéo et le son (cf. la notion générique de texts chez Hesmondhalgh3) —, par le biais de la matérialité numérique et de la programmation informatique, devient potentiellement activable à tout moment.
La présente contribution se penchera sur cette évolution à partir d’une approche technosémiotique, qui étudie la mise en forme du sens jusque dans ses ressorts informatiques4. Celle-ci sera combinée, suivant l’invitation judicieuse du regretté Yves Jeanneret5, à une analyse socio-économique. Car, dans ce contexte de « programmabilité6 », généralisée des textes en ligne, les éditeurs de presse ont dû composer, depuis plus d’une vingtaine d’années maintenant, avec les opérateurs de cette intermédiation informatique (infomédiation) que sont les principales plateformes numériques7.
Les relations entre ces deux types d’acteurs, relations asymétriques et largement à l’avantage des plateformes, ont entraîné une reprise des contenus journalistiques sans rétribution équitable, voire sans rétribution aucune. Face à cette situation où le seul rapport de forces, ou plus exactement le seul jeu des forces du marché, aurait pour conséquence un tarissement des ressources pour les éditeurs et donc un appauvrissement de l’information — quand bien même celle-ci circulerait-elle de façon démultipliée —, l’intervention de la puissance publique s’est avérée nécessaire. Elle s’est concrétisée très tardivement, à la toute fin des années 2010, par une directive européenne, immédiatement transférée dans le droit français.
Édictée en 2019, cette directive vise à réguler les relations entre acteurs économiques — éditeurs de presse d’un côté, plateformes numériques de l’autre — par un agissement sur les programmations informatiques et les affichages d’information qu’elles autorisent. Pour rendre compte de cette imbrication entre rapports socio-économiques et modalités technosémiotiques, on s’arrêtera ici sur les tensions autour de la reprise, par les plateformes, de simples extraits (snippets) des informations parallèlement publiées sur les sites de médias d’actualité. Elles seront illustrées par les manières d’accéder aux articles d’un des principaux éditeurs de presse français, Le Monde, par l’intermédiaire du moteur de recherche dominant qu’est Google.
Du XIXe au XXIe siècle, l’évolution des voies d’accès à l’information
Le cas d’étude portera plus précisément sur la médiatisation, et la plateformisation attenante donc, d’un évènement se produisant au moment de préparer ces lignes, au printemps 2022. Le samedi 28 mai 2022 précisément, la France accueille la finale de la principale compétition européenne de Football (Ligue des Champions), le sport majeur du continent. La partie oppose les équipes de Liverpool et de Madrid et, comme à leur habitude, les supporters anglais se sont déplacés en grand nombre. Plusieurs d’entre eux rencontrent toutefois des problèmes au moment d’accéder au Stade de France (à Saint-Denis, dans la périphérie la plus paupérisée de la capitale française), se retrouvant agglutinés devant les grilles d’entrée, quand ces dernières se voient escaladées et franchies par des riverains sans billets. Dans la panique, les forces de l’ordre, manifestement débordées, interviennent en réprimant de façon indistincte les personnes présentes, parfois des enfants venus assister au match en famille. De sportif, l’évènement prend un tournant politique, voire diplomatique, au fil de sa médiatisation, et notamment à mesure que la gestion par le ministre de l’Intérieur est critiquée, jusqu’à donner lieu à des demandes de réparation de la part des autorités britanniques.
Il ne s’agira pas ici de revenir sur le traitement journalistique d’un tel évènement, pour lequel on aurait pourtant beaucoup à dire quant aux stéréotypes assignés aux habitants des quartiers populaires (dénoncés comme « voyous » dans les discours d’élus cités par Le Monde) ou au contexte post-Brexit marquant les relations entre France et Royaume-Uni. L’objectif sera plutôt ici de voir comment on accède à cet évènement médiatique, entre la version imprimée du journal, et son pendant numérique.
Le journal sous forme papier est rendu disponible aux lectrices et lecteurs, moyennant paiement, par deux voies. Il peut être délivré directement au domicile de l’abonné.e, ou bien proposé au sein d’espaces de vente accessibles depuis la voie publique, au premier rang desquels les kiosques. Le kiosque à journaux ici photographié le 30 mai 2022 à Paris (Figure 1), de couleur vert sombre, et surmonté successivement d’une frise, d’un dôme et d’une flèche, correspond à l’époque haussmannienne et plus précisément aux dessins de l’architecte Georges Davioud8. Il rappelle à quel point ce XIXe siècle, si décisif pour l’essor de la presse écrite française, se concrétisait jusque dans la sociabilité des rues de la capitale9.
Fig. 1 : kiosque à journaux
Dans la profondeur de ce kiosque (Figure 2), on peut distinguer des rayonnages où s’entassent quantité de magazines aux couvertures en papier glacé hautes en couleur. Apparaissent au premier plan deux présentoirs réservés aux publications du groupe Le Monde, sur la gauche, et du groupe Le Figaro, sur la droite, reflétant d’ailleurs ainsi dans l’espace leurs positionnements éditoriaux respectifs. Le présentoir du groupe Le Monde, qui affiche sur fond bleu métallique sa dénomination logotypée en lettres gothiques blanches, contient des exemplaires du mensuel Le Monde Diplomatique dans sa partie haute, et du quotidien Le Monde dans sa partie basse. Ce dernier, plié en deux, ne dévoile que le haut de sa Une. En dessous de la manchette plaçant en son centre le nom du journal logotypé et aux couleurs cette fois-ci quelque peu inversées (lettres gothiques noires avec soulignement par liseré bleu sur fond de papier blanc), on peut distinguer une partie du ventre, espace central caractérisé par un gros titre en lettres capitales blanches « URGENCE CLIMATIQUE » et ressortant dans un encadré bleu, précédé d’un autre titre en tribune, « Stade de France : des défaillances en chaîne ».
Fig. 2 : les rayonnages et présentoirs du kiosque
Un examen plus précis de la mise en Une papier de cet évènement est, presque paradoxalement, procuré par sa version numérisée au format PDF (Figure 3). Étiré de façon verticale, le titre « Stade de France : des défaillances en chaîne » coiffe cinq colonnes qui chacune annoncent les différents développements à venir en pages intérieures.
Fig. 3 - Une papier du Monde
Ces pages 12 et 13 (Figure 4) font partie de la rubrique « France » et, plus précisément, de la sous-rubrique « Sécurité » : Le Monde par la structuration de sa maquette traduit ainsi son propre découpage du monde10 et, dans le cas présent, assigne ainsi à cet évènement des enjeux politiques relatifs au maintien de l’ordre. Plusieurs modules linguistiques et iconiques occupent la tabularité11 de cette double page, dont trois photographies et quatre articles.
Fig. 4 : pages 12 et 13 du Monde
L’un de ces articles se détache sur le plan typographique, possédant un titre et un chapeau aux corps (taille des caractères) bien supérieurs. Il s’étale par ailleurs sur les deux pages. Cet article se distingue aussi par son contenu plus factuel, qu’illustrent les trois photographies adjacentes. Les trois autres articles s’inscrivent dans son sillage, avec un traitement journalistique de plus en plus périphérique : analyse des réactions politiques de l’opposition au gouvernement, interrogation plus générale sur la gestion des futurs Jeux olympiques à Paris (en 2024), parallèle établi avec des débordements de spectateurs dans un match du championnat national de football.
On retrouve ce même article sur le site web du Monde, avec toutefois quelques variantes vis-à-vis de la version papier : un intertitre supplémentaire a été inséré (« Véritable appel d’air »), seules deux photographies sur trois apparaissent, et le titre a été modifié, passant de « Incidents au Stade de France : les failles et le déni » (version papier, cf. supra figure 4) à « Incidents au Stade de France : le déni des pouvoirs publics malgré une organisation défaillante » (version web, cf. infra figure 5 et figure 6).
Fig. 5 : titre de la version web de l'article du Monde
Fig. 6 : l'article web en entier
La mise en forme a elle aussi évolué, non seulement au niveau des polices de caractère ou de la mise en gras du chapeau, mais aussi, et surtout, au niveau de l’encadrement paratextuel. D’une part, le rubriquage n’est plus le même, dans sa terminologie et aussi de façon plus structurelle dans l’arborescence du site afin de faciliter son repérage en ligne12 : « France — Sécurité » dans la version papier, contre « Société - Police et justice » dans la version web. D’autre part, à l’en-tête relativement discret de la version papier (numéro de page, et logo du journal de taille réduite et positionné à l’écart) est substitué un header sur le web (logo de taille supérieure et positionné au centre, le tout souligné par un liseré bleu) qui s’apparente pour beaucoup à la manchette que l’on trouve généralement en Une.
Cette dernière différence, entre l’en-tête de la page-papier et le header de la page-écran, est la plus essentielle. Elle reflète un changement véritablement paradigmatique entre deux modes d’organisation des parcours de lecture, correspondant à deux objets éditoriaux distincts. Le journal papier, sans être un objet complètement clos puisqu’il a toujours été le lieu d’une circulation transtextuelle assez intense13, n’en demeure pas moins un objet fini, dont chaque page constitue une composante ordonnée depuis la Une via un chemin de fer, appellation originelle rappelant bien cette fixité matérielle. À l’inverse, le site web d’un journal, comme l’ensemble de ses déclinaisons numériques en ligne, est un objet éditorial ouvert, constamment modifiable et reliable à d’autres espaces, et dont les pages-écrans sont activées et atteintes selon une ré-éditorialisation beaucoup plus incidente14.
Certes, on peut aussi passer par la home, et en un clic déboucher sur l’article et sa page-écran attenante, reproduisant ainsi peu ou prou le dépliement du journal papier que l’on trouverait depuis la Une jusqu’aux pages intérieures. Ce type de cheminement n’est toutefois pas le plus fréquent. Dans la grande majorité des cas, l’accès aux informations d’actualité en ligne passe par des portes dérobées (side-door access = 73%15) accessibles depuis les grandes plateformes numériques. Ainsi, le plus souvent, c’est à la suite d’une requête dans un moteur de recherche, de la consultation d’un agrégateur de nouvelles, ou du fil de son réseau social numérique sur smartphone, que l’internaute va atterrir dans l’espace éditorial du journal. L’affichage du header du Monde en haut de cette landing page (figure 5, cf. supra) est là pour le signifier de façon plus que manifeste.
Une circulation des textes accélérée et soumise à la programmation informatique
Des deux voies d’accès à un article d’actualité en ligne, la plus usitée revient ainsi à transiter par une plateforme numérique. Celle-ci mentionne l’article sous la forme d’un titre cliquable, possiblement accompagné d’un descriptif de quelques mots (snippet), voire d’une illustration photographique ou d’une vidéo, tout comme elle mentionne quantité d’autres articles à la suite. Une telle situation nécessite d’être davantage décrite sur le plan technosémiotique, et ceci au regard des enjeux socio-économiques qui l’accompagnent.
Dans le cas de Google, l’article est mentionné, et accessible par le biais d’un hyperlien, sur de nombreuses pages-écrans de la plateforme. Celles-ci sont générées par deux principaux types de services, le moteur de recherche (Google) et l’agrégateur de nouvelles (Google Actualités). Dans les faits, les deux sont largement imbriqués puisque le moteur de recherche généraliste possède un onglet spécialisé dans les actualités et, réciproquement, l’agrégateur autorise la formulation de requêtes par l’internaute. Ces combinaisons donnent lieu à des affichages chaque fois différents, variant en outre selon le type d’appareil utilisé.
Voici pour commencer les mentions affichées sur écran d’ordinateur :
- La requête « stade de france » adressée au moteur de recherche généraliste Google génère une page de résultats (SERP : Search engine results page) listés de façon verticale (figure 7).
Fig. 7 : la requête "stade de france" sur Google
On retrouve au bas de cette page, entre un hyperlien vers un service de billetterie pour les matchs programmés au stade et un autre hyperlien vers le site de la ville de Saint-Denis, l’intitulé « Incidents au Stade de France : le déni des pouvoirs publics… » (intitulé tronqué). Il est surmonté de son URL et d’une référence au rubriquage « Société - Police et justice », puis d’une datation de sa publication « Il y a 8 heures » et d’une phrase « Des supporters de Liverpool bloqués devant les grilles du Stade de France brandissent leurs tickets, à Saint-Denis (Seine-Saint-Denis)… » (phrase tronquée elle aussi) qui s’avère être la légende de la photographie illustrant l’article sur le site web du Monde (figure 6, cf. supra).
- Lorsqu’on se rend sur l’onglet « Actualités » du moteur de recherche, cette photographie sous forme de vignette miniature apparaît au côté de la mention de l’article (figure 8).
Fig. 8 : l'onglet "Actualités" de Google
Cette fois, le titre est présenté de façon complète, surmonté par une autre vignette reprenant la lettre gothique M du Monde sous forme logotypée, et suivi d’une datation ainsi que de phrases extraites du chapeau : « Match retardé, violences, intrusions, gaz lacrymogènes… La soirée de samedi a tourné au fiasco, en marge de la final… ».
- La consultation de l’agrégateur Google Actualités ne fait pas directement mention de l’article sur sa page d’accueil « À la Une ». Pour en retrouver la trace, il faut se rendre dans la rubrique « France » de l’agrégateur (figure 9).
Fig. 9 : page d'accueil de Google Actualités sans recherche précise
Couplé avec un article du Figaro et une vignette photographique de membres du Gouvernement, l’article est mentionné de façon rudimentaire par son intitulé, la datation de sa publication, et le nom du journal.
- Dernière façon d’accéder à la mention de l’article sur ordinateur, la formulation d’une requête « stade de france » au sein de l’agrégateur Google Actualités se révèle la plus directe. La SERP ainsi générée place en tête de ses résultats la mention de l’article (figure 10).
Fig. 10 : la page de "Google Actualités" modifiée par la recherche "stade de france"
Toujours couplé à un article du Figaro, l’article du Monde est cependant ici, outre son titre, sa datation, et le nom du journal, accompagné de la vignette photographique représentant les supporters de Liverpool bloqués devant les grilles.
Des chemins d’accès similaires sont empruntables sur smartphone, via la navigation web mobile, conduisant à une diversité comparable d’affichages de la mention de l’article : voir par exemple les affichages à la suite d’une requête « stade de france » dans les pages web pour mobile du moteur de recherche (figure 11), puis dans son onglet « Actualités » (figure 12), et enfin dans l’agrégateur de nouvelles (figure 13).
Fig. 11 : affichage en navigation web mobile suite à la recherche "stade de france"
Fig. 12 : affichage en navigation web mobile dans l'onglet "Actualités" à la suite de la recherche "stade de france"
Fig. 13 : affichage en navigation web mobile de l'agrégateur de nouvelles "Google Actualités"
S’y ajoute par ailleurs la possibilité d’accéder à l’article via les applications logicielles de Google adaptées au système d’exploitation de l’appareil. Ainsi, à titre d’exemple, sur l’application Google Actualités pour iOS (appareil iPhone), la formulation de la requête « stade de france » peut amener à mentionner l’article sous la forme originale de la photographie des supporters brandissant leurs billets devant les grilles du stade, avec en surimpression la vignette de la lettre M logotypée, la datation et le nom du journal, et le titre de l’article (figure 14).
Fig. 14 : affichage sur l'application mobile "Google Actualités"
Google procède ainsi à une myriade de recompositions sémiotiques sur ses différentes pages-écrans. Ces recompositions ne sont pas toujours cohérentes, lorsque par exemple l’une d’elles affiche la légende d’une photographie (figure 7), alors que la photographie concernée est placée sur d’autres pages-écrans (figures 8, 10, 12 et 14). Fort hétérogènes donc, ces recompositions ont néanmoins en commun de reposer sur des fragments reformatés de l’article d’origine : titre (intégral ou tronqué), extraits du chapeau, photographie en vignette miniature, légende de cette photographie.
Ces réassemblages relativement hétéroclites dépendent des algorithmes de sélection et recomposition que Google a développés pour chacun de ses services et outils correspondants. En fonction de leurs spécifications informatiques respectives, ils vont aller puiser les modules linguistiques et iconiques de l’article que le journal leur permet d’indexer. Ce guidage pour l’indexation fait lui aussi l’objet d’une programmation informatique, décelable dans le code source HTML ou XML de la page web du journal (figure 15).
Fig. 15 : code source HTML ou XML de la page web du journal
Parmi les différentes lignes de code figurent des métadonnées (inscrites entre les balises <meta>) et en particulier celles spécialement destinées aux robots des outils de recherche comme Google (<meta name="robots">). À l’instar d’autres métadonnées destinées à aiguiller d’autres plateformes comme Twitter (<meta name="twitter:card">), elles vont permettre d’enclencher cette reprise de fragments et ainsi industrialiser de façon automatisée la dissémination des textes en ligne16.
La résultante de cette dissémination généralisée des modules de l’article est une sorte de dilution éditoriale du journal17. Celui-ci, décomposé en de multiples modules affichés sur une multitude d’espaces numériques externes, perd en un seul clic son unité éditoriale d’origine. Ses modules sont recomposés quasiment à l’infini et de façon presque immédiate, aux côtés de modules provenant d’autres journaux et médias (stations de radio, chaînes de télévision), sur les pages-écrans des plateformes qui procèdent à ces réassemblages.
Une telle déperdition éditoriale du journal rappelle encore une fois sa dimension fondamentalement transtextuelle. Cependant, elle atteint désormais une vitesse et une échelle sans commune mesure avec les périodes passées, et a pour corollaire sur le plan socio-économique une forte déperdition de valeur au profit des plateformes. Celles-ci, en se posant comme infomédiaires (intermédiaires informatiques) entre les internautes et les éditeurs de journaux, privent ces derniers de deux types de ressources.
Tout d’abord, les éditeurs perdent au passage la connaissance de leur lectorat ou au moins de leur lectorat potentiel, qui aurait pu être valorisée sur le plan marketing. À leur place, les plateformes récoltent des données sur les pratiques des internautes (ex. : centres d’intérêt déduits des requêtes dans le moteur de recherche). Combinées à celles extraites d’autres data channels18 placées en quantité d’autres points de passage de l’internet, ces données permettent de reconstituer des profils d’utilisatrices et utilisateurs relativement fins et autorisant un ciblage commercial.
Par ailleurs, les internautes peuvent se contenter de l’information présente sur la page-écran de la plateforme, même dans sa configuration réduite à un assez grossier package19 de titres et de vignettes photographiques, et ainsi ne pas juger nécessaire de cliquer sur les hyperliens correspondants. Ce sont autant de visiteuses et de visiteurs ne se déplaçant pas jusqu’au site du journal, une audience perdue en cours de route et qui se traduit par un manque à gagner sur le plan publicitaire : à titre de comparaison, en 2017, sur un marché estimé à un peu plus de 4 milliards d’euros en France, les éditeurs de presse percevaient environ un vingtième des dépenses des annonceurs (234 millions) quand Google en attirait près de la moitié (1,8 milliard)20.
La directive Copyright de 2019, tentative avortée de réguler la modularisation éditoriale
Les journaux se voient ainsi à la fois déstructurés sur le plan éditorial et exploités sur le plan économique, et ce depuis près de vingt ans maintenant, si l’on remonte au lancement de la version française de l’agrégateur Google News en 200321. Fortement dépendants d’un nombre réduit de plateformes pour l’apport d’audience vers leur site, les éditeurs se retrouvent face à un oligopsone difficilement contestable par le seul jeu du marché. Il leur est en particulier très difficile de se liguer contre la plateforme dominante qu’est Google, qui leur apporte bon an mal an — et malgré quelques variations selon les sites — près de la moitié de leur audience. À plusieurs reprises, Google a envisagé de désindexer les sites récalcitrants, mais n’a pas eu besoin de mettre sa menace à exécution, sachant que plusieurs sites concurrents se seraient immédiatement engouffrés dans une telle brèche.
Dans une telle situation, seule une intervention des pouvoirs publics est en mesure d’apporter les corrections nécessaires, et de façon d’autant plus légitime que la viabilité d’une information plurielle et de qualité est indispensable à une bonne vie démocratique. Une tentative en ce sens a bien eu lieu dans la première moitié des années 2010 de la part de l’État français. Relevant d’un dispositif d’aides à la presse, elle s’est hélas avérée à la fois faible en volumes financiers, peu contraignante pour les plateformes et de surcroît en grande partie retournée à son profit par Google22. À cette aune, l’initiative de régulation européenne concrétisée par la directive Copyright de 2019 (Directive EU 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Markets), a paru constituer une évolution majeure. L’examen de sa mise en application en France, toujours à propos du cas des relations entre Google et Le Monde, un éditeur pourtant mieux armé que les autres, mène toutefois à un bilan mitigé.
Parmi ses différents articles, la directive en comprend un spécifiquement consacré à la reprise en ligne des informations de presse. L’article 15, explicitement intitulé « Protection of press publications concerning online uses », est le fruit de discussions nourries en amont, ayant notamment opposé les défenseurs des droits des éditeurs (publishers) et les lobbyistes des opérateurs de plateformes (information society service providers dans la terminologie juridique européenne). Il aboutit à ce que la reprise des informations des premiers soit limitée, sauf sinon à engendrer une compensation financière de la part des seconds. Les plateformes sont ainsi tenues de ne pas afficher le contenu des éditeurs, tant qu’elles ne s’en voient pas concéder le droit contre reversement pécuniaire, à la notable exception suivante, inscrite dans l’alinéa 2 de l’article 15 : « the use of individual words or very short extracts of a press publication ».
Premier État membre à transposer la directive dans son droit national, la France a dès le 24 juillet 2019 adopté la Loi 2019-775 tendant à créer un droit voisin au profit des agences de presse et des éditeurs de presse. Son article 2 reprend termes à termes ceux employés dans la directive européenne, autorisant « l’utilisation de mots isolés ou de très courts extraits », tout en précisant que « l’efficacité des droits […] est notamment affectée lorsque l’utilisation de très courts extraits se substitue à la publication de presse elle-même ou dispense le lecteur de s’y référer. »
Applicable trois mois plus tard, soit au début de l’automne 2019, la loi a vu son esprit quasi immédiatement détourné par Google. La firme californienne, après avoir bataillé dans les coulisses des institutions européennes, puis avoir protesté publiquement contre le caractère supposément injuste de la mesure votée par le parlement national, a fini par indiquer ce que serait désormais sa politique générale vis-à-vis des éditeurs de presse français. Sur Le blog officiel de Google France, le 25 septembre 2019, sans à aucun moment faire référence à un quelconque reversement aux nouveaux ayant-droits, la « mise en conformité avec la loi » est plutôt présentée dans la continuité de « la possibilité [qu’ont toujours eue] les éditeurs de choisir s’ils voulaient ou non que leurs contenus soient accessibles via le moteur de recherche de Google ou sur Google Actualités ». La seule inflexion réside dans l’annonce de « réglages plus granulaires pour les webmestres grâce auxquels les éditeurs peuvent indiquer la quantité d’information qu’ils souhaitent voir apparaître sous forme d’aperçu dans les résultats de la recherche ».
La traduction pratique est livrée le même jour sur le Blog Officiel pour les webmestres présentant les balises informatiques attenantes, implémentables dans le code source des pages web des éditeurs. Après un rapide rappel de l’existence de la balise no-snippet, permettant de prévenir le robot indexeur qu’aucun aperçu de la page ne peut être affiché sur la plateforme, sont au contraire présentés trois autres balises destinées à paramétrer l’affichage et signalées comme autant de « Nouveauté[s] » : max-snippet pour préciser « la longueur maximale, en nombre de caractères, d’un extrait de texte », max-video-preview pour « la durée maximale, en secondes, d’un aperçu vidéo animé », et max-image-preview pour « la taille maximale de l’aperçu d’image à afficher pour toutes les images de cette page ».
Dans un même mouvement, les éditeurs de presse français ont pour la plupart d’entre eux intégré ces nouvelles balises au code source de leurs pages web respectives. Plus encore, ils les ont employées le plus souvent de façon maximaliste, à l’instar de ce que l’on peut relever au sein des spécifications informatiques gouvernant l’article web du Monde examiné de plus près ici (figure 15, cf. supra) :
<meta name="robots" content="max-snippet:-1">
<meta name="robots" content="max-video-preview:3">
<meta name="robots" content="max-image-preview:large">
Dans cet exemple, à l’exception des aperçus vidéos pour lesquels une limite de durée est précisée (3 = trois secondes), les aperçus de texte et d’images fixes sont eux en revanche poussés au maximum : la spécification -1 signifie que « la longueur de l’extrait est illimitée », et la spécification large autorise « un aperçu d’image de grande taille pouvant s’étendre sur toute la largeur de la fenêtre d’affichage » (précisions apportées par Google aux développeurs de programmes informatiques sur https://developers.google.com).
Les éditeurs ont adopté une attitude panurgique quant au codage informatique de leurs pages, car ils ne peuvent pas se permettre d’être désindexés des différents services de Google. Faire figurer une balise no-snippet reviendrait pour chaque éditeur à devenir invisible sur la première plateforme pourvoyeuse d’audience. Qui plus est, chaque éditeur, de peur de se faire doubler dans cette quête de trafic par ses propres homologues, a préféré graduer vers la limite haute le degré de reprise de ses informations par la plateforme. Ce qui est présenté par Google en cette fin de décennie 2010 comme un « choix » laissé à la libre appréciation de chaque éditeur n’en est en réalité pas un; il continue plutôt à s’apparenter au contrat léonin perdurant depuis plusieurs années par le biais du protocole robots.txt23.
Si les éditeurs de façon assez unanime recourent à un semblable codage informatique de leurs pages, qui conduit à une ouverture élargie de l’objet éditorial qu’est leur journal, certains peuvent néanmoins en parallèle obtenir des compensations financières de la part des plateformes, et notamment de Google. Les éditeurs ne sont de fait pas tous placés dans une même situation de dépendance vis-à-vis de la plateforme. Certains disposent d’atouts les amenant à tirer leur épingle du jeu, en s’appuyant dorénavant sur les prises fournies par le nouveau contexte législatif.
À cet égard, Le Monde figure parmi les plus privilégiés, à la fois à titre individuel et à titre collectif. D’une part, le groupe Le Monde est membre de l’association professionnelle la plus influente, l’Apig — Alliance de la presse d’information générale, qui regroupe des centaines de publications sur l’ensemble du territoire, au niveau national comme local. Dès les premiers instants, en novembre 2019, l’Apig a saisi l’Autorité de la Concurrence pour exiger une application plus stricte de la loi, susceptible d’entraîner des versements concrets des plateformes au titre des droits voisins. Dans le même temps, elle a négocié plus confidentiellement avec Google un accord-cadre, obtenu début 2021 au profit de ses seuls membres et concernant de nouveaux services premium (Google News Showcase). D’autre part, Le Monde, source de référence et publication pivot dans la mise à l’agenda médiatique national, par conséquent incontournable aux yeux de Google, a pu faire jouer une carte plus personnelle. Ceci s’est traduit en monnaie sonnante et trébuchante dans un contrat de gré à gré signé entre les deux parties en 2022, et allouant un million d’euros par an au journal (avec effet rétroactif de deux autres millions d’euros pour les années précédentes, depuis la loi de 2019 donc), mais avec pour contrepartie un affichage encore plus poussé dans les services de Google (« Extended News Previews », contrat révélé par Mediapart le 22 juin 2022).
Ainsi, même pour un acteur aussi puissant que Le Monde, qui peut de surcroît s’appuyer sur une organisation professionnelle (Apig) à l’activité de lobbying très organisée et apte à s’engager dans des contentieux juridiques sur la durée, les compensations financières obtenues de façon discrétionnaire s’accompagnent aussi d’une ouverture de plus en plus grande de l’objet éditorial journal à l’emprise des plateformes. De son côté, Google, malgré un encadrement juridique devenu plus contraignant, encadrement matérialisé par des sanctions substantielles (amende record de 500 millions d’euros infligée à Google par l’Autorité de la Concurrence à l’été 2021) avant de se relâcher quelque peu, n’en a pas moins poursuivi sa stratégie consistant à diviser pour mieux régner24. Comme par le passé, Google s’est employé à toujours éviter de se présenter face à un front uni des éditeurs, en faisant jouer des rivalités internes entre eux par le biais de modifications techniques s’imposant de facto à tous.
Épilogue… provisoire
Faire respecter ses droits de propriété intellectuelle, et plus largement conserver son intégrité éditoriale, s’avère ainsi de plus en plus complexe pour un journal en ce XXIe siècle naissant. Un détour par l’histoire de la presse, sur sa longue durée, rappelle néanmoins que ceci n’a pas toujours constitué un objectif en soi.
Les premiers périodiques imprimés du XVIIe siècle, s’ils pouvaient comporter une part d’information originale, s’appuyaient aussi pour beaucoup sur des nouvelles produites par des tiers, nouvelles manuscrites ou déjà imprimées dans d’autres gazettes. Pratique largement admise, la compilation de nouvelles a même pu constituer, dans la seconde moitié du XIXe siècle, la totalité de la surface éditoriale de certaines publications aux noms parfaitement évocateurs : Gazette des gazettes, Journal des journaux25. Quelques décennies plus tard cependant, ce type d’initiative éditoriale sera davantage vilipendé à mesure que le droit d’auteur se cristallise et accompagne au XIXe siècle l’envol industriel et marchand de la presse26.
Si les éditeurs, et les auteurs, se montrent ainsi progressivement plus regardants quant à la reprise de leurs productions, leur réaction reste néanmoins alors assez différente de celle observée dans la situation contemporaine. Une certaine tolérance demeurait à l’époque, sans doute parce que ces journaux voleurs du XIXe siècle, en comparaison des plateformes numériques du XXIe siècle, étaient perçus comme une moindre menace. D’une part, ils ne préemptaient pas une portion des revenus aussi vaste que celle captée aujourd’hui via la publicité ciblée et les données numériques. D’autre part, il s’agissait d’acteurs du même secteur et non pas de nouveaux entrants (outsiders) comme l’ont été par la suite les compagnies de télégraphe, transcrivant les nouvelles des journaux, ou les stations de radio, les lisant à haute voix sur les ondes, et donc in fine les plateformes numériques27.
D’autres différences sont également à rechercher, comme le présent texte y invite, dans l’articulation entre des évolutions technosémiotiques et une structuration socio-économique assez inédite.
Certes, la modularisation éditoriale des journaux a là encore toujours existé, en particulier via le format du paragraphe depuis les origines de la presse28. Et, symétriquement, le processus de composition-recomposition a lui aussi été à l’œuvre dès le début, avec des procédés d’impression connaissant un passage à un stade véritablement industriel au cours du XIXe siècle29. Cependant, cet environnement technosémiotique connaît une accentuation avec le numérique, marquée respectivement par une granularisation de modules eux-mêmes diversifiés (écrits, mais aussi sons, images fixes et animées), ainsi que par une systématisation et une accélération de leur reprise.
Les plateformes sont à même d’assurer le réassemblage à haute fréquence de ces matériaux numériques épars, en fonction de profils ou demandes ad hoc des internautes, données simultanément valorisables sur le plan marketing (en particulier auprès d’annonceurs via des publicités ciblées). De cette position centrale dans la filière émergente de l’information en ligne30, qui s’apparente à un oligopsone où une myriade d’éditeurs se retrouvent atomisés et fortement dépendants, les plateformes peuvent insuffler à ces derniers, via le code, des injonctions pouvant aller jusqu’à un renoncement à « l’actif de marque » que constitue l’identité éditoriale de leur journal31.
Faute d’une régulation par les pouvoirs publics véritablement effective à ce jour, on se retrouve ainsi en présence d’un type d’acteur qui à la fois peut user d’un pouvoir de marché considérable sur le plan économique, et qui par sa maîtrise technologique peut imposer par la programmation ses conditions, avec des conséquences éditoriales qui évidemment interrogent. Car face à ces mouvements systémiques, demeure plus que jamais la question essentielle d’une information plurielle et de qualité, et donc de son financement, par-delà sa circulation généralisée.
Notes
1 Roy Pinker, Fake news & viralité avant internet. Les lapins du Père-Lachaise et autres légendes médiatiques, CNRS Éditions, 2020.
2 Sarah Mombert, « Le journalisme aux ciseaux. Les journaux voleurs et le recyclage du texte de presse », Le magasin du XIXe siècle, no 11, 2021, p. 102–108.
3 David Hesmondhalgh, The Cultural Industries, Sage Publications, 2013.
4 Samuel Goyet, « Outils d’écriture du web et industrie du texte. Du code informatique comme pratique lettrée », Réseaux, no 206, 2017, p. 61–94.
5 Yves Jeanneret, Critique de la trivialité. Les médiations de la communication, enjeux de pouvoir, Éditions Non Standard, 2014.
6 Anne Helmond, « The platformization of the web: Making web data platform ready », Social Media + Society, vol. 1, no 2, 2015, p. 1–11.
7 Franck Rebillard et Nikos Smyrnaios, « Quelle “plateformisation” de l’information? Collusion socio-économique et dilution éditoriale entre les entreprises médiatiques et les infomédiaires de l’internet », tic&société, vol. 13, no 1–2, 2019, p. 247–293.
8 Yvan Combeau, Histoire de Paris, Presses universitaires de France, 2021.
9 Sophie Corbillié, Emmanuelle Fantin et Adeline Wrona, « Paris et les médias, une histoire entremêlée », in S. Corbillié, E. Fantin, A. Wrona (dir.), Paris, capitale médiatique, Presses universitaires de Vincennes, 2022.
10 Maurice Mouillaud et Jean-François Tétu, Le journal quotidien, Presses universitaires de Lyon, 1989.
11 Marie-Laure Florea, « Tabularité : des textes aux corpus », Corpus, no 8, 2009, p. 177–196.
12 Juliette Charbonneaux, « L’écriture du titre journalistique face aux infomédiaires : compétition, coopétition ou coopération? Le cas de BFMTV.com », Quaderni, no 107, 2022, p. 57–72.
13 Guillaume Pinson, Julien Schuh et Pierre-Carl Langlais, « La réimpression dans la presse francophone du 19e siècle : outils numériques et enjeux de mesure de viralité », Journée d’étude Bases de données et outils numériques : des révélateurs de l’imprimé et du littéraire, 2016.
14 Adeline Wrona, « Éditorialisation », Publictionnaire. Dictionnaire encyclopédique et critique des publics, 2021.
15 RISJ, Digital News Report, Reuters Institute for the Study of Journalism, 2021, p. 24.
16 S. Goyet, art. cit., p. 61–94.
17 F. Rebillard et N. Smyrnaios, art. cit., p. 247–293.
18 A. Helmond, art. cit., p. 1–11.
19 David Nieborg et Thomas Poell, « The platformization of cultural production: theorizing the contingent cultural commodity », New Media & Society, vol. 20, no 11, 2018, p. 4275–4292.
20 Bearing Point, Médias et publicité en ligne. Transfert de valeur et nouvelles pratiques, Étude pour le ministère de la Culture et le Conseil supérieur de l’audiovisuel, 2018.
21 F. Rebillard et N. Smyrnaios, art. cit., p. 247–293.
22 Ibid.
23 Guillaume Sire, « Inclusion exclue : le code est un contrat léonin. Enquête sur la valeur technique et juridique du protocole robots.txt », Réseaux, no 189, 2015, p. 187–214.
24 Charis Papaevangelou et Nikos Smyrnaios, « Regulating dependency: the political stakes of online platforms’ deals with French publishers » (preprint), HAL SHSi, 2022.
25 Will Slauter, « Le paragraphe mobile. Circulation et transformation des informations dans le monde atlantique du XVIIIe siècle », Annales. Histoire, Sciences Sociales, vol. 67, no 2, 2012, p. 363–389.
26 S. Mombert, art. cit., p. 102–108.
27 Will Slauter, « Taking the Long View: The Business of News and the Limits of Copyright », Critical Analysis of Law: An International & Interdisciplinary Law Review, vol. 6, no 2, 2019, p. 262–272.
28 W. Slauter, « Le paragraphe mobile. », art. cit., p. 363–389.
29 Ryan Cordell, « Viral Textuality in Nineteenth-Century US Newspapers Exchanges », in V. Alfano, A. Stauffer (eds), Virtual Victorians. Networks, Connections, Technologies, Palgrave McMillan, 2015.
30 F. Rebillard et N. Smyrnaios, art. cit., p. 247–293.
31 Virginie Sonet, « Retour critique sur une décennie d'information sur smartphone comme produit de contraste des ambitions des plateformes », Les Cahiers du journalisme, vol. 2, n°6, 2021, p. R11-R32.