Presses anciennes et modernes à l'ère du numérique

Les bots comme outil d’analyse et de remédiation des corpus : la théorie du « triangle de l’intelligence »

Table des matières

JULIETTE DE MAEYER et DOMINIQUE TRUDEL

Le développement accéléré des outils numériques a profondément transformé la recherche universitaire dans tous les domaines, incluant les lettres et les sciences humaines et sociales. Alors que ces transformations se présentent le plus souvent sous le signe de la nouveauté ou de la rupture avec le passé, cet article a pour objectif d’articuler l’utilisation d’outils numériques à la théorie médiatique du « triangle de l’intelligence » développée il y a plus d’un siècle par Franklin Ford (1849-1918), un journaliste américain qui a joué un rôle pionnier dans le champ des études sur les médias et la communication1. Dans ce contexte, les outils numériques se présentent non pas comme des instruments génériques permettant d’analyser un corpus de textes, mais plutôt comme des algorithmes spécifiquement construits à partir des propositions de celui-ci, et entrant en dialogue avec lui. Au fil de cette construction, la théorie du « triangle de l’intelligence » s’incarne dans un dispositif mettant en relation les textes numérisés de Ford et trois « bots » qui permettent tout à la fois d’en proposer une première analyse et de les mettre en circulation (ou de les « remédier »)2. Ce dispositif permet ainsi de mettre en lumière des aspects jusqu’ici méconnus de la trajectoire professionnelle et intellectuelle de Ford et de reconsidérer tout à la fois son héritage dans les études portant sur les médias et la communication ainsi que les résonances contemporaines de propositions souvent un peu maladroites dont la principale qualité est une sérendipité parfois étonnante.  

Après avoir exposé la trajectoire ayant conduit Ford à élaborer la théorie du « triangle de l’intelligence » et ses ramifications, notre propos s’attarde plus spécifiquement à décrire de manière réflexive l’élaboration et le fonctionnement d’un dispositif méthodologique dont le champ d’application est singulier, mais dont les modalités d’élaboration sont modestement proposées comme un exemple. En s’arrimant aux contours de l’objet analysé, les outils numériques en viennent à se présenter comme une prolongation de celui-ci, ce qui permet de problématiser, à partir du concept de remédiation, la relation entre l’objet d’analyse, la démarche méthodologique et l’analyse à proprement parler. Ce faisant, cette approche prend à revers une critique couramment formulée à l’encontre des démarches mettant à profit les outils numériques, qui marqueraient l’effacement de la théorie devant les data3.

Un homme et son triangle

Né en 1849 dans une région rurale du Michigan, aux États-Unis, Franklin Ford fait ses premières armes comme journaliste dans différents journaux (Baltimore Gazette, Philadelphia Record, New York Sun) puis devient en 1880 éditeur du Bradstreet’s Journal of Trade, Finance, and Public Economy. Nouvel organe de l’agence de crédit Bradstreet, le journal innova à de nombreux égards. Utilisant les nouvelles technologies de l’époque — le télégraphe, le téléphone, la machine à écrire — de manière intensive, Bradstreet’s a constitué un véritable laboratoire d’expérimentation aux yeux de Ford4. Dans sa perspective, ces nouvelles technologies permettaient une approche véritablement scientifique de la collecte, de l’organisation et de la dissémination de l’information.

Les idées parfois grandiloquentes de Ford n’ont qu’en partie été mises en place à Bradstreet’s, où elles se sont butées à la résistance de plusieurs. Après avoir quitté son poste en 1887, Ford a consacré sa vie à un travail à la fois théorique et pratique. En plus de multiplier les lettres, traités, et autres opuscules détaillant les fondements d’une conception pleinement scientifique de l’information, il a de manière frénétique mis sur pied des bureaux visant à concrétiser celle-ci. Nommés « The Cabinet of News, » «The News Office » ou simplement « Ford’s, » ceux-ci n’ont jamais véritablement pris leur envol et semblent avoir été des entreprises solitaires existant surtout sur l’en-tête d’un papier à lettres.

Les projets de Ford n’ont jamais été aussi près de se réaliser que durant son séjour à l’Université du Michigan, entre 1888 et 1892, durant lequel il a tenté de lancer un journal révolutionnaire, Thought News. La petite équipe rassemblée autour de Ford et son frère Corydon, qui compte en son sein certains des fondateurs des sciences sociales américaines, parmi lesquels John Dewey, Charles Cooley, Robert Ezra Park et George Herbert Mead, s’est alors engagée dans une réflexion pionnière sur les médias et la communication anticipant sur les développements ultérieurs du pragmatisme et de la sociologie de l’École de Chicago. Poussant les métaphores organicistes et machinistes vers des sommets poétiques, le groupe avait pour ambition de combler l’écart entre théorie et pratique en mettant en pratique des enquêtes identifiant les relations entre les faits. Une publicité annonçant la publication imminente du premier numéro expose ainsi la nature du projet éditorial :

« Thought News has but one thing to report and that is a mere announcement—the announcement that the social organism is here (...) If the social organism is a fact, and not a poetic dream, it must be studied like a steam engine, in its principle and in its practical activity (...) So the chasm between education and life, between theory and practice, is bridged over once and forever »5.

Mystérieusement, le projet ne s’est jamais concrétisé. Il laisse néanmoins comme héritage un document, le Draft of Action, dans lequel Ford expose les principes généraux derrière Thought News6. Le document détaille les contours du « triangle de l’intelligence, » une théorie normative de la dissémination de l’information qui prévoit leur triple circulation selon trois modalités distinctes et trois niveaux d’intérêt : les « general news » à l’intérieur de trois journaux (le quotidien politique The Newsbook, le plus sensationnaliste The Town ainsi que le Daily Want, qui contient exclusivement de la publicité), les « class news, » qui visent des secteurs économiques particuliers et qui sont présentés dans des publications spécialisées (qui portent des titres évocateurs tels que Grain, Fruit, Metals et Chemical News), et enfin les « individual news, » des informations personnalisées qui sont communiquées sur demande, suite à une enquête menée par un bureau spécialisé, Fords. Les trois côtés du triangle correspondent à trois compagnies différentes (News Association, Class News Company et Fords) que Ford souhaitait mettre sur pied et lier par d’étroites relations commerciales, l’ensemble formant « l’Intelligence Trust. » L’ensemble est présenté à la fois comme un plan d’affaires détaillé, Ford expliquant par exemple comment le Daily Want devrait d’abord être publié dans les grands marchés de Chicago, New York, Philadelphie et Boston, et comment ses tarifs seraient plus avantageux que ceux du New York Herald, et sur le plan théorico-politique. Le triangle de l’information permettrait ni plus ni moins de rendre compte des transformations sociales et politiques — et d’en être le moteur, puisqu’aux yeux de Ford, l’information, si elle circule bien, permettrait à la société de s’auto-gouverner.

Une archive à créer, analyser et disséminer

Thought News et le Draft of Action sont au cœur des travaux portant sur Ford et sur son héritage, alors que ses activités et sa production intellectuelle avant et après cet épisode ne sont que très peu connues. Cette méconnaissance est en partie liée à l’absence d’un fonds d’archives dédié à Ford. En octobre 1914, un violent incendie ravagea son bureau de l’Université Columbia, réduisant en cendres des décennies de travail. Les quelques traces documentaires des activités de Ford ayant survécu sont disséminées dans des dizaines de collections à travers les États-Unis, dont bon nombre ne sont pas numérisées à ce jour. Une première étape de notre recherche a dès lors pris la forme d’une recherche archivistique traditionnelle, laquelle nous a permis d’identifier une soixantaine de documents écrits par Ford, lesquels ont été numérisés et partiellement intégrés au site web du projet, www.franklinford.org. Ces textes sont de différentes natures : des lettres envoyées à une série de correspondants plus ou moins célèbres (Norman Angell, James Burrill Angell, Thomas McIntyre Cooley, Oliver Wendell Holmes Jr., William Graham Sumner, Lester Frank Ward, etc.), des livres et fascicules, des articles de presse et autres publications mineures. Ces documents, pour la plupart inconnus des chercheurs s’étant précédemment intéressés à Franklin Ford, permettent de mieux comprendre la nature de ses activités et l’ensemble de sa trajectoire intellectuelle, sans la réduire à l’épisode Thought News

Expérimenter avec les bots

Outre la collecte de cette archive et sa lecture rapprochée afin de mieux retracer les contours de la vie de Ford et de sa contribution, notre projet inclut aussi un volet expérimental, qui cherche à croiser la fascination de Ford pour les nouvelles technologies de son temps (le télégraphe, le téléphone) avec les médias d’aujourd’hui. Ce rapprochement s’impose par les thèmes dont traite Ford : son œuvre est traversée par les enjeux de la circulation de l’information, de l’efficacité avec laquelle les «faits» voyagent, et des infrastructures nécessaires pour arriver à une dissémination optimale de ceux-ci. Un regard anachronique — pleinement assumé et revendiqué7 — ne peut s’empêcher d’y voir quelque chose qui ressemble aux notions contemporaines de réseaux et d’écosystèmes informationnels. Il ne fait aucun doute que s’il avait vécu dans les années 2020, Ford aurait intégré les médias sociaux et les algorithmes à sa vision. Pour explorer ce rapprochement dans une démarche qui ne se limiterait pas à la lorgnette étroite des filiations ou d’un portrait de Ford en précurseur, nous avons mis en place un dispositif expérimental qui vise à remédier Ford dans plusieurs environnements médiatiques qui lui sont étrangers et anachroniques, parcourus sous les traits d’un « bot ».

La notion de « bot » (une contraction de « robot ») désigne assez largement des logiciels qui effectuent des tâches de manière (semi-)automatisée. Il existe de nombreux types de bots, mais le terme a gagné en popularité au cours des dernières années pour désigner plus spécifiquement les bots qui, sur les médias sociaux, personnifient de manière plus ou moins sophistiquée des utilisateurs humains8. Ces « bots sociaux » ont différentes raisons d’être — qui vont de la propagande politique au service à la clientèle, en passant par des initiatives artistiques ou ludiques — et représentent un phénomène suffisamment important pour que le magazine Wired affirme en 2014 que les bots sont désormais plus nombreux que les humains sur le Web9. Si les réseaux de télégraphe et de téléphone sont emblématiques du paysage médiatique de la fin du 19ème siècle, les bots, avec leurs logiques algorithmiques et leur association étroite avec les plateformes de réseaux sociaux, constituent des éléments spécifiques aux environnements médiatiques contemporains. Transformer Franklin Ford en bot fait s’entrechoquer « anciens» et « nouveaux » médias, dans une démarche inspirée des travaux en histoire des médias qui problématisent les contours de ces catégories 10. Ainsi, avec les bots, nous pouvons explorer certaines questions théoriques (comment matérialiser le « triangle de l’intelligence » à travers sa remédiation dans des « nouveaux » médias ?), méthodologiques (puisque tous les bots travaillent à partir d’un même corpus d’archives, qu’apporte cette lecture distante ?) et biographiques (qui est Ford et comment les bots viennent-ils questionner certains pans de sa vie et de son œuvre ?).

En guise de ligne directrice pour mener à bien cette expérience, nous nous sommes emparés de la théorie du triangle de l’intelligence en tentant de l’adapter au paysage médiatique contemporain et en travaillant à partir d’une même matière première (les « faits » à disséminer), soit les écrits de Ford. Dans une sorte de mise en abyme, les « nouvelles » qui sont mises en circulation par notre triangle de bots sont les idées de Ford elles-mêmes, c’est-à-dire le contenu d’un corpus11 de textes de Ford que nous avons rassemblés au sein d’une archive numérisée. Dans les sections suivantes, nous décrirons cette archive ainsi que le processus de création des trois bots et les enjeux qu’ils soulèvent.

Trois bots pour incarner les trois branches du triangle

Dans la première branche du triangle, Ford entrevoyait un système de diffusion des nouvelles généralistes pour un large public. C’est Twitter qui nous a semblé constituer la plateforme idéale pour explorer cet aspect : Twitter est une plateforme davantage centrée sur l’actualité et les nouvelles que d’autres, les messages y sont diffusés à un public potentiellement large, et les systèmes d’amplification algorithmique (qui exposent les utilisateurs de Twitter à des contenus provenant de sources auxquels ils ne sont pas nécessairement abonnés) en font un espace qui, à l’instar des journaux généralistes envisagés par Ford, voit se côtoyer des informations de toutes sortes.

Le bot @franklinfordbot, créé en mars 2017, consiste en un script qui découpe le corpus des textes de Ford en phrases et pioche dans ce répertoire pour ensuite les publier, grâce à l’API de Twitter, à une fréquence qui va de quelques heures à deux jours. Une deuxième version du bot Twitter, lancée en avril 2020, permet quant à elle de réfléchir à la nature assez diverse des annotations que les méthodes numériques permettent — c’est-à-dire tout ce qui peut venir « augmenter » le texte. Dans cette nouvelle itération, nous avons cherché à maintenir la connexion et à renforcer la juxtaposition entre les tweets de @franklinfordbot et les textes de Franklin Ford (les « originaux », qui sont en fait des versions numérisées des documents) : chaque tweet est agrémenté d’un lien qui renvoie au PDF du document dont il est tiré sur le site web du projet. En sens inverse, la navigation sur le site web du projet permet d’accéder aux tweets à partir des PDF. Les tweets peuvent donc être conçus comme des annotations aux documents (et vice-versa), de même que l’ensemble des réactions que les tweets peuvent éventuellement provoquer (qu’il s’agisse des réponses d’autres utilisateurs ou de nouvelles juxtapositions créées par les algorithmes de Twitter).

La deuxième branche du triangle est celle des « class news. » Elle consistait pour Ford en des journaux spécialisés destinés à disséminer de l’information ciblée à certains secteurs d’activité. Pour trouver un terrain propice à l’exploration de cette idée de spécialisation, nous avons opté pour la plateforme Reddit, qui héberge des forums de discussion sur une vaste gamme de sujets. Au moment de créer le bot u/franklinfordbot, Reddit comptait 2.5 millions de forums (des « subreddits ») différents, organisés en catégories et sous-catégories.

Plutôt que de diffuser des extraits des écrits de Ford à un large public de manière indiscriminée, comme dans le cas du bot Twitter, l’objectif consiste ici à en apparier des passages aux discussions spécifiques ayant lieu dans ces forums. Dans une première étape, nous avons cherché à comprendre — dans une logique de bot — de quoi parle Ford. Des algorithmes de topic modeling12 nous ont ainsi permis d’associer chaque paragraphe13 du corpus à un ensemble de cinq mots-clés le décrivant. Nous avons ensuite utilisé ces mots-clés pour faire une recherche sur Reddit, via son API, et sélectionné le fil de discussion jugé le «plus pertinent » par le moteur de recherche de Reddit. Le bot publie alors le fragment du corpus correspondant en réponse au fil de discussion, et répète l’ensemble de l’opération avec la paire de fragment/mots-clés suivante quelques heures plus tard.

L’objectif de ce bot était de faire intervenir u/franklinfordbot dans des conversations spécialisées, afin de mettre en œuvre la théorie du triangle de l’intelligence voulant que chaque information soit acheminée à son public pertinent. Les résultats sont plus ou moins heureux : parfois, u/franklinfordbot touche juste et semble effectivement publier des contributions adéquates, qui font écho aux thématiques des fils de discussion spécialisés où il intervient. Par exemple, en réponse à un fil de discussion au sujet de « The search for truth in a post-truth society14 » publié dans un forum consacré à la philosophie (r/Philosophy), u/franklinfordbot a publié un extrait du Draft of Action dans lequel la vérité est effectivement un thème récurrent. Mais souvent, voire dans la plupart des cas, la cohérence thématique des interventions de u/franklinfordbot est faible. Ses interventions semblent inadéquates, mal ajustées à la discussion originale. Paradoxalement, la circulation optimale et bien catégorisée de l’information escomptée s’apparente davantage à une certaine cacophonie qui a le mérite d’exposer les limites de la logique algorithmique que nous avons adoptée : on peut supposer que les mots-clés ne décrivent pas parfaitement les fragments du corpus, ou encore que la recherche par mots-clés dans l’API de Reddit donne un résultat trop vague.

Le troisième bot que nous avons conçu incarne la dernière branche du triangle de l’intelligence : celle des nouvelles personnalisées. Afin de répondre à des requêtes d’information individualisées, nous avons conçu un agent conversationnel (et plus spécifiquement un « chatbot »). Celui-ci se présente sous la forme d’une fenêtre de conversation sur le site web du projet dans laquelle les utilisateurs sont invités à poser des questions (avec l’invite « Buy your facts at Ford’s. Corporations investigated. Trade conditions reported. » qui reprend des slogans utilisés par Ford pour décrire le travail de ses bureaux). Pour répondre à ces questions, nous avons créé un générateur de texte avec GPT-2, une technologie d’intelligence artificielle qui utilise un modèle pré-entraîné pour générer du contenu en langage naturel15. Celui-ci a été entraîné sur le même corpus que les autres bots, et permet donc de produire du texte original qui imite le ton et le style de Ford, et donc de produire de l’information à la demande. Encore une fois, les résultats sont plus ou moins pertinents au regard des questions posées. Comme le corpus est de taille modeste, plus ou moins riche au niveau thématique et pas complètement « nettoyé, » les réponses n’apparaissent pas tant comme des réponses aux questions, mais plutôt comme des excroissances d’un corpus pointant dans de nouvelles directions. 

La création de ces trois bots nous a donc permis de nous interroger sur une application contemporaine du triangle de l’intelligence, en plus d’apprendre à utiliser différentes techniques, langages de programmation et API. Les bots se sont également avérés des collaborateurs précieux dans une optique de dissémination des connaissances : ils font circuler notre travail et celui de Ford auprès de différents publics, bien au-delà du cercle restreint d’universitaires qui s’y étaient jusqu’ici intéressés. Dans le même ordre d’idée, les bots ont aussi des qualités pédagogiques, et nous avons pu les utiliser dans nos enseignements comme porte d’entrée pour sensibiliser les étudiants à différents enjeux liés à l’histoire des médias. Enfin, au-delà de leurs qualités d’ambassadeurs, les bots contribuent également à notre recherche d’autres manières : en tant qu’objets techniques à la fois récalcitrants et autonomes, ils constituent un dispositif réflexif qui renvoie aux chercheurs qui les déploient des questions méritant d’être explorées.

Explorer l’autonomie des bots : surréalisme numérique et questions éthiques

Les bots disposent d’une certaine autonomie. Ils agissent en effet selon les règles posées par ceux qui les créent, mais sans que la portée exacte de leurs interventions puisse être prévue — notamment parce qu’ils interagissent à la fois avec les algorithmes et les utilisateurs des plateformes de réseaux sociaux où ils mènent leur existence.

Sur Twitter, c’est surtout le caractère aléatoire des tweets et leur irruption dans un nouveau contexte qui créent des effets intéressants. Dans l’écosystème de Twitter, les phrases extraites du corpus fordien font parfois écho — à plus d’un siècle d’intervalle — aux préoccupations de certains commentateurs des médias d’aujourd’hui. Ainsi, quand @franklinfordbot publie des messages tels que « The time has come when it will pay to act on the reality underlying the existing newspaper structure ,16 » on peut y voir une certaine résonance avec les propos de Jeff Jarvis, un professeur, expert et commentateur des transformations médiatiques actuelles, qui écrit, par exemple, « Newspaper companies need to get to the point of financial reality from which they can grow again17 ».

Les tweets de @franklinfordbot constituent aussi des points d’entrée nouveaux dans les textes de Ford. En proposant une lecture non linéaire des documents, ils permettent de mettre en lumière des passages qui n’auraient pas nécessairement attiré l’attention autrement. Plus spécifiquement, cette non-linéarité converge avec certaines tentatives de concevoir le « surréalisme numérique » comme une méthode pour l’histoire des médias18. Celle-ci consiste à révéler des aspects des textes médiatiques qui ne seraient pas visibles sans les techniques de découpage automatisé assistées par ordinateur. À l’instar de la méthode du «cut-up» ou de la « méthode paranoïaque-critique » de Salvador Dali, les interventions aléatoires de @franklinfordbot ont contribué à produire une « connaissance irrationnelle qui jaillit de juxtapositions inattendues d’éléments sans lien entre eux »19.

L’expérience u/franklinfordbot, sur Reddit, ouvre quant à elle des pistes de réflexion éthique intéressantes sur le caractère nuisible des bots. En effet, ce bot a régulièrement frappé le mur des filtres anti-spam. Car au lieu de simplement diffuser des messages à qui veut bien s’y abonner, comme son homologue sur Twitter, u/franklinfordbot cherche à intervenir de manière plus active dans des communautés. Même s’il intervient de manière parcimonieuse, grâce à des limites que nous avons mises en place (par exemple : ne pas publier trop fréquemment, ou ne pas répondre deux fois à un même fil de discussion), ses interventions sont considérées comme indésirables sur de nombreux subreddits. Dans la boîte de réception de u/franklinfordbot, on trouve donc une étrange correspondance : des messages envoyés automatiquement par d’autres bots, pour signaler que ses tentatives de publications ont été bloquées ou même que son compte a été banni de manière permanente dans certaines communautés.

Tout cela pose la question des limites éthiques d’un bot : voulons-nous d’un bot qui est considéré comme une nuisance par les communautés dans lesquelles il cherche à intervenir ? En publiant des messages alors que personne ne lui a rien demandé, est-ce que le bot outrepasse ses droits ? Et dans quelle mesure peut-on et doit-on rendre notre bot plus agréable ? En poursuivant une logique d’alternance entre lecture distante et lecture rapprochée, automatisation et intervention humaine, nous avons donc bâti et raffiné le fonctionnement de u/franklinfordbot au fil d’un lent processus d’observation et d’essais-erreurs, et en restant à l’écoute des réactions — algorithmiques ou humaines — que le bot suscite. Une première couche de rétroaction est ainsi lisible dans les interactions avec l’API de Reddit : dès nos premiers essais, celle-ci nous a confrontés à des scénarios que nous n’avions pas nécessairement anticipés, lesquels ont constitué des occasions de raffiner le comportement de notre bot. Par exemple, la plateforme ne permet pas d’intervenir dans des fils de conversation qui sont trop anciens (et ont été archivés), ou qui ont été verrouillés par les modérateurs de la communauté. Ce sont des contraintes techniques, mais aussi des indications précieuses sur la marge d’action du bot à l’intérieur de la communauté Reddit.

Une deuxième couche de rétroaction provient des différentes communautés dans lesquelles notre bot essaie d’interagir. Certaines d’entre elles choisissent volontairement, via leur politique de modération, de ne pas permettre les publications des bots — elles privilégient un entre-soi humain. La forme que prend cette politique varie d’une communauté à l’autre, mais nous pouvons nous appuyer sur certaines récurrences pour éviter de les importuner. Certaines communautés se dotent, par exemple, de bots dont la mission est justement d’empêcher l’intervention d’autres bots20. En faisant cela, la communauté envoie donc un signal clair : les bots ne sont pas les bienvenus, ils seront systématiquement bloqués. On pourrait alors simplement laisser la nature (algorithmique) agir et laisser notre bot se heurter à cet adversaire (toujours plus fort que lui). Nous avons plutôt utilisé cette limite comme une occasion d’enseigner à notre bot d’être un peu plus attentif aux signaux : si une communauté choisit de s’allouer les services d’un tel cerbère, passons simplement notre chemin et allons cogner à la porte suivante.

D’autres mécanismes sont parfois moins lisibles. De nombreuses communautés sur Reddit utilisent par exemple la mécanique du « karma » pour réguler qui peut (ou non) intervenir en leur sein. Le « karma » est un score que chaque utilisateur de Reddit possède, et qui est censé refléter la valeur que lui accorde la communauté. Chaque intervention (publication ou commentaire) peut en effet récolter des votes (positifs ou négatifs) des autres utilisateurs : ces votes sont compilés et mis à jour continuellement dans un score qui représente le « karma » de l’utilisateur. Outre les mécanismes de visibilité qui structurent l’ensemble de la plateforme (les contributions les plus appréciées seront les plus visibles), le karma sert aussi à monnayer l’entrée dans certaines communautés : les utilisateurs qui n’atteignent pas un certain seuil de karma ne peuvent pas participer. Si cela a pour but d’écarter les nuisibles, qu’ils soient humains ou non, Reddit suggère de ne pas se mettre en quête de points, mais de « simplement être une bonne personne21. » Voilà qui pose problème à u/franklinfordbot (et pour beaucoup de nouveaux utilisateurs humains de Reddit) : comment peut-il être une bonne personne ? Si personne n’aime ses publications, il ne gagnera pas de karma. S’il n’a pas de karma, il ne pourra pas publier dans la plupart des communautés. C’est la possibilité même de produire des bots « honnêtes » et de bonne foi (sans recourir à des stratagèmes pour gonfler artificiellement sa réputation, par exemple) qui est ici remise en question, et l’incarnation spécifique de Franklin Ford en u/franklinfordbot contribue de cette manière aux débats sur le rôle des bots dans les écosystèmes médiatiques22.

Les corpus récalcitrants : rendre visible la remédiation

Un autre aspect intéressant des bots est la façon dont ils mettent en évidence la matérialité (et le désordre) du processus de remédiation nécessaire pour passer de Franklin Ford à sa version robot, ou, en d’autres termes, des documents d’archives aux tweets, aux publications sur Reddit et aux réponses du chatbot. La notion de remédiation a été proposée par les théoriciens des médias Jay David Bolter et Richard Grusin en 199923, pour décrire les enchevêtrements complexes des anciennes et des nouvelles technologies médiatiques et l’oscillation constante entre l’immédiateté et l’hypermédialité qui est au cœur des médias numériques. Par « remédiation, » ils entendent l’opération par laquelle les « nouveaux » médias remanient ou incorporent les « anciens» médias, tout en les faisant disparaître. C’est exactement ce que font les bots : ils récupèrent, recyclent, réutilisent un matériau médiatique « ancien, » celui qui est tiré des écrits hétéroclites de Ford (des livres, des opuscules, des lettres…), et les font complètement disparaître en s’incarnant dans des dispositifs qui mettent en scène Ford. Que ce soit sur le compte Twitter @franklinfordbot, le compte Reddit u/franklinfordbot ou le chatbot, tout concorde à faire croire que c’est Ford qui est en train de « parler » de manière directe et immédiate. Or, Franklin Ford est mort en 1918 et son existence sous forme de bots est tout le contraire de l’immédiateté associée à une prise de parole. De multiples opérations de remédiation, qui ne vont pas sans heurt, sont nécessaires pour passer de Ford aux bots. Ainsi, et pour ne donner qu’un exemple simplifié de ce parcours, prenons un opuscule écrit par Ford, Mayor Edson’s Charter and the Democratic Principle, qui a été imprimé en 1883 à New York par Bradstreet Press et récemment numérisé par Internet Archive, une organisation basée à San Francisco. Cette numérisation implique que les pages en papier ont été transformées en une série d’images qui ont été traitées par un logiciel de reconnaissance optique des caractères (OCR) afin d’apposer une couche de texte lisible par les ordinateurs. Nous avons extrait ce texte pour l’inclure dans notre corpus (constitué de fichiers plein texte), qui est ensuite manipulé par différents scripts qui permettent d’effectuer les opérations nécessaires aux bots (découpage en phrases, par exemple), pour ensuite passer par les API des plateformes telles que Twitter et Reddit pour, enfin, être publié. Tous ces passages sont en réalité des transformations : à chaque étape de la remédiation, le matériau peut perdre des aspects, en gagner d’autres — il n’est jamais tout à fait pareil. L’opération de reconnaissance optique des caractères (OCR), par exemple, est cruciale. Loin de permettre une reproduction fidèle du document original, elle peut même plutôt être qualifiée d’opération de « recomposition » du texte24.

Face à l’effacement de ces différentes transformations qu’implique le processus de remédiation (elles deviennent invisibles puisque le « nouveau » média présente son contenu comme une version transparente de l’ancien média), nous avons essayé de le rendre visible, là où c’était possible. Par exemple, en conservant les « erreurs » d’OCR plutôt qu’en essayant de les corriger, ou en incluant dans le design du site web du projet des traces de la matérialité des documents du corpus (des notes manuscrites en marge des textes, des éléments graphiques issus des transformations médiatiques tels que la numérisation de microfilms), nous avons essayé de montrer, par petites touches, que ce n’est jamais Ford qui parle directement à travers les bots, mais plutôt de nombreuses couches documentaires manipulées et transformées à de multiples reprises.

Quand les bots renvoient des questions à Franklin Ford

Certaines actions des bots renvoient des questions à l’œuvre et la vie de Franklin Ford lui-même, et imposent dès lors une alternance entre la lecture distante25 permise par les machines et la lecture rapprochée qui demande de se replonger dans les documents et leur contexte. En observant les actions des bots, on peut se demander s’ils sont des avatars fidèles, et s’ils représentent bien Ford et ce que nous savons de lui. Par exemple, le fait que u/franklinfordbot publie tout à la fois des messages dans des forums complotistes (r/conspiracy, r/conspiracy_commons) ou dédiés à l’astrologie (r/AskAstrologer) et dans des forums aux allures plus sérieuses, dédiés à la science (r/Science), à la philosophie (r/Philosophy) ou la politique (r/politics) soulève une question qu’on peut se poser à propos de Ford : comment était-il perçu par ses contemporains, comment ses idées étaient-elles accueillies ? Était-il pris au sérieux et si oui, par qui ? À cet égard, il faut noter que la littérature secondaire a souvent fait de Ford un hurluberlu : il est parfois décrit comme un journaliste-philosophe cinglé26, un excentrique27, ou même un scélérat.28 Notre exploration de l’œuvre de Ford et d’un vaste corpus documentaire témoignant de ses activités dresse un portrait plus nuancé : la grandiloquence et l’originalité de Ford suscitaient certes l’incompréhension de ses contemporains, et il lui est arrivé d’être associé à des projets douteux29, mais Ford était également un membre respecté de la bonne société de New York ou de Detroit. Membre de clubs privés, il était régulièrement invité à prononcer des conférences et participait à la vie politique (particulièrement la politique municipale). L’ambivalence du bot u/franklinfordbot renvoie donc à celle de Ford lui-même, et invite à creuser ces nuances en les replaçant dans le contexte de la vie publique américaine du tournant du XXe siècle.

Un autre aspect des bots qui fait écho à la vie et à l’œuvre de Franklin Ford est leur caractère éphémère et, dans un certain sens, l’échec de leur existence. En effet, les trois bots que nous avons décrits n’ont connu qu’une existence relativement brève, et ils sont tous actuellement hors service. Contrairement à ce que peuvent laisser penser leur caractère automatique et leur nature machinique, la survie des bots est une affaire délicate : il ne s’agit pas simplement d’appuyer sur un bouton pour qu’ils existent indéfiniment. Le bot Twitter @franklinfordbot a été actif entre le 21 mars 2017 et le 16 août 2021. Après avoir publié 1578 tweets, s’est interrompu suite à une erreur que nous n’avons pas immédiatement identifiée, et n’a jamais été relancé par la suite. Le bot Reddit u/franklinfordbot a publié 1363 commentaires entre le 3 septembre 2020 et le 30 octobre 2022, avant de voir son compte suspendu par Reddit (cela après avoir été banni de nombreux subreddits sur lesquels il avait tenté d’intervenir). Le chatbot a été actif entre septembre 2020 et janvier 2022, nous avons ensuite cessé de payer l’abonnement à l’infrastructure nécessaire.

Ces destinées en forme de cul-de-sac peuvent rappeler les projets de Franklin Ford, qui ont eu pour la plupart une durée de vie très limitée, ont pris fin dans des circonstances troubles, ou n’ont même jamais vu le jour : le journal Thought News n’a jamais été publié, le service Ford’s Special News, lancé au printemps 1887, a pris fin après quelques semaines d’activité, suite à une âpre dispute de Ford avec ses collaborateurs, et bon nombre des idées ambitieuses de Ford n’ont jamais existé que sur papier. Les fins malheureuses des bots — qui ont péri par manque d’entretien, de moyens ou par leur incapacité à convaincre les autres usagers de leur utilité — imitent donc, sans que cela ait été prévu, la façon de fonctionner de Ford, que ces échecs n’ont, semble-t-il, jamais découragé. À la fin de sa vie, et après de nombreux échecs, il continuait à présenter ses utopies informationnelles avec conviction à ses interlocuteurs. L’intérêt des bots, dans le cadre de ce projet de recherche, n’était donc pas de les voir fonctionner à long terme : le processus qui a mené à leur création a été riche en questionnements nouveaux et en enseignements, et on peut lire leur fin décevante comme un hommage au personnage qui les a inspirés.

Notes

1 Pour des éléments biographiques détaillés et un aperçu de la place de Ford dans l’historiographie, voir notamment Dominique Trudel et Juliette De Maeyer, « The Many-Sided Franklin Ford and the History of a Post-Discipline, » Communication Theory 32, no. 4 (2022) : 439-449.

2 Le dispositif est en ligne sur www.franklinford.org. Une version préliminaire de cette démarche a fait l’objet d’un article détaillé, voir Juliette De Maeyer et Dominique Trudel, « @franklinfordbot: Remediating Franklin Ford, » Digital Journalism 6, no. 6 (2018) : 1270-1287.

3 Chris Anderson, « The End of Theory », Wired (23 juin 2008), https://www.wired.com/2008/06/pb-theory/.

4 Dans une lettre à James Burrill Angell datée du 13 avril 1887, Ford présente Bradstreet’s comme un « newspaper laboratory. »

5 « The Thought News », University of Michigan Daily, 8 avril 1892.

6 Le Draft of Action n’aborde pas nommément Thought News décrit une autre publication qui s’y apparente, The Newsbook.

7 Sur l’importance de l’anachronisme, voir Nicole Loraux, « Éloge de l’anachronisme en histoire, » Le Genre Humain 1, no. 27 (1993) : 23-39.

8 Dennis Assenmacher, Lena Clever, Lena Frischlich, Thorsten Quandt, Heike Trautmann et Christian Grimme. « Demystifying Social Bots: On the Intelligence of Automated Social Media Actors. » Social Media + Society 6, no. 3. https://doi.org/10.1177/2056305120939264; Steve Jones. « How I Learned to Stop Worrying and Love the Bots. » Social Media + Society 1, no. 1. https://doi.org/10.1177/205630511558034; Samuel Woolley, danah boyd et Meredith Broussard. « How to Think About Bots. » Motherboard, 13 février 2016. https://motherboard.vice.com/en_us/article/qkzpdm/how-to-think-about-bots.

9 Robert McMillan. « Bots Now Outnumber Humans on the Web. » Wired, 18 décembre 2014. https://www.wired.com/2014/12/bots-now-outnumber-humans-web.

10 Lisa Gitelman. Always Already New : Media, History and the Data of Culture (Cambridge : MIT Press, 2006); Benjamin Peters. « And Lead Us Not into Thinking the New Is New: A Bibliographic Case for New Media History. » New Media & Society 11, no. 1–2 : 13–30. https://doi.org/10.1177/1461444808099572; Manuel Menke et Christian Schwarzenegger. «On the Relativity of Old and New Media: A Lifeworld Perspective. » Convergence 25, no. 4 : 657–72. https://doi.org/10.1177/1354856519834480

11 Le corpus est constitué de 23 documents dont Ford est l’auteur, qui ont été publiés entre 1874 et 1909.

12 Nous avons utilisé les techniques décrites dans Selva Prabhakaran « Topic Modeling in Python with Gensim. » Machine Learning Plus, 26 mars 2018. https://www.machinelearningplus.com/nlp/topic-modeling-gensim-python.

13 Nous les appelons « fragments » dans la suite du texte car il ne s’agit pas à proprement parler de paragraphes (délimité par la mise en page, et en particulier les retours à la ligne) mais plutôt de groupes de phrases reconstitués arbitrairement, car notre corpus numérisé ne reproduit pas la mise en page.

14 « The search for truth in a post-truth society, » 5 octobre 2020, https://www.reddit.com/r/philosophy/comments/j5gyp5/the_search_for_truth_in_a_posttruth_society

15 Nous avons utilisé la méthode et les outils décrits par Max Woolf dans « How To Make Custom AI-Generated Text With GPT-2. » Max Woolf’s blog, 4 septembre 2019. https://minimaxir.com/2019/09/howto-gpt2

16 Tweet de @franklinfordbot publié le 21 janvier 2019.

17 Tweet de @jeffjarvis publié le 5 septembre 2012.

18 Kevin L. Ferguson, « The Slice of Cinema: Digital Surrealism as Research Strategy, » in The Arclight Guidebook to Media History and Digital Humanities, ed. Charles Acland et Eric Hoyt (Brighton: Reframe Books, 2016).

19 Ferguson, « Slice of Cinema, » 274.

20 Voir par exemple le bot modérateur BotDefense : https://www.reddit.com/r/BotDefense/wiki/index

21 Voir « What is karma? », https://reddit.zendesk.com/hc/en-us/articles/204511829-What-is-karma

22 Voir par exemple : Samuel C. Woolley et Philip N. Howard. « Automation, Algorithms, and Politics. » International Journal of Communication 10 : 9; Joshua Uyheng, Daniele Bellutta et Kathleen M. Carley. « Bots Amplify and Redirect Hate Speech in Online Discourse About Racism During the COVID-19 Pandemic. » Social Media + Society 8, no. 3.

23 Jay David Bolter et Richard Grusin. Remediation: Understanding New Media (Cambridge : MIT Press, 1999).

24  Ryan Cordell. « ‘Q i-Jtb the Raven’: Taking Dirty OCR Seriously. » Book History 20, no. 1: 188–225. https://doi.org/10.1353/bh.2017.0006.

25 Franco Moretti. Distant Reading (London : Verso, 2013).

26 John Durham Peters. « Satan and Savior: Mass Communication in Progressive Thought. » Critical Studies in Mass Communication 6, no. 3 (1989) : 247–63.

27 Czitrom utilise l’adjectif « quixotic » pour décrire Ford, qui renvoie à la figure de Don Quichotte. Daniel J. Czitrom, Media and the American Mind: From Morse to McLuhan (Chapel Hill : University of North Carolina Press, 1990), p. 104.

28 Le terme a été utilisé par John Dewey, lorsqu’il a été interrogé sur l’épisode Thought News. Cité dans Jay Martin. The Education of John Dewey: A Biography (New York : Columbia University Press, 2002), p. 153.

29 Ford a par exemple participé en 1908 aux activités de l'American Civic Alliance, une escroquerie destinée à soutirer de l’argent en faisant miroiter la possibilité de fréquenter des personnes influentes. Voir « Scion or Lafayette or not?, » Chicago Tribune, 28 mai 1909.

Pour citer ce document

Juliette De Maeyer et Dominique Trudel, « Les bots comme outil d’analyse et de remédiation des corpus : la théorie du « triangle de l’intelligence » », Presses anciennes et modernes à l'ère du numérique, actes du congrès Médias 19 - Numapresse (Paris, 30 mai-3 juin 2022), sous la direction de Guillaume Pinson et Marie-Eve Thérenty Médias 19 [En ligne], Dossier publié en 2024, Mise à jour le : , URL: https://www.medias19.org/publications/presses-anciennes-et-modernes-lere-du-numerique/les-bots-comme-outil-danalyse-et-de-remediation-des-corpus-la-theorie-du-triangle-de-lintelligence