à propos du logiciel Prospéro : un ouvrage de Francis Chateauraynaud

Compte-rendu bibliographique et contribution au débat,

paru dans Langage et Société, n° 109, Septembre 2004,

par Jacques Jenny, sociologue


Prospéro. Une technologie littéraire pour les sciences humaines

Francis Chateauraynaud, CNRS Editions, Coll. Communication, 2003


Ce récent ouvrage du sociologue Francis Chateauraynaud récapitule une vingtaine d’années de développement d’une méthode et d’un programme informatique dont il est le concepteur, assisté de l’informaticien Jean-Pierre Charriau, destinés à assister les chercheurs en sciences humaines dans leurs analyses de controverses publiques, de débats de société, à travers les séries temporelles de textes qui en constituent la matière première principale. Plusieurs collègues constituent à leurs côtés une sorte de club d’utilisateurs fidèles qui apportent leur soutien critique et leurs suggestions aux concepteurs, dans le cadre d’un séminaire pluridisciplinaire de l’Ecole des Hautes Etudes en Sciences Sociales et de l’association « Doxa » qui assure la gestion financière du projet et la diffusion du logiciel.

La première version de ce logiciel, appelée Prothèse, correspondait à une phase de recherche sur les polémiques à dominante judiciaire concernant des fautes professionnelles et les imputations de responsabilité pour accidents du travail. Puis il est parvenu à son stade de maturité actuel, sous le nom de Prospéro, qui en élargit le champ d’application à tout déroulement diachronique de « dossiers complexes » sur des thèmes débattus publiquement tant dans des instances d’expertise scientifique et de décision politique ou technique que dans les medias d’opinion publique et dans des mouvements sociaux et groupes de pression Pour et Contre.

Dans un inventaire critique des logiciels d’analyses textuelles pour la recherche en sciences humaines (publié dans Current Sociology et dans le B.M.S., 1997), j’avais classé ces deux programmes dans la catégorie des logiciels dédiés, catégorie tout à fait originale par rapport aux autres grands logiciels mieux connus – tant en France où dominent les outils lexicométriques qu’à l’étranger où dominent ce qu’il est convenu d’appeler les « CAQDAS » (Computer Assisted Qualitative Data Analysis Software) : voir ci-dessous le tableau de classification synthétique des principaux logiciels signalés dans cet inventaire critique ou apparus depuis 1997.


Essai de CLASSIFICATION des logiciels (français) d’Analyses Textuelles

par Jacques Jenny (Octobre 2003), à partir d’articles parus en 1996-97 (cf. infra)

La plupart de ces logiciels comportent (ou devraient comporter : à vérifier cas par cas !), comme fonction de base préalable, un inventaire des “mots” du “corpus”, appelé Lexique ou Vocabulaire ou Dictionnaire. Les mots y sont en principe classés selon l’ordre alphabétique et selon l’ordre de fréquence décroissante.

Les logiciels de lexicométrie automatique sont plus ou moins performants, avec des options différentes concernant les opérations préalables de désambiguïsation, voire de lemmatisation et stemmatisation, de reconnaissance des expressions multimots, de catégorisation grammaticale des mots ou syntagmes nominaux (Lexicométrie paraît bien placé pour cette fonction), et concernant les «mots-outils».

La plupart des logiciels de Statistique textuelle proposent en outre au moins, comme modules de base :

– des tableaux de “spécificités lexicales” (mots sur- et sous-représentés, globalement ou par catégorie), selon les différentes parties du corpus ou selon tel ou tel critère péritextuel,

– des tables de “Concordances”, ou d’usage des Mots En Contexte (M.E.C.) ou “Concordanciers”.

Parmi les logiciels d’inspiration «benzécriste» (= « Analyse des données à la française »), Alceste a la particularité originale de procéder à une Segmentation automatique du corpus en unités de contexte élémentaire (u.c.e. de longueur standardisée).


Traitement

avec algorithmes de

et de Classifications

Correspondances (AFC)

Automatiques

Réseaux Sémant.de

Mots Associés

SANS

= Logiciels

“thesaurus”a priori

Lexicométriques

(Graphes, Analyses

Postfactor.)

Automatique

SANS Segmentation Automatique du Corpus ni Lemmatisation

AVEC Segmentation Automatique du Corpus (u.c.e.) et Lemmatisation


sur Listes SIMPLES de Mots


sur Textes

HYPERBASE, LEXICO, Lexicométrie

ALCESTE

THEMES (Tri-Deux),

ÉVOCATION

CANDIDE,

RÉSEAU-LU






Logiciels “dédiés”,…

généralistes

(sens commun)

… “dédiés  généralisables

(problématique sociologique)

dédiés

(problématiques

ad hoc

spécifiques)

AVEC “thesaurus”

TROPES

PROSPERO

Civilité, Coconet,

Hyperstoria






Avec Lecture

Extensions de     Logiciels ….

d’analyse d’enquêtes

sur Bases de   données

Structurées

Humaine

Champs de type TEXTUEL

..associés à des Champs …

… de type Numérique

ou Codé

(Subjectivité Assumée)

= CAQDAS

Modules

LEXICA du Sphinx,

SPAD-T de Spad,

Modules

INTERVIEWS de Modalisa,

WordMapper de Grimmer,

Modules

Analyse Qualitative

d’ASKIA, d’EOLE,

Module

Jeu de Mots

de MLI, etc….

CAQDAS Sociologiques

(étrangers)

ex. SATO (Québec),

QUALITA (Espagne),

… Atlas-Ti, Max (Allemagne), …

Nudist-NVivo (Australie)


pour mémoire

“Analyse de Discours”

Aucun logiciel

Spécifique






p.m.

“Ingénierie Textuelle”

“Info-Com”


(Analyses de Messages,


«Audits textuels»)


ex. LIDIA



p.m.

“Gestion de

Connaissances”

ex. “Plateforme”

BELUGA

ex. CORA (Intuition),

NEURONAV

ASKSAM,

etc…






p.m.

Analyseurs

Morpho-Syntaxiques

ex. LEXPLORER,

WEBLEX

ex. INTEXT,

STELLA,

NOMINO, CRISTAL, etc.

p.m. Dictionnaires de référence de la Langue française (sur Bases de Données Numérisées)

ex. Banque de Données Littéraires FRANTEXT (INALF) associée à HYPERBASE

et nombreux Logiciels de Text Mining, de Veille et Recherche Documentaires stricto sensu (avec ou sans équations booléennes)

Principaux sites comportant des listes, voire des comparaisons, de logiciels pour sciences sociales :

– LEJEUNE Christophe (Belgique) :                   www.smess.egss.ulg.ac.be/lejeune/logiciels

– Harald KLEIN (Rudolstadt, Allemagne) :      www.intext.de/textanae.htm

Sociological. Research Online (Grande Bretagne) – confrontation des logiciels Atlas-Ti et Nudist :                                          www.socresonline.org.uk/socresonline/3/3/4.html

– JENNY Jacques :                       http://jacquesjenny.com/legs-sociologique/

Références bibliographiques

– JENNY Jacques, Méthodes et pratiques formalisées d’analyse de contenu et de discours dans la recherche sociologique française contemporaine. Etat des lieux et essai de classification. Bulletin de Méthodologie Sociologique (B.M.S.), n° 54, Mars 1997, p. 64-112. LASMAS-IRESCO (CNRS).

– MANGABEIRA Wilma (1996), editor. Qualitative Sociology and Computer Programs : Advent and Diffusion of Computer-Assisted Qualitative Data Analysis Software (CAQDAS), Current Sociology (44-3) hiver 1996, pp. 187-321.


Chacun des dossiers analysés par Prospéro comporte un enjeu socialement important et traite d’un thème dominant unique, tel que la gestion (largement médiatisée) de crises et de risques écologiques et sanitaires majeurs à propos de l’amiante, de l’ESB (la « vache folle »), des centrales nucléaires, mais aussi tel que des polémiques et débats internes à certains groupes sociaux ciblés (les intellectuels et Céline, les sciences sociales et l’affaire Sokal, les sportifs et le dopage), ou générés par des mouvements sociaux et/ou des événements politiques qui font la « une » de l’actualité (le mouvement des sans-papier, le premier tour des élections présidentielles de 2002, la crise du Kosovo, la guerre en Irak). Il s’agit bien là de sujets « sensibles », traités « à chaud », souvent évités ou édulcorés en sociologie positiviste.

C’est la diversité même de ces différentes expériences d’analyse sociologique qui a contribué et contribue encore à enrichir le cahier des charges du logiciel et qui constitue un capital de connaissances cumulatives, thésaurisées (par mise en mémoire électronique non seulement des corpus mais surtout des nouvelles catégories d’analyse), en constante progression, qui profite à tous les utilisateurs potentiels. La singularité constitutive de chaque « affaire », loin d’être un handicap, est exploitée comme pour toute nouvelle affaire judiciaire qui fait jurisprudence : faute d’arguments standardisés, les analystes comme les acteurs sociaux sont contraints d’inventer pour gérer l’incertitude, voire le changement de paradigme ou de problématique, mais le dispositif conserve une trace enregistrée de ces traitements singuliers, de ces « mises en scène de changement de régime » pour d’éventuelles équivalences de situation polémique à venir.

Comme applications emblématiques de ces enrichissements, l’Auteur cite souvent les deux premières recherches qui ont mis Prospéro à l’épreuve :

– le dossier des débats politico-littéraires et moraux sur Louis-Ferdinand Céline (1993, 1200 pages), dossier « brûlant » s’il en est mais aussi dossier à plusieurs facettes, dont il a fallu gérer les contours et les interférences de genres discursifs hétérogènes,

–  la recherche de Marie-Christine Bureau (Centre d’Etudes de l’Emploi) sur les débats publics concernant « la nouvelle question sociale » (1995, 1500 pages), débats sur « la fin de l’Etat-Providence » provoqués/alimentés par des rapports ou ouvrages largement médiatisés (Alain Minc, Pierre Rosanvallon, Robert Castel, …) et incarnés/suscités dans la pratique économico-politique de l’époque par le fameux « plan Juppé » de réforme des retraites. Depuis cette application, Prospéro fait davantage appel à cette classe d’objets et d’usages du langage que sont les « marqueurs », et autres connecteurs de modalité, d’argumentation, par exemple ici les marqueurs de « rupture paradigmatique » (du genre « désormais on ne plus [ …] comme avant »), qui sont repérés au-delà de leurs formes grammaticales simples, notamment adjectifs ou adverbes. Et, dans cette classe des marqueurs, les traitements prospériens ultérieurs, notamment celui de l’affaire Sokal, dans laquelle des énoncés ironiques, ambigus ou équivoques côtoient le pamphlet, les aveux, le droit de réponse, voire le soupçon de canular, ont permis d’améliorer encore la sensibilité de l’outil aux marques les plus fines de la description et de l’argumentation.

Soit dit en passant, cette remarque témoigne bien du caractère évolutif et flexible de ce logiciel, rendu possible par son refus du tout-automatique des algorithmes fermés et autres « boîtes noires » et par son invitation à pratiquer en cas de besoin les lectures intelligentes, subjectives et informées, des analystes, en contact direct et permanent avec les textes « bruts ». Ce recours, ce retour, au « full text » est notamment conseillé en complément de certaines « routines » d’indexation et autres traitements informatisés, pour en vérifier, contrôler, corriger, affiner, les résultats « à la main » (listes et thesaurus, classifications, tables d’enchaînements discursifs ou argumentatifs, de cooccurrences ou de spécificités, …), ou pour relancer d’autres requêtes d’analyse, voire pour remettre ces routines en question, à l’adresse des concepteurs.


D’autre part, l’augmentation du nombre des applications de Prospéro a déjà généré une transformation qualitative importante de son « mode opératoire », comme on dit en criminologie. Plus nombreux et plus « percutants » sont les dossiers traités par Prospéro, plus il a de chances d’observer des articulations, parfois surprenantes, entre certains d’entre eux : c’est le cas, notamment, de dossiers qu’on pourrait appeler « emblématiques » ou « fondateurs », comme celui du sang contaminé ou celui de Tchernobyl (ou, potentiellement, de la canicule estivale de 2003), qui instaurent de nouveaux « repères de précédence et d’obsolescence », de nouvelles limites entre l’ « avant » et l’ « après », entre les opinions consensuelles et évidences du sens commun et les questions vives encore en débat ou en voie de caducité, qui impliquent de nouveaux critères et dispositifs d’alerte et de prévention, qui modifient des stéréotypes, déstabilisent des « langues de bois », qui déplacent éventuellement les frontières entre les prérogatives et les responsabilités respectives des « experts », des décideurs et du « profane tout-venant », qui restructurent les cadres de référence, les configurations discursives et pragmatiques, les modèles et catégories d’analyse, voire les grilles de lecture et d’interprétation.

Bref, les traitements prospériens ne peuvent plus dès lors rester monothématiques : complexification considérable, certes, mais compensée par les avantages inestimables que produit le passage du mode opératoire jusque là a priori monographique à un mode nécessairement élargi, enrichi, potentiellement généralisant – au moins au niveau des « middle range theories » comme disait Merton. Et déjà le collectif des prospériens s’oriente vers l’organisation en réseau d’une « bibliothèque d’affaires, controverses et crises », avec répertoire des catégories de leurs analyses et des formules de leurs descriptions, avec aussi les « textes prototypiques » (de ce qui se dit ou s’est dit, ici ou là, concernant par exemple, la « logique de marché », le « principe de précaution », le « développement durable », les « prophéties de malheur », etc …).


L’Auteur est bien conscient de la nécessité de conjuguer les apports de nombreuses disciplines et sous-disciplines (notamment du côté de la linguistique et de la sociolinguistique) pour réaliser cet ambitieux projet. Tout son ouvrage, et ses références bibliographiques, témoignent qu’il leur a déjà beaucoup emprunté, avec une affinité particulière pour les approches argumentatives d’Olivier Ducrot et plus largement pour l’approche pragmatique, celle qui correspond le mieux au courant de la sociologie, pragmatique, auquel il se réfère explicitement (cf. le deuxième P de Prospéro).

Il reconnaît d’ailleurs en toute modestie que Prospéro a encore beaucoup à apprendre des différents courants de ces disciplines-sœurs – à condition bien sûr de ne pas les instrumentaliser ou de ne pas se faire phagocyter par elles, c’est-à-dire à condition de maintenir le cap sur nos objectifs spécifiques de sociologues.


Le livre comporte un exposé de la genèse, des principes constitutifs et des modalités de fonctionnement du logiciel Prospéro. Il aborde aussi les fondements théoriques et épistémologiques de toute interprétation sociologique d’énoncés langagiers, ce qui a incité notre collègue Bernard Reber (philosophe au CERSES – Centre d’Etude et de Recherche sur l’Ethique et le Sens) à engager un débat avec l’Auteur et avec les lecteurs de Langage et Société, dans le cadre de la rubrique « Débat » du présent numéro, page 111.


Le projet ne manque pas d’ambition : au-delà de l’objectif premier, qui est simplement de « décrire » la dynamique des événements et des controverses publiques, il s’agit d’instaurer un dispositif de confrontation des interprétations. Ce sont des techniques de « lectures assistées » (appelées ici, on ne sait pourquoi, « technologies littéraires »), qui s’inspirent d’ailleurs de nos habitudes de lecture courantes (par ex. lecture « à rebours », lectures sélectives, « orientées vers des cibles précises », repérages co-textuels, inter-textuels, voire contextuels, contrôles a posteriori des résultats …) et qui sont mises en œuvre pour objectiver des « représentations des textes ». Et, comme ces techniques sont flexibles et reproductibles par plusieurs « lecteurs », avec leurs propres présupposés, cadres d’analyse et hypothèses ou intuitions ou prénotions (ici assumées au lieu d’être, ailleurs, rejetées), la méthode Prospéro ouvre des espaces de traductions plurielles par va-et-vient continu entre les polémiques et stratégies déployées dans ces dossiers-problèmes, d’une part, et les « joutes interprétatives » que peuvent se livrer les chercheurs entre eux, d’autre part.

Lesquels espaces n’interviennent pas, comme avec d’autres méthodes, dans la phase ultime des commentaires APRES l’élaboration de « résultats consolidés » mais DANS le parcours même du traitement interactif des documents. C’est pour cela que Prospéro vient récemment de s’enrichir d’une interface entre lui-même et les chercheurs, dénommée Marlowe, qui est plus ambitieuse qu’un simple assistant pour le pilotage individuel de Prospéro puisqu’elle est conçue comme un support de travail coopératif, voire comme une étape vers la constitution progressive d’une « intelligence sociologique artificielle sur fond de cognition distribuée ».


PROgramme de Sociologie Pragmatique, Expérimentale et Réflexive sur Ordinateur), Prospéro est un dispositif méthodologique et informatique complexe, qui s’acquitte lui-même de la fonction de « veille documentaire », en amont du processus d’analyse. Ouvert en permanence sur toute source documentaire pertinente, notamment par connexion permanente sur le réseau Internet, il fonctionne aussi comme une Banque de données dont les plus-values sont générées par l’accumulation et la capitalisation des dépôts.

Quant au centre du dispositif – la mise en œuvre de cette technologie originale de lecture descriptive et interprétative, là où s’opèrent les indexations et les classifications des éléments textuels, puis leurs rapprochements et agencements en configurations argumentatives, en grilles interprétatives, en schèmes de transformations – c’est une gageure de la présenter clairement en quelques pages, surtout pour moi qui ne l’ai jamais pratiquée personnellement. Je ne vais donc pouvoir exposer que ce qui me paraît en constituer l’essentiel, notamment en termes de présupposés pas toujours explicités, de manière à indiquer quelques-uns des enjeux de la méthode, voire à suggérer quelques pistes de développement possible.

Pour les lecteurs désireux d’en savoir davantage, je renvoie évidemment au texte du débat introduit par Bernard Reber, qui est assez prolixe sur la technologie Prospéro, notamment dans le paragraphe où il est question de « l’interaction entre séries textuelles et attentes de l’interprète » (cf. infra, page 111).

Je conseille aussi la lecture d’un long entretien, très intéressant, que Francis Chateauraynaud a accordé à deux politologues, Philippe Blanchard et Thomas Ribémont, dans le cadre d’un numéro spécial des Cahiers politiques (Credep, Université Paris-9, Paris, L’Harmattan, 2003) consacré aux «  méthodes des sciences sociales : innovation et renouvellement », entretien qui offre de bons résumés de certaines parties de l’ouvrage ici analysé.

On n’hésitera pas non plus à consulter le site Web qui est consacré à Prospéro, à l’adresse suivante :            http://prosperologie.org


Ma lecture est celle d’un sociologue, et ce compte-rendu s’adresse d’abord à nous les sociologues. Cela dit, j’espère bien que nos amis sociolinguistes, eux/elles, au moins ceux/celles avec qui nous sommes engagé(e)s dans notre revue commune Langage ET Société, s’intéresseront aussi à Prospéro et, au-delà, à ces quelques réflexions sur une méthode d’analyse dont les motivations et les objectifs sont différents des leurs. Rappelons, pour faire bref, que les documents textuels, les « données langagières » (au sens le plus large) ne sont pas pour nous (à moins que nous ne soyons sociologues « du langage ») des objets de recherche à analyser pour eux-mêmes mais que nous les considérons néanmoins non plus seulement comme de simples « supports d’informations » mais comme des pratiques sociales (langagières ou discursives) parmi d’autres ou plutôt articulées à d’autres, qui ne prennent sens qu’au sein de dispositifs, structures et institutions sociales englobantes (et non pas seulement contextuelles).


Les cadres de référence disciplinaires et théoriques de Francis Chateauraynaud s’inspirent d’un pragmatisme éclectique, qui se méfie a priori des allégeances doctrinales ou méthodologiques simplificatrices : il ne se proclame ni statisticien ni linguiste ni sémanticien, ni adepte des systèmes-experts de l’Intelligence Artificielle ou des analyses de Réseaux – bien qu’il soit ou a été un peu tout cela à la fois.

De même il refuse le réductionnisme des deux postures épistémologiques opposées que sont, d’une part, les sociologies positivistes de « rupture avec le sens commun » (cf. Bourdieu, mais aussi la démarche sémio-structuraliste à l’œuvre dans le logiciel Alceste) et, d’autre part, les sociologies de l’action privilégiant les jeux stratégiques d’acteurs lucides et « compétents », capables d’interpréter leurs propres actes, pensées et paroles dans leur contexte (cf. l’interactionnisme, l’ethnométhodologie, la sociologie pragmatique). Entre ces deux postures, avec cependant un petit penchant pour la deuxième, il plaide pour l’invention d’une troisième voie, dénommée provisoirement « pragmatique des transformations », avec ses multiples dimensions constitutives des raisonnements et des interprétations.


En revanche l’Auteur se reconnaît proche et du paradigme des « contraintes de justification » de Luc Boltanski et de celui des « logiques de réseau » de Bruno Latour. Mais, après avoir essayé plusieurs « architectures cognitives et instrumentales », il a finalement opté pour une posture de neutralité (ou de recherche de synthèse ?) par rapport à ces langages théoriques, par rapport aussi aux démarches trop formalisées (par ex. modèles préexistants en linguistique ou en statistique ou en lexicologie politique, jugés trop contraignants, pas assez flexibles) ou au contraire de type phénoménologique ou ethnographique, de facture jugée (trop ?) littéraire.


Il ne s’agit pas ici seulement d’un parti-pris a priori de pragmatisme éclectique, pour se concentrer sur l’objectif prioritaire d’ « apprendre d’abord à décrire les cas et les dossiers », ce matériel empirique complexe non encore décrit par les sociologues, de « dresser le répertoire de ce qui est nécessaire pour ces descriptions ». Car il pourrait s’agir aussi d’une contamination du chercheur-concepteur par la dynamique de son objet de recherche, « dossiers évolutifs de controverses publiques », selon le paradigme de Gilbert Simondon, pour qui un objet technique ne progresse qu’en prise avec la matière sur laquelle il travaille. En effet, les auteurs-acteurs de ces controverses ne sont-ils pas contraints, sauf rigidité pathologique, de s’écouter, de peser le Pour et le Contre, de négocier des compromis, … tout comme les chercheurs qui s’en font les interprètes … ?


Après ces longs préliminaires concernant les présupposés et les enjeux de la méthode Prospéro, il reste à exposer les modalités techniques concrètes de sa mise en œuvre – pour répondre à la question pratique, obsédante et incontournable, des non-initiés : comment ça marche ?

Quitte à décevoir, je serai là aussi très bref et essaierai d’aller à l’essentiel de ce qu’il faut savoir non pas pour manipuler le logiciel mais pour comprendre en quoi consistent ses procédures et ses résultats.


Tout d’abord, il faut bien comprendre que Prospéro ne demande pas qu’on dispose de cadre d’analyse a priori, déjà formaté, ce pourquoi je l’ai classé dans la catégorie des logiciels dédiés « généralisables » – puisque l’un des buts affichés du traitement est précisément d’assister le chercheur dans l’élaboration du cadre d’analyse le mieux approprié aux éléments textuels et contextuels du dossier qu’il doit décrire, par un long processus d’élucidation de ses propres stratégies interprétatives.

Mais peut-on se passer d’un cadre d’analyse pour quelque opération descriptive que ce soit ?

A mon avis personnel, cette question fondamentale devrait être davantage débattue qu’elle ne l’est dans cet ouvrage sur Prospéro, où elle me semble plutôt éludée et contournée par la solution suivante, que je considère comme trop minimaliste : c’est le modèle actanciel, en référence à Greimas mais sans pour autant adhérer à son modèle sémiotique, qui fournit ce cadre d’analyse a priori, c’est-à-dire en fait ce que l’A. appelle un « langage-pivot », « variante outrageusement simplifiée des grammaires lexico-fonctionnelles ».


Ce langage-pivot se compose de sept objets lexicaux de base, flexibles, dont les portées analytiques sous Prospéro et les référents linguistiques correspondants sont représentés dans le tableau suivant (page 130 de l’ouvrage) :



Type de base


Portée analytique sous Prospéro


Référent linguistique




Entités

Actants, Personnages

et Thèmes en jeu


Noms ou groupes de noms

Qualités


Formes de qualification des entités


Adjectifs

Épreuves

Types d’action, de transformation

ou de jugement


Verbes

Marqueurs

Modalités, connecteurs, quantificateurs


Adverbes

Mots-outils

Éléments d’articulation

et de connexion

Articles indéfinis, auxiliaires, conjonctions, pronoms

Nombres

Unités de mesure, datations,

formes d’évaluation

Valeurs numériques

(chiffres ou lettres)

Indéfinis

Résidu non indexé

parce que non pertinent

Chaînes de caractères

quelconques


Des procédures préalables ou complémentaires ou correctrices permettent d’affiner ces catégorisations en objets lexicaux de base, car Prospéro ne cultive pas ce « fétichisme » des formes lexicales brutes, qu’impliquerait cette commode mais stupide définition informatique du mot comme « chaîne de caractères séparée de ses voisines par des espaces (le fameux code ASCII 32) ». Assumant, et même exploitant, les ressources du chercheur quant à sa connaissance intuitive du dossier, il préfère s’en remettre au « sens subjectif » d’un regroupement de termes dont la signification est stabilisée par les usages plutôt qu’au « contre-sens objectif » des termes séparés : d’où l’importance accordée aux procédures de repérage des « expressions », locutions, et autres mots composés stabilisés, de repérage plus difficile, des « formules » (ou, plus largement des « agencements lexicaux »), très importants pour l’analyse, depuis et dans leurs apparitions-émergences jusqu’à leurs disparitions-évanescences.

Autre manifestation de ce souci de coller au plus près du sens intuitif, tel qu’il fonctionne de fait par et pour les acteurs du dossier / auteurs des textes / analystes du corpus, Prospéro regroupe sous une même appellation, dite « être fictif » (le « quasi-personnage » de Ricoeur) les variantes de désignation des entités (personnages ou thèmes ou organismes), qui ne sont parfois justifiées que par le souci esthétique d’éviter les redondances. Par exemple les occurrences de ‘Tonton’, ‘François Mitterrand’, ‘Mitterrand’, ‘le Président de la République’, désignant le même personnage ‘Président François Mitterrand’ dans les textes datés des deux septennats qu’il a effectués, seront codées comme être fictif avec la convention d’écriture homogène suivante : MITTERRAND@


Prospéro permet d’opérer des catégorisations sur les quatre premiers types d’objets de base : certaines catégories sont déjà implantées dans la mémoire du logiciel, parce que rencontrées de manière récurrente dans la plupart des dossiers de controverse déjà analysés. Il est toujours possible d’en ajouter mais il est aussi toujours possible de les critiquer pour ajustement ou suppression.

La structuration hiérarchique des objets lexicaux et de leurs catégorisations, correspondant à la distinction générique/ spécifique des thesaurus en documentation, s’appelle ici des « collections », par ex. pour regrouper des pays, des personnages, des événements, des dispositifs, objets et techniques, etc ….

Catégories et collections constituent ce que l’A. appelle les « registres du discours ».

Les « structures » dans lesquelles entrent entités et personnages se repèrent par leurs environnements thématiques, leurs jeux de qualification et autres agencements discursifs – selon une navigation textuelle et intertextuelle, pilotée par les chercheurs aux différentes échelles du corpus (énoncés, blocs, sous-corpus, voire anti-corpus)….

… alors qu’on préfèrera parler de « configurations », selon la terminologie du sociologue Norbert Elias, si l’on veut éviter les dérives structuralistes ou systémiques de la rigidité structurale et de la marginalisation des sujets-acteurs.


Quant aux grands types d’énoncés, ceux-là mêmes que distinguent la plupart des linguistes (assertoriques, apodictiques, hypothétiques, épistémiques et déontiques), c’est aux modalités verbales et adverbiales et à certains marqueurs spécifiques ou formules typiques stabilisées qu’est confiée la tâche de les reconnaître dans le corpus (cf. pages 224-225).


Trois techniques d’indexation concourent à optimiser cette distribution des mots ou groupes de mots du corpus et ces catégorisations, sous le contrôle final du chercheur :

– filtrage automatique selon repères morphosyntaxiques,

– confrontation aux dictionnaires déjà accumulés dans la mémoire de Prospéro par les applications précédentes,

– indexation ou correction « manuelle » au coup par coup, si nécessaire.


A partir de ces indexations du corpus, pratiquement tous les tris et opérations de spécificité, de recoupement et de croisement, sont possibles, à la demande des chercheurs et sans faire appel ni aux méthodes de l’ « Analyse des Données à la française » qui caractérisent la plupart des logiciels français de lexicométrie (tradition benzécriste de l’Analyses Factorielle des Correspondances et des Classifications automatiques) ni aux expressions graphiques des réseaux sémantiques et autres graphes de mots associés (ce que, personnellement, je regrette un peu) – auxquels l’A. reproche de suggérer une réification abusive des configurations textuelles.


Les textes de chaque dossier sont définis (pages 82-84) comme un dispositif d’expression combinant les quatre principales modalités suivantes, auxquelles correspondent autant de modes de lecture combinées, autant de dimensions constitutives des problématiques de recherche : espace de représentation, argumentation, récit, interactions (dialogisme, polyphonies, …).

Le tableau ci-dessous indique comment les différents objets et structures manipulés et produits par Prospéro se distribuent selon ces quatre modalités ou dimensions problématiques :


Résultats produits par les traitements de Prospéro

Dimensions constitutives des

problématiques de recherche

listes d’entités ou collections

type de monde déployé

catégories de discours, modalités, jeux de qualités, formules ou configurations discursives

formes argumentatives

personnages (êtres fictifs), acteurs principaux (actants),

ou certains marqueurs d’enchaînement interphrastique

structures narratives

formes de présence des auteurs et destinataires, traces de fonction phatique, formes de clôture et ouverture du discours

type de rencontres ou

interactions sociales


Et surtout, la spécialité originale de Prospéro est de traiter la temporalité des dossiers comme une structure ou une dimension transversale fondamentale.

Non seulement, évidemment, tous les documents du corpus sont datés et localisés, leurs sources et références externes sont signalés, ce qui permet d’opérer des analyses chronologiques « objectives » précises des événements, décisions et actions rapportées, et des discours polémiques qui jalonnent les controverses. Mais encore les termes et expressions discursives qui expriment précisément des rapports à la durée et au temps (le Temps du Chronos et le Temps du Kairos), au-delà des déclinaisons temporelles des verbes et des adverbes, et de certains référents déictiques ou anaphoriques, sont traqués et extraits du corpus. Ces marqueurs viennent alors compléter et enrichir les chronologies objectives, faisant lien éventuellement entre les diverses modalités discursives du corpus.


C’est aussi une des originalités de Prospéro de ne pas normaliser les modalités de présentation finale des résultats d’analyse, mais de proposer aux chercheurs plusieurs stratégies pour rédiger leurs comptes-rendus d’enquête à partir des différentes opérations demandées au logiciel – ce que l’on peut effectivement constater en comparant les publications des différents chercheurs sur différents dossiers.


Les « sorties » du programme se présentent donc sous la forme simple et classique de listes et nomenclatures (ou collections), de systèmes d’indexation (catégories d’analyse des entités, des qualités, des épreuves, des marqueurs), de dictionnaires, de tables de correspondance, ainsi que sous la forme de citations ‘verbatim’ d’extraits textuels pertinents de tel ou tel point de vue, ce qui s’apparente aux opérations de « résumage automatique » de certains logiciels documentaires spécialisés.


Enfin, pour clore ici ce déjà trop long compte-rendu, j’aborderai précisément le problème des clôtures et limites du champ d’application du logiciel Prospéro.

L’expérience a déjà montré que ce logiciel a été capable d’absorber des « dossiers » qui s’éloignent de son champ d’application initial, celui des controverses publiques et médiatisées portant principalement sur, pourrait-on dire, les « dégâts du progrès » et autres problèmes dits d’environnement technique et sanitaire dans notre pays, ou sur les grands débats de société concernant les transformations socio-économiques en cours. Et que, à chaque étape de son parcours, il a su montrer ses capacités d’adaptation, en s’enrichissant de nouvelles fonctions, de nouvelles procédures, de nouvelles stratégies d’interprétation des textes.

Mais l’Auteur de cet ouvrage reconnaît volontiers que le format des textes des corpus analysés est généralement celui de textes publics, le plus souvent « impersonnels » et relativement normés du point de vue discursif, et que les applications de la méthode sur des entretiens non directifs, voire des conversations de rue ou en privé, n’en sont qu’à leurs débuts.

Lorsqu’on sait que ce dernier type de « données langagières » constituent de fait la majorité des « matériaux » recueillis par les sociologues (sans parler ici de nos amis sociolinguistes), du moins en France selon une longue tradition « magnétophonique » renforcée par le courant ethnométhodologique, on ne peut que souhaiter que cet outil logiciel parvienne à franchir avec succès cette ligne de démarcation qui le sépare encore des échanges verbaux « interpersonnels » spontanés, sans parler des nouveaux modes de communication, disons « transpersonnels, provoqués par les nouveaux dispositifs et réseaux socio-techniques de transmission des messages.

Une réponse à to “à propos du logiciel Prospéro : un ouvrage de Francis Chateauraynaud”

Laisser un commentaire