Logiciels d’Analyse Textuelle : Compléments – 2002
Complément à l’article paru dans le Bulletin de Méthodologie Sociologique (B.M.S.), n° 54, Mars 1997
http://jacquesjenny.com/legs-sociologique/?page_id=1253
Il s’agit d’un complément de BIBLIOGRAPHIE, d’un petit GLOSSAIRE,
et de quelques informations pratiques (adresses de sites Web, séminaires de recherche …)
rédigés par le même auteur cinq ans plus tard, en 2002, toujours à propos des
logiciels d’analyse textuelle pratiqués en France pour les sciences sociales
on peut aussi trouver ce complément dans le site Web de la revue B.M.S., à l’adresse précise suivante : http://www.cmh.pro.ens.fr/bms/arcati/BMS54-Jenny-New.htm
___________________________________________________________________________
1 – Bibliographie sélective
établie par Jacques Jenny en mars 2002, en complément de celle déjà publiée dans l’Annexe II de l’article originel datant de mars 1997 – dont on rappelle ici la référence exacte :
JENNY Jacques, Méthodes et pratiques formalisées d’analyse de contenu et de discours dans la recherche sociologique française contemporaine. Etat des lieux et essai de classification. Bulletin de Méthodologie Sociologique (B.M.S.), n° 54, Mars 1997, p. 64-112. LASMAS-IRESCO (CNRS).
a – Articles
MAINGUENEAU Dominique, Les tendances françaises en analyse du discours, 12 Nov. 1998. |
Conférence à l’Université d’Osaka. Accès sur le site Web : http://jupiter.lang.osaka-u.ac.jp/ |
||||||||||||
REINERT Max, Quelques interrogations à propos de l’ “objet” d’une analyse de discours de type statistique et de la réponse “Alceste”. Langage et Société, n° 90, Décembre 1999, p. 57-70. |
l’A. progresse des notions de “ proposition ” (selon Benzécri, puis selon Peirce) à la notion d’“énoncé”, compatible avec la sociolinguistique de l’énonciation. |
||||||||||||
JENNY Jacques, Pour engager un débat avec Max Reinert, à propos de la réponse “Alceste” à l’ “objet” d’une analyse de discours de type statistique. Langage et Société, n° 90, Décembre 1999, p. 73-85. |
Critique de l’article précédent, pour engager le débat et proposer d’autres critères d’évaluation des logiciels à partir de leurs présupposés implicites (entrée lexicale ou non, statistique fréquentiste ou non). |
||||||||||||
LAHLOU Saadi, La modélisation de représentations sociales à partir d’un corpus de définitions, in Martin Evelyne (éd.). Informatique textuelle. Coll. Etudes de Sémantique Lexicale. Institut National de la Langue Française. Paris, Didier Eruditions, 1996, p 55-98. |
Le corpus analysé (par le logiciel Alceste) est constitué de la totalité des définitions d’un grand dictionnaire concernant les mots qui se rattachent au 1er ou au 2ème degré (renvois sémantiques aux mots associés) aux deux thèmes différents que sont le manger (environ 17000 mots), d’une part, et l’information (235 mots), d’autre part. L’A. analyse par introspection les procédures et les étapes qui produisent les “bonnes” interprétations concernant les “ classes d’énoncés ” calculées par le logiciel, celles qui seront finalement publiées : essais et erreurs à la recherche du P.P.C.P. (Plus Petit Commun Paradigme) et méthode d’“abduction” (introduction subreptice de la connaissance préalable que l’analyste a du monde) autant que d’ “induction, aveugle et sourde au sens” comme le voudrait la méthode Alceste, inspirée du benzécrisme. Par ces recours nécessaires et inévitables à l’expérience subjective, il propose un compromis pragmatique avec les principes rigoureux du benzécrisme qui a inspiré Alceste. |
||||||||||||
WALD Paul, Classes d’énoncés, dimensions modales et catégories sociales dans ALCESTE. Revue de sociologie et d’anthropologie Utinam, Paris, L’Harmattan, 1999, n° 1-2. |
Le calcul des “ classes d’énoncés ” (par Alceste) ne représente pour l’A. que la première partie de la méthode. Conscient du caractère statique de ces classes, qui dessinent des “lieux” d’énonciation habituels (les topoï ou mondes lexicaux), il mobilise d’autres ressources de la méthode Alceste : – en observant la fréquence des mots-outils de différentes catégories (exclus du calcul des classes) dans leurs u.c.e. (“ unités de contexte élémentaires ”) respectives, on peut évaluer les “postures” d’énonciation associées à ces lieux : c’est la modalisation, – en comparant au sein du corpus les lieux et les positions d’énonciation de différentes catégories de locuteurs, socialement situés, par un banal calcul de spécificité lexicale, on peut repérer des registres langagiers caractéristiques de ces catégories (par ex., ici, l’enquêtrice elle-même, opposée aux sujets interviewés – eux-mêmes subdivisés en deux groupes aux pratiques sociales déjà identifiées comme différentes) : c’est la catégorisation sociale. |
||||||||||||
DERYCKE Marc, Le clivage du signe selon Benveniste, Langage et Société, n° 70, Décembre 1994, p. 35-60. |
Statuts respectifs du mot et de la phrase dans le discours. Cf. la notion d’usage des mots, dans leur contexte phrastique, ou de Concordance. |
||||||||||||
BRUGIDOU Mathieu et LE QUEAU Pierre, Les “rafales”, une méthode pour identifier les différents épisodes d’un récit. Contribution au traitement et à l’interprétation des entretiens non-directifs de recherche. B.M.S., n° 64, Octobre 1999, p. 49-81. |
Analyse statistique de la “densité d’occurrence” des mots dans les séquences successives d’un texte. Méthode incorporée au logiciel Tropes. |
||||||||||||
ARMONY Victor, DUCHASTEL Jules et BOURQUE Gilles, Quantitative tools for Qualitative analysis : an indicator for segment typicallity. JADT (Journées d’Analyse des Données Textuelles), 1998. Site Web de JADT |
Méthode de calcul d’un indicateur de typicalité pour chaque segment textuel (ici : chaque phrase) : le poids de chaque mot dans chaque segment est comparé (par la distance du Chi-deux) à son poids dans l’ensemble du corpus. Cette méthode peut compléter les opérations du logiciel québécois SATO, ou de tout autre logiciel qui calcule les occurrences de chacun des mots dans le corpus et dans chaque segment textuel. |
||||||||||||
BENHADID Ilham, MEUNIER Jean-Guy, HAMIDI Saâd, REMAKI Zira, NYONGWA Moses, Etude expérimentale comparative des méthodes statistiques pour la classification des données textuelles. JADT, 1998. Site Web de JADT (cf. adresse du site, plus loin). |
Comparaison des résultats obtenus par trois méthodes de classification dont le but est identique : créer des classes de segments textuels de contenu sémantique similaire. |
||||||||||||
HELSLOOT Niels et HAK Tony, La contribution de Michel Pécheux à l’analyse de discours. L. et S., n° 91, Mars 2000, pages 5-33. Traduit de l’anglais par Emmanuelle Cambon. |
Cf. aussi la revue Mots, n° 9, Octobre 1984, sur Michel Pécheux et l’analyse de discours. |
||||||||||||
KRIEG Alice, La dénomination comme engagement. Débats dans l’espace public sur le nom des camps découverts en Bosnie. L. et S., n° 93, Septembre 2000, pages 33-69 |
Il s’agit des “ camps de concentration ”, syntagme à valeur argumentative – avec des emplois métadiscursifs impliquant une référence au nazisme. Cet article prolonge une thèse sur les usages et contextes de “ formules ” (en référence à J.P. Faye) comme celle de “ purification ethnique ”. |
||||||||||||
SCELLES Régine, Apports de logiciels d’analyse de données textuelles dans les procédures d’analyse de contenu d’entretiens semi-directifs de recherche : Alceste et Hyperbase. B.M.S., n° 57, Décembre 1997, pages 25-48. |
Un exemple de confrontation de deux logiciels lexicométriques. |
||||||||||||
GUÉRIN-PACE France, La statistique textuelle; Un outil exploratoire en sciences sociales. Population, 52ème Année, n° 4, Juillet-Août 1997, pages 865-887. |
Inventaire des méthodes de statistique textuelle (en fait, principalement en lexicométrie benzécriste), de leurs emplois et des résultats qu’elles produisent – notamment pour séquences biographiques codées en alphanumérique. |
||||||||||||
CHATEAURAYNAUD Francis, Prospéro. De l’analyse du discours à la génération d’observatoires sociologiques. Document de travail polycopié. Association Doxa, Juin 1998. |
A compléter par la citation des recherches en cours, qui utilisent le logiciel Prospéro, dont : |
||||||||||||
BUREAU Marie-Christine (avec Chateauraynaud Francis), A propos des débats sur la “ nouvelle question sociale ”. Un essai d’exploration critique. C.E.E., Mars 1997 (diffusion restreinte). |
Application du logiciel Prospéro à de grands corpus textuels (document de travail). |
||||||||||||
PLISSONNEAU-BONNEAU Anne, Approches d’analyse de contenu en sciences sociales. Essai d’étude comparative. Mémoire de D.E.A. en sciences sociales, Paris V- Sorbonne, Août 1997, non publié. |
l’A. applique à un même corpus d’entretiens de recherche (récits de vie profession.) la méthode dite d’“analyse structurale de récit” (selon C. Dubar et D. Demazière, dans la tradition sémiologique), non informatisée et la méthode d’“analyse cognitivo-discursive” (selon R. Ghiglione, dans la tradition psycho-cognitiviste), récemment informatisée avec le logiciel Tropes |
||||||||||||
FIELDING Nigel G. et M. LEE Raymond, Applications of Computer Software in the Sociological Analysis of Qualitative Data, B.M.S., n° 57, Décembre 1997, pages 3-24. |
Reprise d’un article paru dans Current Sociology, volume 44, n° 3, Hiver 1996 : Trend Report sur “ Advent and Diffusion of CAQDAS ”, édité par Wilma Mangabeira. |
||||||||||||
MAKDESSI Yara, MOGOUTOV Andrei, VICHNEVSKAIA Tania, Le choix des mots et de la langue pour parler de soi. Paris, Septembre 1999. |
Communication aux 6èmes journées scientifiques du Réseau Lexicologie, Terminologie, Traduction de l’UREF (Beyrouth, 11-13 Novembre 1999), avec application du logiciel Réseau-Lu sur des entretiens semi-directifs. |
||||||||||||
BRUGIDOU Mathieu et LABBE Dominique, Le discours syndical français contemporain (CFDT, CGT, FO) en 1996-98. Rapport du C.E.R.A.T., Grenoble, Février 2000, 150 pages. |
Confrontation des analyses produites par deux logiciels lexicométriques : Alceste et un autre, Lexicométrie, en cours d’élaboration. |
||||||||||||
LABBE Dominique et MONIERE Denis, Le discours gouvernemental : Canada, Québec, France (1944-2000). Rapport du C.E.R.A.T., Grenoble, Novembre 2001, 160 pages + 13 p. d’annexes et 4 p. de bibliographie |
Analyse des spécificités lexicales comparées (selon dix catégories grammaticales), concluant que « les discours gouvernementaux tendent à se ressembler de plus en plus, gommant ainsi les différences entre les institutions et les cultures nationales. » |
||||||||||||
LABBE Dominique, Analyse des représentations du confort électrique à partir d’un corpus d’entretiens. Rapport du C.E.R.A.T., Grenoble, Juin 2002, 114 pages |
Rapport terminal d’un contrat de recherche avec le GRETS (E.D.F.) – qui a fourni le «verbatim» d’environ 200 entretiens réalisés au cours des 8 dernières années. |
||||||||||||
MOSCAROLA Jean, Contribution of qualitative methods to research in work and organizational psychology : Sphinx and MCA. Institut de Rech. en Economie et Gestion, Université de Savoie, 2002 ( ?) |
Entre les paradigmes positiviste et constructiviste : choisir les outils logiciels adaptés aux problématiques et aux méthodes de recherche, dans une perspective de complémentarité et non de compétition. |
||||||||||||
CHANAL Valérie et MOSCAROLA Jean, Langage de la théorie et langage de l’action. Analyse lexicale d’une recherche-action sur l’innovation. Communic. aux 4èmes Journées JADT, Nice 1998. |
L’opposition discours scientifiques /discours pratiques (sur ce thème de l’innovation) se combine avec l’opposition énoncé /énonciation, dans les interactions réciproques entre chercheurs et «gestionnaires». |
||||||||||||
b – Ouvrages et Numéros spéciaux de revues
Langages, n° 132, Décembre 1998 : Cognition, catégorisation, langage, par R. Ghiglione, J.P. Desclés, J.F. Richard et al.
Langage et Société, revue trimestrielle, Maison des Sciences de l’Homme de Paris (directrice : Sonia Branca-Rosoff) : lire par exemple le n° spécial de Décembre 2001, n° 98, sur « Langues et insertion sociale ».
Site Web : http://www.l-et-s.msh-paris.fr
Mots, revue du Groupe de Lexicologie Politique de l’E.N.S. de Saint-Cloud. Presses de la F.N.S.P., Paris (en cours d’installation à Lyon)
de BONVILLE Jean, L’analyse de contenu des medias. De la problématique au traitement statistique. Paris, Bruxelles, 2000, coll. Culture et Communication. |
Orientation dominante “ Info-Com ”, avec développements en méthodologie statistique. |
||||||
GHIGLIONE Rodolphe, LANDRÉ Agnès, BROMBERG Marcel, MOLETTE Pierre, L’analyse automatique des contenus. Paris, Dunod, 1998. Contient un disque Cédérom de démonstration du logiciel Tropes, diffusé par la société ACETIC. |
Ouvrage de référence du Groupe de Recherche sur la Parole, Paris 8, publié peu de temps avant le décès de son directeur, R. Ghiglione. |
||||||
MARCHAND Pascal, L’Analyse du Discours Assistée par Ordinateur (A.D.A.O.). Concepts, méthodes, outils. Paris, A. Colin, 1998. |
Orientation dominante Psychologie sociale et “ Info-Com ”, avec abondante bibliographie. |
||||||
JEANDILLOU Jean-François, L’analyse textuelle. Paris, A. Colin, 1997. |
Orientation dominante “ Analyse littéraire ”, avec initiation aux notions linguistiques de base. |
||||||
MAINGUENEAU Dominique, L’énonciation en linguistique française. Paris, Hachette, 1994, coll. Les Fondamentaux. |
Initiation aux notions de base de la problématique de l’ “ énonciation ”, nécessaire pour renouveler nos acquis obsolètes de grammaire scolaire. |
||||||
MAINGUENEAU Dominique, L’Analyse du Discours. Paris, Hachette 1991, nouv. édition 1997, coll. Linguistique. |
Synthèse des multiples approches de recherche qui se sont greffées sur “ l’école française d’analyse du discours ” depuis les années 60. |
||||||
SARFATI Georges-Elia, Eléments d’analyse du discours. Paris, Nathan, coll. Linguistique. |
En format poche (série 128), pour lecteurs pressés, avec bibliographie. |
||||||
PECHEUX Michel, L’inquiétude du discours. Paris, Editions des Cendres, 1990. |
Sélection posthume de textes, présentés par Denise Maldidier. Cf. aussi Mots, n° spécial, n° 9, Octobre 1984. |
||||||
BOURQUE Gilles et DUCHASTEL Jules, Restons traditionnels et progressifs. Pour une nouvelle analyse du discours politique : le cas du régime Duplessis au Québec. Montréal, Editions du Boréal, 1998. |
Contient une application du logiciel québécois SATO. |
||||||
CHATEAURAYNAUD Francis et TORNY Didier, Les sombres précurseurs. Une sociologie pragmatique de l’alerte et du risque. Paris, Eds. de l’E.H.E.S.S., 1999. |
Contient une note de 23 pages sur le logiciel Prospéro. |
||||||
CHATEAURAYNAUD Francis, Prospéro. Une technologie littéraire pour les sciences humaines. CNRS Editions, collection Communication, Avril 2003, 383 pages + bibliographie et index |
Compte-rendu détaillé dans le B.M.S. n° 79, Juillet 2003, par F. Chateauraynaud, B. Reber et K. Van Meter |
||||||
Notre collègue sociologue et ami Pierre Achard nous a quittés d’une mort subite quelques mois après la publication de mes articles sur les méthodes informatisées d’analyse de contenu et de discours. Je ne dirai jamais assez tout ce que mon travail d’inventaire critique des logiciels d’analyse textuelle lui doit, à lui personnellement ainsi qu’au séminaire d’Analyse de Discours et à la revue Langage et Société qu’il animait respectivement depuis une dizaine et une vingtaine d’années.
Un numéro spécial de Langage et Société lui a été consacré en signe d’hommage et de reconnaissance : c’est le n° 86, Mars 1998.
Je n’oublie pas non plus tout ce que je dois aussi à Antoine Culioli, à Josiane Boutet, à Pierre Fiala, à la regrettée Jenny Simonin-Grumbach, à Colette Guillaumin, à Dominique Maingueneau et à quelques autres, pour m’avoir sensibilisé et initié aux charmes austères de la sociolinguistique de l’énonciation.
2 – Quelques petits problèmes de Vocabulaire (parmi tant d’autres) :
Discours (et formations discursives, genres, types et modes, ….)
La littérature (socio)linguistique abonde sur la question des “ genres de discours ”, depuis Bakhtine, Todorov, Jenny Grumbach, notamment. Un numéro spécial de Langage et Société y a été consacré, sous l’impulsion de Sonia Branca-Rosoff (n° 87, Mars 1999 : Types, modes et genres de discours : entre langue et discours).
Pierre Achard a problématisé de manière originale (dans la perspective des travaux de M. Foucault et de M. Pécheux sur les “ formations discursives ”) les relations entre genres discursifs et registres; cette problématique était centrale dans son projet de création d’une équipe de recherche au CNRS (SLADE = Sociologie du Langage, Analyse de Discours, Enonciation) dont sa mort prématurée a empêché la réalisation. L’hypothèse de base en est la suivante : “ il est possible de mettre en rapport les activités sociales (registres) – une famille d’actes relativement homogènes – et des contraintes de forme (les genres discursifs) – des invariants formels motivés -, que l’on peut décrire en s’appuyant sur la linguistique de l’énonciation ” (L. et S., n° 86, Décembre 1998, page 69).
Analyse de/du/des Discours
Par rapport aux expressions usuelles et classiques d’Analyse de contenu et d’Analyse de texte, l’Analyse Discursive peut se décliner en Analyse DE DISCOURS (où elle prend rang de méthode transdisciplinaire, selon les conceptions de Pierre Achard, voire de discipline à part entière, avec ses “ discursivistes ”), Analyse DU Discours (selon la tradition française d’une sociolinguistique de l’énonciation, dominée notamment par A. Culioli et D. Maingueneau, qui s’exprime dans le revue Langages) ou, plus modestement, Analyse DES discours (où les discours sont considérés comme des pratiques sociales parmi d’autres, langagières et discursives certes mais très diversifiées – d’où l’emploi du pluriel – et intégrées dans des paradigmes extra-linguistiques (socio., psychosocio., économiques, politologiques, historiques, etc…). Le langage n’y est pas réduit au statut de simple “ outil de communication ” ni à l’inverse la parole simplement assimilée à un acte – selon l’expression “ speaching act ” d’Austin, et pourtant on s’accorde à y reconnaître des effets de “ performativité ”.
Sociolinguistique et Sociologie du langage
Sur ce débat récurrent, on pourra consulter les contributions de J. Boutet, P. Fiala et J. Simonin-Grumbach (Critique, n° 344, Janvier 1976), puis de Pierre Achard dans son “ Que sais-je ? ”, n° 2720, P.U.F., 1993, et dans de nombreuses autres publications (cf. sa bibliographie dans L. et S., n° 86, Mars 1998), et enfin, tout récemment, de L.J. Calvet et de G. Varro dans L. et S., n° 88, Juin 1999, de C. Canut dans L. et S., n° 91, Mars 2000.
Corpus (textuel) : les linguistes ont une conception et une définition précises, et opératoires, de cette notion de corpus. Cf. par ex. cette définition de John Sinclair, 1996, citée par Benoît Habert, Adeline Nazarenko et André Salem dans Les linguistiques de corpus, Paris, A. Colin,1997, page 144 : “ un corpus est une collection de données langagières qui sont sélectionnées et organisées selon des critères linguistiques explicites pour servir d’échantillon du langage ”).
En sociologie et autres disciplines de sciences sociales on peut se permettre de définir comme corpus tout ensemble de textes (d’origine écrite ou verbale, publique ou privée, mais rarement exhaustifs ni représentatifs) qu’on rassemble au cours de nos investigations de terrain (le terrain pouvant se situer dans la rue, le métro, à la radio, à la télévision, au bistro, au boulot, comme dans les chansons, les proverbes et autres aphorismes, dans les journaux, les livres, au Journal Officiel, dans les textes de loi, les circulaires administratifs, sur les affiches publicitaires murales, …) en fonction de nos objets de recherche, extra-linguistiques, par exemple : controverses, débats, conversations, mouvements sociaux, pratiques et représentations sociales, concernant tel ou tel problème ou “ fait de société ”, domaine d’action ou d’activité, rapport social (de classe, de genre, de génération, d’ethno-culture, …), évolution en cours, résistances au changement, etc…
Concordances et Correspondances : par convention, on appelle
– Concordances de tel mot (ou locution) d’un corpus la liste affichée/imprimée des occurrences de ce mot dans ses contextes (à n mots près, avant et après, ou dans un court segment textuel, tel que la phrase) : ce que les documentalistes appellent les KWIC (Key-Words In Context). L’origine de cette pratique est attribuée au Dominicain Saint-Chef, dans la tradition de l’exégèse des textes sacrés où le sens des mots ne peut se lire que dans et par leurs usages contextuels. Cf. la thèse de Magit Sekhraoui (Laboratoire de Lexicologie Politique de Saint-Cloud), Paris, Janvier 1996, et son logiciel (ce qu’on appelle un “ concordancier ”) baptisé Saint-Chef, cités dans mon article BMS54.
Cette notion de Concordance peut avoir un rapport avec celle d’ “environnement sémantique”, mais surtout avec la conception “ socio-discursive ” moderne qui distingue les mots du vocabulaire et leur “ mise en discours ” dans le processus d’énonciation, là où on distinguait classiquement le contenu (lexical) et la forme (syntaxique, rhétorique, stylistique, etc…) des énoncés.
– Correspondances le résultat de calculs visant à fournir une représentation synthétique (syncrétique ?) des liens statistiques observables dans les “ tableaux lexicaux ”, où chaque ligne représente un fragment de corpus (ex. un éditorial de presse écrite, une partie thématique d’entretien semi- ou non-directif) et chaque colonne une “ forme lexicale ” (ex. un mot, une locution). Dans le contexte méthodologique franco-français, ce sont les techniques de calcul de Benzécri (A.F.C., A.C.P., etc…) qui dominent largement. Ces techniques exigent la solution préalable des problèmes de “ découpage du corpus ” en fragments textuels, d’une part, et de l’éventuelle agrégation des mots (par lemmatisation / stemmatisation / synonymie, etc…), voire de l’élimination optionnelle de certains mots, dits vides, d’autre part.
Activité psychocognitive : où il est question (selon Kintsch et Van Dijk, cités par R. Ghiglione) des activités cognitives et mnémoniques fondamentales qui présideraient à toute production et compréhension langagière, telles que nos capacités de garder en mémoire tant de mots déjà prononcés et d’anticiper tant de mots à prononcer.
Analyse des Données : terme générique, abusif lorsqu’il désigne implicitement la seule méthode d’analyse benzécriste qui domine en France (car il y a d’autres manières d’analyser des données multidimensionnelles), auquel je préfère la désignation techniquement plus correcte d’analyse spectrale-factorielle (le spectre des facteurs additifs correspondant à la décomposition de la lumière blanche composite à travers le prisme, le calcul matriciel opérant ici comme un prisme).
Types et Classes (d’objets, d’individus statistiques) : j’ai utilisé l’expression de types homogènes calculés là où Alceste parle de classes (dans le calcul des classes d’u.c.e. : unités de contexte élémentaire). Au delà des conventions de vocabulaire, il faut bien distinguer les agrégations calculées par des procédures (“ fréquentistes ”) de classification automatique et celles que construit le recours (“ intuitionniste ”) aux grilles d’analyse paradigmatique a priori du chercheur. Cf. Types homogènes calculés et/ou Classes significatives construites : réflexions épistémologiques sur les modes de traitement de la complexité, in Enquêtes statistiques et Indicateurs de pratiques familiales. Collectif, Paris, 1989, CNRS-IRESCO : p. 67-76.
Entrée lexicale : désigne la dimension principale, sinon unique (ici, la dimension lexicale), selon laquelle une méthode logicielle aborde l’analyse des corpus textuels. Que tout logiciel doive commencer par établir la liste des occurrences lexicales (liste des “mots” ou locutions, qu’on appelle le lexique, ou le vocabulaire, du corpus) – selon l’ordre alphabétique des mots, pour la commodité des recherches, et selon leur rang de fréquence décroissante (du plus employé aux “hapax”), cela ne justifie pas qu’il en reste à ce “niveau discursif” élémentaire. Si, en outre, un logiciel exclut de cette liste les mots dits vides, ou “mots-outils”, cela manifeste qu’il est prisonnier de ce que j’appelle le “paradigme des mots-clés” chers aux documentalistes – selon lequel la sélection des mots (ou locutions) “descripteurs” les plus pertinents et leur simple juxtaposition suffirait à “résumer” le sens du texte. Or si l’on veut faire plus et mieux que de l’analyse documentaire, ou de l’analyse “de contenu”, on ne peut négliger les autres “facettes” de l’organisation langagière-discursive complexe – quelle que soit par ailleurs la sophistication des techniques statistiques ou graphiques mobilisées pour décrire la combinatoire booléenne des mots, les correspondances factorielles et les spécificités lexicales, les réseaux de mots associés, etc…
3 – Quelques sites Web et séminaires de recherche ouverts
JADT (Journées d’Analyse des Données Textuelles) : http://www.ulg.ac.be/facphl/jadt2004
Ces Journées regroupent le réseau des pratiquants des “ Statistiques Textuelles ”, au-delà des seuls benzécristes qui dominent le paysage franco-français, par exemple : en provenance du Québec, V. Armony, J. Duchastel et G. Bourque (cf. article cité ci-dessus); J.G. Meunier et ses coéquipiers (cf. article cité ci-dessus); en provenance d’Italie, S. Bolasco et A. Morrone; mais aussi plusieurs collègues français qui investissent dans une gamme de méthodes diversifiées (dont M. Brugidou, D. Labbé, V. Beaudoin, etc…).On trouvera la plupart des communications des Journées JADT de 1998, 2000 et 2002 dans la revue en ligne Lexicometrica (cf. site Web ci-dessous).
Equipe Lexico – ILPGA, Sorbonne Nouvelle Paris 3 (André Salem et Serge Fleury) :
Téléchargement du logiciel Lexico3 et des articles de la revue Lexicometrica (qui contient entre autres les communications des JADT depuis 1998) par : http://cavi.univ-paris3.fr/lexicometrica
GRAM – Groupe de Recherche sur l’Analyse de discours des Medias, avec un groupe de discussion sur Internet (responsables Alice Krieg <krieg@univ-paris12.fr> et Hélène Cardy <cardy@univ-paris8.fr>) : http://www.fr.groups.yahoo.com/group/legram
où circulent, notamment, les textes se rapportant au thème de leur dernière rencontre interdisciplinaire des 15 et 16 Mars 2002 à Paris (Rapports de l’analyse de discours des medias avec la sociologie et la psychologie sociale)
CEDP – Centre d’Etude du Débat Public, Université François Rabelais de Tours, qui organise, notamment, les 3 et 4 Juin 2002 un séminaire de recherche sur « du traitement du discours dans des recherches en communication » :
http://www.univ-tours.fr/recherche/lab17.htm
Séminaire de recherche sur l’Analyse de Discours, Maison des Sciences de l’Homme, Paris.
Contact : <francois.leimdorfer@printemps.uvsq.fr>
Research in Critical Discourse Analysis, site Web en langues anglaise et espagnole, animé par le professeur Teun A. Van Dijk (qui coordonne aussi les revues internationales Discourse and Society et Discourse Studies) : http://www.hum.uva.nl/~teun/
“ Text analysis resources ”, compiled by Harald Klein (Sciences sociales, Rudolstadt, Germany) : http://www.intext.de/textanae.htm
Catalogue de la plupart des logiciels d’analyse textuelle pratiqués dans le monde, avec descriptifs sommaires et coordonnées de leurs auteurs – où l’on ne trouve que deux logiciels d’origine française (Alceste et Spad-T). 45 pages.
Sociological Research Online : http://www.socresonline.org.uk/socresonline/3/3/4.html
Article en ligne de Christine A. Barry (1998) : Choosing Qualitative Data Analysis Software. Atals/Ti and Nudist Compared. 15 pages.
Réseau ARCATI (Atelier-Réseau Coopératif pour Analyses Textuelles Informatisées), fondé à l’Iresco en 1999 par Mohammed Hassini et Jacques Jenny, avec un « Comité de pilotage » qui a évolué jusqu’à la fin du Réseau en janvier 2006.
On trouvera sur une autre page du présent site le projet initial et l’histoire de ce Réseau, avec les programmes annuels de son Séminaire de 2000 à 2004 :
Concernant des logiciels ou groupes de recherche ou organismes :
PROSPERO (F. Chateauraynaud) |
http://www.prosperologie.org |
TROPES (Sté ACETIC) |
http://www.acetic.fr (téléchargement du module ‘Zoom’) |
HYPERBASE (Etienne Brunet) |
http://www.ancilla/unice.fr/ |
ALCESTE (Max Reinert) |
http://www.image.cict.fr |
LEXICO 3 (André Salem) |
http://www. cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/ |
SPHINX (et module Lexica) |
http://www.lesphinx-developpement.fr |
SPAD-T (Sté DECISIA) |
http://www.decisia.com |
ASKIA (Sté ASKIA) |
http://www.askia.com |
JEU DE MOTS(Sté M.L.I.) |
mli01@club-internet.fr |
WordMapper (J.F. Grimmer) |
http://www.grimmersoft.com (téléchargt. de versions démo.) |
MODALISA (Sté Kynos) |
http://www.modalisa.com |
RESEAU-LU (Andrei Mogoutov) |
http://www.aguidel.com |
EVOCATION 2000 (Pierre Vergès) |
vergesp@mmsh.univ-aix.fr (logiciel gratuit pour recherche publ.) |
WEBLEX (ex.Lexplorer – S. Heiden) |
http://www.weblex.com |
LATL |
http://www.latl.unige.ch/latl/ |
Analyse syntaxique |
http://www.lli.univ-paris13.fr/ |
INaLF et Base de Données Frantext |
http://www.ciril.fr/INALF/ (catégoriseurs morphosyntaxiques) |
Q.S.R. (Tom Richards) |
tom@qsr.com.au (logiciels Nudist et Nvivo, Australie) |
INTEXT (Harald Klein) |
http://www.intext.de (cf. ci-dessus : Text Analysis Resources) |
Sage Publications |
http://www.sagepub.co.uk (doc. commerc. sur logiciels étrangers) |
Social Research Update (U. de Surrey) |
http://www.soc.surrey.ac.uk/sru/ (revue de sociologie en ligne) |
(Nota : l’exactitude des adresses ci-dessus n’est pas garantie, même à la date d’octobre 2004)
Autres publications récentes (de J.J.) ayant un rapport indirect (mais réel) avec le sujet traité ici :
JENNY Jacques, Un nouveau paradigme pour penser le changement ? le processus d’individuation transductive, selon Gilbert Simondon. Les Cahiers de l’Implication, n° 1 – Groupe de Sociologie Institutionnelle, Université de PARIS 8, Département des Sciences de l’Education, Hiver 1997/98, pp. 31-44.
JENNY Jacques, Quelles logiques de recherche ? Article introductif d’un numéro spécial de la revue Utinam (revue de sociologie et d’anthropologie), Paris, Editions L’Harmattan, 2000, pp. 20-47. Ce numéro spécial est consacré à la confrontation, à l’appariement, des méthodes dites “qualitatives” et “quantitatives” dans les études longitudinales de trajectoires biographiques.
JENNY Jacques, Quanti / Quali» = distinction artificielle, fallacieuse et stérile ! Communication pour le 1er Congrès de l’A.F.S. (Association Française de Sociologie), Groupe RTF-20 (Méthodes), Villetaneuse – 25 février 2004.
Bonjour,
Je souhaiterais savoir s’il est possible de télécharger/utiliser le logiciel EVOCATION 2000 de (P. Vergès).
Les données que je souhaite traiter sont issues d’une tâche d’association hiérarchisée.
Cordialement,
W. Lopes
Bonjour
Je suis étudiante à l’ENS de Marrakech, et je suis en train de faire un projet de fin d’études sur les représentations des étudiants au de développement durable.
Je demande votre aide, j’ai besoin de logiciel EVOC 2000 pour le traitement des RS
Merci d’avance