17.06.2013 Views

Hathout, N. (2009) - ERSS - Université Toulouse II-Le Mirail

Hathout, N. (2009) - ERSS - Université Toulouse II-Le Mirail

Hathout, N. (2009) - ERSS - Université Toulouse II-Le Mirail

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Université</strong> de <strong>Toulouse</strong><br />

Mémoire présenté pour l’obtention d’une<br />

habilitation à diriger des recherches<br />

spécialité : linguistique<br />

Contributions à la description<br />

de la structure morphologique du lexique<br />

et à l’approche extensive en morphologie<br />

Nabil <strong>Hathout</strong><br />

CLLE-<strong>ERSS</strong>, CNRS & <strong>Université</strong> de <strong>Toulouse</strong> <strong>II</strong>-<strong>Le</strong> <strong>Mirail</strong>


Remerciements<br />

Je remercie Jacques Durand d’avoir accepté de m’accompagner dans la présentation de<br />

cette habilitation et pour ses conseils et sa disponibilité.<br />

Je remercie également :<br />

– Dany Amiot, Marie-Paule Péry-Woodley, Vito Pirrelli, Michel Roché et Pierre<br />

Zweigenbaum qui ont bien voulu faire partie de mon jury d’habilitation ;<br />

– Marc Plénat auquel mes recherches doivent beaucoup ;<br />

– Dany Amiot, Michel Aurnague, Gilles Boyé, Myriam Bras, Jacques Durand, Cécile<br />

Fabre, Marc Plénat, Josette Rebeyrolles, Michel Roché, Ludovic Tanguy et Pierre<br />

Zweigenbaum pour leur aide dans la rédaction de ce mémoire ;<br />

– Michel Aurnague, Andrée Borillo, Gilles Boyé, Myriam Bras, Georgette Dal,<br />

Jacques Durand, Cécile Fabre, Bruno Gaume, Hélène Giraudo, Olivier Hautecœur,<br />

Françoise Kerleroux, Stéphanie Lignon, Fabio Montermini, Philippe Muller,<br />

Fiammetta Namer, Marc Plénat, Franck Sajous, Jeannine Richard-Zappella, Michel<br />

Roché, Ludovic Tanguy et Jesse Tseng pour leur amitié, leurs conseils et les nombreuses<br />

collaborations.<br />

Mes remerciements vont enfin à Aïda, à nos enfants Emna et Hamza et à mes parents<br />

Mohamed-Salah et Zina pour leur affection et leur soutien.<br />

iii


Table des matières<br />

Introduction 9<br />

1 Parcours scientifique 13<br />

1.1 De la théorie du gouvernement et du liage à la morphologie lexicale paradigmatique<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

1.2 Découvrir la structure morphologique du lexique . . . . . . . . . . . . . . . 15<br />

1.2.1 Verbaction, TLFindex et <strong>Le</strong>xeur . . . . . . . . . . . . . . . . . . . . . 15<br />

1.2.2 DéCor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />

1.2.3 Analogies morphosynonymiques . . . . . . . . . . . . . . . . . . . . 17<br />

1.2.4 Proximité et paradigmes morphologiques . . . . . . . . . . . . . . . . 19<br />

1.3 La morphologie extensive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

1.3.1 Webaffix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

1.3.2 Contribution méthodologique et technique . . . . . . . . . . . . . . 22<br />

1.3.3 Description morphologique . . . . . . . . . . . . . . . . . . . . . . . 23<br />

1.3.4 Productivité morphologique . . . . . . . . . . . . . . . . . . . . . . . 25<br />

1.3.5 Diffusion et réutilisation des données . . . . . . . . . . . . . . . . . . 26<br />

1.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26<br />

2 Un modèle théorique de la morphologie lexicale 27<br />

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

2.2 Principes généraux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

2.3 Un modèle à quatre niveaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

2.4 Proximité morphologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

2.5 Proximité lexicale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34<br />

2.6 Organisation morphologique du lexique . . . . . . . . . . . . . . . . . . . . . 35<br />

2.6.1 Paradigmes morphologiques et paradigmes lexicaux . . . . . . . . . . 35<br />

2.6.2 Analogie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

2.7 Sémantique d’instance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

2.8 Système de contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

v


vi Table des matières<br />

2.9 Contraintes sur la position lexicale . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

2.10 Contraintes morphophonologiques . . . . . . . . . . . . . . . . . . . . . . . 44<br />

2.10.1 Dissimilation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />

2.10.2 Taille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

2.11 Contraintes lexicales sur la forme . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

2.11.1 Recyclage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

2.11.2 Transparence sémantique . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />

2.11.3 Transparence catégorielle . . . . . . . . . . . . . . . . . . . . . . . . . 52<br />

2.12 <strong>Le</strong> jeux des contraintes : le cas des dérivés en anti- . . . . . . . . . . . . . . . 53<br />

2.13 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

3 Nouveau paradigme d’analyse morphologique automatique 57<br />

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

3.1.1 Analyse morphologique lexématique . . . . . . . . . . . . . . . . . . 57<br />

3.1.2 Combiner la proximité morphologique et l’analogie formelle . . . . 60<br />

3.1.3 Réseau morphologique . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />

3.1.4 Travaux connexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

3.2 Proximité morphologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

3.2.1 Traits formels et traits sémantiques . . . . . . . . . . . . . . . . . . . 64<br />

3.2.2 Connecter les lexèmes via leurs traits . . . . . . . . . . . . . . . . . . 66<br />

3.2.3 Estimer la similarité morphologique des mots . . . . . . . . . . . . . 67<br />

3.2.4 Voisinages morphologiques . . . . . . . . . . . . . . . . . . . . . . . . 69<br />

3.3 Analogie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

3.3.1 Connecter les familles et les séries . . . . . . . . . . . . . . . . . . . . 70<br />

3.3.2 Analogies formelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72<br />

3.3.3 Implémentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />

3.4 Premiers résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76<br />

3.5 Conclusion et développements futurs . . . . . . . . . . . . . . . . . . . . . . 77<br />

4 Analyse unifiée de la préfixation en anti- 81<br />

4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

4.2 Anti- est un préfixe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

4.2.1 Radicaux nominaux, adjectivaux et verbaux . . . . . . . . . . . . . . 83<br />

4.2.2 Radicaux pluriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />

4.2.3 Anti-VN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87<br />

4.2.4 Anti- devant des syntagmes nominaux sans déterminant . . . . . . . 88<br />

4.2.5 Anti- devant des noms propres, des propositions, des interjections<br />

et des onomatopées . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88<br />

4.2.6 Anti- devant des pronoms . . . . . . . . . . . . . . . . . . . . . . . . . 89<br />

4.2.7 Anti- devant des syntagmes nominaux comportant un déterminant . 90<br />

4.3 La sémantique des dérivés en anti- . . . . . . . . . . . . . . . . . . . . . . . . 92<br />

4.3.1 Notions générales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

4.3.2 Interprétations spatiales endocentriques . . . . . . . . . . . . . . . . 97<br />

4.3.3 Interprétations spatiales exocentriques . . . . . . . . . . . . . . . . . 98


Table des matières vii<br />

4.3.4 Interprétations logiques endocentriques . . . . . . . . . . . . . . . . 99<br />

4.3.5 Interprétations adversatives exocentriques . . . . . . . . . . . . . . . 101<br />

4.3.6 Interprétations adversatives endocentriques . . . . . . . . . . . . . . 103<br />

4.3.7 Unité de famille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104<br />

4.4 Caractérisation catégorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106<br />

4.5 Radicaux d’emprunt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />

4.5.1 Parasynthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108<br />

4.5.2 Radicaux suffixés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109<br />

4.5.3 Allomorphie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

4.5.4 Supplétion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />

4.5.5 Substitution de suffixes . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />

4.5.6 Surcharge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />

4.5.7 Identité de forme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112<br />

4.5.8 Élision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />

4.5.9 Suffixation d’expressions nominales . . . . . . . . . . . . . . . . . . . 114<br />

4.5.10 Bases désadjectivales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114<br />

4.5.11 Périmètre du voisinage morphologique . . . . . . . . . . . . . . . . . 115<br />

4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116<br />

Conclusion 119<br />

Bibliographie 123


Introduction<br />

Contrairement à la thèse dont la durée est souvent liée à celle de la bourse ou du financement<br />

obtenu, il n’y a pas de réelle limite au nombre d’années de carrière pour la<br />

présentation d’une habilitation à diriger les recherches. Dans mon cas, ce temps a été relativement<br />

long parce que j’ai changé de thématique de recherche après mon recrutement au<br />

CNRS et que mes travaux se répartissent dans deux domaines distincts de la linguistique<br />

— la morphologie et le traitement automatique des langues —, mais aussi parce que la direction<br />

de travaux de recherche comporte une part de responsabilité qu’il faut être prêt à<br />

assumer. L’un des préalables à cet engagement est, je crois, d’avoir soi-même un programme<br />

scientifique en état de marche, bien délimité, avec des objectifs et des orientations clairement<br />

identifiés. Je pense que mon programme de recherche a aujourd’hui atteint ce niveau<br />

de maturité.<br />

Mon mandat au comité national de la recherche scientifique 1 et ma fonction de secrétaire<br />

scientifique de la section 34 (langues, langage, discours) ont eu un rôle déterminant<br />

dans cette maturation. Cette expérience m’a permis d’avoir une idée claire de ce que l’on<br />

attend d’un chercheur en linguistique, de ce qu’est un bon dossier scientifique, d’observer<br />

la diversité des parcours et des stratégies professionnels, de m’imprégner des nombreux<br />

exemples de réussites scientifiques et de tirer des leçons des quelques cas problématiques<br />

ou difficiles que nous avons eu à examiner. Mon passage au comité national m’a aussi permis<br />

de comparer mes recherches à celles du reste de la communauté et surtout de n’avoir<br />

plus aucun complexe sur la position de mes travaux dans la discipline. Il m’a aussi permis<br />

d’avoir une idée assez précise des recherches menées en linguistique en France. Cette<br />

connaissance du champ s’ajoute à celle que j’ai dans les domaines de la morphologie et<br />

du traitement automatique des langues. Mes collaborations avec les morphologues français<br />

ont été nombreuses et régulières, dans le cadre du GDR 2220 (description et modélisation<br />

en morphologie) dirigé par Bernard Fradin et de la rédaction collective de l’ouvrage Aperçus<br />

de morphologie du français (Fradin et al. <strong>2009</strong>). Au niveau européen et international,<br />

l’organisation, en collaboration, du 3 e Forum de morphologie (Fradin et al. 2003a) et des<br />

1. J’ai en fait été élu deux fois. La première fois en 2004, sur un poste vacant, pour une durée de 6 mois<br />

seulement.<br />

9


10 Introduction<br />

Décembrettes (<strong>Hathout</strong> et Roché 2003, <strong>Hathout</strong> et Montermini 2007, Montermini et al.<br />

2007), devenue aujourd’hui l’une des principales conférences européennes de morphologie,<br />

m’a donné l’occasion de rencontrer une bonne partie des figures importantes de la discipline<br />

et de connaître les travaux qui sont réalisés dans les principaux centres de recherche<br />

en Europe. J’ai aussi une bonne connaissance du domaine du traitement automatique des<br />

langues. Je fais partie du comité de rédaction de la revue TAL (traitement automatique des<br />

langues) et je participe régulièrement aux comités de lecture et de programme de la conférence<br />

TALN (conférence sur le traitement automatique des langues naturelles), dont j’ai<br />

organisé en collaboration avec Philippe Muller l’édition de 2007 (Benamara et al. 2007) 2 .<br />

Je ne présente dans ce mémoire que les aspects scientifiques de mon travail. Mes autres<br />

expériences et activités sont listées dans mon CV. J’ai par ailleurs choisi de mettre l’accent<br />

sur mes chantiers en cours et de présenter plus succinctement mon parcours scientifique. Il<br />

m’a en effet semblé important de présenter en détail mes thématiques de recherches principales,<br />

la façon dont je les aborde et quelques-uns des résultats récemment obtenus. Ces<br />

chantiers définissent le cadre de mes recherches à venir et celles dans lesquelles j’envisage<br />

d’encadrer des travaux d’étudiants de master et de thèse. <strong>Le</strong>s recherches en cours dans ces<br />

différents chantiers n’ont pas toutes le même état d’avancement et de finalisation. <strong>Le</strong>s plus<br />

récentes comme le modèle théorique du chapitre 2 sont encore en développement. À l’inverse,<br />

le modèle informatique présenté dans le chapitre 3 est plus abouti. Ces différences se<br />

retrouvent aussi au sein d’une même étude comme l’analyse de la préfixation en anti- (chapitre<br />

4) où celle des dérivés comme anti-obèse pourrait être affinée davantage tandis que<br />

celle de la sous-série des adjectifs comme antiparlementaire ou antilimace est plus assurée.<br />

Ce mémoire se compose de quatre chapitres. Dans le premier, je présente mes activités<br />

scientifiques depuis mon DEA, obtenu en 1989, jusqu’à aujourd’hui. J’y montre la cohérence<br />

de mon programme de recherche et la façon dont mes chantiers de recherche actuels<br />

s’inscrivent dans la continuité de mes travaux antérieurs. J’explique notamment comment<br />

mes travaux de morphologie informatique et descriptive s’organisent autour de mes deux<br />

thèmes de recherche principaux : la découverte de la structure morphologique du lexique<br />

et la morphologie extensive.<br />

<strong>Le</strong> deuxième chapitre décrit un modèle théorique de la morphologie dérivationnelle.<br />

Il m’est en effet apparu nécessaire de replacer l’ensemble de mes recherches tant informatiques<br />

que descriptives dans un contexte théorique général. Mon objectif est avant tout<br />

de caractériser de façon précise les paradigmes morphologiques et les objets dont ils sont<br />

constitués et d’expliciter les contraintes qui portent sur l’expression morphologique du<br />

sens et sur la forme des mots.<br />

Je décris dans le chapitre 3 un modèle informatique qui permet de renouveler la façon<br />

dont est conçue l’analyse morphologique automatique. J’y propose un changement de paradigme<br />

qui consiste à passer d’une analyse de mots à une analyse globale du lexique. La<br />

mise en œuvre de ce type d’analyse fait intervenir les notions de proximité, de familles et<br />

de séries présentées dans le chapitre 2. Je montre comment on peut implémenter de façon<br />

simple cette proximité et comment on peut utiliser l’analogie formelle pour découvrir une<br />

partie des relations qui s’établissent au sein des familles et des séries morphologiques.<br />

2. Farah Benamara et Sylwia Ozdowska sont les organisatrices de la conférence associée RECITAL 2007.


Introduction 11<br />

<strong>Le</strong> dernier chapitre présente une étude approfondie de la préfixation en anti- réalisée<br />

dans le cadre de la morphologie extensive. Trois problèmes y sont abordés. <strong>Le</strong> premier<br />

concerne la diversité des séquences introduites par anti- et les conséquences de cette pluralité<br />

sur la caractérisation de la nature de anti- : est-ce un préfixe ou une préposition ? <strong>Le</strong><br />

deuxième problème est celui de l’unité de la préfixation en anti-. Je montre qu’il existe cinq<br />

interprétations possibles pour les dérivés en anti- et qu’elles peuvent être rassemblées au<br />

sein d’une même famille de sens. Enfin, j’aborde la question de la parasynthèse. J’en propose<br />

une analyse qui découle directement des contraintes morpholexicales qui sont décrites<br />

dans le chapitre 2.<br />

Avant d’entrer dans le vif du sujet, je voudrais signaler que je travaille principalement<br />

sur le français car c’est la seule langue pour laquelle mes intuitions sont assez fiables. <strong>Le</strong><br />

français n’est cependant pas ma langue maternelle. Mon autre langue est le tunisien, ce qui<br />

pourrait expliquer mon penchant pour une conception paradigmatique de la morphologie<br />

des langues, et notamment de celle du français. Par ailleurs, je ne travaille que sur l’écrit<br />

parce que je m’intéresse essentiellement à la sémantique lexicale et à l’interface entre la<br />

sémantique et la morphologie. Je voudrais aussi indiquer qu’une grande partie du travail<br />

présenté dans ce mémoire est issue de collaborations à la fois nombreuses et régulières<br />

comme en témoigne la liste de mes publications, et souligner que les propositions et les<br />

analyses détaillées dans les chapitres 2 et 4 sont essentiellement une interprétation personnelle<br />

des idées, des principes et des réflexions qui constituent le substrat scientifique de<br />

l’axe DUMAL, le groupe des morphologues de CLLE-<strong>ERSS</strong> 3 .<br />

3. <strong>Le</strong>s morphologues et les phonologues de CLLE-<strong>ERSS</strong> sont aujourd’hui rassemblés au sein de l’axe Mor-<br />

Pho-<strong>Le</strong>x.


CHAPITRE 1<br />

Parcours scientifique<br />

Je retrace dans ce chapitre mon parcours scientifique en m’attachant à montrer sa cohérence<br />

et à présenter la façon dont s’articulent les recherches que j’ai menées durant cette<br />

première phase de ma carrière. Je montre notamment comment ces recherches débouchent<br />

sur mes chantiers actuels. Ils sont présentés de façon détaillée dans les trois chapitres suivants<br />

de ce mémoire. Ce premier chapitre est plus synthétique et décrit seulement les<br />

contributions les plus significatives de mes travaux antérieurs. Je profite aussi de ce tour<br />

d’horizon pour esquisser quelques-uns de mes projets futurs.<br />

1.1 De la théorie du gouvernement et du liage à la morphologie<br />

lexicale paradigmatique<br />

Mon premier travail de recherche a été un DEA dirigé par Mario Borillo sur la sémantique<br />

des prépositions directionnelles devant, derrière, à droite de, à gauche de. Cette étude<br />

a été menée dans un cadre pluridisciplinaire. J’ai proposé une formalisation des descriptions<br />

de Vandeloise (1986) et Herskovits (1982) dans une approche inspirée de la « physique<br />

qualitative » (Hayes 1985, Davis 1988). J’ai ensuite effectué une thèse sous la direction de<br />

Patrick Saint-Dizier sur l’analyse syntaxique automatique du français basée sur la théorie<br />

du gouvernement et du liage (GB ; Government and Binding Theory) de Chomsky (1981,<br />

1986). <strong>Le</strong> cadre informatique de cette thèse était la programmation logique avec contraintes<br />

(Jaffar et Lassez 1987, Colmerauer 1990, Jaffar et Maher 1994). La principale contribution<br />

de ce travail est une modélisation des principes et des théories qui composent GB dans une<br />

logique du premier ordre augmentée de contraintes.<br />

J’ai ensuite été recruté comme chargé de recherche CNRS sur un programme de recherche<br />

en traitement automatique des langues dans un cadre génératif. J’ai été affecté<br />

à l’INaLF à Nancy. L’adéquation entre ce programme et les activités menées au sein de<br />

l’équipe de recherche et de services informatiques à laquelle j’ai été rattaché était quasi<br />

nulle. Mon programme de recherche a donc entamé une évolution longue et douloureuse<br />

vers des thématiques mieux adaptées à mon environnement de travail comme l’acquisition<br />

13


14 Parcours scientifique<br />

de connaissances à partir du Trésor de la Langue Française (TLF) dont l’informatisation<br />

venait à peine de démarrer. Après une première étude linguistique des marqueurs superficiels<br />

dans les définitions de botanique et de chimie (<strong>Hathout</strong> 1996a, b), je me suis lancé<br />

dans l’analyse syntaxique des définitions du TLFi (Trésor de la Langue Française informatisé)<br />

et la réalisation d’un analyseur syntaxique adapté à ces données. <strong>Le</strong>s difficultés que j’ai<br />

rencontrées dans le traitement des verbes m’ont donné l’occasion d’entamer ma première<br />

collaboration avec Fiammetta Namer sur la construction d’un lexique syntaxique pour le<br />

TAL à partir du <strong>Le</strong>xique-Grammaire du LADL (<strong>Hathout</strong> et Namer 1997a, b, 1998). Malheureusement,<br />

les améliorations attendues ne se sont pas concrétisées. <strong>Le</strong> développement<br />

de cet analyseur a ensuite été progressivement abandonné au profit d’une nouvelle thématique<br />

de recherche : la morphologie informatique.<br />

Durant cette période, j’ai aussi participé à un nombre important de projets et collaborations<br />

comme l’action d’évaluation des étiqueteurs morphosyntaxiques Grace, le projet<br />

européen LE-Parole sur la constitution de corpus et de lexiques au format TEI ou le projet<br />

Iliad sur la création d’une chaîne d’analyse linguistique et statistique de l’information<br />

en corpus (Toussaint et al. 1998). J’ai également fait, en collaboration avec Pascal Amsili,<br />

quelques incursions en sémantique formelle dans le cadre de la DRT (Kamp 1981, Asher<br />

1993). Nous nous sommes intéressés à la représentation de la négation (Amsili et <strong>Hathout</strong><br />

1996) et au typage des λ-DRS (Amsili et <strong>Hathout</strong> 1998).<br />

Si la morphologie informatique est devenue, à l’INaLF, ma principale thématique de<br />

recherche, c’est grâce à la disponibilité de gros lexiques flexionnels comme TLFnome 1 et<br />

parce que j’ai tout de suite eu la conviction qu’une bonne partie des connaissances morphologiques<br />

pouvaient être acquises à partir de ces ressources. Cette conviction et les principes<br />

qui guident mes recherches actuelles se sont mis en place dès mon premier travail de morphologie<br />

informatique, à savoir la construction du lexique Verbaction, sur une proposition<br />

de Didier Bourigault. <strong>Le</strong> fait de travailler sur des lexiques complets m’a naturellement<br />

amené à m’intéresser à la structure de ces objets et m’a convaincu que cette dernière détermine<br />

largement les propriétés individuelles des mots. J’ai également été influencé par l’idée<br />

d’apprentissage endogène que les travaux de Didier Bourigault sur <strong>Le</strong>xter ont contribué à<br />

diffuser largement (Bourigault 1994). Après mon arrivée à <strong>Toulouse</strong>, les collaborations et<br />

les échanges que j’ai eus avec Marc Plénat ont été déterminants dans l’orientation de mes<br />

recherches. J’ai ainsi pris conscience de l’importance des données et surtout de celles qui ne<br />

se trouvent pas dans les dictionnaires, de la diversité des conditionnements, de la nécessité<br />

de travailler sur des grandes quantité d’exemples et de la difficulté de les collecter. J’ai aussi<br />

appris, en travaillant avec Marc Plénat, que les données ne sont pas tout et que l’analyse<br />

linguistique est un art difficile.<br />

La suite du chapitre détaille les deux axes principaux qui structurent mes recherches<br />

en morphologie. La section 1.2 présente mes travaux de linguistique informatique relatifs<br />

à la découverte de la structure morphologique du lexique et la section 1.3 mes recherches<br />

autour de la morphologie extensive.<br />

1. TLFnome est un lexique flexionnel construit à l’INaLF en 1996 par Jacques Maucourt et Marc Papin<br />

à partir de la nomenclature du TLF. Il a été mis au format XML en 2005 et rebaptisé Morphalou 1.0. Il est<br />

disponible sous cette forme sur le site du CNRTL (www.cnrtl.fr/lexiques/morphalou/).


Découvrir la structure morphologique du lexique 15<br />

1.2 Découvrir la structure morphologique du lexique<br />

La première constante des recherches que je mène depuis une dizaine d’années est leur<br />

finalité : la découverte de la structure morphologique dérivationnelle du lexique. Cet objectif<br />

initialement un peu flou s’est nettement précisé après mon arrivée à l’<strong>ERSS</strong>.<br />

1.2.1 Verbaction, TLFindex et <strong>Le</strong>xeur<br />

J’ai réalisé mes premiers travaux en morphologie en construisant, avec l’aide de Anne<br />

Berche et Fabienne Mougin, deux ressources lexicales destinées au traitement automatique<br />

du français. La première est dérivationnelle, Verbaction, et la seconde flexionnelle,<br />

TLFindex. Verbaction est un lexique de couples verbe : nom 2 dont le nom est morphologiquement<br />

apparenté au verbe et peut être utilisé pour exprimer l’action dénotée par ce<br />

dernier 3 . L’exemple (1) illustre son format actuel dans lequel les mots sont munis d’étiquettes<br />

morphosyntaxiques au format Grace (Rajman et al. 1997). Ce lexique a été réalisé<br />

en utilisant findaffix, un utilitaire fourni avec le correcteur orthographique ispell, qui permet<br />

d’apprendre des schémas de suffixation à partir d’une liste de mots. Un schéma de<br />

suffixation est un couple de suffixes s1 : s2 qui permet de mettre en relation deux formes<br />

w1 et w2 telles que w2 puisse être obtenue en enlevant à w1 le suffixe s1 puis en lui ajoutant<br />

le suffixe s2. En d’autres termes, w1 et w2 peuvent être connectées s’il existe un radical r tel<br />

que w1 = r⊙s1 et w2 = r⊙s2 où ⊙ dénote la concaténation. <strong>Le</strong>s relations identifiées de cette<br />

manière s’établissent entre des mots qui appartiennent à la même famille morphologique.<br />

Ces schémas sont communément utilisés pour le traitement automatique de la morphologie,<br />

entre autres par Jacquemin (1997), Pirrelli et Yvon (1999), Zweigenbaum et Grabar<br />

(1999), Grabar et Zweigenbaum (1999), Gaussier (1999) ou Schone et Jurafsky (2000).<br />

(1) censurer/Vmn---- censure/Ncfs<br />

centraliser/Vmn---- centralisation/Ncfs<br />

centrer/Vmn---- centrage/Ncms<br />

centrer/Vmn---- centration/Ncfs<br />

J’ai ainsi adopté, dès le départ, une conception relationnelle du lexique et une approche<br />

inductive dans laquelle les relations morphologiques émergent des données, de façon globale.<br />

Je signale que ce travail a été réalisé sans connaissance théorique approfondie en matière<br />

de morphologie dérivationnelle. Ceci explique en partie le fait qu’il n’ait donné lieu<br />

à aucune publication spécifique. <strong>Le</strong>s techniques que j’y ai mises en œuvre sont présentées<br />

dans le chapitre 8 de Tanguy et <strong>Hathout</strong> (2007).<br />

La première version de Verbaction, construite à partir des entrées de la nomenclature du<br />

TLF, comprenait 6 742 dérivés. Une deuxième version a été réalisée, avec l’aide de Sylwia<br />

Ozdowska, en complétant la première au moyen des entrées secondaires du TLF et par une<br />

collecte sur le Web (Tanguy et <strong>Hathout</strong> 2002a, 2003, <strong>Hathout</strong> et Tanguy 2002a, 2006). Elle<br />

contient 9 393 couples. Verbaction illustre le type de connaissances que doit, selon moi,<br />

décrire une base de données morphologiques.<br />

2. Dans la suite du mémoire, je noterai par x : y les instances des relations lexicales.<br />

3. Verbaction est diffusé sous licence Creative Common (w3.erss.univ-tlse2.fr/ressources/<br />

verbaction/).


16 Parcours scientifique<br />

La seconde ressource que j’ai réalisée est TLFindex, un lexique flexionnel construit<br />

à partir des entrées secondaires du TLF et destiné à compléter TLFnome. <strong>Le</strong>s schémas<br />

d’affixation utilisés pour le créer ont été appris à partir de TLFnome. L’approche adoptée<br />

est exemplariste. Elle consiste à préserver les régularités formelles de ce lexique initial.<br />

J’ai également construit en 2001, en collaboration avec Cécile Fabre et avec l’aide de<br />

Franck Floricic et Chrystèle <strong>Le</strong>sselingue, <strong>Le</strong>xeur, un lexique dérivationnel de noms en -eur.<br />

Ce lexique de 3 766 entrées décrit les relations entre ces noms et leurs bases éventuelles<br />

(<strong>Hathout</strong> et Fabre 2002). Il a été réalisé dans le but de caractériser en contexte les similarités<br />

des structures argumentales des noms déverbaux en -eur avec celles de leurs bases verbales.<br />

L’étude a fait apparaître que les verbes et les noms déverbaux partagent une partie très<br />

faible de leurs compléments et que la prise en compte de ce paramètre est cruciale si l’on<br />

veut décrire l’héritage des structures argumentales (Fabre et al. 2004).<br />

1.2.2 DéCor<br />

La morphologie informatique est devenue, à partir de 1997, mon thème de recherche<br />

principal. J’ai participé à la première école d’été de morphologie organisée à Nantes par<br />

Paul Boucher et au projet Franlex (base de données lexicales sur la morphologie dérivationnelle<br />

en français contemporain) proposé par Georgette Dal et Christian Jacquemin.<br />

Franlex a débouché sur le projet MorTAL (analyseur morphologique pour le traitement<br />

automatique de la langue) coordonné par Georgette Dal et dont les autres membres étaient<br />

Christian Jacquemin, Fiammetta Namer et moi-même (Dal et al. 1999, <strong>Hathout</strong> et al. 2002,<br />

Dal et al. 2004). J’ai également participé activement aux travaux du GDR 2220 (description<br />

et modélisation en morphologie) dirigé par Bernard Fradin.<br />

Dans le cadre de MorTAL, j’ai développé l’analyseur DéCor (dérivation pour les corpus)<br />

composé d’un ensemble de programmes permettant de découvrir les bases des mots<br />

construits par un affixe donné. L’identification de la base d’un dérivé se fait en deux temps :<br />

DéCor rassemble dans un premier temps les éléments de la famille morphologique du dérivé,<br />

c’est-à-dire l’ensemble des mots pouvant lui être connectés par des schémas de suffixation.<br />

Il sélectionne ensuite une base parmi ces parents en fonction (i) de la taille de leurs<br />

séries analogiques, i.e. du nombre de couples qui participent à l’analogie formelle définie<br />

par le schéma qui les connectent au dérivé, et (ii) de la taille du radical qu’ils partagent avec<br />

ce dernier. Cet analyseur a clairement fait apparaître la distance qui sépare l’approche que<br />

j’ai adoptée du modèle SILEX développé par Danielle Corbin (1987, 1991) et son équipe.<br />

La différence essentielle est que dans le modèle SILEX les dérivés sont construits par des<br />

règles de construction de mots (RCM) indépendantes les unes des autres. Par la suite, la<br />

construction de chaque mot particulier est également indépendante si l’on omet le principe<br />

de copie. <strong>Le</strong>s spécificités de chaque dérivé peuvent ainsi être réglées au moyen d’ensembles<br />

d’exceptions comme l’a implémenté Fiammetta Namer (2005) dans son analyseur DériF<br />

(dérivation en français ; sur cette question, voir aussi Dal et Namer (2005)). En revanche,<br />

dans une conception relationnelle, chaque dérivé entretient des relations avec l’ensemble<br />

des membres de sa famille et celle qui le lie à sa base n’est pas intrinsèquement différente<br />

des autres. Une autre différence vient du fait que DéCor n’implémente aucune connaissance<br />

linguistique particulière à l’exception de l’observation très générale que deux mots


Découvrir la structure morphologique du lexique 17<br />

qui partagent leur radical sont susceptibles d’appartenir à la même famille morphologique.<br />

<strong>Le</strong>s bases sont identifiées uniquement à partir des formes des mots du lexique. Or, leurs<br />

spécificités et celles des leurs dérivés ne peuvent être prises en compte qu’en utilisant des<br />

données plus riches qui contiennent des informations sémantiques, comme je l’ai fait par la<br />

suite dans <strong>Hathout</strong> (2001) et <strong>Hathout</strong> (<strong>2009</strong>a).<br />

J’ai au préalable examiné deux autres méthodes susceptibles de rapprocher les résultats<br />

de DéCor de ceux de DériF. La première consiste à utiliser des indices statistiques globaux<br />

comme le rapport entre la fréquence du dérivé et celle du candidat ou la mesure de<br />

l’information mutuelle des suffixes au sein des couples de mots (<strong>Hathout</strong> 2000). Ces mesures<br />

n’ont malheureusement pas permis d’améliorer significativement les performances de<br />

DéCor pour les suffixations comme -iser dont l’analyse diverge le plus de celle de DériF.<br />

Notons que le rapport entre la fréquence d’un dérivé et celle de sa base est aussi utilisé<br />

en psycholinguistique par Hay (2000) comme indice de décompositionnalité et d’analysabilité<br />

(parsability). <strong>Le</strong>s expériences que présente Hay font apparaître que les dérivés qui<br />

sont moins fréquents que leur bases tendent à être décomposés lors de l’accès lexical tandis<br />

que ceux qui sont plus fréquents tendent à être reconnus sans décomposition, comme des<br />

formes entières, par une stratégie d’appréhension globale (whole word route). Cet indice<br />

contraint également l’ordre des affixes dans les mots. Hay propose la généralisation suivante<br />

: les affixes facilement analysables ne doivent pas apparaître dans la portée d’affixes<br />

non analysables.<br />

La deuxième voie que j’ai explorée a été de redéfinir la tâche et d’utiliser un référentiel<br />

mieux adapté à DéCor que les analyses de DériF. Cette nouvelle tâche consiste à classer<br />

les mots du lexique en familles morphologiques au lieu d’associer les dérivés à leurs bases<br />

(<strong>Hathout</strong> 2005). Cette classification est une étape supplémentaire vers la découverte de la<br />

structure morphologique du lexique. Je signale que Gaussier (1999) propose une technique<br />

similaire de classification en familles morphologiques. Gaussier utilise ensuite ces familles<br />

pour identifier des morphèmes et des relations morphologiques.<br />

1.2.3 Analogies morphosynonymiques<br />

DéCor exploite les analogies graphémiques qui impliquent des dérivés suffixés. Il s’appuie<br />

sur l’hypothèse que le partage d’un radical commun suffisamment long par deux<br />

formes est fortement corrélé à un partage de propriétés sémantiques. <strong>Le</strong>s expériences menées<br />

montrent que cette corrélation est insuffisante et qu’il est nécessaire de disposer d’une<br />

caractérisation sémantique des mots. Pour répondre à cette difficulté, j’ai mis au point une<br />

méthode d’acquisition de relations morphologiques à partir de dictionnaires de synonymes<br />

(<strong>Hathout</strong> 2001, 2002, 2003, 2005). Il s’agit d’utiliser l’analogie pour croiser les familles morphologiques<br />

avec des ensembles de synonymes. La méthode consiste à utiliser dans un<br />

premier temps DéCor pour calculer l’ensemble des relations morphographiques qui s’établissent<br />

à l’intérieur des familles morphologiques. Seules les suffixations sont considérées.<br />

On croise ensuite ces relations familiales avec des relations de synonymie pour former des


18 Parcours scientifique<br />

quadruplets analogiques comme en (2) 4 . En (2a) par exemple, la décoration est à l’action<br />

de décorer ce que l’embellissement est à l’action d’embellir. De même, en (2b), une facétie<br />

est un acte ou une parole facétieuse de la même façon qu’une drôlerie est un acte ou une<br />

parole drôle.<br />

(2) a. décoration : décorer :: embellissement : embellir<br />

b. facétie : facétieux :: drôlerie : drôle<br />

Ce type de croisement s’avère très efficace pour former des couples de mots morphologiquement<br />

apparentés avec une précision de l’ordre de 95% pour le dictionnaire de synonymes<br />

de l’ATILF 5 et de 92% en anglais pour les synsets de WordNet (Miller et al. 1990,<br />

Fellbaum 1999). Il est également intéressant parce qu’il permet de relier des couples qui<br />

relèvent de séries dérivationnelles différentes comme en (2a) ou dans lesquels les relations<br />

morphologiques sont inversées comme en (2b). Dans ce quadruplet, facétie est la base de<br />

facétieux mais drôlerie est dérivé drôle.<br />

J’ai également effectué une comparaison de la sélectivité de différents types de quadruplets.<br />

On peut en effet typer les quadruplets morphosynonymiques de la manière suivante :<br />

– un quadruplet est dit « exact » (de type E) si c’est une analogie formelle comme (3) ;<br />

– un quadruplet qui n’est pas exact est dit « hétérogène » (de type H) comme (4).<br />

(3) déchirer : déchirure :: érafler : éraflure<br />

(4) déchirer : déchirure :: fendre : fente<br />

On peut ensuite projeter ce typage sur les couples qui composent les quadruplets :<br />

– un couple est dit « exact » (de type E) s’il fait partie d’un quadruplet exact ;<br />

– un couple qui n’est pas exact est dit « hétérogène » (de type H).<br />

<strong>Le</strong> typage des couples permet en retour de caractériser plus finement les quadruplets de<br />

type H. Trois sous-types peuvent être distingués :<br />

– un quadruplet est de sous-type H0 si ses deux couples sont de type E ;<br />

– un quadruplet est de sous-type H1 si l’un de ses couples est de type E et l’autre de<br />

type H ;<br />

– un quadruplet est de sous-type H2 si ses deux couples sont de type H .<br />

J’ai révisé manuellement des échantillons 200 couples qui apparaissent dans ces différents<br />

types de quadruplets et j’ai mis en évidence que la meilleure précision est obtenue pour les<br />

couples E issus de quadruplets H0 ou H1. <strong>Le</strong>s couples qui apparaissent dans des quadruplets<br />

E ont une précision inférieure. Cette observation, qui peut paraître contre-intuitive,<br />

s’explique par le fait que les couples E sont plus fortement contraints lorsque la caractérisation<br />

synonymique est distincte de celle qui est issue des séries morphologiques.<br />

4. Je rappelle qu’une analogie est une relation quaternaire qui s’établit entre les éléments d’un quadruplet<br />

(a, b, c, d) tel que a est à b ce que c est à d. Un quadruplet analogique (a, b, c, d) est noté a : b :: c : d. Par<br />

abus de langage, on utilise aussi le terme d’« analogie » pour désigner les quadruplets qui appartiennent à une<br />

relation analogique.<br />

5. Voir www.atilf.fr/synonymes/ pour une présentation de cette ressource. Une version nettoyée de<br />

ce dictionnaire est consultable sur le portail lexical du CNRTL (www.cnrtl.fr/synonymie/).


Découvrir la structure morphologique du lexique 19<br />

1.2.4 Proximité et paradigmes morphologiques<br />

Dans tous les travaux qui viennent d’être présentés, les relations morphologiques sont<br />

calculées au moyen de schémas d’affixation. Cette technique présente deux limites. La première<br />

est qu’elle nécessite un découpage « morceaulogique » des mots en un radical et un<br />

affixe, ce qui n’est pas totalement satisfaisant dans la perspective lexématique dans laquelle<br />

je me place. La seconde est qu’un bon nombre de relations lui échappent, notamment celles<br />

qui sont peu fréquentes dans les dictionnaires comme charivari : charivaresque et celles<br />

qui font intervenir des affixes non contigus comme dans fructueux : infructueusement. Il<br />

s’agit là d’un verrou pour l’ensemble des recherches en morphologie informatique. J’ai proposé<br />

dans <strong>Hathout</strong> (2008, <strong>2009</strong>a, b) une mesure de la proximité morphologique qui permet<br />

d’identifier des voisinages au sein desquels on peut retrouver des relations morphologiques<br />

sans décomposer les mots en un radical et un ou plusieurs affixes. Cette mesure, présentée<br />

en détail dans le chapitre 3, rend compte notamment de la gradabilité des relations morphologiques<br />

(Hay et Baayen 2005). Elle constitue un élément nouveau dans la description de<br />

la structure morphologique du lexique. Cette mesure est directement inspirée des travaux<br />

que j’ai réalisés en collaboration avec Bruno Gaume et Philippe Muller sur la désambiguïsation<br />

lexicale (Gaume et al. 2004a, b) et l’acquisition de synonymes à partir des définitions<br />

du TLFi (Muller et al. 2006). Nous avons utilisé pour ces deux tâches des graphes lexicaux<br />

explorés au moyen d’algorithmes de marches aléatoires. La ressource que j’ai utilisée dans<br />

l’expérience détaillée dans le chapitre 3 a aussi été préparée conjointement lors de cette<br />

collaboration.<br />

Cette mesure de proximité peut être complétée par l’explicitation d’autres éléments de<br />

la structure morphologique, à savoir (i) les familles et les séries flexionnelles, dérivationnelles,<br />

morphologiques et lexicales et (ii) les analogies qui permettent de les interconnecter.<br />

Ces paradigmes forment un maillage qui permet de redéfinir la tâche d’analyse morphologique.<br />

L’ensemble est décrit dans les chapitres 2 et 3. Dans le chapitre 2, proximité et paradigmes<br />

sont intégrés dans un embryon de théorie de la morphologie dérivationnelle afin<br />

de montrer comment ces éléments s’organisent et s’utilisent. Il s’agit d’un cadre basé sur<br />

l’usage, dans lequel performance et compétence ne sont pas séparées. Ce cadre me permet<br />

aussi d’articuler mes travaux en morphologie informatique et mes travaux de description<br />

morphologique.<br />

<strong>Le</strong>s recherches que je décris dans le chapitre 3 illustrent la possibilité de pratiquer la<br />

linguistique en construisant des modèles informatiques et donnent une idée de la façon<br />

dont ces derniers permettent de renouveler les points de vue sur les objets de la discipline.<br />

Pour reprendre une expression de Didier Bourigault, je dirais que je suis moi aussi « le linguiste<br />

de ce schéma » 6 , c’est-à-dire un linguiste à part entière qui s’appuie sur des objectifs<br />

et des méthodes de traitement automatique des langues pour comprendre et décrire des<br />

phénomènes linguistiques.<br />

6. Didier Bourigault nous a présenté lors des premières grammaires aérées de l’<strong>ERSS</strong>, un schéma sur la<br />

place des outils informatiques dans la recherche en linguistique.


20 Parcours scientifique<br />

1.3 La morphologie extensive<br />

Si, comme on vient de le voir, la linguistique informatique offre une voie de recherche<br />

fructueuse en morphologie, son efficacité dépend de façon cruciale de la bonne connaissance<br />

des objets et des données qu’elle traite. Cette connaissance ne peut être atteinte que<br />

par la description linguistique qui, comme l’a bien montré Marc Plénat (2000) (voir aussi<br />

Plénat et al. (2002)), doit être extensive. La morphologie extensive 7 est une pratique qui<br />

consiste à baser les descriptions sur la plus grande quantité possible d’exemples authentiques.<br />

Nous avons par exemple constitué un corpus de plus de 5 000 adjectifs en -able<br />

pour décrire les relations qui s’établissent entre ces derniers et leurs noms recteurs, soit<br />

plus du triple du nombre d’exemples considérés par les études antérieures de ce suffixe (<strong>Hathout</strong><br />

et al. 2003). L’approche extensive relève d’une conception de la linguistique comme<br />

science d’observation 8 . Elle découle de la constatation que la quantité de données disponibles<br />

détermine la résolution des observations qui peuvent être réalisées. Plus ces données<br />

sont nombreuses, plus le niveau de détail des observations est élevé. Or, les exemples déterminants<br />

pour l’analyse d’une construction particulière sont généralement les plus rares.<br />

Pour espérer découvrir un nombre suffisant de tels spécimens, il faut disposer d’un très<br />

gros corpus d’exemples. <strong>Le</strong> linguiste doit par conséquent consacrer une part importante de<br />

son activité de recherche à la collecte systématique de tous les spécimens qu’il peut trouver.<br />

<strong>Le</strong>ur compilation dans une base de données prend un temps considérable. Si la collecte proprement<br />

dite est rapide 9 , la validation des données collectées exige un travail philologique<br />

long et fastidieux (<strong>Hathout</strong> et al. <strong>2009</strong>a).<br />

1.3.1 Webaffix<br />

La rentabilité de la morphologie extensive est directement liée à la possibilité de collecter<br />

facilement de grandes quantités d’exemples. À l’heure actuelle, la seule ressource qui<br />

permette d’en rassembler en nombre suffisant est le Web. On peut naturellement aussi utiliser<br />

des bases textuelles, des archives de journaux ou des dictionnaires informatisés, mais<br />

ces corpus sont trop petits et leur contenu est trop normalisé pour permettre d’observer les<br />

constructions sporadiques qui nous intéressent. <strong>Le</strong> principal objectif de la collecte est en<br />

effet de trouver des exemples souvent rares voire exceptionnels capables de nous éclairer<br />

sur la manière dont s’organisent les dérivés d’une construction morphologique particulière.<br />

La façon la plus simple de trouver des exemples sur le Web consiste à soumettre manuellement<br />

des requêtes à un moteur de recherche comme Google, Yahoo ou plus récemment<br />

Bing. <strong>Le</strong> linguiste s’appuie alors sur son intuition pour prédire des instances de la construction<br />

à laquelle il s’intéresse. Cet exercice présente cependant deux limites. La première est<br />

le temps qu’il faut pour soumettre les milliers voire les dizaines de milliers de requêtes<br />

correspondant aux différentes formes sous lesquelles la construction peut se réaliser. Quel-<br />

7. Cette approche a été initiée et définie par Marc Plénat à qui l’on doit également son nom.<br />

8. Je remercie Marc Plénat de m’avoir fait découvrir cette formule bien connue de Gustave Guillaume.<br />

9. Cette affirmation doit cependant être nuancée pour un domaine connexe comme la phonologie. Dans<br />

un projet comme PFC par exemple (Durand et al. 2002, 2005), la collecte des données comporte un important<br />

travail d’enregistrement et de transcription.


La morphologie extensive 21<br />

qu’un qui s’intéresserait par exemple aux déverbaux en -eur doit soumettre pour chacun<br />

des 10 000 verbes du français 10 au moins une requête pour chacune des finales -eur, -eurs,<br />

-euse, -euses, -trice, -trices, soit environ 60 000 requêtes. La seconde limite est plus gênante<br />

que la première car elle est liée à la compétence linguistique et à l’imagination du chercheur.<br />

Nul n’est en effet capable d’imaginer spontanément la diversité et l’étendue des utilisations<br />

que les locuteurs font d’une construction donnée, même de celles qu’on considère a priori<br />

comme les plus simples comme les suffixations en -able ou en -ion.<br />

Pour répondre à ces difficultés, j’ai développé, en collaboration avec Ludovic Tanguy,<br />

Webaffix, une boîte à outils d’acquisition lexicale à partir du Web (<strong>Hathout</strong> et Tanguy<br />

2002a, b, 2006, Tanguy et <strong>Hathout</strong> 2002a, b, 2003). Webaffix permet de créer et de compléter<br />

des lexiques de façon semi-automatique par de nouvelles formes construites morphologiquement.<br />

Il offre deux fonctionnalités principales : la recherche de ces formes sur le Web<br />

et leur filtrage. Webaffix se compose de trois modules :<br />

1. un module de recherche par motif 11 qui permet de découvrir des formes qui correspondent<br />

à un patron donné comme par exemple la possession d’une finale particulière<br />

;<br />

2. un composant de prédiction morphologique permettant de calculer les formes des<br />

bases ou des dérivés ;<br />

3. un méta-moteur disposant de fonctionnalités dédiées à l’exploration lexicale du Web.<br />

Une partie des techniques implémentées dans le deuxième et le troisième module sont détaillées<br />

dans les chapitres 8 et 10 de Tanguy et <strong>Hathout</strong> (2007). D’autres systèmes comme<br />

WaliM développé par Namer (2003b, 2005), proposent des fonctionnalités similaires à celles<br />

de Webaffix. WaliM est destiné à la validation par le Web de formes construites morphologiquement.<br />

Webaffix propose deux modes de recherche de mots nouveaux. <strong>Le</strong> premier exploite un<br />

lexique existant ou une base de données morphologiques à partir desquels on génère une<br />

liste de formes candidates. On utilise ensuite le méta-moteur pour rechercher sur le Web<br />

des attestations de ces formes. <strong>Le</strong> second mode recourt au module de recherche par motif<br />

pour repérer sur le Web des formes qui correspondent à une configuration donnée, par<br />

exemple, toutes celles qui finissent par -able, sans aucune contrainte sur le radical. C’est de<br />

cette façon que nous avons découvert des formes comme wapisable 12 ou copolymérisable<br />

dont le radical ne fait partie ni de la nomenclature du TLF et ni de celle du GRLF (<strong>Hathout</strong><br />

et al. 2003). Ce mode de recherche présente un intérêt exceptionnel car il permet de<br />

découvrir des constructions imprévisibles comme la première ou qui sont difficilement prédictibles<br />

à partir des ressources disponibles comme la seconde. <strong>Le</strong> fait de ne plus pouvoir<br />

l’utiliser est pour nous un réel handicap.<br />

10. Ce chiffre correspond approximativement au nombre de verbes que l’on trouve dans le TLF et le GRLF<br />

(Grand Robert de la Langue Française).<br />

11. Ce module faisait appel au moteur AltaVista. Suite au rachat de AltaVista par Overture en 2003, ellemême<br />

rachetée par Yahoo en 2004, ce moteur ne permet plus l’utilisation des caractères jokers nécessaires à la<br />

recherche par motif.<br />

12. Cet adjectif est construit sur wapiser ‘modifier un site Web pour le rendre accessible via le protocole<br />

Wap’. Wap est un protocole d’accès à Internet à partir d’un téléphone portable ou d’un assistant personnel.


22 Parcours scientifique<br />

Même si le premier mode de recherche est toujours opérationnel, nous avons cherché<br />

d’autres moyens de collecter des dérivés « inattendus ». La première piste explorée a été<br />

Trifouillette 13 , un outil d’indexation lexicale du Web développé par Franck Sajous (Sajous<br />

et Tanguy 2006). Ce projet n’a malheureusement pas permis d’atteindre les résultats espérés<br />

du fait des difficultés liées à l’indexation du Web, et notamment aux pièges à robots (spider<br />

traps). Plus récemment, nous avons pu utiliser des pages Web collectées par un partenaire, la<br />

société Exalead 14 . <strong>Le</strong> corpus qu’elle a généreusement mis à notre disposition dans le cadre<br />

du projet Quaero contient 2,5 millions de pages et 3,3 milliards de mots. Une expérience<br />

a été réalisée en collaboration avec Franck Sajous et Ludovic Tanguy sur ces données dans<br />

le but d’acquérir de nouveaux noms déverbaux en -ion, -ment et -age. Nous avons ainsi pu<br />

estimer qu’en moyenne, moins d’une page sur 1 000 contient un dérivé valide inconnu (i.e.<br />

qui ne se trouve pas dans la version actuelle de Verbaction). <strong>Le</strong>s différentes étapes de cette<br />

quête de mots nouveaux destinés notamment aux morphologues extensifs sont présentées<br />

dans <strong>Hathout</strong> et al. (<strong>2009</strong>b).<br />

1.3.2 Contribution méthodologique et technique<br />

Ma contribution à l’approche extensive en morphologie a également été de nature méthodologique<br />

et technique. J’ai publié en collaboration deux articles de synthèse destinés à<br />

faire connaître cette approche (<strong>Hathout</strong> et al. 2008, <strong>2009</strong>a). Nous y présentons quelquesunes<br />

des avancées que l’on peut directement attribuer à l’utilisation de très grandes quantités<br />

d’exemples comme la mise en évidence de certains conditionnements complexes qui<br />

contrôlent la troncation des radicaux dans les dérivés en -esque (Plénat et Roché 2003) ou<br />

l’absence de toute contrainte catégorielle sur les bases d’adjectifs en -able (<strong>Hathout</strong> et al.<br />

2003). L’approche extensive est aussi présentée en détail par Durand (<strong>2009</strong>), dans une perspective<br />

épistémologique.<br />

L’un des enseignements des premières études de morphologie extensive qui ont été réalisées<br />

est que la qualité des exemples collectés ne constitue pas un problème car toutes les<br />

données utilisées font in fine l’objet d’une validation par le linguiste. Par ailleurs, la possibilité<br />

de réaliser facilement des travaux de morphologie dérivationnelle à partir de données<br />

provenant de sources faiblement contrôlées comme des pages Web distingue nettement<br />

cette discipline de la syntaxe et de la phonologie. Parmi les raisons qui sont à l’origine de<br />

cet avantage, on peut citer :<br />

(i) pour la phonologie, le fait que les corpus oraux sont rares et de taille très réduite en<br />

comparaison de corpus écrits et des textes disponibles sur le Web. <strong>Le</strong> développement<br />

des techniques de reconnaissance de la parole pourrait, dans le futur, réduire cette<br />

avance ;<br />

(ii) pour la syntaxe, le fait que l’unité d’indexation privilégiée des textes est le mot graphique.<br />

L’adoption généralisée de l’approche extensive en morphologie est freinée par le fait que<br />

la collecte des exemples ne peut pas être réalisée sans un minimum d’outils et de compé-<br />

13. w3.erss.univ-tlse2.fr/trifouillette/<br />

14. www.exalead.com


La morphologie extensive 23<br />

tences en linguistique informatique. Pour aider à lever ce verrou, j’ai publié, en collaboration<br />

avec Ludovic Tanguy, Perl pour les linguistes, un guide pratique à l’usage des linguistes<br />

qui veulent exploiter des données langagières (Tanguy et <strong>Hathout</strong> 2007). Ce livre fait suite<br />

à l’école thématique sur « la constitution et l’analyse de corpus et de lexiques pour la recherche<br />

en morphologie » que j’ai organisée en juillet 2003 en collaboration avec Fiammetta<br />

Namer dans le cadre du GDR de morphologie. L’ouvrage est à la fois un manuel permettant<br />

d’acquérir des connaissances élémentaires d’informatique et de programmation en Perl et<br />

un livre de « recettes » qui propose des programmes prêts à l’emploi que l’on peut utiliser<br />

tels quels ou adapter pour des tâches particulières. Ce livre dispose d’un site Web d’accompagnement<br />

qui contient un environnement de travail, l’ensemble des programmes et des<br />

exemples de données (corpus et lexiques) qu’ils permettent de manipuler 15 .<br />

1.3.3 Description morphologique<br />

J’ai également réalisé la description extensive de deux affixations. La première, menée<br />

en collaboration avec Marc Plénat et Ludovic Tanguy, a porté sur la sémantique de la suffixation<br />

en -able et plus précisément sur la relation qui s’établit entre l’adjectif construit et<br />

son nom recteur (<strong>Hathout</strong> et al. 2003). Nous y avons montré que cette relation ne peut pas<br />

être caractérisée en termes de transformation syntaxique à partir de l’équivalent propositionnel<br />

du syntagme nominal, par exemple de (5b) pour (5a). On trouve en effet un grand<br />

nombre de noms recteurs correspondant à des sujets (6) et à des compléments indirects<br />

introduits par les prépositions à (7a), de (7b), sur (7c), pour (7d), etc.<br />

(5) a. un poisson pêchable<br />

b. Max pêche un poisson.<br />

(6) <strong>Le</strong> terme de proche s’entend par les personnes non adhérables à l’AGPM et à l’AGPM<br />

Familles et qui bénéficient du parrainage préalable d’un adhérent de l’AGPM ou de<br />

l’AGPM Familles nominativement identifié www.agpm.fr/pdf/groupe/statuts_agpm_<br />

familles.pdf<br />

(7) a. <strong>Le</strong> premier PC « parlable ». On pourra maintenant causer à son ordinateur. www2.<br />

canoe.com/techno/nouvelles/archives/1996/09/1996 0926-162324.html<br />

b. Soit tout risque de devenir sacré et impraticable. Soit tout devient profane, usable<br />

et abusable. rad2000.free.fr/glosds01.htm<br />

c. À quelques sandwiches près, l’image qu’il offre n’est pas si éloignée de la réalité,<br />

à tout le moins de la réalité « enquêtable ». www.homme-moderne.org/plpl/l0207/<br />

41.html<br />

d. C’est pourquoi la démarche islamiste "est théoriquement plaidable". www.<br />

archipress.org/ts66/forum.htm<br />

Il n’est pas davantage possible de décrire la suffixation en -able en termes de contraintes sur<br />

les rôles thématiques. On observe en effet que les noms recteurs de ces adjectifs peuvent<br />

recevoir l’ensemble des rôles présents dans la structure argumentale du verbe de base, à<br />

15. perl.linguistes.free.fr.


24 Parcours scientifique<br />

l’exception d’agent. Nous avons aussi mis au jour un grand nombre d’attestations dans lesquelles<br />

le noms recteur correspond à un circonstant de lieu (8a), de temps (8b), de cause<br />

(8c), etc. et non à un argument du verbe base. Plus intéressant encore est le fait que certains<br />

noms recteurs ne correspondent ni à des arguments, ni à des circonstants mais à des compléments<br />

de nom d’un argument ou d’un circonstant. En (9) par exemple, consistance est<br />

complément de béton, l’objet du verbe verser.<br />

(8) a. On met 10mn à monter la tente, 50mn à enfoncer les sardines... Jamais vu un terrain<br />

de camping aussi peu ‘sardinable’. perso.club-internet.fr/belyne/corse%<br />

20<strong>II</strong>I.htm<br />

b. Ici, la période navigable, est de trois mois plus longue que dans la rive nord de la<br />

méditerranée. www.cap-tunisie.com/HTML/port.htm<br />

c. pis finalement, c’est plus une situation pleurable quand j’y pense que quand ça<br />

arrive. 66.46.177.46/zerotom/archives/005804.php<br />

(9) La versatilité de Sikadur 42 Grout Pak Multi-Flo permet un ratio agrégat/résine<br />

de 6:1 pour une consistance versable, 5:1 pour une consistance<br />

autonivelante. 207.61.100.79/fr/constr/cat/Division3/03600_Coulis/<br />

CoulisABaseDeResineReactive/Sikadur42GroutPakMulti-Flo_F_03600.pdf<br />

Nous avons établi que la sémantique du suffixe -able est relativement abstraite, ce qui induit<br />

une sous-spécification sémantique des adjectifs construits et une grande multiplicité<br />

dans leurs interprétations. Un adjectif comme pêchable peut ainsi se trouver dans une dizaine<br />

de relations sémantiques différentes avec ses noms recteurs (<strong>Hathout</strong> et al. 2003:76).<br />

Enfin, nous avons observé qu’il n’existe pas de contrainte catégorielle sur les bases et avons<br />

identifié cinq nouvelles séries d’adjectifs dénominaux en -able en plus des quatre habituellement<br />

reconnues (Gawelko 1975, Plénat 1988).<br />

J’envisage de reprendre cette étude de la suffixation en -able afin d’apporter une réponse<br />

à la question, toujours en suspens, de l’impossibilité pour le nom recteur d’un adjectif en<br />

-able d’être un agent. Cette réponse pourrait être exprimée en termes de la dynamique des<br />

forces de Talmy (2000) présentée en section 4.3.1. Comme pour les adjectifs préfixés en<br />

anti- qui ont une interprétation adversative (voir section 4.3.5), l’analyse des dérivés en -<br />

able ferait intervenir un agent intentionnel qui n’est pas nommé et qui souhaite accomplir<br />

l’action évoquée par la base de l’adjectif. Par exemple, dans le cas de (5a), cette action est<br />

celle de pêcher ce poisson. Cet agent exerce ainsi une force antagoniste qui tend à la réalisation<br />

de cette action. L’utilisation d’un adjectif en -able présente l’entité désignée par le<br />

nom recteur, par exemple le poisson en (5a), comme exerçant une force agoniste visant à<br />

faire échouer cette action. Dans l’exemple (5a), le poisson exerce une force qui tend à empêcher<br />

l’agent de le pêcher. En utilisant un adjectif en -able, on indique en plus que la force<br />

exercée par l’agent est supérieure à celle exercée par l’entité désignée par le nom recteur,<br />

par exemple en (5a) que le poisson ne parviendra pas à empêcher le pêcheur de l’attraper.<br />

L’impossibilité d’avoir un agent comme nom recteur découle alors simplement du fait que<br />

ce dernier ne peut pas en même temps vouloir la réussite de l’action évoquée par la base et<br />

exercer une force qui vise à l’empêcher 16 . Notons que cette situation est différente de celle<br />

16. Je remercie Michel Aurnague de m’avoir suggéré cette analyse.


La morphologie extensive 25<br />

que l’on trouve dans un exemple comme (10) analysé par Talmy (2000:431-433) où l’on a<br />

une opposition psychologique entre deux parties de soi, le désir de répondre qui exerce une<br />

force agoniste et l’intériorisation des normes sociales qui exerce une force antagoniste.<br />

(10) Il s’est abstenu de répondre.<br />

La deuxième description morphologique extensive que j’ai réalisée porte sur la préfixation<br />

en anti-. Elle fait l’objet du chapitre 4. Elle reprend une étude menée en collaboration<br />

avec Marc Plénat et Olena <strong>Le</strong>vkovych que nous avons présentée aux 4 es Décembrettes (Plénat<br />

et al. 2004a).<br />

1.3.4 Productivité morphologique<br />

La morphologie extensive se distingue nettement de ce que l’on pourrait considérer<br />

comme une morphologie de corpus à laquelle on pourrait rattacher par exemple les travaux<br />

sur la productivité morphologique réalisés au sein de l’action « bases de données constructionnelles<br />

et productivité des procédés morphologiques en corpus » du GDR de morphologie.<br />

J’ai réalisé dans ce cadre, en collaboration avec Bernard Fradin et Fanny Meunier,<br />

une étude de la suffixation en -et et en -ette à partir d’un corpus composé de 5 années d’archives<br />

du journal Libération (Fradin et al. 2003b). Une base de données de 1 145 noms a<br />

été constituée. Notons que ce chiffre est très faible en comparaison du nombre d’exemples<br />

qu’une étude extensive pourrait rassembler. Plénat (2005) a par exemple rassemblé un corpus<br />

de 550 noms déverbaux en -ette lorsque le corpus de Fradin et al. (2003b) n’en contient<br />

qu’une trentaine, soit un rapport de l’ordre de 20 pour 1. <strong>Le</strong>s 1 145 noms ont été analysés<br />

et répartis en 18 sous-séries sémantico-référentielles 17 en fonction de deux critères : la<br />

dénotation du dérivé et la relation qu’il entretient avec sa base. Une comparaison de la productivité<br />

de la suffixation en -et et -ette dans ces différentes sous-séries a été réalisée. Nous<br />

avons aussi comparé la productivité de la suffixation en -et à celle de la suffixation en -ette.<br />

<strong>Le</strong>s conclusions de cette étude sont qu’il existe une grande variabilité de la productivité<br />

de -et et -ette en fonction des sous-séries et que -ette est deux fois plus productif que -et.<br />

Ce travail a été poursuivi par une étude psycholinguistique qui a confirmé l’existence de<br />

plusieurs patrons dérivationnels (Meunier et al. 2007).<br />

J’ai également participé aux travaux de l’action « aspects de la productivité morphologique<br />

» du GDR de morphologie qui visent à créer une cartographie de la productivité<br />

morphologique d’un ensemble d’affixes du français, notamment -able, -oir, -ion, -iser, -<br />

ifier, -ité, -iser, -if, -ique (Grabar et al. 2006a, b). Dans le cadre de cette collaboration, nous<br />

avons mis au point une grille d’analyse commune qui distingue différentes catégories de<br />

lexèmes suffixés. La productivité morphologique de ces affixes a été calculée dans différents<br />

corpus d’articles du journal <strong>Le</strong> Monde.<br />

<strong>Le</strong>s mesures statistiques définies par Baayen (1992) pour estimer la productivité d’un<br />

procédé morphologique doivent nécessairement être calculées dans des corpus de taille réduite<br />

car il est nécessaire d’y relever tous les mots construits par le procédé. En revanche,<br />

ce type de morphologie de corpus n’est pas adaptée à la description des procédés morphologiques<br />

du fait de leur forte plasticité sémantique et de la dispersion des créations lexicales.<br />

17. J’emprunte ce terme à Roché (<strong>2009</strong>, en préparation).


26 Parcours scientifique<br />

1.3.5 Diffusion et réutilisation des données<br />

La morphologie extensive augmente également l’urgence d’un problème pour lequel il<br />

n’existe pas encore de réponse satisfaisante, ni pour le français ni pour aucune autre langue :<br />

la conservation, la réutilisation et la complétion des corpus d’exemples. La collecte et le<br />

traitement des données absorbe en effet une partie importante de l’activité de recherche<br />

des morphologues extensifs, mais l’étendue de ce travail est difficile à faire reconnaître<br />

pleinement et à rentabiliser. Elle n’apparaît en effet qu’en filigrane dans les publications que<br />

les données extensives permettent de rédiger, à travers les analyses d’une portion infime des<br />

exemples rassemblés. Or, relativement à l’effort réalisé, le travail supplémentaire qui serait<br />

nécessaire pour préserver ces collections et permettre leur diffusion éventuelle est faible.<br />

La difficulté est de deux ordres : la mise en forme des données et leur mode de diffusion.<br />

Elle pourrait être résolue s’il existait un outil simple et facile à utiliser destiné à la description<br />

et l’exploitation des corpus d’exemples en morphologie. Cet outil pourrait prendre la<br />

forme d’un service Web similaire aux applications Google Docs 18 permettant de décrire<br />

les données de façon souple et cumulative. Il serait utilisé par les morphologues dès le début<br />

de leur travail de collecte et de vérification. Pour faciliter son adoption, un tel système<br />

pourrait fournir à l’utilisateur une partie des exemples dont il a besoin, notamment ceux<br />

qui figurent dans les dictionnaires.<br />

J’envisage de travailler, en collaboration avec Gilles Boyé, sur un outil de ce genre.<br />

De type Wiki, il disposera d’un canevas formé par les familles et les séries présentées en<br />

section 2.6. Ce canevas pourra être construit en utilisant les techniques décrites dans le<br />

chapitre 3. Cette proposition se distingue de la plupart des projets antérieurs de création<br />

de bases d’exemples morphologiques souvent conçus dans le but de fusionner des bases<br />

existantes. Il faut au contraire, selon nous, créer un système destiné aux études nouvelles.<br />

<strong>Le</strong>s collections d’exemples existantes pourront y être ultérieurement intégrées, si cet outil<br />

s’impose comme une base fiable et pratique.<br />

1.4 Conclusion<br />

<strong>Le</strong>s chantiers présentés dans la suite du mémoire sont les prolongements naturels de<br />

mes travaux antérieurs. <strong>Le</strong> premier, qui est l’objet du chapitre 3, est la poursuite de la caractérisation<br />

de la structure morphologique du lexique dans le cadre de la création d’une<br />

base de données morphologiques à large couverture. <strong>Le</strong> second chantier, illustré par le<br />

chapitre 4, est la description morphologique dans un cadre extensif et DUMALien (Roché<br />

et al. 2010). Il m’est également apparu nécessaire de replacer mes recherches dans un<br />

contexte théorique général dont quelques-uns des éléments sont présentés dans le chapitre<br />

2.<br />

18. docs.google.com.


CHAPITRE 2<br />

Un modèle théorique de la<br />

morphologie lexicale<br />

2.1 Introduction<br />

<strong>Le</strong> développement d’un modèle théorique de la morphologie lexicale n’est pas un objectif<br />

premier dans mes recherches, mais une réponse à un double besoin. <strong>Le</strong> premier est<br />

de disposer d’un cadre théorique et d’un ensemble d’outils adaptés aux analyses morphologiques<br />

dérivationnelles (chapitre 4). <strong>Le</strong> second est d’inscrire le paradigme d’analyse morphologique<br />

automatique que je propose (chapitre 3) dans un cadre théorique permettant<br />

d’identifier les objectifs à atteindre. Il ne s’agit donc pas ici de décrire un modèle complet<br />

permettant de rendre compte de tous les phénomènes de la morphologie dérivationnelle,<br />

mais plutôt de proposer un cadre général dont certains aspects font l’objet d’une élaboration<br />

plus détaillée. <strong>Le</strong>ur mise au point générale ayant été réalisée en vue de l’analyse de la<br />

préfixation en anti-, j’utiliserai principalement cette dérivation pour les illustrer.<br />

Dans un modèle par règles comme celui de Corbin (1987, 1991), le dispositif est simple :<br />

on dispose d’un ensemble d’inputs qui permettent de produire des outputs au moyen de<br />

règles de construction de mots (RCM). Mais quel est la nature d’un tel dispositif dans un<br />

modèle lexématique sans RCM où il n’y a que des outputs et où l’input est la totalité du<br />

lexique ? Un début de réponse consiste à mettre en évidence l’existence de paradigmes morphologiques<br />

comme le font par exemple Blevins (2003, 2006) ou Booij (2007, 2008). Ces<br />

auteurs s’attachent à montrer les avantages qu’apportent ces paradigmes dans l’analyse des<br />

phénomènes morphologiques mais ne disent rien du cadre dans lequel ils s’insèrent. Une<br />

exception notable à cette tendance est Roché (en préparation). Reconnaître le rôle des paradigmes<br />

en morphologie est une première étape importante, mais quel est le statut de ces<br />

paradigmes ? Comment sont-ils utilisés ? Dans quel système s’insèrent-ils ? Comment passer<br />

d’un système capable de découvrir des paradigmes à un système capable de prédire des<br />

formes nouvelles et de tenir compte des variations comme les allomorphies et les supplétions<br />

? C’est à ces questions que ce chapitre tente d’apporter quelques éléments de réponse.<br />

27


28 Un modèle théorique de la morphologie lexicale<br />

2.2 Principes généraux<br />

1. <strong>Le</strong> cadre théorique que je propose peut être vu comme un passage d’une morphologie<br />

analytique à une morphologie topologique centrée sur les relations qui existent entre les<br />

mots et sur les distances qu’elles induisent, la caractérisation précise de chaque instance<br />

de ces relations devenant secondaire. Ce cadre est basé sur l’usage. Il peut être rapproché<br />

des modèles proposés par Jackendoff (1975), Bybee (1985, 1988, 1995), Neuvel et Singh<br />

(2001), Burzio (2002), Gaume (2004) ou Pirrelli (2007).<br />

2. Je considère qu’il existe une distinction claire entre morphologie et lexique :<br />

– la morphologie est un ensemble de moyens à la disposition des locuteurs qui permettent<br />

d’exprimer des sens à l’aide de mots 1 (en production 2 ) et de retrouver des<br />

sens à partir de mots (en compréhension) ;<br />

– le lexique est un espace dédié à la mémorisation des mots, des lexèmes et des relations<br />

qui s’établissent entre eux.<br />

Morphologie et lexique sont néanmoins intimement liés : les mots construits par la morphologie<br />

3 sont normalement destinés à entrer dans le lexique ; le lexique fournit à la morphologie<br />

l’essentiel des informations dont elle a besoin pour caractériser le sens et la forme<br />

des mots.<br />

3. Je considère qu’un mot est caractérisé par son sens, sa forme et sa catégorie :<br />

– Un mot est dérivé si son sens est construit, c’est-à-dire s’il est défini relationnellement<br />

(Corbin et Temple 1994).<br />

– La forme d’un mot est une collection d’indices qui signalent un ensemble de relations<br />

entre ce dernier et d’autres mots du lexique.<br />

– La catégorie d’un mot est un ensemble de traits morphosyntaxiques qui dépendent<br />

du contexte dans lequel le mot est utilisé.<br />

4. Je considère que la détermination de la forme des mots (en production) ou de leur sens<br />

(en compréhension) est réalisée individuellement pour chaque occurrence. La morphologie<br />

opère ainsi au même niveau que la syntaxe, à savoir celui de la production langagière et de<br />

son interprétation. Elle n’opère pas au niveau du lexique mais a accès à l’ensemble des objets<br />

lexicaux permettant de faire référence, et notamment aux formes fléchies, aux locutions, aux<br />

expressions usuelles, etc.<br />

5. Je considère qu’il n’existe qu’une morphologie qui a en charge à la fois la flexion et<br />

1. J’utilise le terme de « mot » pour désigner les mots-occurrences qui apparaissent dans les productions<br />

langagières.<br />

2. <strong>Le</strong> terme de « production » (resp. « compréhension ») a ici le sens de production de mots dans le cadre<br />

de la production d’énoncés (resp. compréhension des mots dans le cadre de la compréhension des énoncés).<br />

La production des mots concerne à la fois les mots déjà mémorisés dans le lexique et ceux qui ne le sont<br />

pas encore. J’utiliserai le terme de construction pour parler de la formation de mots morphologiquement complexes.<br />

Je signale que cette formation ne présuppose pas que le mot construit est nouveau, i.e. absent du lexique<br />

mémorisé.<br />

3. Il s’agit ici d’un abus de langage. Ce sont les locuteurs et non la morphologie qui construisent les mots.<br />

L’expression « les mots construits par la morphologie » doit donc être comprise comme un raccourci de « les<br />

mots construits par les locuteurs en utilisant des moyens morphologiques ».


Un modèle à quatre niveaux 29<br />

la dérivation. Je considère aussi que la morphologie est sollicitée chaque fois qu’un mot est<br />

utilisé, y compris lorsque ce dernier est déjà mémorisé dans le lexique.<br />

6. Je considère que la forme d’un mot construit est principalement déterminée par le<br />

lexique existant et ses structures et par un ensemble de contraintes concurrentes, en suivant<br />

(Plénat 2000). Ces contraintes n’entrent cependant pas dans le cadre de la théorie de<br />

l’optimalité (Prince et Smolensky 1993, McCarthy et Prince 1993) car (i) elles ne sont pas<br />

hiérarchisées, et (ii) elles sont gradables. Par ailleurs, je ne m’intéresse pas à leur universalité.<br />

7. <strong>Le</strong> modèle que je propose est non compositionnel : les dimensions sémantique et formelle<br />

des mots y donnent lieu à des traitements indépendants. <strong>Le</strong>s contraintes qui déterminent<br />

la forme ne portent pas sur le sens, et, réciproquement, les mécanismes qui déterminent<br />

le sens ne prennent pas en compte la forme. L’articulation entre forme et sens se<br />

situe uniquement au niveau du lexique.<br />

2.3 Un modèle à quatre niveaux<br />

La morphologie opère sur quatre niveaux de représentation : un niveau sémantique, un<br />

niveau formel, un niveau catégoriel et un niveau lexical qui supporte l’organisation morphologique.<br />

<strong>Le</strong> niveau lexical est conçu comme un espace discret composé de positions.<br />

Ces positions remplissent dans le modèle une fonction similaire à celle des lexèmes ou des<br />

unités lexicales. Une position est une cellule dans laquelle sont mémorisés des mots décrits<br />

entre autres par un sens, une forme, une catégorie et une fréquence. <strong>Le</strong>s mots qui partagent<br />

une même position sont ordonnés en fonction de leur fréquence. <strong>Le</strong>s plus fréquents sont les<br />

plus accessibles. Celui qui est premier définit les valeurs par défaut de la position : son sens<br />

(resp. sa forme et sa catégorie) par défaut. Par ailleurs, les mots contenus dans les positions<br />

sont connectés les uns aux autres par des relations sémantiques, formelles et catégorielles<br />

(Bybee 1985, 1988, 1995). Chaque occurrence de chaque mot est donc mémorisée avec l’ensemble<br />

des relations qui la caractérisent. <strong>Le</strong> niveau lexical mémorise aussi ces relations et<br />

leurs fréquences. Ces relations varient selon deux paramètres : (i) leurs forces que l’on pourrait<br />

estimer par le nombre moyen de traits partagés par les mots qu’elles connectent ; (ii)<br />

leurs fréquences que l’on pourrait estimer par le nombre de couples de mots entre lesquels<br />

elles s’établissent. <strong>Le</strong>s relations entre les mots induisent des relations entre les positions qui<br />

les contiennent. Ces relations varient selon les mêmes paramètres de force et de fréquence.<br />

Pour prendre une image, le niveau lexical est une sorte de filet multidimensionnel dont les<br />

nœuds sont plus ou moins gros selon qu’ils sont plus ou moins fréquents et dont les fils<br />

seraient élastiques. Ces fils seraient constitués de brins plus ou moins nombreux en fonction<br />

de la fréquence de la relation et plus ou moins courts en fonction du nombre de traits<br />

partagés. Certains segments seraient ainsi plus rigides (i.e. plus gros et plus courts) que<br />

d’autres. Par ailleurs, ces relations s’organisent en paradigmes, c’est-à-dire que les relations<br />

de même type s’orientent toutes de la même manière. Elles renforcent ainsi localement la<br />

rigidité du lexique dans cette direction, et par suite la leur (i.e. leur propre rigidité).<br />

L’une des caractéristiques du modèle proposé est que les niveaux sémantique, formel et


30 Un modèle théorique de la morphologie lexicale<br />

catégoriel ne sont pas directement en correspondance. Ils le sont seulement par l’intermédiaire<br />

du niveau lexical. Ces correspondances peuvent être représentées schématiquement<br />

comme en figure 2.1. L’objectif de la morphologie est de trouver les meilleures correspondances<br />

possibles entre ces quatre niveaux. Pour ce faire, les correspondances sont soumises<br />

à un système de contraintes permettant de sélectionner celles qui offrent la coïncidence<br />

optimale entre sens, positions lexicales, formes et catégories. <strong>Le</strong> niveau lexical est donc<br />

l’équivalent du niveau morphomique proposé par (Aronoff 1994:25).<br />

sémantique sens visé<br />

↕<br />

lexique position lexicale ↔ catégorie morphosyntaxe<br />

↕<br />

réalisation forme réalisée<br />

Figure 2.1 – Un modèle à quatre niveaux. <strong>Le</strong> niveau sémantique est composé de sens,<br />

le niveau formel de formes, le niveau catégoriel de traits morphosyntaxiques et le niveau<br />

lexical de positions lexicales. Chaque niveau possède sa propre structure. <strong>Le</strong>s structures des<br />

quatre niveaux sont relationnelles. <strong>Le</strong>s relations à chaque niveau définissent une mesure de<br />

proximité. La morphologie met en correspondance les objets qui composent les quatre<br />

niveaux en préservant au mieux les proximités qui existent au sein de chaque niveau. <strong>Le</strong>s<br />

positions lexicales servent d’interface entre les formes des mots (formes réalisées), leurs<br />

propriétés morphosyntaxiques (catégories) et les sens qui leur sont attribués (sens visés).<br />

La morphologie est utilisée en production et en reconnaissance. Dans le premier cas,<br />

elle est conçue comme un prestataire de service dont le rôle est d’exprimer un sens à l’aide<br />

d’un mot, lorsqu’il existe un moyen d’y parvenir. Pour être exprimé, ce sens, que j’appellerai<br />

sens visé, doit être apparié à une position p dans le lexique qui peut être soit occupée,<br />

soit encore vide, mais cette distinction n’est pas essentielle. La position p ne peut pas être<br />

située n’importe où dans l’espace lexical. Seuls les emplacements qui peuvent entrer dans<br />

les structures paradigmatiques existantes sont autorisés pour les sens construits. En conséquence,<br />

le lexique est un espace discret, ce qui distingue ce modèle de celui de Victorri<br />

(1994), Ploux et Victorri (1998). La morphologie détermine ensuite la forme la plus appropriée<br />

à l’identification de p, tout en tenant compte du contexte particulier dans lequel le<br />

mot est utilisé et notamment des propriétés morphosyntaxiques qu’il détermine. Lorsque<br />

p contient des mots mémorisés, elle exerce une attraction qui favorise la réutilisation de<br />

l’une des formes de ces mots (Burzio 2002). Si p est vide, la morphologie a le choix entre<br />

l’utilisation d’une forme existante, i.e. de la forme d’un mot mémorisé qui occupe une position<br />

proche de p, ou la création d’une forme nouvelle dont les propriétés définissent les<br />

mêmes proximités avec les formes des mots des positions proches de p que celles de ces<br />

positions avec p. En reconnaissance, les correspondances sont établies en sens inverse. La<br />

première étape consiste à apparier la forme réalisée et les propriétés morphosyntaxiques<br />

de l’occurrence avec une position p dans le lexique. Cette position peut être vide ou déjà


Un modèle à quatre niveaux 31<br />

occupée. Dans un second temps, p est mise en correspondance avec un sens visé en tenant<br />

compte des autres éléments du contexte d’utilisation du mot. Ce sens peut être celui d’un<br />

mot mémorisé dans p si p en contient, celui d’un mot qui se trouve dans une position voisine,<br />

ou un sens nouveau dont les propriétés définissent les mêmes proximités avec les sens<br />

des mots des positions proches de p que celles de ces positions avec p. La morphologie est<br />

donc aussi un prestataire de service spécialisé dans l’identification du sens exprimé par les<br />

mots.<br />

L’architecture illustrée par la figure 2.1 s’inspire du modèle à deux niveaux de Koskiennemi<br />

(1983) notamment par l’existence de correspondances entre les niveaux et par le fait<br />

que ces dernières sont contrôlées par des contraintes. <strong>Le</strong> modèle à deux niveaux est un cadre<br />

formel et informatique dans lequel la morphologie opère sur deux types de représentations,<br />

formelles et lexicales. <strong>Le</strong>s représentations formelles décrivent les réalisations qui peuvent<br />

être décrites par des graphies (par exemple, dérivation) ou par des transcriptions phonétiques.<br />

<strong>Le</strong>s représentations lexicales sont des concaténations de morphèmes qui satisfont à<br />

des contraintes morphotactiques élémentaires (par exemple dériv+ion). <strong>Le</strong>s deux types de<br />

représentations sont composés de symboles, formels dans un cas et lexicaux dans l’autre.<br />

<strong>Le</strong>s symboles qui composent les représentations formelles et lexicales de chaque mot sont<br />

en correspondance un à un. Si nécessaire, des symboles vides 0 sont introduits (par exemple,<br />

dérivat0ion : dériv00+ion où a, t et + sont en correspondance avec des symboles vides).<br />

<strong>Le</strong>s correspondances entre les deux représentations sont contrôlées par des règles à deux<br />

niveaux destinées principalement à rendre compte des allomorphies. Ces règles remplissent<br />

un rôle similaire aux contraintes présentées dans les sections 2.8 à 2.11. <strong>Le</strong> modèle que je<br />

propose s’éloigne néanmoins de celui de Koskiennemi sur plusieurs points : (i) le cadre<br />

général est purement lexématique ; (ii) le niveau sémantique est distinct du niveau lexical ;<br />

(iii) le modèle comporte une mesure de proximité entre les mots ; (iv) les correspondances<br />

préservent au maximum la structure topologique qui existe dans chacun des quatre niveaux.<br />

<strong>Le</strong> modèle à quatre niveaux peut également être rapproché du modèle connexionniste<br />

de Seidenberg et Gonnerman (2000) et de Plaut et Gonnerman (2000) qui comporte lui<br />

aussi un niveau intermédiaire « caché » destiné à représenter les régularités statistiques qui<br />

existent entre trois niveaux d’entrée-sortie : un niveau sémantique, un niveau phonologique<br />

et un niveau orthographique. Ces quatre niveaux sont implémentés sous forme de réseaux<br />

de neurones. <strong>Le</strong>s unités du niveau caché sont connectées à celles des trois autres. En revanche,<br />

il n’y a pas de connexions directes entre les unités des trois niveaux d’entrée-sortie.<br />

L’idée d’établir des correspondances entre un espace de formes caractérisées par leurs<br />

propriétés phonologiques et un autre niveau de représentation, qui en plus préservent les<br />

distances entre les mots est à la base du modèle développé par Vito Pirrelli et ses collaborateurs<br />

(Pirrelli et al. 2004, Pirrelli et Herreros 2007, Pirrelli 2007, Calderone et al.<br />

2007). Dans ce modèle, la morphologie flexionnelle de langues comme l’italien, l’anglais ou<br />

l’arabe est représentée au moyen de cartes auto-organisatrices (Self Organizing Maps) de<br />

Kohonen (1995). Ces cartes sont des algorithmes neuronaux qui permettent de réaliser une<br />

projection non linéaire d’un espace de grande dimension sur un espace bidimensionnel afin<br />

de faire apparaître les proximités topologiques entre les données et les zones denses (i.e. les<br />

agrégats d’éléments).


32 Un modèle théorique de la morphologie lexicale<br />

L’existence d’un niveau lexical intermédiaire entre catégorie, forme et sens apporte au<br />

modèle un degré de liberté qui lui permet de rendre compte de la plasticité catégorielle et<br />

sémantique et de la polyvalence des formes. La plasticité catégorielle repose sur la continuité<br />

qui existe entre de nombreuses catégories comme les noms et les adjectifs (comme on<br />

peut le voir par exemple dans une ferme modèle) ou les participes verbaux et les adjectifs<br />

(par exemple dans un animal blessé et un animal qui a été blessé). La plasticité sémantique<br />

des mots peut par exemple être illustrée par les cinq sens de farfouillette (1) listés par Plénat<br />

(2005) ou par ceux de russe (2) présentés dans Roché (2008). Réciproquement, ce degré de<br />

liberté permet de rendre compte de l’utilisation d’une même forme pour exprimer des sens<br />

différents comme anti-Sarkozy dans les exemples (3) et (4). Anti-Sarkozy est habituellement<br />

utilisé pour désigner une opposition à la politique ou aux idées de Nicolas Sarkozy<br />

(3). Mais dans un contexte comme (4), ce mot signifie « qui est tout le contraire d’un Sarkozy<br />

».<br />

(1) a. ‘action de farfouiller’ ;<br />

b. ‘personne qui farfouille’ ;<br />

c. ‘instrument pour farfouiller’ ;<br />

d. ‘endroit où l’on farfouille’ ;<br />

e. ‘ce que l’on farfouille’<br />

(2) a. ‘nom du peuple’ ;<br />

b. ‘gentilé de Russie’ ;<br />

c. ‘relatif au peuple russe’ ;<br />

d. ‘relatif à la Russie’ ;<br />

e. ‘relatif aux citoyens de la Fédération de Russie’ ; etc.<br />

(3) La mobilisation anti-Sarkozy continue sur la Toile. www.lemonde.fr/cgi-bin/ACHATS/<br />

acheter.cgi?offre=ARCHIVES&type_item=ART_ARCH_30J&objet_id=987148&clef=<br />

ARC-TRK-NC_01<br />

(4) Juppé, c’est l’anti-Sarkozy. pascaldecaillet.blog.tdg.ch/archive/2008/03/10/<br />

juppe-l-anti-sarkozy.html<br />

2.4 Proximité morphologique<br />

La force des relations qui s’établissent entre les mots a été décrite de manière imagée cidessus<br />

comme la longueur des segments d’un filet lexical. <strong>Le</strong>s segments courts connectent<br />

des positions proches. Cette notion peut être définie de façon formelle comme une mesure<br />

de proximité morphologique. Elle peut être implémentée comme je le présente dans le<br />

chapitre 3 et dans <strong>Hathout</strong> (2008, <strong>2009</strong>a, b) 4 . Cette mesure peut être décrite de la manière<br />

4. Dans cette implémentation, la mesure n’est pas symétrique. C’est en effet davantage une mesure d’accessibilité<br />

qu’une mesure de proximité. Pour obtenir une mesure symétrique, il suffit de remplacer les valeurs<br />

m(x, y) + m(y, x)<br />

de proximité m(x, y) par la moyenne .<br />

2


Proximité morphologique 33<br />

suivante (D2.1) 5 :<br />

Définition 2.1 Proximité morphologique<br />

a. Deux formes qui partagent à la fois des propriétés sémantiques et formelles sont morphologiquement<br />

proches.<br />

b. La proximité morphologique de deux mots est d’autant plus grande que le nombre des<br />

propriétés sémantiques et formelles qu’ils partagent est grand.<br />

c. La proximité morphologique de deux mots est d’autant plus grande que les propriétés<br />

qu’ils partagent leur sont spécifiques, c’est-à-dire que peu d’autres mots en sont munis.<br />

Cette mesure de la proximité morphologique est globale : elle prend en compte la totalité<br />

du lexique. Inspirée des travaux de Gaume (2004) et Gaume et al. (2002, 2006), elle peut être<br />

comparée à la mesure proposée par Jackendoff (1975) pour estimer le coût de l’information<br />

ajoutée par une nouvelle entrée lexicale. Elle peut par ailleurs être restreinte aux seules<br />

propriétés formelles (resp. sémantiques) afin de définir une mesure de proximité formelle<br />

(resp. sémantique). Ces trois mesures induisent chacune une topologie sur le niveau de<br />

représentation dans lequel elles sont définies. Notons qu’une mesure similaire peut aussi<br />

être définie pour le niveau catégoriel.<br />

<strong>Le</strong>s propriétés sémantiques et formelles qui servent à déterminer D2.1 doivent être<br />

maximalement redondantes afin de capter le plus grand nombre possible de similarités qui<br />

existent entre les mots. Pour une langue comme le français, on peut par exemple utiliser<br />

comme propriétés formelles d’un mot donné l’ensemble des séquences sonores qui apparaissent<br />

dans sa forme. Un mot comme atomique sera ainsi décrit par les traits listés en (5)<br />

où # marque le début et la fin du mot 6 .<br />

(5) /#atOmik#/,<br />

/#atOmik/, /atOmik#/,<br />

/#atOmi/, /atOmik/, /tOmik#/,<br />

/#atOm/, /atOmi/, /tOmik/, /Omik#/,<br />

/#atO/, /atOm/, /tOmi/, /Omik/, /mik#/,<br />

/#at/, /atO/, /tOm/, /Omi/, /mik/, /ik#/,<br />

/#a/, /at/, /tO/, /Om/, /mi/, /ik/, /k#/,<br />

/a/, /t/, /O/, /m/, /i/, /k/<br />

Pour une langue gabaritique comme l’arabe, on peut utiliser des séquences similaires en<br />

remplaçant les représentations phonétiques par des schèmes consonantiques et vocaliques<br />

(Pirrelli et Federici 1994, Pirrelli et Herreros 2007). Par exemple, les propriétés associées à<br />

la forme /maktabun/ ‘bureau’ seraient alors les séquences qui apparaissent dans les patrons<br />

/#mktb#/ et /#CaCCaCun#/ où C représente une consonne. La finale /un/ étant une marque<br />

de cas, elle est traitée comme un élément vocalique. Ces deux patrons peuvent être obtenus<br />

5. Dans la suite du mémoire, les numéros des définitions seront précédés de la lettre « D » et ceux des<br />

contraintes par la lettre « C ».<br />

6. Cette liste peut être étendue davantage encore en ajoutant des traits dans lesquels certains des symboles<br />

seraient non spécifiés. Cette extension pourrait être réalisée pour tous les traits de (5). Par exemple, à partir de<br />

/tOm/, on ajouterait / Om/, /t m/, /tO /, / m/, / O /, /t / où « » représente un symbole joker.


34 Un modèle théorique de la morphologie lexicale<br />

simplement à partir de la graphie vocalisée du mot (6) ; le /un/ final est noté par le dernier<br />

diacritique vocalique.<br />

(6) <br />

<strong>Le</strong> sens étant abstrait, il est plus difficile de connaître précisément les objets qui le<br />

composent. Si l’on considère qu’il est de nature relationnelle, les traits sémantiques que<br />

l’on pourrait associer à un mot seraient des ensembles redondants de sens connexes (par<br />

exemple, des sous-ensembles de la liste (7a) dans le cas de atomique), de relations sémantiques<br />

(par exemple, des sous-ensembles de (7b)) et de couples (relation sémantique, sens<br />

connexe) (par exemple, des sous-ensembles de (7c)).<br />

(7) a. atome nucléaire bombe radiation électron etc.<br />

b. ‘relatif à’ synonyme ‘sert à fabriquer’ ‘émet’ ‘dans son orbite’ etc.<br />

c. (‘relatif à’, atome), (synonyme, nucléaire), (‘sert à fabriquer’, bombe),<br />

(‘émet’, radiation), (‘dans son orbite’, électron), etc.<br />

Remarque 1.– La proximité morphologique est maximale entre les mots morphologiquement<br />

apparentés qui sont sémantiquement les plus proches (Roché <strong>2009</strong>, Dal 2007), notamment<br />

entre :<br />

– les verbes et les noms processifs correspondants (diffuser : diffusion) ;<br />

– les noms et les adjectifs de relation correspondants (parlement : parlementaire) ;<br />

– les adjectifs et les noms de propriété correspondants (obèse : obésité) ;<br />

– les adjectifs et les adverbes de manière correspondants (magnifique : magnifiquement).<br />

Remarque 2.– Cette mesure permet par ailleurs de distinguer pour un dérivé donné, par<br />

exemple nationaliser, la relation qu’il a avec sa base, national, de celles qu’il a avec ses<br />

propres dérivés comme nationalisation ou renationaliser. Un mot est moins proche de sa<br />

base qu’il ne l’est de ses dérivés simplement parce qu’il partage davantage de propriétés<br />

sémantiques et formelles avec les seconds. Par exemple, les propriétés sémantiques et formelles<br />

induites par la suffixation en -iser sont partagées par nationaliser avec nationalisation<br />

mais sont absentes de national. L’intersection de l’ensemble des traits de nationaliser et nationalisation<br />

contient donc strictement l’intersection des traits de nationaliser et national.<br />

Par suite, la proximité de nationaliser est plus grande avec nationalisation et qu’avec national.<br />

Remarque 3.– Cette mesure ne tient pas compte de la saillance des positions. Par exemple,<br />

dans un triplet (pluie, pluvieux, pluviosité), la relation pluie : pluvieux contribue plus à la<br />

caractérisation du sens de pluvieux que pluviosité : pluvieux.<br />

2.5 Proximité lexicale<br />

La proximité morphologique peut être étendue en une proximité lexicale en y intégrant<br />

les propriétés catégorielles :<br />

Définition 2.2 Proximité lexicale


Organisation morphologique du lexique 35<br />

a. Deux formes qui partagent des propriétés sémantiques, formelles ou catégorielles sont<br />

lexicalement proches.<br />

b. La proximité lexicale de deux mots est d’autant plus grande que le nombre des propriétés<br />

sémantiques, formelles et catégorielles qu’ils partagent est grand.<br />

c. La proximité lexicale de deux mots est d’autant plus grande que les propriétés qu’ils<br />

partagent leur sont spécifiques, c’est-à-dire que peu d’autres mots en sont munis.<br />

<strong>Le</strong>s propriétés catégorielles sont des traits morphosyntaxiques qui décrivent la partie du<br />

discours et, en fonction de cette dernière, le genre, le nombre, le cas, la personne, le temps,<br />

le mode, etc. Par exemple, les traits élémentaires associés aux mots chat et dort pourraient<br />

être ceux présentés en (8). Ces traits élémentaires permettent d’associer à chaque mot des<br />

traits complexes, en l’occurrence des ensembles redondants de traits élémentaires comme<br />

par exemple (9) pour le nom chat.<br />

(8) a. chat : nom ; masculin ; singulier<br />

b. dort : verbe ; 3 e personne ; singulier ; présent ; indicatif<br />

(9) {nom, masculin, singulier} ; {nom, masculin} ; {nom, singulier} ; {masculin, singulier} ;<br />

{nom} ; {masculin} ; {singulier}<br />

La contribution des propriétés catégorielles à la proximité lexicale est faible car ce sont les<br />

traits les moins spécifiques.<br />

2.6 Organisation morphologique du lexique<br />

<strong>Le</strong>s relations formelles, sémantiques et catégorielles qui s’établissent entre les positions<br />

du lexique définissent un ensemble de structures paradigmatiques qui sont utilisées par la<br />

morphologie pour analyser les mots et pour en construire de nouveaux (Blevins 2003). Ces<br />

paradigmes sont interconnectés les uns avec les autres par des relations analogiques. Ils<br />

définissent un maillage qui est spécifique au niveau de représentation lexical et qui renforce<br />

l’accessibilité morphologique (D2.1).<br />

2.6.1 Paradigmes morphologiques et paradigmes lexicaux<br />

<strong>Le</strong>s paradigmes qui composent l’organisation morphologique du lexique peuvent être<br />

distingués selon trois dimensions : (i) famille vs série en fonction de leur taille et de leur<br />

cohésion ; (ii) flexion vs dérivation en fonction de la nature des relations sémantiques qui<br />

s’établissent entre leurs éléments ; (iii) morphologie vs lexique. Ces trois dimensions identifient<br />

un groupe de paradigmes privilégiés notamment les lexèmes, les séries flexionnelles<br />

lexicales, les familles dérivationnelles morphologiques, les familles dérivationnelles lexicales,<br />

les séries dérivationnelles morphologiques et les séries dérivationnelles lexicales.<br />

On peut définir les familles morphologiques comme des ensembles de mots qui sont<br />

très proches les uns des autres et qui partagent le plus grand nombre possible de propriétés<br />

sémantiques et formelles les plus spécifiques possible. De même une série morphologique


36 Un modèle théorique de la morphologie lexicale<br />

est un ensemble aussi grand que possible de mots qui partagent des propriétés morphologiques<br />

et catégorielles très générales et qui participent à un nombre aussi grand que possible<br />

d’analogies intégrant d’autres mots de la série.<br />

La distinction entre morphologie et lexique se retrouve au niveau de la structure morphologique<br />

du lexique :<br />

– <strong>Le</strong>s paradigmes morphologiques rassemblent des ensembles de mots qui entretiennent<br />

des relations morphologiques. Par exemple, modifier : modifiable appartient<br />

à un paradigme morphologique car les deux mots partagent en même temps des propriétés<br />

de forme et de sens.<br />

– <strong>Le</strong>s paradigmes lexicaux réunissent des éléments qui se trouvent dans des relations<br />

qui sont généralement exprimées morphologiquement. <strong>Le</strong>s paradigmes lexicaux<br />

étendent les paradigmes morphologiques en y incluant les supplétions. Par<br />

exemple, prison : carcéral appartient à un paradigme lexical qui contient également<br />

commerce : commercial, université : universitaire, périphérie : périphérique, etc. Prison<br />

et carcéral ne sont pas morphologiquement apparentés parce qu’ils ne partagent<br />

pas de propriétés formelles. Néanmoins, la relation sémantique qui les unit, relation<br />

entre un nom et son adjectif de relation, est normalement exprimée en utilisant<br />

un procédé morphologique, par exemple les suffixations en -al, -el, -aire, -ien, -éen,<br />

-ique, etc. comme on peut le voir dans les exemples ci-dessus. <strong>Le</strong> paradigme lexical<br />

est ainsi caractérisé par un rapport sémantique constant entre les membres des<br />

relations qu’il contient.<br />

Il n’existe pas de critère simple permettant de distinguer les relations flexionnelles des<br />

relations dérivationnelles. <strong>Le</strong>s relations flexionnelles s’établissent entre des mots de même<br />

catégorie (i.e. partie du discours) dont les sens sont strictement interprédictibles (Boyé<br />

2010). Par exemple, la relation entre les formes adjectivales vert et verte est flexionnelle<br />

car le sens de chacune d’elles peut être complètement récupéré à partir de celui de l’autre.<br />

La seule différence qui existe entre ces deux mots est la valeur du genre, masculin dans<br />

un cas et féminin dans l’autre. <strong>Le</strong>s relations flexionnelles sont d’autre part limitées à un ensemble<br />

réduit de propriétés morphosyntaxiques. Par ailleurs, tous les couples du paradigme<br />

qui contient vert : verte présentent exactement la même différence. <strong>Le</strong>s relations flexionnelles<br />

se distinguent aussi par la systématicité quasi totale des paradigmes dans lesquels<br />

elles s’insèrent. Cette rigidité absolue des relations flexionnelles les distingue des relations<br />

dérivationnelles qui sont elles caractérisées par une grande souplesse. Notons cependant<br />

que certaines relations dérivationnelles comme celles qui s’établissent entre les noms et les<br />

adjectifs de relation correspondants, entre les verbes et les noms processifs correspondants<br />

et entre les adjectifs et les noms de propriétés correspondants ou entre les adjectifs et les<br />

adverbes de manière correspondants sont relativement proches des relations flexionnelles.<br />

<strong>Le</strong>s familles flexionnelles morphologiques regroupent des mots qui partagent deux à<br />

deux des propriétés formelles et qui entretiennent des relations flexionnelles. Par exemple,<br />

la famille flexionnelle morphologique de lavons contient lavera et l’ensemble des formes<br />

fléchies du verbe laver, ce dernier n’ayant pas de radicaux supplétifs 7 . À l’inverse, allons a<br />

7. Par radicaux supplétifs, j’entends thèmes au sens de (Bonami et Boyé 2003, Bonami et al. <strong>2009</strong>). Par<br />

exemple, écrivons et écrira appartiennent à des familles flexionnelles morphologiques différentes.


Organisation morphologique du lexique 37<br />

dans sa famille flexionnelle morphologique allaient mais pas ira ni vont qui appartiennent à<br />

des familles flexionnelles morphologiques différentes. <strong>Le</strong>s familles flexionnelles morphologiques<br />

sont les paradigmes les plus denses qui soient car leurs éléments sont maximalement<br />

proches les uns des autres du point de vue morphologique. Ces derniers ne diffèrent en<br />

effet que sur le plan flexionnel, or les propriétés et les marques flexionnelles sont les caractéristiques<br />

les moins spécifiques dans la mesure où elles sont les plus fréquentes.<br />

<strong>Le</strong>s lexèmes sont des familles flexionnelles lexicales qui regroupent des mots entre<br />

lesquels il existe des relations flexionnelles, même s’ils ne partagent pas de propriétés formelles.<br />

Ces mots peuvent appartenir à une ou à plusieurs familles flexionnelles morphologiques.<br />

Par exemple, le lexème de lavons est identique à sa famille flexionnelle morphologique.<br />

Celle de allons, en revanche, contient les mots des familles flexionnelles morphologiques<br />

de allons, de ira et de vont. <strong>Le</strong>s lexèmes sont des paradigmes pratiquement aussi<br />

denses que les familles flexionnelles morphologiques.<br />

À l’opposé, les séries flexionnelles lexicales et les séries flexionnelles morphologiques<br />

sont les paradigmes les moins denses. Ils rassemblent des formes qui sont disséminées sur<br />

l’ensemble du lexique et qui sont connectées par les relations morphologiques les plus<br />

lâches. Ces relations s’établissent entre des formes de lexèmes différents qui portent la<br />

même flexion et partagent l’ensemble de leurs propriétés morphosyntaxiques. Par exemple,<br />

la série flexionnelle morphologique de dérivons contient l’ensemble des formes verbales<br />

conjuguées à la 1 re personne du pluriel du présent de l’indicatif comme (10). Ces formes partagent<br />

la même marque flexionnelle et les mêmes propriétés morphosyntaxiques de temps,<br />

de mode et de personne.<br />

(10) lavons ; évitons ; verbalisons ; mangeons ; visons ; prenons<br />

La série flexionnelle lexicale de dérivons contient aussi sommes, en plus des mots de la série<br />

flexionnelle morphologique illustrée en (10).<br />

<strong>Le</strong>s familles dérivationnelles morphologiques, ou plus simplement familles morphologiques,<br />

correspondent à des relations morphologiques intermédiaires qui s’établissent<br />

entre des lexèmes dont les formes partagent leurs propriétés les plus spécifiques. <strong>Le</strong>s<br />

membres de ces familles partagent donc en même temps des propriétés de forme et de sens.<br />

Ces familles correspondent aux paradigmes dérivationnels présentés dans Roché (2008,<br />

<strong>2009</strong>, 2010b). Par exemple, la famille morphologique de dérivation contient des lexèmes<br />

comme (11). <strong>Le</strong>s familles sont des ensembles denses dont les éléments sont très proches<br />

tant du point vue formel que sémantique. Elles possèdent peu d’éléments. En contrepartie,<br />

le lexique contient un grand nombre de familles.<br />

(11) dérivation ; dériver ; dérivable ; dérivationnel ; dérivationnellement ; dérivatif ; dérive<br />

; dériveur ; dérivée<br />

<strong>Le</strong>s familles dérivationnelles lexicales, ou plus simplement familles lexicales, rassemblent<br />

au sein d’un même ensemble les éléments de plusieurs familles morphologiques<br />

lexicalement complémentaires. Par exemple, la famille lexicale de champignon contient à<br />

la fois la famille morphologique de champignon, champignonner, champignonneux, champignonnière,<br />

etc., celle de fongus, fongique, fongicide, etc. et celle de mycète, mycétique,<br />

mycotique, mycose, mycosique, mycologie, etc. Ces trois familles morphologiques sont sé-


38 Un modèle théorique de la morphologie lexicale<br />

mantiquement très proches puisque champignon, fongus et mycète sont par exemple synonymes.<br />

Elles sont réunies au sein de la même famille lexicale parce que fongique est l’adjectif<br />

relationnel de champignon et que cette relation sémantique est habituellement exprimée<br />

morphologiquement comme dans robot : robotique ou relation : relationnel. Dans le cas de<br />

champignon : fongique, la relation n’est pas morphologique. Champignon et fongique ne<br />

peuvent donc appartenir à la même famille morphologique. Cette relation est en revanche<br />

lexicale et sémantique, fongique occupant dans le lexique la position d’adjectif de relation<br />

de champignon. C’est en ce sens que ces familles sont lexicalement complémentaires. La situation<br />

est similaire pour champignon et mycotique. La complémentarité des trois familles<br />

morphologiques apparaît pour plusieurs autres relations, par exemple avec fongicide (resp.<br />

mycocide) ou antifongique (resp. antimycotique) qui occupent les positions de dérivés en<br />

-cide et en anti- de champignon. Plus généralement, deux familles morphologiques sont<br />

réunies au sein de la même famille lexicale si les deux conditions suivantes sont vérifiées :<br />

1. Elles contiennent des éléments maximalement proches sur le plan sémantique. Ces<br />

éléments peuvent être par exemple des synonymes (marseillais : phocéen) ou bien<br />

être dans une relation verbe : nom d’action (tomber : chute), nom : adjectif de relation<br />

(oreillons : ourlien) ou adjectif : nom de qualité (allemand : germanicité) (Roché<br />

<strong>2009</strong>).<br />

2. Certains éléments de l’une des familles morphologiques occupent dans le lexique des<br />

positions non pourvues dans l’autre. En d’autres termes, l’une des familles fournit à<br />

l’autre un radical supplétif.<br />

Ces conditions peuvent naturellement être généralisées à des ensembles de plus de deux<br />

familles morphologiques.<br />

<strong>Le</strong>s séries dérivationnelles morphologiques correspondent à des relations plus lâches<br />

qui s’établissent entre des lexèmes dont les formes partagent des propriétés qui sont non<br />

flexionnelles et peu spécifiques. Ces formes partagent notamment leurs propriétés morphosyntaxiques<br />

(i.e. elles appartiennent à la même partie du discours). Par exemple, dérivation<br />

appartient à une série de noms en -ion qui inclut compilation, production, succion, vision,<br />

etc. À l’inverse des familles morphologiques, les séries dérivationnelles morphologiques<br />

sont des ensembles de grande taille mais peu denses : leurs éléments sont relativement distants<br />

les uns des autres. <strong>Le</strong> nombre de séries dérivationnelles est très inférieur à celui des<br />

familles morphologiques.<br />

<strong>Le</strong>s séries dérivationnelles morphologiques ne contiennent que des mots construits par<br />

une même dérivation. Par exemple, confection ou locomotion n’appartiennent pas à la série<br />

dérivationnelle morphologique de compilation bien que ce soient des noms d’action finissant<br />

en -ion. <strong>Le</strong> lexique contemporain ne contient pas en effet de lexèmes leur permettant de<br />

participer à la série des analogies qui rassemble les éléments de la série dérivationnelle morphologique<br />

de compilation. Confection et locomotion appartiennent en revanche à la série<br />

dérivationnelle lexicale de compilation. Cette série contient naturellement aussi les éléments<br />

de la série dérivationnelle morphologique de compilation. <strong>Le</strong>s séries dérivationnelles lexicales,<br />

ou séries dérivationnelles, généralisent ainsi les séries dérivationnelles morphologiques.<br />

<strong>Le</strong>s mots y sont rattachés uniquement sur la base de leur sens et de leur forme.<br />

Ces séries sont les paradigmes lexicomorphologiques définis dans Roché (2008, <strong>2009</strong>). La


Organisation morphologique du lexique 39<br />

figure 2.2 récapitule les différents types de paradigmes qui ont été présentés. Chacun de ces<br />

types est illustré par un couple de l’une de ses instances.<br />

flexionnelle dérivationnelle<br />

famille lavons : lavera allons : ira dériver : dérivable prison : carcéral<br />

série lavons : coupons lavons : sommes dérivable : variable furieux : curieux<br />

morphologique lexicale morphologique lexicale<br />

Figure 2.2 – Exemples de couples caractéristiques des huit paradigmes proposés. <strong>Le</strong>s paradigmes<br />

morphologiques rassemblent des mots qui partagent en même temps des propriétés<br />

sémantiques et formelles. <strong>Le</strong>s paradigmes lexicaux étendent les paradigmes morphologiques<br />

en relâchant l’obligation de partage de propriétés formelles. <strong>Le</strong>s familles rassemblent<br />

des mots qui partagent leurs propriétés les plus spécifiques. <strong>Le</strong>s séries rassemblent<br />

des mots qui partagent leurs propriétés les moins spécifiques. <strong>Le</strong>s paradigmes flexionnels<br />

rassemblent des mots qui ne diffèrent que par leurs propriétés morphosyntaxiques. <strong>Le</strong>s paradigmes<br />

dérivationnels rassemblent des mots dont les différences ne sont pas flexionnelles.<br />

<strong>Le</strong>s familles lexicales que je propose se distinguent nettement des familles synchroniques<br />

dérivationnelles de Gruaz (1997a, b) et des familles morphologiques de Corbin<br />

(1997). Ces auteurs envisagent en effet les familles essentiellement comme un mode d’organisation<br />

lexicographique et non comme une composante fondamentale de la structure<br />

morphologique du lexique, leur objectif étant la création de dictionnaires morphologiques,<br />

le DISFA pour Gruaz et le DDF pour Corbin. De ce fait, aucun d’eux ne propose de croiser<br />

ces familles avec des séries dérivationnelles. Par ailleurs, les familles qu’ils proposent<br />

sont constituées à partir de racines, de têtes de famille, de primitifs, comme par exemple<br />

lait pour la famille de laitier. Ma proposition est différente car je considère que les familles<br />

et les séries émergent du lexique dans sa globalité et s’agrègent à partir des relations de<br />

proximité morphologique qui existent entre les lexèmes et les formes qu’ils rassemblent.<br />

Notons que plusieurs études psycholinguistiques portent sur les effets liés aux paradigmes<br />

morphologiques. Ainsi, New et al. (2004) montrent que le lexème (i.e. la famille<br />

flexionnelle) intervient dans le traitement des mots qui le composent, notamment via sa<br />

fréquence. Ces auteurs ont en effet montré que le traitement des noms singuliers en français<br />

dépend de la fréquence cumulée du lexème. Des effets liés aux séries ont également<br />

été mis en évidence en néerlandais et en finnois par Bertram et al. (1999, 2000). <strong>Le</strong>s expériences<br />

réalisées indiquent que le mode de stockage et la stratégie de reconnaissance des<br />

mots dépendent de deux propriétés des séries : (i) l’existence de séries homonymes et (ii) la<br />

productivité. <strong>Le</strong>s conclusions de leurs études sont que les mots qui portent un suffixe productif<br />

qui n’a pas un homonyme plus productif sont traités par une stratégie à deux voies<br />

(dual route) tandis que ceux dont le suffixe n’est pas productif ou qui ont un homonyme<br />

plus productif donnent lieu à une stratégie d’appréhension globale (whole word route).<br />

Notons aussi que le fait de se placer dans un cadre paradigmatique n’est pas incompatible<br />

avec l’utilisation de termes comme « radical », « initiale » ou « finale ». Ces termes


40 Un modèle théorique de la morphologie lexicale<br />

désignent des segments de la forme des mots, considérés comme de simples indices. Ce ne<br />

sont ni des objets lexicaux, ni des unités qui auraient une représentation dans la grammaire<br />

ou le lexique :<br />

– Par « radical », j’entends la partie de la forme partagée par un mot avec d’autres<br />

membres de sa famille morphologique.<br />

– Par « initiale » et « finale », j’entends la partie de la forme qui est partagée par les<br />

membres de la série morphologique du mot et qui permet de reconnaître cette dernière.<br />

<strong>Le</strong>s familles et les séries dérivationnelles induisent ainsi une segmentation approximative<br />

de la forme des mots qui dégage des signaux destinés à guider l’analyse.<br />

2.6.2 Analogie<br />

Parmi les nombreuses relations lexicales qui s’établissent entre les éléments des paradigmes<br />

présentés ci-dessus, les analogies 8 jouent un rôle particulier dans l’organisation<br />

morphologique du lexique. Elles sont présentes dans tous les paradigmes, flexionnels, dérivationnels,<br />

morphologiques ou lexicaux. Par exemple, dérivons et dérivait qui appartiennent<br />

au même lexème font partie d’analogies comme (12a). De même, au sein de la série<br />

flexionnelle de dérivons, le couple dérivons : évitons participe à un ensemble d’analogies<br />

qui contient (12b). De façon similaire, dérivation et dériver qui appartiennent à la même<br />

famille morphologique sont impliqués dans une série d’analogies telles que (13a). De la<br />

même manière, dérivation et variation qui se trouvent dans la même série dérivationnelle<br />

font partie d’analogies comme (13b).<br />

(12) a. dérivons : dérivait :: parlons : parlait<br />

dérivons : dérivait :: finissons : finissait<br />

dérivons : dérivait :: prenons : prenait<br />

dérivons : dérivait :: évitons : évitait<br />

b. dérivons : évitons :: dériver : éviter<br />

dérivons : évitons :: dériveras : éviteras<br />

(13) a. dérivation : dériver :: navigation : naviguer<br />

dérivation : dériver :: immersion : immerger<br />

b. dérivation : variation :: dériver : varier<br />

dérivation : variation :: dérivable : variable<br />

Il existe plusieurs types d’analogies. <strong>Le</strong>s plus contraintes sont les analogies formelles<br />

qui doivent être vérifiées par les formes elles-mêmes, par exemple par les graphies comme<br />

(12b) (<strong>Le</strong>page 2003, Stroppa 2005, Yvon 2006, Stroppa et Yvon 2006). Il existe d’autre part<br />

des analogies sémantiques comme (14) où la relation concerne le sens des lexèmes (Gentner<br />

1983). Entre ces deux extrémités, on trouve des analogies dérivationnelles morphologiques<br />

qui s’établissent entre des termes qui appartiennent aux mêmes familles morphologiques<br />

8. Pour une présentation générale de l’utilisation de l’analogie comme principe explicatif de faits morphologiques,<br />

voir Dal (2003a, 2008).


Sémantique d’instance 41<br />

et aux mêmes séries dérivationnelles comme (13a) qui correspondent aux règles de redondance<br />

lexicale de Jackendoff (1975). On trouve aussi des analogies dérivationnelles lexicales<br />

comme (15) qui sont des analogies sémantiques dans lesquelles les membres de chaque<br />

couple appartiennent à la même famille morphologique. Ce type d’analogie est utilisé par<br />

<strong>Hathout</strong> (2001).<br />

(14) texte : écrire :: maison : bâtir<br />

(15) batterie : batteur :: violon : violoniste<br />

<strong>Le</strong>s analogies jouent un rôle important dans l’organisation morphologique du lexique<br />

car elles connectent les lexèmes aux séries flexionnelles d’une part et les familles dérivationnelles<br />

aux séries dérivationnelles de l’autre (voir section 3.3.1). Ces connections permettent<br />

de caractériser sémantiquement les séries, les unes par rapport aux autres (<strong>Hathout</strong> 2003).<br />

<strong>Le</strong>s analogies sont également importantes parce qu’elles définissent les modèles constructionnels<br />

et les schèmes de nomination présentés dans Skousen (1989, 1992), Becker (1994),<br />

Roché (2007, <strong>2009</strong>). Ces schèmes correspondent aux relations morphologiques les plus<br />

couramment utilisées pour exprimer les sens construits. Chaque schème dispose d’un pouvoir<br />

d’attraction qui dépend de sa taille (Jackendoff 1975, Burzio 2002) : une analogie est<br />

d’autant plus apte à être utilisée pour former des mots nouveaux qu’elle comporte un grand<br />

nombre de quadruplets.<br />

2.7 Sémantique d’instance<br />

<strong>Le</strong>s lexèmes construits ont, au niveau du lexique, une sémantique abstraite déterminée<br />

en grande partie par les familles et les séries auxquelles ils appartiennent. La sémantique<br />

lexicale d’un lexème est généralement sous-déterminée afin de pouvoir s’adapter à un<br />

nombre suffisant de contextes. On peut en effet supposer que la mémorisation d’un lexème<br />

dont le sens serait trop contraint et dont la fréquence ne serait pas élevée n’est pas rentable.<br />

En discours, lorsqu’un locuteur utilise un mot, il lui assigne une sémantique d’instance.<br />

Cette sémantique d’instance doit idéalement être compatible avec la sémantique lexicale<br />

du lexème. Elle n’est cependant pas toujours totalement spécifiée (Corbin et Temple<br />

1994). <strong>Le</strong>s sens des instances ne sont ni prévus ni listés lors de la première utilisation du<br />

mot. Ils sont créés et assignés par le locuteur chaque fois qu’il se sert d’un mot. De son<br />

côté, l’interlocuteur doit découvrir la sémantique de chaque instance à partir :<br />

1. de la sémantique lexicale du lexème que l’on peut voir comme un invariant sémantique<br />

défini par les membres de la série morphologique du lexème et par ceux de sa<br />

famille lexicale. Cet invariant est un sens très abstrait. Par exemple, l’invariant correspondant<br />

à la série des noms en -ette est que le dérivé désigne une entité qui est<br />

« petite », d’une façon ou d’une autre, dans sa catégorie (Plénat et al. 2004b, Plénat<br />

2005). Celui des dérivés préfixés en anti- de la sous-série qui contient antiparlementaire,<br />

anti-émeute et antilimace est de désigner la propriété de s’opposer aux<br />

nuisances causées aux intérêts d’un agent non explicité (voir section 4.3.6) 9 .<br />

9. Dans la suite du mémoire, j’utiliserai le dérivé antilimace comme identifiant de cette sous-série.


42 Un modèle théorique de la morphologie lexicale<br />

2. des valeurs sémantiques des instances du lexème déjà rencontrées et des instances des<br />

membres de sa famille et de sa série. Ces valeurs définissent un sens par défaut, celui<br />

que le mot a habituellement, le plus fréquemment. Par exemple, antilimace désigne<br />

par défaut un produit qui empêche les limaces de manger les plantations et bleuet une<br />

centaurée bleue. <strong>Le</strong> sens par défaut doit être compatible avec l’invariant sémantique<br />

précédent.<br />

3. du contexte dans lequel elle est utilisée.<br />

Dans tous les cas, le sens de l’instance est recalculé à l’intérieur des limites définies par<br />

l’invariant sémantique de la série morphologique et de la famille lexicale d’une part et du<br />

contexte de l’autre. Ce calcul peut se limiter à une simple copie du sens mémorisé dans le<br />

lexique (i.e. copie du sens par défaut), mais il peut aussi aboutir à un sens différent induit<br />

par un contexte particulier comme anti-Sarkozy dans l’exemple (4).<br />

2.8 Système de contraintes<br />

<strong>Le</strong>s correspondances entre sens visés, positions lexicales, formes réalisées et catégories<br />

sont réglées par des contraintes concurrentes, redondantes et non obligatoires. Certaines<br />

de ces contraintes sont également contradictoires, c’est-à-dire qu’elles ne peuvent pas être<br />

satisfaites en même temps. <strong>Le</strong>s correspondances entre sens visé et position lexicale, entre<br />

forme réalisée et position lexicale et entre catégorie et position lexicale sont conçues comme<br />

des compromis optimaux entre les exigences de ces différentes contraintes. Je rappelle que<br />

les positions lexicales représentent des lexèmes et que ces derniers sont des classes de mots.<br />

La satisfaction de ces contraintes sur la forme, sur le sens et sur la catégorie présente les<br />

caractéristiques suivantes :<br />

– L’optimum est recherché séparément pour chaque occurrence de chaque mot. L’importance<br />

relative des contraintes est en effet susceptible de varier en fonction du<br />

contexte dans lequel un mot est utilisé et des objectifs du locuteur.<br />

– <strong>Le</strong>s contraintes sont toutes gradables 10 . <strong>Le</strong>ur satisfaction n’est donc pas binaire, en<br />

oui ou non.<br />

– Certaines contraintes sur la forme et sur la catégorie sont relativement faibles et ne<br />

peuvent obtenir seules la sélection des réalisations qui leur conviennent. Elles doivent<br />

s’allier à d’autres contraintes pour leur imposer des ajustements satisfaisants.<br />

Dans le reste du chapitre, je m’intéresse essentiellement aux contraintes qui portent<br />

sur la production des mots, c’est-à-dire (i) sur la sélection d’une position lexicale pour un<br />

sens visé donné (section 2.9) et (ii) sur la sélection d’une forme réalisée pour une position<br />

lexicale donnée (section 2.11). <strong>Le</strong>s contraintes qui gèrent l’interprétation des mots seront<br />

traitées dans une étude ultérieure. Je signale qu’une grande part des contraintes présentées<br />

dans ce qui suit ne sont pas nouvelles. Elles réinterprètent dans le modèle à quatre niveaux<br />

des contraintes qui ont été déjà proposées ou mises en évidence comme :<br />

10. Pour une présentation de synthèse de la gradabilité des phénomènes morphologiques, voir Hay et<br />

Baayen (2005).


Contraintes sur la position lexicale 43<br />

– les contraintes dissimilatives (section 2.10.1), qui pénalisent les formes qui<br />

contiennent des répétitions de sons identiques ou proches (Plénat 2000, Lignon 2000,<br />

Roché 2003a, 2007, Lignon et Plénat <strong>2009</strong>, Roché <strong>2009</strong>) ;<br />

– les contraintes de taille (section 2.10.2) qui pénalisent les radicaux trop courts ou trop<br />

longs (Plénat et Roché 2003, Roché 2003a, Plénat <strong>2009</strong>, Roché 2008) ;<br />

– les contraintes de transparence (section 2.11.2) qui favorisent les formes qui permettent<br />

l’identification la plus exacte possible du sens construit des lexèmes (Corbin<br />

2001a, b) ;<br />

– les contraintes sur le marquage catégoriel (section 2.11.3) qui favorisent les formes<br />

qui permettent la meilleure identification possible de leur catégorie grammaticale<br />

(Corbin 2001b).<br />

Ces contraintes sont toutes illustrées par leur contribution à l’analyse des dérivés en anti-<br />

(voir aussi section 2.12).<br />

2.9 Contraintes sur la position lexicale<br />

Deux contraintes règlent la sélection de la position lexicale associée à un sens visé. Cette<br />

sélection dépend de la qualité de la position et de celle de la correspondance entre le sens<br />

visé et les sens mémorisés dans la position. La qualité d’une position lexicale est déterminée<br />

par :<br />

(i) la fréquence cumulée du lexème et celle des membres de sa famille dérivationnelle<br />

lexicale (Bybee 1985) ;<br />

(ii) la densité de la famille de la position ;<br />

(iii) la taille du réseau de relations dans lequel la position est impliquée.<br />

Ces deux dernières caractéristiques sont liées à la richesse et la force de la définition de<br />

la position dans le lexique. <strong>Le</strong>s contraintes permettant de sélectionner la position lexicale<br />

optimale (C2.1 ; C2.2) sont formulées en utilisant les notions générales suivantes (D2.3 ;<br />

D2.4 ; D2.5 ; D2.6) :<br />

Définition 2.3 Relation morphologique<br />

Une relation morphologique est une relation lexicale qui peut être exprimée morphologiquement.<br />

Cette relation fait partie des paradigmes morphologiques qui structurent le lexique.<br />

Définition 2.4 Force d’une relation morphologique<br />

Une relation morphologique est d’autant plus forte :<br />

a. que les couples de positions qu’elle connecte sont proches morphologiquement.<br />

b. qu’elle connecte un grand nombre de couples de positions (i.e. qu’elle induit une analogie<br />

morphologique qui contient un grand nombre de couples).<br />

c. que les couples de positions qu’elle connecte participent chacun à un grand nombre<br />

d’analogies morphologiques.<br />

Définition 2.5 Force de la définition lexicale<br />

Une position lexicale est d’autant plus fortement définie :


44 Un modèle théorique de la morphologie lexicale<br />

a. que les positions avec lesquelles elle est en relation représentent des mots fréquents et<br />

que ces positions participent elles-mêmes à un grand nombre de relations et d’analogies<br />

morphologiques.<br />

b. que la zone du lexique dans laquelle elle se trouve est dense (i.e. que la position a un<br />

grand nombre de voisins proches).<br />

c. que les relations dans lesquelles elle se trouve sont nombreuses et qu’elles participent<br />

à un grand nombre d’analogies morphologiques.<br />

Lorsque le sens visé doit être exprimé morphologiquement, la zone dense pertinente pour<br />

D2.5b est la famille dérivationnelle lexicale et les relations à considérer pour D2.5c sont<br />

les relations morphologiques. Un corollaire de D2.5c est qu’une position lexicale optimale<br />

doit appartenir à une série dérivationnelle morphologique aussi grande que possible.<br />

Définition 2.6 Saillance d’une position lexicale<br />

Une position lexicale est d’autant plus saillante :<br />

a. qu’elle représente un mot fréquent.<br />

b. qu’elle est fortement définie.<br />

Contrainte 2.1 Contrainte de préservation de la proximité sémantique<br />

La position lexicale p qui convient le mieux à un sens visé s est celle qui est morphologiquement<br />

la plus proche possible des positions q1, . . . , qn associées aux mots m1, . . . , mn qui sont<br />

sémantiquement les plus proches de s.<br />

En d’autres termes, s’il existe des mots mémorisés dont le sens est proche du sens visé, alors<br />

la position lexicale à sélectionner doit être proche de celles de ces mots.<br />

Contrainte 2.2 Contrainte sur la saillance de la position lexicale<br />

La position lexicale qui convient le mieux à un sens visé est la plus saillante possible.<br />

Je signale que les définitions et les contraintes proposées dans cette section ne font intervenir<br />

que cinq notions : (i) la proximité morphologique ; (ii) la proximité sémantique ; (iii)<br />

la fréquence des mots représentés par une position ; (iv) le nombre de relations auxquelles<br />

participent une position ; (v) le nombre d’analogies auxquelles participent une relation.<br />

2.10 Contraintes morphophonologiques<br />

Je ne considère ici que les contraintes morphophonologiques déjà mises en évidence, à<br />

savoir les contraintes dissimilatives et les contraintes de taille. <strong>Le</strong>s dérivés en anti- illustrent<br />

l’optionalité de ces contraintes. Ces contraintes ne les affectent en effet pas du tout.


Contraintes morphophonologiques 45<br />

2.10.1 Dissimilation<br />

<strong>Le</strong>s contraintes dissimilatives ont été décrites et étudiées en détail par Plénat (2000),<br />

Roché (1997, 2003a), Lignon (2000), Lignon et Plénat (<strong>2009</strong>). Elles pénalisent la création<br />

de formes qui contiennent des sons identiques ou proches situés à proximité. Par exemple,<br />

elles expliquent pourquoi les locuteurs utilisent la forme camionneur et non camionnier et<br />

pourquoi ils préfèrent moliéresque à moliérien. Ces contraintes ne sont naturellement pas<br />

obligatoires et l’on trouve sur le Web plusieurs attestations de l’adjectif moliérien.<br />

<strong>Le</strong>s dérivés en anti- témoignent également de l’optionalité de ces contraintes. Elles<br />

n’ont en effet aucun impact sur la formation de ces derniers comme le montre la possibilité<br />

d’itération du préfixe dans anti anti bayesien (16), anti-anti-CPE (17) ou anti-antiavortement<br />

(18). L’insensibilité à ces contraintes s’observe aussi sur les dérivés dont le radical<br />

commence par /ti/ comme antititan, antititanesque ou antititiste (19), par une syllabe<br />

phonologiquement proche comme anti-Tintin (20) et même par la voyelle /i/ comme antiidiot<br />

(21). Cette particularité est signalée par Dell (1995). Dans cet article, Dell s’appuie<br />

sur le maintien de la voyelle /i/ à l’initiale du radical dans des configurations comme (21),<br />

prononcé /Ãtiidjo/ et non /Ãtidjo/, pour conclure que anti-, comme d’autres préfixes, est<br />

un mot phonologique à part entière.<br />

(16) J’ai installé spamassassin depuis qq temps et ça marche pas mal sauf pour les spams<br />

anti anti bayesien. linuxfr.org/~lordcow/,2.html<br />

(17) <strong>Le</strong>s « anti-anti-CPE » saisissent la justice, comme des salariés le feraient dans une<br />

usine bloquée par un piquet de grève. www.marianne2.fr/Qui-sont-les-anti-anti-<br />

CPE-_a65697.html<br />

(18) Une contre-manifestation d’anti-anti-avortement avait lieu en même temps.<br />

Ça a failli dégénérer... actualite.alvinet.com/article-1161362-anti-ivgmanifestation-devant-urbain-v-le-flop-des-anti-avortement.html<br />

(19) Il connaissait bien Rajk et pensait organiser un gouvernement antititiste en exil. www.<br />

persee.fr/.../xxs_0294-1759_1990_num_25_1_2225<br />

(20) En cela c’est un anti-Tintin. lechoucas.dupuis.com/lechoucas/serie/auteur2.html<br />

(21) Imaginons la tête du monsieur qui a installé cela, si demain il y avait un boitier antivieux<br />

! ! ! ou pire un boitier anti-idiot (pour rester correct) www.rue89.com/2008/04/<br />

30/le-boitier-anti-jeunes-est-bien-illegal<br />

L’insensibilité des dérivés en anti- aux contraintes dissimilatives se manifeste également par<br />

le fait qu’il n’y a pas de semi-vocalisation de /i/ en /j/ ni d’insertion de yod épenthétique<br />

devant une voyelle autre que /i/ (Lombard 1964, Morin 1971, Durand 1982) 11 : antiatomique<br />

est prononcé /ÃtiatOmik/ et non /ÃtjatOmik/ ni /ÃtijatOmik/ ; anti-érotique est<br />

prononcé /ÃtieKOtik/ et non /ÃtjeKOtik/ ni /ÃtijeKOtik/.<br />

11. Lombard (1964) et Morin (1971) sont cités par Dell (1995).


46 Un modèle théorique de la morphologie lexicale<br />

2.10.2 Taille<br />

La formation des mots est aussi soumise à des contraintes de taille qui pénalisent la<br />

création des formes trop longues ou trop courtes. Ces contraintes sont responsables du<br />

raccourcissement ou de l’allongement des radicaux afin que la taille de ces derniers soit<br />

proche de l’optimum qui est de deux syllabes (Plénat et Roché 2003, Plénat <strong>2009</strong>). Par<br />

exemple, le nom propre Récamier est accourci dans récamiesque pour éviter de produire<br />

la forme récamiéresque dont le radical comporte trois syllabes et deux /e/ consécutifs. La<br />

forme récamiesque satisfait ainsi à la fois les contraintes dissimilatives et les contraintes de<br />

taille. À l’inverse, la forme goutte est allongée dans gouttelette pour éviter la forme gouttette<br />

qui présente deux /t/ consécutifs ; là encore, c’est la coalition des contraintes de taille et des<br />

contraintes dissimilatives qui induit la forme interfixée.<br />

<strong>Le</strong>s contraintes de taille sont optionnelles et n’ont elles aussi pas d’influence sur la<br />

préfixation en anti-. Par exemple, le radical de anticonstitutionnel, sur lequel est formé le<br />

fameux anticonstitutionnellement, comporte cinq syllabes. Plus généralement, la possibilité<br />

de préfixer anti- à des groupes nominaux sans déterminant comme anti-fil à pendre le linge<br />

(22) légitime la présence parmi ces dérivés de mots longs voire très longs.<br />

(22) J’ai bien compris que tu étais anti-fil à pendre le linge alors hop, enlevé! Quant à<br />

savoir si la levée a été faite, tu n’as pas dû bien regarder. www.vacanceo.com/albums_<br />

photos/voir-photo_396772.php<br />

2.11 Contraintes lexicales sur la forme<br />

<strong>Le</strong>s contraintes sur la position lexicale portent sur la correspondance entre le sens visé<br />

et la position lexicale. <strong>Le</strong>s contraintes morphophonologiques portent uniquement sur la<br />

forme. Il existe un troisième groupe de contraintes qui contrôlent les correspondances<br />

entre la position lexicale et la forme et entre la catégorie et la forme, via la position lexicale.<br />

Ces contraintes favorisent les formes qui sont les mieux à même d’exprimer morphologiquement<br />

le sens des dérivés et leur catégorie. Certaines sont bien connues comme les<br />

contraintes de transparence qui, dans un modèle morphématique, stipulent que la forme<br />

idéale d’un dérivé est la concaténation des morphèmes qui composent sa structure. À l’inverse<br />

des contraintes morphophonologiques, ces contraintes interviennent de manière prépondérante<br />

dans la détermination de la forme des dérivés en anti-.<br />

2.11.1 Recyclage<br />

La première des contraintes à laquelle sont soumises les formes des mots est celle de la<br />

primauté du lexique mémorisé. Cette contrainte favorise la réutilisation des formes ayant<br />

déjà servi à exprimer le sens visé par le locuteur. Elle correspond au principe d’économie<br />

proposé par Roché (2008). La rareté relative des créations lexicales dans les discours témoigne<br />

de l’importance de cette contrainte. Dans les corpus, le nombre de néologismes<br />

est infinitésimal par rapport à celui des occurrences. Cette contrainte est aussi responsable<br />

de la préservation des formes allomorphiques et supplétives. Elle peut être formulée de la<br />

manière suivante (C2.3) :


Contraintes lexicales sur la forme 47<br />

Contrainte 2.3 Contrainte de recyclage<br />

La forme optimale d’un mot est aussi proche que possible d’une forme mémorisée dans une<br />

position lexicale aussi saillante que possible.<br />

Idéalement, cette forme est donc celle d’un mot existant très fréquent. Cette contrainte<br />

permet par ailleurs de légitimer les conversions, i.e. les formes obtenues par dérivation non<br />

affixale.<br />

La contrainte de recyclage intervient de façon nette dans la sélection des radicaux adjectivaux<br />

des formes des dérivés. Par exemple, la sélection de la forme antipiratable (23)<br />

pour un dérivé dont la base peut être exprimée par le lexème piratage 12 peut être en partie<br />

attribuée à cette contrainte qui favorise le radical mémorisé piratable à un radical nouveau<br />

ou à un radical plus rare comme piratesque, piratier, piratien, etc. La sélection de ce radical<br />

est également conditionnée par la série des dérivés de la forme anti-Xable présentée en section<br />

4.3.6. La table 2.1 fait apparaître la corrélation qui existe entre la fréquence des lexèmes<br />

et la disponibilité de leurs formes comme radicaux de dérivés en anti- 13 . La contrainte de<br />

recyclage rend compte de cette corrélation.<br />

(23) aucune console n’est anti-piratable<br />

les mini dvd pour xbox vierge existe a la vente<br />

forum.hardware.fr/hfr/JeuxVideo/piratage-xbox-commence-sujet_34065_1.htm<br />

lexème pages dérivés en anti-<br />

piratage 2 200 000 220 000<br />

piratable 20 000 20<br />

piratesque 940 0<br />

piratier 580 0<br />

piratien 63 0<br />

Table 2.1 – Fréquences de quelques lexèmes de la famille dérivationnelle de piratage et<br />

des dérivés en anti- dont le radical est une de leurs formes. <strong>Le</strong>s chiffres présentés sont la<br />

somme des nombres de pages en français indexées par Google qui contiennent ces formes.<br />

Une corrélation nette peut être établie entre la fréquence du lexème et la disponibilité de<br />

ses formes comme radicaux de dérivés en anti-. Décompte réalisé le 27 août <strong>2009</strong>.<br />

<strong>Le</strong> recyclage concerne aussi les formes entières des dérivés et pas seulement leurs radicaux.<br />

Par exemple, antimauritanien peut à la fois signifier ‘opposé à la Mauritanie’ (24)<br />

ou ‘opposé aux mauritaniens’ (25). Deux sens construits différents sont ainsi exprimés par<br />

la même forme. Notons que le recyclage de la forme antimauritanien est renforcé par celui<br />

de mauritanien qui est à la fois l’adjectif relationnel correspondant à Mauritanie et son<br />

12. Antipiratable peut également être analysé comme un dérivé de la sous-série antihéros dont le sens serait<br />

‘qui a des propriétés contraires à celles d’un système piratable’. Sa base serait alors l’adjectif piratable. Je<br />

remercie Marc Plénat de m’avoir signalé cette possibilité.<br />

13. Je renvoie à <strong>Hathout</strong> et al. (<strong>2009</strong>a, 2008) pour les précautions d’emploi de ce type de statistiques.


48 Un modèle théorique de la morphologie lexicale<br />

gentilé (Roché 2008). <strong>Le</strong> recyclage contribue ainsi à l’organisation analogique induite par<br />

le principe de copie (Dell 1970). Par ailleurs, Roché (2008) note que les adjectifs sont plus<br />

souvent concernés par le recyclage que les autres catégories parce qu’ils sont dénués de capacité<br />

référentielle directe et qu’ils ont davantage de plasticité sémantique. Je rappelle que<br />

les contraintes qui contrôlent les correspondances entre les quatre niveaux de représentation<br />

sont redondantes et qu’elles s’appliquent systématiquement même lorsque l’analyse<br />

d’un mot particulier n’impose pas d’y faire appel.<br />

(24) Selon le journal, les deux Français, qui ont quitté samedi Nouakchott pour la France,<br />

ont été accusés "d’activités anti-mauritaniennes", notamment "d’espionnage et de<br />

menées subversives". membres.tripod.fr/JournalRefus/actualite10.html<br />

(25) <strong>Le</strong>s émeutes anti-commerçants au Sénégal, par exemple, sont devenues des émeutes<br />

antimauritaniennes dans la presse d’abord, qui a fait l’amalgame entre commerçants<br />

et mauritaniens, mais de ce fait, dans la rue dès le lendemain, puis antisénégalaises en<br />

Mauritanie, et d’une révolte contre la marchandise et les marchands on est passé à un<br />

conflit interethnique. www.teleologie.org/OT/deboard/2889.html<br />

2.11.2 Transparence sémantique<br />

<strong>Le</strong>s contraintes de transparence correspondent à la contrainte de fidélité bien connue<br />

en morphophonologie. Dans un cadre lexématique classique, cette contrainte est maximalement<br />

satisfaite par les formes des dérivés affixaux obtenus par concaténation directe<br />

de l’affixe dérivationnel à la forme de la base comme dans acide > acidité 14 ou roman ><br />

antiroman. À l’inverse, une forme comme antiparlementaire n’est pas optimale car elle décrit<br />

un sens construit que l’on peut paraphraser par ‘opposé au parlementaire’, différent<br />

du sens usuel de ce mot, ‘opposé au parlement’. Dans ces modèles, la fidélité est conçue<br />

comme la configuration par défaut dans laquelle les formes sont les reflets exacts des sens<br />

construits compositionnels qu’elles servent à exprimer. Cette contrainte est notamment<br />

proposée dans Corbin (2001a) et (2001b) sous forme respectivement, d’une « contrainte de<br />

conformité structuro-sémantique » et d’une « contrainte de conformité sémantique » 15 .<br />

Dans le modèle paradigmatique que je propose, la transparence est une contrainte gradable<br />

qui favorise les formes qui permettent une reconnaissance optimale de la position<br />

lexicale qui correspond à un sens visé par le locuteur. Cette contrainte ne concerne que<br />

les mots dérivés, c’est-à-dire ceux dont la position lexicale est associée à un sens construit.<br />

Dans ce qui suit, cette position est appelée position sélectionnée. Je rappelle qu’un sens<br />

construit est un sens défini relationnellement, i.e. par les relations qui existent entre sa position<br />

et les autres positions du lexique.<br />

La forme idéale d’un dérivé, celle qui est maximalement transparente, doit permettre<br />

d’identifier toutes les relations que ce mot entretient avec les autres mots du lexique. Il<br />

14. J’écrirai A > B pour indiquer que B est un dérivé dont la base peut être exprimée par A.<br />

15. Contrainte de conformité structuro-sémantique : La forme optimale d’une unité construite est<br />

la plus proche possible de la forme attendue à partir de la structure et du sens construit (Corbin 2001a).<br />

Contrainte de conformité sémantique : La forme optimale d’une unité construite par affixation est<br />

la plus proche de la forme obtenue par la concaténation de toutes et rien que les formes des constituants<br />

concourant à la construction de son sens (Corbin 2001b).


Contraintes lexicales sur la forme 49<br />

n’est évidemment pas possible de décrire en même temps, au moyen d’une seule forme,<br />

l’immense collection de ces relations et des positions auxquels la position sélectionnée est<br />

connectée. La solution de rechange la plus efficace consiste à identifier cette position par<br />

l’une de ces relations, celle qui est la plus forte au sens de D2.4. Une fois cette relation choisie,<br />

il suffit de l’exprimer de la manière la plus transparente possible. L’identification de la<br />

position sélectionnée se fait ainsi au moyen d’un couple (relation, origine) où la relation est<br />

celle qui a été choisie pour identifier la position sélectionnée et où l’origine est la position<br />

à laquelle la position sélectionnée est connectée par la relation (voir figure 2.3). L’origine<br />

est la position de la base du dérivé. La notion de base devient ainsi secondaire. Elle découle<br />

ainsi simplement des contraintes de transparence.<br />

<br />

anti-éblouissement<br />

r<br />

éblouissement<br />

<br />

antilimace<br />

Figure 2.3 – Identification de la position de anti-éblouissement à partir de celle de sa base<br />

éblouissement et de la relation morphologique r qui les connecte. La position de antiéblouissement<br />

est caractérisée par sa proximité avec la position de éblouissement et avec<br />

celles des dérivés morphologiques de la sous-série antilimace.<br />

La base est donc une position parmi d’autres à partir de laquelle l’identification de la<br />

position sélectionnée peut être réalisée. Pour une position sélectionnée donnée, il existe<br />

autant de couples qu’il y a de relations qui connectent cette position à d’autres positions<br />

lexicales. L’expression du sens construit consiste ainsi à sélectionner le meilleur couple et à<br />

l’exprimer de la façon la plus transparente possible. On a donc deux groupes de contraintes :<br />

l’un pour choisir le couple (relation morphologique, base) le mieux à même d’identifier le<br />

sens construit ; l’autre pour favoriser l’expression la plus transparente possible de ce couple.<br />

<strong>Le</strong>s contraintes du premier groupe peuvent être formulées comme suit (C2.4 ; C2.5) :<br />

Contrainte 2.4 Contrainte sur la sélection de la relation morphologique<br />

La relation morphologique qui permet l’identification optimale de la position lexicale associée<br />

à un sens construit est la relation la plus forte possible qui connecte cette position à une<br />

autre position du lexique.<br />

Cette relation morphologique détermine la série dérivationnelle à laquelle appartient le<br />

mot. Je rappelle que la force d’une relation morphologique est définie en D2.4.


50 Un modèle théorique de la morphologie lexicale<br />

Contrainte 2.5 Contrainte sur la sélection de la base<br />

La base qui permet l’identification optimale de la position lexicale associée à un sens<br />

construit est :<br />

a. la position la plus proche possible de la position sélectionnée ;<br />

b. la position la plus saillante possible ;<br />

c. la position connectée à la position sélectionnée qui participe avec cette dernière au plus<br />

grand nombre possible d’analogies morphologiques.<br />

Comme pour D2.5b, un corollaire de C2.4 et C2.5c est que la série dérivationnelle qui<br />

permet la meilleure identification du sens construit est la plus grande possible (i.e. celle qui<br />

contient le plus grand nombre possible de lexèmes). Notons que le fait qu’une position<br />

sélectionnée p ait une base b n’interdit pas à cette dernière d’avoir p comme base. C’est le<br />

cas des mots qui sont en relation de motivation réciproque comme carrossier et carrosserie<br />

ou pessimiste et pessimisme (Roché 2010a).<br />

<strong>Le</strong> deuxième groupe de contraintes porte sur l’expression transparente de cette base b<br />

et de la série dérivationnelle qui correspond à la relation morphologique r qui connecte b<br />

à la position sélectionnée. Cette position peut être vide ou contenir des mots mémorisés.<br />

Dans le second cas, la position appartient à une série qui exprime r et qui est sélectionnée.<br />

Dans le premier, il faut identifier la série la mieux à même d’exprimer r en utilisant D2.7.<br />

Considérons par exemple un dérivé adjectival dont le sens construit est ‘qui protège de<br />

l’éblouissement’. Cette position est définie par le couple (éblouissement, r) où r(x, y) est une<br />

relation glosable par ‘x protège de y’. Cet adjectif occupe une position caractérisée par sa<br />

proximité avec la position de éblouissement et avec celles des dérivés morphologiques de la<br />

sous-série antilimace, de la série des dérivés en pare- (pare-soleil) et en para- (parapluie) et<br />

des composés en protège- (protège-cahier). Supposons que la fréquence et la productivité<br />

de la préfixation en anti- conduise à sélectionner cette sous-série, i.e. à utiliser ou créer<br />

une position dans cette sous-série. L’identification de cette position peut alors être illustrée<br />

comme en figure 2.3.<br />

La contrainte de transparence de la base (C2.6) favorise les formes qui permettent<br />

d’identifier la base, i.e. la position correspondant au mot éblouissement. La meilleure façon<br />

d’y parvenir est simplement d’y faire apparaître la séquence éblouissement. De même,<br />

la transparence de la série dérivationnelle (C2.7) favorise les formes qui permettent d’identifier<br />

la série du dérivé, en l’occurrence celle des mots préfixés en anti-, et plus précisément<br />

ceux de la sous-série antilimace. La meilleure façon pour une forme d’atteindre cet objectif<br />

est de posséder les marques caractéristiques de cette série, c’est-à-dire l’initiale anti-. Plus<br />

généralement, la transparence peut être imposée au moyen des deux contraintes suivantes<br />

(C2.6 ; C2.7) complétées par la définition D2.7 :<br />

Définition 2.7 Série dérivationnelle d’un dérivé<br />

La série dérivationnelle d’une position est la série dont les positions sont les plus proches<br />

possible de cette position.<br />

Contrainte 2.6 Contrainte de transparence de la base


Contraintes lexicales sur la forme 51<br />

La forme optimale permettant l’identification de la position lexicale d’un dérivé est formellement<br />

la plus proche possible de l’une des formes d’un mot qui est morphologiquement aussi<br />

proche que possible de la base du dérivé.<br />

Contrainte 2.7 Contrainte de transparence de la série dérivationnelle<br />

La forme optimale d’un dérivé est formellement la plus proche possible du plus grand<br />

nombre possible de formes de mots appartenant à la série dérivationnelle du dérivé.<br />

La contrainte C2.6 légitime à la fois les formes antipère et antipaternel pour exprimer<br />

un sens construit comme ‘qui s’oppose aux pères’ tout en favorisant la première forme par<br />

rapport à la seconde. La forme père étant plus proche que paternel de père, antipère est<br />

plus transparent que antipaternel. <strong>Le</strong> radical paternel est néanmoins acceptable selon C2.6<br />

car c’est une forme d’un mot dont la position lexicale est contiguë à celle de la base père<br />

(voir section 2.4). <strong>Le</strong> fait que paternel appartienne à la famille lexicale de père découle simplement<br />

de la définition de ce paradigme. La situation est identique pour antiparlement et<br />

antiparlementaire : la première forme est plus transparente que la deuxième. La contrainte<br />

C2.7 rend compte d’une forme comme européen dont la finale -éen est proche mais n’est<br />

pas identique à -ien, la marque caractéristique des mots de sa série dérivationnelle (Lignon<br />

2000, 2010).<br />

Un corollaire important des contraintes C2.6 et C2.7 peut être formulé sous la forme<br />

d’une contrainte C2.8 :<br />

Contrainte 2.8 Contrainte d’adéquation<br />

La forme optimale d’un dérivé ne contient que du matériel phonologique qui contribue<br />

directement à l’identification de sa position lexicale.<br />

Cette contrainte rend compte du fait qu’il ne suffit pas de disposer des marques caractéristiques<br />

de la série dérivationnelle et de contenir l’une des formes de la base pour être maximalement<br />

transparent. Par exemple, toutes les formes qui contiennent la séquence éblouissement<br />

et qui commencent par anti-, comme par exemple antiséblouissementière, ne sont<br />

pas aussi satisfaisantes que anti-éblouissement. La contrainte C2.8 pénalise les formes qui<br />

contiennent du matériel sonore qui ne sert pas directement à identifier la position du sens<br />

construit comme le -s- épenthétique et la finale -ière dans antiséblouissementière. C’est un<br />

corollaire des contraintes C2.6 et C2.7 car les formes qui contiennent du matériel parasite<br />

sont plus éloignées de la base et de la série dérivationnelle que celles qui ne contiennent<br />

que le minimum indispensable, les propriétés relatives à ces segments additionnels n’étant<br />

partagées ni avec la base ni avec les membres de la série dérivationnelle.<br />

<strong>Le</strong>s formulations de C2.6 et C2.7 ne font pas intervenir directement les notions de<br />

radical et de marque caractéristique. Ces deux notions peuvent être définies comme des<br />

ensembles de propriétés formelles : le radical correspond à l’ensemble maximal de propriétés<br />

formelles partagées avec la base ou un mot de sa famille lexicale ; les marques caractéristiques<br />

correspondent à l’ensemble des propriétés les plus spécifiques partagées par<br />

le maximum de formes de mots de la série dérivationnelle du dérivé. <strong>Le</strong> cas optimal est


52 Un modèle théorique de la morphologie lexicale<br />

celui de anti-éblouissement dont le radical est une des formes de la base 16 . <strong>Le</strong> dérivé antiéblouissement<br />

partage ainsi le maximum possible de propriétés formelles avec éblouissement.<br />

Anti-éblouissement dispose de l’initiale anti- comme tous les dérivés de sa série. Il<br />

partage donc avec le maximum d’éléments de cette série la propriété la plus spécifique possible,<br />

i.e. la présence du préfixe.<br />

2.11.3 Transparence catégorielle<br />

<strong>Le</strong> niveau de représentation catégoriel décrit l’organisation du lexique en catégories.<br />

Cette organisation exerce sur la formation des mots une pression similaire à celle des séries.<br />

Il n’existe en effet qu’un nombre très réduit de combinaisons de traits morphosyntaxiques<br />

qui induisent un nombre tout aussi réduit de classes. Chaque lexème fait partie d’une catégorie<br />

(i.e. partie du discours) qui détermine les différentes manières dont on peut l’utiliser.<br />

<strong>Le</strong>s propriétés catégorielles constituent ainsi l’un des éléments fondamentaux de la caractérisation<br />

des lexèmes, qu’ils soient construits ou non. <strong>Le</strong>s catégories sont essentiellement des<br />

ensembles de même nature que les séries, même si leur fonction est nettement différente.<br />

La contrainte qu’elles exercent sur la sélection de la forme des mots est similaire à celle des<br />

séries (C2.9). Je rappelle (i) qu’en production, le rôle de la morphologie est d’exprimer un<br />

sens au moyen d’un mot, (ii) que ce dernier doit entrer dans un énoncé et (iii) que c’est ce<br />

contexte qui détermine sa catégorie. Pour cette tâche, la catégorie du dérivé peut donc être<br />

considérée comme une donnée.<br />

Contrainte 2.9 Contrainte de transparence catégorielle<br />

La forme optimale d’un dérivé est formellement aussi proche que possible du plus grand<br />

nombre possible de formes de mots appartenant à la catégorie grammaticale du dérivé.<br />

La contrainte C2.9 favorise l’utilisation de formes qui ressemblent à celles des mots de<br />

leur catégorie qui sont déjà mémorisés et notamment aux mots construits. C2.9 est en fait<br />

simplement un cas particulier d’une règle plus générale qui favorise la création de mots<br />

conformes aux régularités formelles déjà établies au sein du lexique. En l’occurrence, il<br />

s’agit ici de régularités formelles qui s’établissent à l’intérieur des catégories grammaticales.<br />

Cette contrainte reprend l’idée des intégrateurs paradigmatiques proposée par Corbin<br />

(1991). Elle est également proche de la « contrainte de conformité catégorielle » 17 introduite<br />

par Corbin (2001b). En français, le marquage morphologique dérivationnel se situe<br />

généralement à la fin des mots. Cette situation est liée au fait que les mots dérivés constituent<br />

une partie importante des unités du lexique et au fait que les mots suffixés représentent<br />

la plus grande partie d’entre eux. Par ailleurs, les marques flexionnelles sont aussi<br />

toutes situées à la fin des mots (Dell 1970).<br />

16. Anti-éblouissement peut également être analysé comme un dérivé formé sur le verbe éblouir dont le<br />

sens serait ‘qui protège du risque d’être ébloui’. Dans ce cas, cette forme ne satisferait pas la contrainte de<br />

transparence de la base mais pourrait être sélectionnée parce qu’elle serait optimale relativement à la contrainte<br />

sur la sélection de la relation morphologique (C2.4) .<br />

17. Contrainte de conformité catégorielle : En français, la forme optimale d’un mot construit se mesure<br />

à la conformité de sa finale aux finales prototypiques, s’il y en a, de la catégorie lexicale à laquelle il appartient.<br />

En particulier, la forme optimale d’un adjectif construit est celle d’un adjectif suffixé (Corbin 2001b).


<strong>Le</strong> jeux des contraintes : le cas des dérivés en anti- 53<br />

La ressemblance formelle d’un mot avec les mots de sa catégorie ou au moins avec<br />

un nombre suffisant de ses éléments est évaluée sur la base du partage de la même finale.<br />

Par exemple, pour qu’un dérivé ressemble à un adjectif il doit avoir une finale caractéristique<br />

des mots construits de cette catégorie comme -el, -ique, -eux, -if , -ien, -ard, -able,<br />

-é, etc. Ainsi, lors de la construction d’un mot qui doit être utilisé comme un adjectif, la<br />

contrainte C2.9 favorisera les formes qui comportent l’une de ces finales. Dans le cas des<br />

suffixations, C2.9 n’a pas d’effet puisque les mots suffixés ont trivialement une finale déjà<br />

présente parmi les éléments de leur catégorie. Ainsi, les adjectifs dérivés par suffixation ont<br />

une finale qui est bien celle d’un adjectif. Dans le cas des préfixations, la satisfaction de la<br />

contrainte de transparence catégorielle n’est pas automatique. Diverses stratégies visant à<br />

la satisfaire peuvent être observées comme le recours à un radical adjectival morphologiquement<br />

apparenté à la base comme dans parlement > antiparlementaire (voir section 4.5)<br />

ou l’élision d’une partie des constructions qui expriment cette base comme dans attaque<br />

aérienne > anti-aérien (voir section 4.5.8). <strong>Le</strong>s préfixations en post-, pré-, sub-, sous-, anté-,<br />

etc. sont soumises aux mêmes contraintes et présentent des dérivés similaires à anticancéreux<br />

et antiparlementaire (Corbin 1980, 2001b). <strong>Le</strong>s radicaux des dérivés en (26 ; 27 ; 28 ;<br />

29 ; 30) sont des formes adjectivales permettant de satisfaire la contrainte de transparence<br />

catégorielle.<br />

(26) je vais me faire opérer et je voulais savoir ce qu’on faisait comme recherche dans le<br />

sang lors de ce bilan pré-opératoire mis à part le groupe sanguin. forum.doctissimo.<br />

fr/sante/chirurgie/operatoire-bilan-sujet_606_1.htm<br />

(27) <strong>Le</strong> symptôme de douleur post-opératoire est subjectif et limité dans le temps.<br />

www.institut-upsa-douleur.org/Layout/presentation.aspx?ItemID=f2f49c47-<br />

07a0-456b-a047-c51720bc2267<br />

(28) L’archéologie subaquatique a pour objet d’inventorier, d’identifier et d’étudier les sites<br />

à caractère préhistorique ou historique. archeologie.ffessm.fr/<br />

(29) La fonte du glacier forme un torrent appelé torrent émissaire, composé des eaux des<br />

torrents sous-glaciaires. www.ceillac.com/projet-eau-pages/glacier-blanc.htm<br />

(30) Pour montrer combien il est facile de s’abuser en tirant des conséquences de certains<br />

rapprochemens entre la civilisation antécolombienne de l’Amérique et celle de l’ancien<br />

continent, ... fr.wikisource.org/wiki/La_civilisation_Mexicaine_avant_Fernand_<br />

Cortez<br />

La caractérisation des contraintes qui portent sur les correspondances entre les niveaux<br />

lexical et catégoriel sera développée davantage dans le cadre d’une future description détaillée<br />

de la structure flexionnelle des lexèmes dans le modèle à quatre niveaux.<br />

2.12 <strong>Le</strong> jeux des contraintes : le cas des dérivés en anti-<br />

Conjointement, les contraintes présentées ci-dessus permettent de rendre compte de<br />

la grande variété des relations qui existent entre les formes des dérivés et leur sens. Elles<br />

permettent notamment de traiter des phénomènes habituellement analysés au moyen du


54 Un modèle théorique de la morphologie lexicale<br />

principe de copie (Corbin 1987) et du principe d’économie (Roché 2008). Par ailleurs, ces<br />

contraintes affectent uniformément l’ensemble des dérivés en anti- indépendamment de<br />

leurs spécificités sémantiques. Pour illustrer l’interaction de ces contraintes, considérons<br />

l’exemple d’un dérivé de la sous-série antilimace dont la base pourrait être exprimée par<br />

cancer. Ses formes optimales sont déterminées de la manière suivante :<br />

– La contrainte de transparence de la base (C2.6) favorise les formes qui ressemblent<br />

le plus à la base du dérivé et notamment celles dont les radicaux sont des formes de<br />

la base (cancer) ou à défaut, de ses voisins morphologiques immédiats (cancéreux,<br />

cancéré, cancérien, cancérique, cancérer, cancérable) ou éventuellement plus distants<br />

(cancérigène, cancérologue, etc.).<br />

– La contrainte de transparence de la série dérivationnelle (C2.7) favorise les formes<br />

qui portent l’initiale anti- caractéristique de la série.<br />

– La contrainte de transparence catégorielle (C2.9) favorise les formes qui portent une<br />

finale adjectivale ou dont la finale ressemble à celle d’un adjectif (anticancéreux, anticancéré,<br />

anticancérien, anticancérique, anticancérable, etc.). Elle pénalise en revanche<br />

anticancer qui ne dispose pas d’une telle finale.<br />

– La contrainte de recyclage (C2.3) favorise les formes déjà présentes dans le lexique<br />

ou qui ressemblent à un mot existant et celles dont le radical est une forme connue<br />

ou qui ressemble à un mot connu. <strong>Le</strong>s radicaux cancer, cancéreux et cancérigène sont<br />

avantagés par cette contrainte.<br />

<strong>Le</strong> bilan des exigences placées par les différentes contraintes fait apparaître deux finalistes :<br />

1. anticancéreux est la forme optimale pour les contraintes de transparence de la série<br />

dérivationnelle et de transparence catégorielle. Cette forme est également tout à fait<br />

satisfaisante pour les contraintes de transparence de la base et de recyclage. C’est leur<br />

deuxième forme préférée après anticancer.<br />

2. anticancer est la forme optimale pour les contraintes de transparence de la série dérivationnelle,<br />

de transparence de la base (c’est la forme la plus proche de cancer) et de<br />

recyclage (cancer est un mot beaucoup plus saillant dans le lexique existant que les<br />

autres radicaux candidats).<br />

<strong>Le</strong> fait que les formes anticancer et anticancéreux coexistent en français ne pose aucun<br />

problème à la théorie proposée ici. Cette variation découle simplement du fait que pour<br />

certaines occurrences, les locuteurs donnent plus d’importance à la contrainte de transparence<br />

catégorielle et que, pour d’autres, ils préfèrent satisfaire pleinement les contraintes<br />

de transparence de la base et de recyclage. Cet exemple montre qu’il n’y a pas de hiérarchie<br />

universelle entre les contraintes et que la contrainte de transparence de la base et la<br />

contrainte de recyclage sont beaucoup plus fortes que la contrainte de transparence catégorielle<br />

: la forme anticancéreux est sélectionnée parce qu’elle est quasi optimale pour les deux<br />

premières contraintes alors que anticancer est la plus attestée bien qu’elle soit totalement<br />

inacceptable pour la troisième.


Conclusion 55<br />

2.13 Conclusion<br />

Ce chapitre propose un cadre théorique général qui permet d’articuler les travaux présentés<br />

dans la suite du mémoire. Ce modèle prend comme point de départ l’organisation<br />

relationnelle du lexique et la notion de proximité morphologique. Il reconstruit ensuite les<br />

notions de famille morphologique, de série dérivationnelle, de base à partir de l’hypothèse<br />

que la morphologie s’occupe de l’expression du sens au moyen de mots. Il comporte un<br />

système de contraintes permettant de rendre compte de la grande diversité des stratégies<br />

que les locuteurs utilisent pour exprimer un sens au moyen d’un mot dérivé. Ce modèle est<br />

remarquable par plusieurs aspects :<br />

– il est radicalement lexématique ;<br />

– il est paradigmatique ;<br />

– il est non compositionnel ;<br />

– il ne comporte ni règle de construction de mots, ni patrons de construction à la Booij<br />

(2002, 2007) ;<br />

– c’est un modèle exemplariste. Il ne contient aucune structure ou ni aucun objet qui<br />

représente des abstractions. <strong>Le</strong>s paradigmes sont de simples ensembles de mots.<br />

L’utilité de ce modèle reste à confirmer notamment en le confrontant à différentes affixations,<br />

en français et dans d’autres langues. Il doit être étendu à la flexion, à la dérivation<br />

non affixale et à la composition en mettant au point des modes de représentation adaptés<br />

pouvant servir de support aux analogies. Certains de ses aspects doivent être explicités<br />

davantage, notamment l’ensemble des informations associées aux positions lexicales, la représentation<br />

des paradigmes et en particulier des lexèmes, la nature précise des objets mis<br />

en correspondance. Cette élaboration sera réalisée parallèlement au niveau informatique et<br />

théorique afin d’identifier les besoins et de vérifier l’opérationnalité des réponses proposées.<br />

Mais la tâche la plus délicate est la conception de protocoles expérimentaux permettant<br />

de confirmer la réalité des notions et des contraintes qui ont été proposées. Il est inutile<br />

d’espérer atteindre des confirmations similaires à celles de Plénat (2000), Plénat et Roché<br />

(2003), Roché (2003a), Plénat (<strong>2009</strong>) mais il devrait être possible de réaliser des expériences<br />

sur corpus et des expériences psycholinguistiques permettant de les tester.


CHAPITRE 3<br />

Nouveau paradigme d’analyse<br />

morphologique automatique<br />

Mes travaux en linguistique descriptive et en linguistique informatique sont deux facettes<br />

d’un seul et même programme. L’ensemble repose sur les mêmes hypothèses théoriques,<br />

synthétisées dans le chapitre 2. Ces hypothèses permettent de définir un nouveau<br />

paradigme d’analyse morphologique automatique qui consiste à passer d’une analyse morphologique<br />

des mots à une analyse morphologique du lexique. Cette évolution découle<br />

directement de l’approche radicalement lexématique qui est adoptée ici.<br />

3.1 Introduction<br />

3.1.1 Analyse morphologique lexématique<br />

Classiquement, la tâche d’analyse morphologique automatique consiste à décomposer<br />

les mots en morphèmes (Déjean 1998a, b, Gaussier 1999, Schone et Jurafsky 2000, Goldsmith<br />

2001, Creutz et Lagus 2002, Bernhard 2006a, b). C’est notamment ainsi qu’elle est<br />

définie dans les campagnes d’évaluation Morpho Challenge (Creutz et Lagus 2005, Kurimo<br />

et al. 2007, Kurimo et Varjokallio 2008). <strong>Le</strong> cadre théorique sous-jacent est celui de<br />

la morphologie morphématique qui considère que les mots sont constitués de morphèmes<br />

et que ces derniers se combinent relativement à des règles de flexion, de dérivation et de<br />

composition. <strong>Le</strong>s mots seraient donc pourvus d’une structure généralement représentée de<br />

façon arborescente comme en figure 3.1.<br />

<strong>Le</strong>s limites de la morphologie morphématique sont bien connues (Anderson 1992,<br />

Aronoff 1994). Elles peuvent être illustrées par les quelques exemples suivants :<br />

Exemple 1.– Quel est le statut d’une initiale comme per- que l’on retrouve dans les mots de<br />

la liste (1) ? Pour chacun de ces mots, per- peut être remplacée par une autre initiale comme<br />

le montrent les mots entre parenthèses.<br />

57


58 Nouveau paradigme d’analyse morphologique automatique<br />

V<br />

dériv<br />

A<br />

N<br />

-able<br />

-ité<br />

V<br />

dériv<br />

Figure 3.1 – Structures du nom dérivabilité et de l’adjectif dérivationnel telles qu’elles<br />

sont prévues par la morphologie morphématique.<br />

(1) percevoir (recevoir), percuter (discuter), perdition (rédition), perfection (défection),<br />

performer (déformer), perfuser (refuser), permanent (rémanent)<br />

Exemple 2.– <strong>Le</strong> nom dérivation et l’adjectif dérivatif sont formés sur un thème du verbe<br />

dériver. Pourquoi n’existe-t-il pas de verbe similaire pour le nom locomotion et l’adjectif<br />

locomotif ? En d’autres termes, étant donné (2a), quelles sont les solutions des équations en<br />

(2b) ?<br />

(2) a. dérivation = [dérivV -ion]N<br />

dérivatif = [dérivV -if ]A<br />

b. locomotion = [x -ion]N<br />

locomotif = [x -if ]A<br />

Exemple 3.– L’analyse des conversions comporte un morphème zéro dont les propriétés<br />

sémantiques sont difficiles à établir. En (3a), il permet par exemple de former un nom de<br />

qualité, en (3b) un nom d’action et en (3c) un nom qui désigne une entité d’après sa qualité.<br />

(3) a. pouvoirV → [pouvoirV ∅]N<br />

b. volerV → [volV ∅]N<br />

c. petitA → [petitA ∅]N<br />

Exemple 4.– Quel est le statut des interfixes comme en (4) ? Quelles sont leurs propriétés<br />

sémantiques ? Ces séquences, formellement identiques à des suffixes, ont un rôle uniquement<br />

épenthétique (Plénat et Roché 2003, Roché 2003b, Plénat <strong>2009</strong>).<br />

(4) tarte → tartelette ; goutte → gouttelette<br />

<strong>Le</strong>s réponses théoriques apportées à ces problèmes s’inscrivent quant à elles dans le<br />

cadre de la morphologie lexématique (Aronoff 1976, 1994, Anderson 1992, Bybee 1988,<br />

1995, Neuvel et Singh 2001, Burzio 2002, Blevins 2003, 2006). Dans cette approche, les<br />

mots sont des unités atomiques qui n’ont donc pas de structure morphologique. La structure<br />

morphologique est conçue comme un niveau d’organisation du lexique qui se compose<br />

des relations morphologiques s’établissant entre les mots. Elle correspond au niveau de représentation<br />

lexical présenté en section 2.3.<br />

N<br />

A<br />

-ion<br />

-el


Introduction 59<br />

La validité de la conception lexématique de la morphologie a fait l’objet de nombreuses<br />

études en psycholinguistique. En effet, les modèles psycholinguistiques se distinguent nettement<br />

selon que la morphologie soit considérée comme morphématique ou lexématique.<br />

Dans un cas, les objets stockés dans le lexique mental sont conçus comme des morphèmes<br />

et les mots sont décomposés lors de leur traitement. Dans l’autre, le lexique mental contient<br />

des formes complètes et le traitement des mots ne comporte pas de décomposition. Parmi<br />

les tenants de la morphologie lexématique, on peut citer Hay et Baayen (2005) dont l’une<br />

des conclusions est que la gradabilité des phénomènes morphologiques est compatible avec<br />

cette conception.<br />

Ces changements dans la manière dont la morphologie est conçue n’ont en revanche<br />

pas eu jusqu’ici de réelles conséquences sur son traitement automatique si l’on excepte les<br />

travaux de Neuvel et Singh (2001), Neuvel et Fulop (2002), <strong>Hathout</strong> (2001, 2003, 2005)<br />

sur la découverte de relations morphologiques entre les mots et l’acquisition de schémas<br />

d’affixation. Ce chapitre apporte une autre réponse à cette évolution.<br />

<strong>Le</strong> problème à résoudre peut être formulé comme suit : comment réaliser une analyse<br />

morphologique automatique dans le cadre d’une morphologie lexématique, c’est-à-dire<br />

sans recourir aux notions de morphème, d’affixe ni d’exposant morphologique ? La solution<br />

que je propose passe par un changement de paradigme. Elle consiste à redéfinir la tâche<br />

d’analyse morphologique pour que son objectif ne soit plus de découper les mots en morphèmes<br />

mais de découvrir l’organisation morphologique du lexique. Cette organisation<br />

se compose de l’ensemble des paradigmes identifiés en section 2.6.1 et des analogies qui les<br />

connectent, présentées en section 2.6.2. En d’autres termes, il s’agit de construire le maillage<br />

défini par les familles, les séries et les analogies morphologiques. L’analyse des mots particuliers<br />

est ensuite obtenue comme un sous-produit du maillage global. Par exemple, le<br />

nom dérivation n’est plus découpé en deux morceaux dérivat et ion, le premier identifié au<br />

morphème verbal dériv et le second au suffixe déverbal -ion comme dans l’approche morphématique.<br />

Son analyse consiste ici à identifier sa position dans le lexique. Cette position<br />

est caractérisée d’une part par son appartenance à la famille des mots en (5a) et à la série des<br />

mots en (5b) et d’autre part par les analogies qui contiennent les relations qui connectent<br />

dérivation aux éléments de ces deux ensembles comme (6a) pour dérivation : dérivable ou<br />

(6b) pour dérivation : variation.<br />

(5) a. dériver ; dérivable ; dérivatif ; dérivatoire ; dérivationnel ; dérivabilité ; dérive ;<br />

dériveur ; dérivette ; dérivement<br />

b. acclimatation ; bonification ; création ; évolution finition ; éducation ; localisation ;<br />

séduction ; variation<br />

(6) a. dérivation : dérivable :: modification : modifiable<br />

dérivation : dérivable :: adaptation : adaptable<br />

dérivation : dérivable :: observation : observable<br />

b. dérivation : variation :: dériver : varier<br />

dérivation : variation :: dérivationnel : variationnel<br />

dérivation : variation :: dérivabilité : variabilité<br />

dérivation : variation :: dérivable : variable


60 Nouveau paradigme d’analyse morphologique automatique<br />

3.1.2 Combiner la proximité morphologique et l’analogie formelle<br />

Dans la suite de ce chapitre, je présente un modèle informatique qui implémente certains<br />

aspects du modèle théorique décrit dans le chapitre 2. Ce modèle a été mis au point en<br />

utilisant un dictionnaire informatisé, en l’occurrence le Trésor de la Langue Française informatisé<br />

1 (TLFi). Il permet de vérifier que le modèle théorique est opératoire. Cependant,<br />

mon objectif principal est de créer une ressource morphologique fiable et à large couverture.<br />

Pour l’heure, il n’en existe pas pour le français. Ce lexique offrira une description<br />

globale d’un fragment central et de grande taille du vocabulaire du français.<br />

<strong>Le</strong>s relations morphologiques étant des relations de partage de forme et de sens, proposer<br />

une modélisation qui intègre les deux types d’information me semble indispensable<br />

d’autant plus si l’on a l’ambition de rendre compte de phénomènes difficiles comme l’allomorphie,<br />

les supplétions ou la conversion. <strong>Le</strong>s descriptions sémantiques utilisées dans<br />

l’expérience présentée dans la suite du chapitre est en revanche relativement rudimentaire.<br />

Elles servent avant tout à montrer comment il serait possible de les intégrer dans ce modèle.<br />

De plus, les ressources électroniques qui décrivent des connaissances sémantiques sont relativement<br />

rares. <strong>Le</strong>s plus complètes d’entre elles sont certainement les dictionnaires informatisés<br />

et les bases de données lexicales de type WordNet (Miller et al. 1990, Fellbaum<br />

1999). Je suis naturellement conscient des limites des descriptions lexicographiques, mais<br />

je pense que les bénéfices que l’on peut en tirer dépassent largement les difficultés qu’elles<br />

induisent. Ces descriptions sont par ailleurs plus faciles à utiliser que des connaissances<br />

extraites de corpus telles que des voisinages distributionnels (Galy et Bourigault 2005) car<br />

elles ne contiennent que les définitions des sous-sens les plus représentatifs de l’usage des<br />

mots.<br />

La méthode d’analyse morphologique du lexique que je propose s’appuie d’une part<br />

sur une mesure de proximité morphologique qui rapproche les membres des familles morphologiques<br />

et des séries dérivationnelles. Cette mesure prend en compte à la fois les similarités<br />

formelles et sémantiques entre les mots. Elle s’appuie d’autre part sur la découverte<br />

d’analogies formelles entre voisins morphologiques. <strong>Le</strong> recours à l’analogie est relativement<br />

répandu en morphologie informatique (Skousen 1989, 1992, <strong>Le</strong>page 1998, 2000,<br />

2003, Van den Bosch et Daelemans 1999, Pirrelli et Federici 1994, Pirrelli et Yvon 1999,<br />

<strong>Hathout</strong> 2003, 2005, Yvon et al. 2004, Stroppa et Yvon 2005, 2006, Stroppa 2005, Yvon<br />

2006, Langlais <strong>2009</strong>). La principale nouveauté de ma méthode est de combiner l’analogie et<br />

la proximité morphologique. J’utilise dans un premier temps la proximité morphologique<br />

pour sélectionner des quadruplets de mots susceptibles d’être morphologiquement apparentés<br />

puis, dans un deuxième temps, je les filtre pour ne garder que ceux qui forment une<br />

analogie formelle. <strong>Le</strong>s deux techniques sont complémentaires : les voisinages morphologiques<br />

peuvent être calculés en grand nombre, mais ils sont trop grossiers pour discriminer<br />

entre les mots qui sont effectivement morphologiquement apparentés et ceux qui ne le sont<br />

pas ; l’analogie formelle permet un filtrage fin mais elle est coûteuse à calculer.<br />

Plus généralement, le paradigme d’analyse morphologique proposé est original à plusieurs<br />

égards. <strong>Le</strong> premier est que le modèle informatique est purement lexématique. La<br />

1. atilf.atilf.fr/tlf.htm


Introduction 61<br />

découverte des relations morphologiques qui existent entre les mots ne fait pas intervenir<br />

de morphèmes, d’affixes, d’exposants morphologiques ni aucune représentation de ces notions.<br />

<strong>Le</strong> deuxième est que les relations morphologiques entre les mots n’ont pas toutes<br />

la même force (voir définitions D2.4). De ce fait, l’appartenance aux familles et aux séries<br />

est graduelle aussi. Par exemple, dans la famille de dériveur, dérive est plus proche de<br />

ce mot que ne l’est par exemple dérivationnellement. De même, dans la série de formation,<br />

compilation est plus proche de ce mot que ne l’est vision : compilation partage en effet<br />

plus de matériel phonologique avec formation et participe avec lui à un plus grand nombre<br />

d’analogies, en supposant que les traits sémantiques partagés par formation avec ces mots<br />

sont les mêmes. Mon modèle est ainsi compatible avec les observations de Hay et Baayen<br />

(2005) sur la gradabilité des phénomènes morphologiques. <strong>Le</strong> troisième est sa contribution<br />

à l’implémentation des propositions théoriques de Bybee et de Burzio.<br />

La méthode que je propose est aussi très robuste et peut être facilement adaptée à<br />

d’autres langues romanes, à l’anglais et probablement aussi à des langues gabaritiques<br />

comme l’arabe ou l’hébreu. Cette méthode dispose par ailleurs d’une efficacité suffisante<br />

pour être utilisée pour construire de façon semi-automatique une ressource morphologique<br />

à large couverture. Elle intègre de manière uniforme les connaissances sémantiques et formelles.<br />

<strong>Le</strong>s traits utilisées dans l’expérience présentée ci-dessous pourraient être complétés<br />

ou éventuellement remplacés par d’autres comme des traits phonologiques, des éléments<br />

de descriptions extraits de dictionnaires de synonymes ou de WordNet ou des propriétés<br />

distributionnelles acquises dans des corpus. Tous ces traits peuvent être cumulés sans<br />

difficulté malgré les différences de nature et d’origine. <strong>Le</strong> modèle tire en effet profit de la<br />

redondance des traits. Par ailleurs, il est peu sensible aux variations et aux exceptions.<br />

D’un point de vue technique, ma méthode associe :<br />

(i) la représentation du lexique sous la forme d’un graphe et son exploitation par un<br />

algorithme de marches aléatoires, dans la lignée de Gaume (2003, 2004), Gaume et al.<br />

(2002, 2004a, b, 2006), Muller et al. (2006) ;<br />

(ii) l’analogie formelle sur les mots (<strong>Le</strong>page 1998, 2000, 2003, Yvon et al. 2004, Stroppa<br />

et Yvon 2005, 2006, Stroppa 2005, Yvon 2006, Langlais et Patry 2007, 2008, Langlais<br />

<strong>2009</strong>, Langlais et al. <strong>2009</strong>). Cette technique ne fait pas appel à la notion de morphème.<br />

<strong>Le</strong>s correspondances entre les mots sont calculées directement au niveau des chaînes<br />

de caractères (graphies ou transcriptions phonologiques).<br />

3.1.3 Réseau morphologique<br />

La ressource morphologique qui sera construite à terme est un réseau qui décrit la<br />

structure morphologique du lexique présentée dans le chapitre 2. Ce réseau est composé de<br />

mots interconnectés par les relations qui s’établissent au sein des paradigmes présentés en<br />

section 2.6.1, notamment les familles et les séries dérivationnelles morphologiques et lexicales.<br />

Cette structure est complétée par les analogies qui unissent les couples de lexèmes<br />

morphologiquement apparentés. <strong>Le</strong> lexique aura une grande flexibilité lui permettant de<br />

représenter de façon adéquate différents phénomènes morphologiques. <strong>Le</strong> principal est<br />

l’allomorphie qui correspond à une position pour laquelle il y un décalage entre les analo-


62 Nouveau paradigme d’analyse morphologique automatique<br />

gies formelles et l’organisation en familles en séries morphologiques. Par exemple, la forme<br />

déverbale dénivellation sera identifiée comme une forme allomorphique parce que (i) elle<br />

appartient à la série des mots en -ion et (ii) à la famille de déniveler de par sa proximité avec<br />

les éléments qui composent chacun de ces ensembles, et parce que (iii) c’est le nom le plus<br />

proche de ce verbe. <strong>Le</strong>s noms qui finissent en -ion et notamment en -ation se trouvent dans<br />

des analogies avec leur verbe le plus proche, comme (7). L’absence d’une analogie similaire<br />

pour dénivellation apparaît alors comme un trou dans la grille analogique. Un second indice<br />

est la proximité formelle qui existe entre la forme de dénivellation (à la fois graphique<br />

et phonologique /denivElasjÕ/) et celle qui permettrait de combler ce trou (dénivelation ;<br />

/denivlasjÕ/ 2 ).<br />

(7) dérivation : dériver :: compilation : compiler<br />

formation : former :: variation : varier<br />

Ce réseau permettra de représenter par exemple de la même façon les similarités et<br />

les différences qui existent entre curieux et furieux (Jackendoff 1975). <strong>Le</strong> fait que furieux<br />

puisse être analysé comme un adjectif construit sur le nom furie découle de l’appartenance<br />

des deux mots à la même famille et de leur proximité morphologique ; en revanche, curieux<br />

n’étant plus actuellement sémantiquement apparenté au nom cure — dans le sens qu’il a<br />

dans une expression comme n’avoir cure de —, il ne fait pas partie de sa famille morphologique.<br />

<strong>Le</strong> réseau décrira également le fait que furieux : furie participe à des analogies avec<br />

d’autres couples de mots comme (8) alors que curieux ne se trouve dans aucune analogie<br />

similaire. À l’inverse, l’appartenance de furieux et curieux à la même série lexicale découle<br />

simplement du fait qu’ils possèdent chacun les propriétés sémantiques et formelles des adjectifs<br />

en -eux. Cet exemple illustre la souplesse du modèle et le pouvoir descriptif apporté<br />

par les paradigmes et les analogies. Par comparaison, la similarité entre curieux et furieux<br />

ne peut pas être décrite de façon simple dans un modèle morphématique ou dans tout autre<br />

modèle ne disposant pas de séries lexicales ou d’un concept équivalent.<br />

(8) mélodieux : mélodie ; harmonieux : harmonie ; facétieux : facétie<br />

La représentation des mots qui contiennent des interfixes comme en (4) ne présente<br />

pas non plus de difficulté. Ces mots sont des membres à part entière de leurs familles et<br />

de leurs séries. La relation dérivationnelle qu’ils entretiennent avec leurs bases est tout à<br />

fait normale. Elle est représentée par leur appartenance à la même famille morphologique<br />

et par leur proximité morphologique. D’autre part, la présence de l’interfixe renforce leur<br />

intégration formelle dans leurs séries.<br />

L’organisation d’un tel lexique en réseau permet aussi de mieux répondre aux besoins<br />

des outils de traitement automatique des langues et de recherche d’information. <strong>Le</strong>s ressources<br />

morphologiques sont notamment utilisées dans ces domaines pour la désambiguïsation<br />

des rattachements prépositionnels et pour l’expansion de requête. Par exemple,<br />

un analyseur syntaxique comme Syntex (Bourigault et Fabre 2000, Bourigault 2007) utilise<br />

Verbaction, un lexique composé des couples de noms et de verbes proches qui appartiennent<br />

aux mêmes familles morphologiques. Ces informations seront directement dis-<br />

2. Prononciation en français standard. Dans les variantes du français où l’on dit /deniv@le/, on aurait naturellement<br />

/deniv@lasjÕ/.


Introduction 63<br />

ponibles dans le réseau proposé et pourront ainsi être sélectionnées avec davantage de<br />

précision. Dans le domaine de la recherche d’information, les performances de recherche<br />

peuvent être améliorées en ajoutant aux requêtes des mots morphologiquement apparentés<br />

à ceux qu’elles contiennent (Jing et Tzoukermann 1999, Jacquemin et Tzoukermann<br />

1999, Claveau et L’Homme 2005, Moreau et al. 2007). Ces mots appartiennent tous aux<br />

familles morphologiques des mots présents dans les requêtes initiales. De plus, l’estimation<br />

de la proximité morphologique associée à chaque relation permet un réglage fin des expansions.<br />

Par ailleurs, la nature relationnelle de ce réseau n’ajoute aucune difficulté particulière<br />

comme en témoigne le nombre considérable d’applications qui utilisent la base WordNet.<br />

Ce lexique pourra également être utilisé pour la constitution de matériel expérimental<br />

en psycholinguistique. Par exemple, le fait qu’un mot soit construit morphologiquement<br />

ou non peut être directement obtenu en comparant ses séries morphologiques et lexicales.<br />

Parmi les autres caractéristiques prises en compte lors de la sélection du matériel, on peut<br />

citer la ressemblance formelle et l’appartenance à la même famille morphologique. Ces<br />

informations seront présentes sous forme explicite dans le réseau morphologique.<br />

3.1.4 Travaux connexes<br />

L’approche globale adoptée ici distingue nettement le modèle informatique que je propose<br />

d’autres initiatives visant à constituer des bases de données morphologiques comme le<br />

projet MorTAL (Dal et al. 1999, 2004, <strong>Hathout</strong> et al. 2002). Dans ce projet, la base de données<br />

est construite en analysant un à un les dérivés construits par différents affixes comme<br />

-able, -ité, -iser, -ifier, -ion, -ment, etc. au moyen de l’analyseur par règles Dérif (Namer<br />

2003a, 2005). Si l’approche théorique sous-jacente est morphématique, Dérif réalise de fait<br />

une décomposition des mots en racines et affixes. À l’inverse, dans le travail présenté ici, la<br />

totalité du lexique est analysée en une fois.<br />

De nombreux travaux dans le domaine de la morphologie informatique visent à retrouver<br />

les relations morphologiques entre les unités lexicales. Tous s’appuient en premier lieu<br />

sur les similarités qui existent entre les formes graphiques. Ces relations sont principalement<br />

préfixales et suffixales, à deux exceptions près, Yarowsky et Wicentowski (2000) et<br />

Baroni et al. (2002) qui utilisent la distance d’édition de <strong>Le</strong>venshtein pour estimer la similarité<br />

formelle entre les mots. À ma connaissance, tous les autres réalisent d’une façon<br />

ou d’une autre une segmentation des mots, y compris ceux dont le but n’est pas de trouver<br />

des morphèmes comme <strong>Hathout</strong> (2000, 2001, 2003, 2005) ou Neuvel et Singh (2001),<br />

Neuvel et Fulop (2002). <strong>Le</strong> modèle proposé ici se distingue de ces approches par le fait<br />

que les similarités sont déterminées uniquement en fonction du partage des traits formels<br />

et sémantiques. C’est l’une des principales contributions de ce travail.<br />

Par ailleurs, le modèle proposé peut aussi être comparé à d’autres approches qui combinent<br />

les indices graphémiques et sémantiques pour identifier les morphèmes et les relations<br />

morphologiques. <strong>Le</strong>s connaissances sémantiques utilisées sont habituellement acquises<br />

automatiquement à partir de corpus au moyen de techniques comme l’analyse sémantique<br />

latente (Schone et Jurafsky 2000), l’information mutuelle (Baroni et al. 2002) ou<br />

la co-ooccurrence dans une fenêtre de n-mots (Xu et Croft 1998, Zweigenbaum et Grabar<br />

2003a, b, Zweigenbaum et al. 2003). Dans l’expérience présentée ci-dessous, les informa-


64 Nouveau paradigme d’analyse morphologique automatique<br />

tions sémantiques sont extraites d’un dictionnaire informatisé et les similarités formelles<br />

sont calculées au moyen de marches aléatoires (random walks) dans un graphe lexical. Ce<br />

modèle s’inscrit dans la continuité de travaux antérieurs (<strong>Hathout</strong> 2001, 2003, 2005) dans<br />

lesquels j’ai utilisé des ressources lexicographiques pour acquérir des connaissances morphologiques,<br />

notamment le dictionnaire de synonymes de l’ATILF et la base de données<br />

lexicales WordNet.<br />

3.2 Proximité morphologique<br />

J’adopterai ici une définition minimaliste de la parenté morphologique : deux mots sont<br />

morphologiquement apparentés s’ils partagent en même temps des propriétés phonologiques<br />

et sémantiques. Dans l’expérience décrite dans ce chapitre, j’ai utilisé les propriétés<br />

graphémiques des mots à la place de leurs propriétés phonologiques parce que le TLFi ne<br />

fournit pas la prononciation de l’ensemble des entrées, notamment des entrées secondaires<br />

qui se trouvent dans les rubriques « Remarques » et « Dérivés » et dans les articles consacrés<br />

aux affixes et aux éléments formants. J’envisage de reprendre cette expérience en utilisant<br />

Liaphon, le phonétiseur du domaine public de Béchet (2001) qui permet de calculer des<br />

représentations phonologiques directement utilisables.<br />

L’idée développée dans cette section est d’utiliser une mesure de similarité morphologique<br />

comme approximation de la parenté morphologique : deux mots morphologiquement<br />

similaires ont de grandes chances d’être morphologiquement apparentés. Cette similarité<br />

morphologique est estimée en utilisant un bigraphe dont la figure 3.2 présente<br />

un extrait. Ce bigraphe comporte deux ensembles de sommets : d’un côté ceux qui représentent<br />

les lexèmes (dans la partie gauche de la figure) et de l’autre ceux qui représentent<br />

leurs traits sémantiques et formels (dans la partie droite). <strong>Le</strong>s sommets qui représentent les<br />

lexèmes sont identifiés par leurs lemmes (i.e. leurs formes de citation) et leurs catégories<br />

grammaticales. Je signale que ce graphe est conforme au modèle à quatre niveaux (voir section<br />

2.3). <strong>Le</strong>s sommets des traits sémantiques et des traits formels auraient en effet pu être<br />

représentés de part et d’autre des sommets qui représentent les lexèmes.<br />

3.2.1 Traits formels et traits sémantiques<br />

<strong>Le</strong>s traits formels associés à un lexème sont les n-grammes de lettres qui apparaissent<br />

dans son lemme. On impose aux n-grammes une taille minimale (n 3). <strong>Le</strong> début et la<br />

fin des lemmes sont marqués par des $. La figure 3.3 présente une partie des n-grammes<br />

associés au mot orientation où n varie de 13 à 3. Elle permet de voir que les traits formels<br />

associés à un mot donné sont fortement redondants. Une caractéristique importante de<br />

cette description est qu’aucun de ces n-grammes n’a le statut de morphème. Tous les ngrammes<br />

sont utilisés de la même façon. Ils ont tous la même fonction : rapprocher les<br />

mots qui contiennent les mêmes sons.<br />

Il aurait été possible d’utiliser comme traits formels des lexèmes les n-grammes qui<br />

apparaissent dans leurs formes fléchies. Une telle description serait plus fidèle à la morphologie<br />

de mots (word-based morphology). Elle rendrait aussi les allomorphies flexion-


Proximité morphologique 65<br />

N.pointage<br />

N.fermentation<br />

N.orientation<br />

V.orienter<br />

A.original<br />

N.action_X.de<br />

N.résultat_X.de_X.ce<br />

entati<br />

orient<br />

Figure 3.2 – Extrait du bigraphe qui représente le lexique. <strong>Le</strong>s lexèmes se trouvent dans des<br />

ovales, les traits formels dans des octogones et les traits sémantiques dans des rectangles.<br />

<strong>Le</strong> graphe est symétrique.<br />

nelles disponibles au niveau dérivationnel. Cette option n’a pas été cependant retenue parce<br />

qu’elle réduit beaucoup l’homogénéité des représentations formelles. Par exemple, avec un<br />

seuil n 3, un verbe comme malaxer se retrouverait fortement rapproché de tous les<br />

mots qui contiennent la séquence xie comme anxieux, apexien, asphyxie, orthodoxie, etc.<br />

à cause de la forme malaxiez. Pour réduire l’incidence de ce type de traits, il faudrait pondérer<br />

la contribution de chaque n-gramme par une estimation de la fréquence des formes<br />

du lexème dans lesquelles il apparaît. Cette fréquence pourrait être calculée par exemple à<br />

partir d’un gros corpus. Une forme comme malaxiez est probablement très rare voire totalement<br />

absente dans la plupart des corpus 3 . <strong>Le</strong>s connections superflues amenées par les<br />

formes fléchies seraient ainsi affaiblies ou éliminées.<br />

<strong>Le</strong>s traits sémantiques associés à un lexème sont les n-grammes de mots qui apparaissent<br />

dans ses définitions. <strong>Le</strong>s n-grammes qui contiennent des ponctuations autres que<br />

des apostrophes sont éliminés. En d’autres termes, on utilise uniquement les segments qui<br />

apparaissent entre deux ponctuations. <strong>Le</strong>s mots des définitions sont catégorisés et lemmatisés.<br />

<strong>Le</strong>s étiquettes utilisées sont : A pour les adjectifs ; R pour les adverbes ; N pour les<br />

noms ; V pour les verbes ; X pour toutes les autres catégories. Par exemple, les traits sémantiques<br />

induits par la définition (9) du nom orientation sont présentés en figure 3.4. On y<br />

voit notamment que les traits sémantiques sont tout aussi redondants que les traits formels.<br />

Par exemple, deux mots dont les définitions contiennent résultat de cette action auront au<br />

moins 10 traits sémantiques en commun.<br />

3. Elle est par exemple absente de la base Frantext (www.frantext.fr).<br />

$or<br />

$ori


66 Nouveau paradigme d’analyse morphologique automatique<br />

$orientation$<br />

$orientation orientation$<br />

$orientatio orientation rientation$<br />

$orientati orientatio rientation ientation$<br />

· · ·<br />

$ori orie rien ient enta ntat tati atio tion ion$<br />

$or ori rie ien ent nta tat ati tio ion on$<br />

Figure 3.3 – Liste partielle des traits formels associés au mot orientation. <strong>Le</strong>s traits sont les<br />

n-grammes de lettres qui apparaissent dans le mot, avec 13 n 3.<br />

(9) Action d’orienter, de s’orienter ; résultat de cette action.<br />

N.action_X.de_V.orienter<br />

N.action_X.de X.de_V.orienter<br />

N.action X.de V.orienter<br />

X.de_V.s’orienter<br />

V.s’orienter<br />

N.résultat_X.de_X.ce_N.action<br />

N.résultat_X.de_X.ce X.de_X.ce_N.action<br />

N.résultat_X.de X.de_X.ce X.ce_N.action<br />

N.résultat X.ce<br />

Figure 3.4 – Traits sémantiques induits par la définition Action d’orienter, de s’orienter ;<br />

résultat de cette action.<br />

Cette représentation très grossière de la sémantique des mots est inspirée des segments<br />

répétés de <strong>Le</strong>bart et Salem (1994), <strong>Le</strong>bart et al. (1998). Elle présente plusieurs avantages :<br />

1. elle est fortement redondante et peut ainsi capter différents niveaux de similarité qui<br />

existent entre les définitions ;<br />

2. les n-grammes permettent d’intégrer des informations de nature syntagmatique sans<br />

nécessiter une véritable analyse syntaxique des définitions ;<br />

3. elle gomme légèrement les variations qui existent dans le traitement lexicographique<br />

des entrées, notamment dans les découpages en sous-sens et la formulation des définitions.<br />

3.2.2 Connecter les lexèmes via leurs traits<br />

<strong>Le</strong>s traits sémantiques et formels sont utilisés dans le même graphe. Ce graphe est<br />

construit en connectant symétriquement chaque entrée à tous ses traits sémantiques et<br />

formels (voir figure 3.2). Par exemple, orientation est connecté aux traits formels $or,<br />

$ori, $orie, $orien, etc. qui à leur tour sont connectés aux lexèmes orienter, orientable,<br />

orientement, orienteur, etc. De même, orientation est connecté aux traits sémantiques


Proximité morphologique 67<br />

N.action_X.de, N.résultat_X.de_X.ce_N.action, etc. qui sont reliés aux noms orientement,<br />

harmonisation, pointage, etc. <strong>Le</strong>s traits sémantiques et formels sont ainsi utilisés de<br />

façon similaire. Cette représentation correspond précisément au Modèle en réseau (Network<br />

Model) de Bybee (1985, 1988, 1995).<br />

Cette représentation redondante peut aussi être rapprochée de celle qui est utilisée par<br />

Perruchet et Vinter (1998, 2002) dans Parser, un modèle psycholinguistique de reconnaissance<br />

des mots d’un langage artificiel de taille réduite. L’objectif de ces auteurs est de modéliser<br />

l’apprentissage de la langue en s’appuyant sur les lois de la mémoire et de l’apprentissage<br />

associatif. Ce modèle peut être vu comme une variante dynamique de la méthode<br />

proposée par Harris (1955) et affinée par Déjean (1998a, b). Perruchet et Vinter (1998, 2002)<br />

défendent l’idée que l’acquisition du langage est conscient. Cela se traduit par l’utilisation<br />

de représentations explicites des séquences qui composent le flux analysé par Parser. Ce<br />

modèle se distingue sur ce plan des systèmes connectionnistes habituellement utilisés en<br />

psycholinguistique pour modéliser l’acquisition du langage comme par exemple par Rumelhart<br />

et MacClelland (1986). Il est proche, à l’inverse, de celui qui est présenté ici. Il l’est<br />

aussi par l’hypothèse que les représentations linguistiques émergent des données auxquelles<br />

apprenants et les locuteurs sont soumis. <strong>Le</strong> modèle rend compte en outre de l’adaptation<br />

de ces représentations au fur et à mesure de l’exposition aux productions langagières. Cette<br />

dimension dynamique, pour l’instant absente du modèle que je propose, pourra être l’objet<br />

de recherches futures. Notons que Parser est en revanche incapable de traiter des corpus<br />

en langues naturelles.<br />

La représentation du lexique par un bigraphe est intéressante parce qu’elle permet de<br />

propager une activation de façon synchrone vers les traits sémantiques et formels. Elle<br />

l’est aussi parce que le graphe pourrait être utilisé pour la description morphologique. On<br />

pourrait par exemple s’en servir pour caractériser la sémantique des adjectifs en -able en<br />

s’intéressant aux traits sémantiques récurrents dans leurs définitions. De même, il serait<br />

possible de découvrir les finales caractéristiques des noms de bateaux en français (10) en<br />

identifiant les traits formels qui sont associés de façon privilégiée aux traits sémantiques<br />

qui contiennent des mots comme ceux de la liste (11).<br />

(10) a. voilier ; pétrolier ; bananier ; thonier ; sardinier<br />

b. patrouilleur ; torpilleur ; caboteur ; dériveur ; dragueur<br />

(11) bateau ; navire ; barque ; embarcation ; bâtiment ; chaloupe<br />

3.2.3 Estimer la similarité morphologique des mots<br />

La similarité morphologique entre un mot et ses voisins est estimée en simulant la propagation<br />

d’une activation initiée au niveau du sommet qui représente le mot. <strong>Le</strong> graphe<br />

étant bipartie, l’activation doit être propagée un nombre pair de fois. Dans un graphe fortement<br />

redondant comme celui qui est utilisé ici, deux étapes de propagation suffisent à<br />

obtenir les estimations visées. Par exemple, si l’on veut déterminer quels sont les voisins les<br />

plus proches de orientation, on génère une activation au niveau du sommet qui le représente.<br />

Cette activation est ensuite propagée de façon uniforme vers les traits sémantiques et<br />

formels de orientation. Lors de l’étape suivante, l’activation située au niveau des sommets


68 Nouveau paradigme d’analyse morphologique automatique<br />

qui représentent ces traits est propagée vers ceux qui représentent les lexèmes. L’activation<br />

reçue par ces derniers est d’autant plus forte que le nombre de traits qu’ils partagent avec<br />

orientation est élevé et que ces traits sont spécifiques (i.e. qu’ils sont peu fréquents). L’hypothèse<br />

sous-jacente est que le niveau d’activation est une estimation du degré de parenté<br />

morphologique.<br />

D’un point de vue technique, la propagation est simulée par une marche aléatoire dans<br />

le graphe (Gaume 2003, 2004, Gaume et al. 2002, 2004a, b, 2006, Muller et al. 2006).<br />

Elle est calculée de façon classique en multipliant la matrice d’adjacence stochastique du<br />

graphe. Plus précisément, soit G = (V, E) un graphe composé d’un ensemble de sommets<br />

V = {v1, . . . , vn} et d’un ensemble d’arcs E ⊂ V × V. Soit A la matrice d’adjacence de G. A<br />

est une matrice n × n telle que :<br />

Aij =<br />

1 si (vi, vj) ∈ E<br />

0 sinon<br />

<strong>Le</strong>s lignes de A sont normalisées afin d’obtenir une matrice stochastique M :<br />

∀i ∈ [1, n], ∀j ∈ [1, n], Mij = Aij<br />

n<br />

Aik<br />

k=1<br />

Cette valuation des arcs prend en compte le nombre des traits associés à chaque entrée<br />

(du fait de la normalisation des valeurs des arcs qui partent des entrées) et la fréquence des<br />

traits (du fait de la normalisation des valeurs des arcs qui partent des traits).<br />

Pour simuler une marche de longueur n, on multiplie M n fois. (M n )ij est alors la probabilité<br />

d’atteindre le sommet vj à partir du sommet vi après une marche de n étapes. Cette<br />

probabilité peut être interprétée comme un niveau d’activation de vj après une propagation<br />

de n étapes initiée au niveau du nœud vi.<br />

Dans l’expérience présentée dans la suite du chapitre, l’activation est propagée dans<br />

le graphe complet pour moitié vers les traits sémantiques et pour moitié vers les traits<br />

formels. Cette répartition est obtenue en modifiant les valeurs de la matrice M de la manière<br />

suivante. On répartit les arcs du graphe dans trois ensembles E = F ∪ S ∪ L où F contient<br />

les arcs qui connectent une entrée à un trait formel, S les arcs qui connectent une entrée à<br />

un trait sémantique et L les arcs qui connectent un trait sémantique ou formel à une entrée.<br />

<strong>Le</strong>s valeurs de M sont calculées comme suit :


Proximité morphologique 69<br />

si (vi, vf) ∈ F, Mif =<br />

si (vi, vs) ∈ S, Mis =<br />

si (vi, vl) ∈ L, Mil =<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

<br />

0.5<br />

0.5<br />

<br />

Aif<br />

Aih<br />

eih∈F<br />

<br />

Aif<br />

Aih<br />

eih∈F<br />

<br />

Ais<br />

Aih<br />

eih∈S<br />

<br />

Aik<br />

Aih<br />

eih∈S<br />

Ail<br />

Aih<br />

eih∈L<br />

3.2.4 Voisinages morphologiques<br />

si vi est connecté à un trait sémantique<br />

sinon<br />

si vi est connecté à un trait formel<br />

sinon<br />

<strong>Le</strong> graphe utilisé dans l’expérience a été construit à partir des entrées et des définitions<br />

du TLFi. <strong>Le</strong>s définitions qui relèvent des usages non standards comme les emplois vieillis,<br />

archaïques, argotiques, poétiques, les proverbes, les régionalismes, etc. ont été supprimés.<br />

Ce filtrage a aussi éliminé 2 349 entrées. En revanche, les définitions qui concernent des<br />

locutions ont été conservées. <strong>Le</strong> dictionnaire en compte 51 321. L’extraction et le nettoyage<br />

des définitions a été réalisée en collaboration avec Bruno Gaume et Philippe Muller, avec<br />

l’aide de Jean-Marc Destabeaux. <strong>Le</strong> graphe bipartie a été créé à partir des 225 529 définitions<br />

restantes qui décrivent 75 024 entrées (lexèmes). Elles ont induit environ 9 millions<br />

de traits, dont 90% ne sont associés qu’à une entrée. Ces traits hapaxiques ont été supprimés<br />

parce qu’ils ne contribuent pas au rapprochement des entrées. Aucune entrée n’a<br />

été supprimée du fait de cette réduction : toutes contiennent au moins un trait formel (par<br />

exemple un trigramme) ou un trait sémantique (par exemple un mot grammatical) présent<br />

ailleurs dans le dictionnaire. La table 3.1 montre que la réduction est plus forte pour les<br />

traits sémantiques (93%) que pour les traits formels (69%) : il y a plus de variations dans<br />

l’expression du sens que dans la description des formes.<br />

traits complet réduit hapax<br />

formels 1 306 497 400 915 69%<br />

sémantiques 7 650 490 548 641 93%<br />

total 8 956 987 949 556 90%<br />

Table 3.1 – Nombre de traits sémantiques et formels du bigraphe. <strong>Le</strong>s traits hapaxiques<br />

associés à une seule entrée sont supprimés.<br />

L’utilisation du graphe est illustrée par la figure 3.5 qui présente les 40 voisins les plus<br />

proches du verbe fructifier pour trois configurations de propagation. <strong>Le</strong> premier bloc pré-


70 Nouveau paradigme d’analyse morphologique automatique<br />

sente ses voisins dans un graphe qui ne contient que les traits formels. Il fait apparaître<br />

que les membres de sa famille morphologique tendent à apparaître en premier et que ceux<br />

de sa série dérivationnelle, les verbes en -ifier viennent ensuite. Cette répartition découle<br />

directement du fait que les familles sont des ensembles plus denses que les séries. La proximité<br />

morphologique entre les membres des familles est plus forte que celle qui existe entre<br />

les éléments des séries. L’implémentation de la mesure de proximité formelle capture ainsi<br />

en partie cette distinction. Elle pourra être exploitée dans des développements futurs pour<br />

séparer les familles des séries au sein des voisinages. <strong>Le</strong>s voisins dans le graphe qui ne<br />

contient que les traits sémantiques sont présentés dans le deuxième bloc de la figure 3.5.<br />

On observe une forte dégradation des résultats due à la plasticité du sens et à la dispersion<br />

des acceptions qui en découle, mais aussi à la variabilité dans les descriptions lexicographiques<br />

signalée dans le paragraphe précédent. Par exemple, fructifier se trouve rapproché<br />

de missionnaire à cause de la définition (12b) de la locution (12a). La faiblesse de ces résultats<br />

montre la nécessité d’améliorer significativement les traits sémantiques extraits des<br />

définitions. <strong>Le</strong> troisième bloc de la figure 3.5 présente les voisins de fructifier dans le graphe<br />

complet.<br />

(12) a. Faire fructifier la (les) vigne(s) du Seigneur<br />

b. Propager la foi.<br />

La figure 3.5 montre clairement que les traits formels sont les plus prédictifs et que les<br />

traits sémantiques sont les moins fiables. Elle permet également de voir que la proximité<br />

morphologique n’est pas suffisamment sélective et que les voisinages ne peuvent pas être<br />

utilisés tels quels. Il faut les filtrer davantage. Ce filtrage peut être réalisé au moyen de<br />

l’analogie formelle.<br />

3.3 Analogie<br />

3.3.1 Connecter les familles et les séries<br />

<strong>Le</strong>s familles et les séries qui composent la structure morphologique du lexique sont<br />

interconnectées par des analogies. Par exemple, la famille du verbe fructifier permet<br />

de connecter les séries auxquelles appartiennent les mots qui la composent. Ainsi, un<br />

couple fructifier : fructification participe à un nombre important d’analogies avec les autres<br />

membres des séries de fructifier et de fructification comme (13a). De façon duale, la série de<br />

fructifier permet de connecter les familles des éléments qu’elle contient. Un couple comme<br />

fructifier : rectifier prend part à une petite série d’analogies qui implique les membres des<br />

familles de ces deux mots (13b). On voit ainsi que chaque quadruplet analogique est une<br />

interconnexion entre deux familles et deux séries (voir figure 3.6).<br />

(13) a. rectifier : rectification ; certifier : certification ; sanctifier : sanctification ; vitrifier<br />

: vitrification<br />

b. fructificateur : rectificateur ; fructification : rectification ; fructifiant : rectifiant<br />

Ces analogies peuvent être utilisées pour sélectionner les parents morphologiques des<br />

mots parmi leurs voisins. L’idée générale peut être illustrée en utilisant l’exemple du quadruplet<br />

(14). Fructification appartenant à la famille de fructifier et rectifier appartenant à sa


Analogie 71<br />

formel V.fructifier N.fructification A.fructificateur A.fructifiant A.fructifère<br />

V.sanctifier V.rectifier A.rectifier V.fructidoriser N.fructidorien<br />

N.fructidor N.fructuosité R.fructueusement A.fructueux N.rectifieur<br />

A.obstructif A.instructif A.destructif A.constructif N.infructuosité<br />

R.infructueusement A.infructueux V.transsubstantifier V.substantifier<br />

V.stratifier V.schistifier V.savantifier V.refortifier V.ratifier V.quantifier<br />

V.présentifier V.pontifier V.plastifier V.notifier V.nettifier V.mystifier<br />

V.mortifier V.justifier V.idiotifier V.identifier<br />

sémantique V.fructifier V.trouver N.missionnaire N.mission A.missionnaire N.saisie<br />

N.police N.hangar N.dîme N.ban V.affruiter N.melon N.saisonnement<br />

N.azédarach A.fruitier A.bifère V.saisonner N.roman N.troubadour<br />

V.contaminer N.conductibilité N.alevinage V.profiter A.fructifiant<br />

N.pouvoir V.agir N.opération V.placer N.rentabilité N.jouissance N.avocat<br />

N.report A.fructueux V.tourner V.chiper N.économat N.visa N.société<br />

N.réserve N.récréance<br />

complet V.fructifier A.fructifiant N.fructification A.fructificateur V.trouver<br />

A.fructifère V.rectifier V.sanctifier A.rectifier V.fructidoriser N.fructidor<br />

N.fructidorien N.missionnaire N.mission A.missionnaire A.fructueux<br />

R.fructueusement N.fructuosité N.rectifieur N.saisie N.police N.hangar<br />

N.dîme N.ban A.fruitier V.affruiter A.instructif A.obstructif A.destructif<br />

A.constructif N.conductibilité V.saisonner N.melon N.saisonnement<br />

N.azédarach A.bifère V.contaminer N.roman N.troubadour N.alevinage<br />

Figure 3.5 – <strong>Le</strong>s 40 plus proches voisins du verbe fructifier lorsque l’activation est propagée<br />

seulement vers les traits formels (premier bloc), uniquement vers les traits sémantiques<br />

(deuxième bloc) ou à la fois vers les traits formels et sémantiques (troisième bloc). <strong>Le</strong>s mots<br />

qui appartiennent à la famille morphologique ou à la série dérivationnelle fructifier sont en<br />

gras ; les autres sont en italiques.<br />

série, ces deux mots sont des voisins morphologiques de fructifier. De même, rectification<br />

appartenant à la famille de rectifier et à la série de fructification, c’est un voisin morphologique<br />

de ces deux mots. Ces relations peuvent être représentées graphiquement comme en<br />

figure 3.7.<br />

(14) fructifier : fructification :: rectifier : rectification<br />

Réciproquement, si on suppose que les voisins d’un mot lui sont morphologiquement<br />

apparentés, on peut les utiliser pour former des quadruplets analogiques de la manière<br />

suivante :


72 Nouveau paradigme d’analyse morphologique automatique<br />

fructifier<br />

fructification<br />

<br />

<br />

<br />

<br />

rectifier<br />

rectification<br />

famille famille<br />

série<br />

série<br />

Figure 3.6 – L’analogie fructifier : fructification :: rectifier : rectification interconnecte les<br />

familles de fructifier et de rectifier et les séries des verbes en -ifier et des noms en -ion.<br />

fructifier<br />

voisin<br />

fructification<br />

voisin<br />

voisin<br />

rectifier<br />

voisin<br />

rectification<br />

Figure 3.7 – Relations de voisinage au sein du quadruplet fructifier : fructification :: rectifier<br />

: rectification.<br />

pour chaque mot a faire<br />

pour chaque couple (b, c) de voisins de a faire<br />

pour chaque d voisin de b et de c faire<br />

vérifier que (a, b, c, d) est une analogie<br />

fin<br />

fin<br />

fin<br />

3.3.2 Analogies formelles<br />

Une analogie formelle ou analogie graphémique est une relation a : b :: c : d entre quatre<br />

chaînes de caractères telles que les différences qui existent entre a et b sont les mêmes que<br />

celles qui existent entre c et d. C’est par exemple le cas pour le quadruplet (14). Cette<br />

identité des différences est représentée dans la partie gauche de la figure 3.8. Naturellement,<br />

les couples de graphies peuvent présenter plusieurs différences comme on peut le<br />

voir pour l’analogie entre les quatre mots arabes en (15). Ces mots sont respectivement les


Analogie 73<br />

transcriptions du verbe ‘écrire’, du nom ‘document’, du verbe ‘faire’ et du nom ‘effet’ 4 . <strong>Le</strong>s<br />

différences entre les mots du premier couple et entre ceux du second sont représentées dans<br />

la partie droite de la figure 3.8. Elles sont identiques. Cet exemple montre que les analogies<br />

formelles s’établissent aussi entre les parents morphologiques dans une langue gabaritique<br />

comme l’arabe. Je rappelle que la mesure de proximité pourrait facilement être adaptée à la<br />

morphologie de ce type de langue (voir section 2.4).<br />

(15) kataba : maktoubon :: fa3ala : maf3oulon<br />

fructifi er<br />

fructif cation<br />

rectifi er<br />

rectifi cation<br />

ɛ k a t a b a<br />

ma k ɛ t ou b on<br />

ɛ f a 3 a l a<br />

ma f ɛ 3 ou l on<br />

Figure 3.8 – Analogies formelles fructifier : fructification :: rectifier : rectification et kataba<br />

: maktoubon :: fa3ala : maf3oulon. <strong>Le</strong>s différences se trouvent dans les parties encadrées.<br />

ɛ représente la chaîne vide.<br />

Formellement, ces analogies peuvent être définies en termes de factorisation (Yvon et al.<br />

2004, Stroppa et Yvon 2005) de la manière suivante :<br />

Définition 3.1 Factorisation<br />

Soit Σ un alphabet et a ∈ Σ ⋆ une chaîne de caractères définie sur Σ. Une factorisation de<br />

longueur n de a est une séquence de n facteurs f = (f 1 a, · · · , f n a) ∈ Σ ⋆n telle que a = f 1 a ⊙<br />

· · · ⊙ f n a où ⊙ représente la concaténation.<br />

Par exemple, (ma, k, ɛ, t, ou, b, on) est une factorisation de longueur 7 de la chaîne maktoubon.<br />

Définition 3.2 Analogie formelle<br />

Soient (a, b, c, d) ∈ Σ ⋆4 un quadruplet de chaînes de caractères définies sur un alphabet Σ.<br />

(a, b, c, d) est une analogie formelle si et seulement si il existe n ∈ N et quatre factorisations<br />

de longueur n (fa, fb, fc, fd) de a, b, c et d telles que ∀i ∈ [1, n], (f i b , fi c) ∈ {(f i a, f i d ), (fi d , fi a))}.<br />

Par exemple, les factorisations présentées en figure 3.9 permettent de vérifier que (15) est<br />

bien d’une analogie formelle. Ainsi, on a (f 2 b , f2 c) = (f 2 a, f 2 d ) = (k, f) et (f3 b , f3 c) = (f 3 d , f3 a) =<br />

(ɛ, a).<br />

3.3.3 Implémentation<br />

<strong>Le</strong>s analogies formelles sont vérifiées au niveau graphémique. <strong>Le</strong>s différences entre les<br />

deux couples de chaînes de caractères peuvent être calculées à partir des séquences d’opérations<br />

d’édition qui permettent de transformer le premier élément de chaque couple en<br />

4. Cet exemple est inspiré de <strong>Le</strong>page (1998, 2003).


74 Nouveau paradigme d’analyse morphologique automatique<br />

f 1 f 2 f 3 f 4 f 5 f 6 f 7<br />

a ɛ k a t a b a<br />

b ma k ɛ t ou b on<br />

c ɛ f a 3 a l a<br />

d ma f ɛ 3 ou l on<br />

Figure 3.9 – Factorisations de longueur 7 permettant de vérifier que (15) est une analogie<br />

formelle.<br />

l’autre (<strong>Le</strong>page 1998). <strong>Le</strong>s opérations d’édition considérées sont l’insertion d’un caractère<br />

(notée I), la suppression d’un caractère (notée D) et le remplacement d’un caractère par un<br />

autre (notée S). On notera M les caractères qui sont inchangés. La figure 3.10 présente une<br />

séquence permettant de transformer fructueux en infructueusement.<br />

I I M M M M M M M M S I I I I I<br />

ɛ ɛ f r u c t u e u x ɛ ɛ ɛ ɛ ɛ<br />

i n f r u c t u e u s e m e n t<br />

Figure 3.10 – Séquence des opérations d’édition qui transforme fructueux en infructueusement.<br />

<strong>Le</strong> type des opérations est indiqué sur la première ligne : D pour les suppressions,<br />

I pour les insertions, S pour les substitutions et M pour les identités.<br />

Chaque séquence a un coût qui est calculé à partir de celui des opérations élémentaires<br />

qui la composent. On utilise habituellement les valeurs suivantes : 1 pour l’insertion d’un<br />

caractère ; 1 pour la suppression d’un caractère ; 1 pour la substitution d’un caractère ; 0<br />

pour la conservation d’un caractère. La distance de <strong>Le</strong>venshtein d’un couple de chaînes<br />

est le coût minimum des séquences d’édition permettant de transformer la première en la<br />

seconde. Elle est calculée par un algorithme de programmation dynamique en construisant<br />

une matrice semblable à celle qui est présentée en figure 3.11 (Jurafsky et Martin 2000).<br />

Cette matrice représente un treillis d’édition. Chaque séquence d’édition correspond à un<br />

chemin dans le treillis.<br />

<strong>Le</strong> chemin utilisé pour déterminer les différences entre deux chaînes de caractères est<br />

calculé à partir de cette matrice de la manière suivante. <strong>Le</strong> point de départ est la dernière<br />

cellule de la matrice (cellule encadrée dans la figure 3.11) et celui d’arrivée est la première.<br />

<strong>Le</strong> chemin est constitué en sélectionnant comme cellule suivante la voisine de coût le plus<br />

faible. En cas d’égalité, on préfére la cellule de gauche (qui correspond à une insertion) ou<br />

à défaut celle du dessus (suppression) ou enfin celle qui se trouve sur la diagonale supérieure<br />

gauche (substitution). L’idée sous-jacente est d’utiliser le plus court chemin afin de<br />

préserver les segments communs aux deux chaînes et d’appliquer des critères de sélection<br />

uniformes pour permettre la comparaison des différences. L’ordre de préférence relatif des<br />

trois types d’opération n’est donc pas important. La figure 3.11 présente le chemin utilisé<br />

pour identifier les différences entre les chaînes fructueux et infructueusement. La séquence<br />

d’édition décrite par ce chemin est présentée en figure 3.10.


Analogie 75<br />

⋄ i n f r u c t u e u s e m e n t<br />

⋄ 0←1←2 ↖ 3 4 5 6 7 8 9 10 11 12 13 14 15 16<br />

f 1 1 2 2 ↖ 3 4 5 6 7 8 9 10 11 12 13 14 15<br />

r 2 2 2 3 2 ↖ 3 4 5 6 7 8 9 10 11 12 13 14<br />

u 3 3 3 3 3 2 ↖ 3 4 5 6 7 8 9 10 11 12 13<br />

c 4 4 4 4 4 3 2 ↖ 3 4 5 6 7 8 9 10 11 12<br />

t 5 5 5 5 5 4 3 2 ↖ 3 4 5 6 7 8 9 10 11<br />

u 6 6 6 6 6 5 4 3 2 ↖ 3 4 5 6 7 8 9 10<br />

e 7 7 7 7 7 6 5 4 3 2 ↖ 3 4 5 6 7 8 9<br />

u 8 8 8 8 8 7 6 5 4 3 2 ↖ 3 4 5 6 7 8<br />

x 9 9 9 9 9 8 7 6 5 4 3 3 ← 4 ← 5 ← 6 ← 7 ← 8<br />

Figure 3.11 – Matrice des distances d’édition de <strong>Le</strong>venshtein et chemin décrivant la séquence<br />

d’opérations d’édition permettant de transformer fructueux en fructueusement. ⋄<br />

représente le début de la chaîne. La cellule (i, j) de la matrice indique la distance d’édition<br />

entre la sous-chaînes des i premiers caractères de fructueux et celle des j premiers caractères<br />

de infructueusement.<br />

<strong>Le</strong>s séquences d’opérations d’édition peuvent être simplifiées en fusionnant les suites<br />

d’identités (M). La séquence de la figure 3.10 devient alors (16). Cette représentation fait<br />

ressortir les différences entre les chaînes. Ces différences sont par exemple les mêmes<br />

que celles du couple soucieux : insoucieusement (17) avec lequel fructueux : infructueusement<br />

forme une analogie. <strong>Le</strong>s représentations (16) et (17) peuvent être rendues totalement<br />

identiques en remplaçant leurs sous-chaînes communes par un caractère joker @<br />

comme en (19). On obtient alors une représentation que l’on peut utiliser comme une<br />

signature σ du couple. Cette signature correspond précisément aux parties encadrées de<br />

la figure 3.8. L’analogie formelle (18) peut être ainsi réduite à une comparaison des signatures<br />

σ(fructueux, infructueusement) et σ(soucieux, insoucieusement). Plus généralement,<br />

quatre chaînes (a, b, c, d) ∈ Σ ⋆4 constituent une analogie formelle si et seulement si<br />

σ(a, b) = σ(c, d).<br />

(16) ((I,ɛ,i), (I,ɛ,n), (M,fructueu,fructueu), (S,x,s), (I,ɛ,e), (I,ɛ,m), (I,ɛ,e), (I,ɛ,n), (I,ɛ,t))<br />

(17) ((I,ɛ,i), (I,ɛ,n), (M,soucieu,soucieu), (S,x,s), (I,ɛ,e), (I,ɛ,m), (I,ɛ,e), (I,ɛ,n), (I,ɛ,t))<br />

(18) fructueux : infructueusement :: soucieux : insoucieusement<br />

(19) ((I,ɛ,i), (I,ɛ,n), (M,@,@), (S,x,s), (I,ɛ,e), (I,ɛ,m), (I,ɛ,e), (I,ɛ,n), (I,ɛ,t))<br />

Notons qu’il possible de réduire le nombre de quadruplets considérés par l’algorithme<br />

de la section 3.3.1 en utilisant quelques heuristiques simples comme le fait que :<br />

– les différences de longueur dans chaque couple doivent être identiques (<strong>Le</strong>page<br />

2000) : l(a) − l(b) = l(c) − l(d) où l(x) représente la longueur de x ;


76 Nouveau paradigme d’analyse morphologique automatique<br />

– les catégories des entrées sont en relation analogique : (cat(b), cat(c)) ∈<br />

{(cat(a), cat(d)), (cat(d), cat(a))} où cat(x) représente la catégorie de x.<br />

En revanche, l’heuristique de Langlais et Yvon (2008) qui consiste à imposer aux premiers<br />

caractères des quatre chaînes et à leurs derniers caractères de former des analogies est trop<br />

forte.<br />

Pour finir, j’insiste sur le fait que la vérification des analogies formelles ne fait pas intervenir<br />

les notions de morphème, d’affixe ou d’exposant morphologique. Elle consiste<br />

uniquement en une mise en correspondance de couples de chaînes de caractères.<br />

3.4 Premiers résultats<br />

<strong>Le</strong> modèle informatique présenté dans ce chapitre n’est pas un analyseur complet permettant<br />

de créer l’ensemble du réseau morphologique décrit en section 3.1.3. Il s’agit d’un<br />

travail exploratoire dont l’objectif est de confirmer l’opérationnalité de ce modèle et de<br />

mettre au point l’implémentation des composants de base de l’analyseur que sont la proximité<br />

morphologique et l’analogie formelle. Une évaluation détaillée de ces composants est<br />

donc pour l’heure prématurée. C’est pourquoi je ne présente que quelques résultats partiels<br />

et préliminaires.<br />

Ces résultats ont été obtenus en identifiant les 100 plus proches voisins de chaque mot<br />

du lexique. J’ai ensuite calculé les analogies formelles obtenues à partir de 22 entrées, appartenant<br />

à 4 familles morphologiques de la tranche fr- du TLF pour laquelle je dispose d’une<br />

classification révisée manuellement par Josette <strong>Le</strong>comte et moi (20). J’ai révisé ces analogies<br />

manuellement en considérant comme corrects les quadruplets (a, b, c, d) qui satisfont (21a)<br />

ou (21b). Des exemples de quadruplets corrects sont présentés en (22) et de quadruplets<br />

erronés en (23). On peut voir que les analogies collectées réunissent des dérivés et leurs<br />

bases comme en (22a), mais aussi des dérivés qui partagent la même base comme en (22b)<br />

ou des relations plus distantes entre un dérivé et la base de sa base comme en (22c).<br />

(20) a. S.fructidor ; A.fructidorien ; S.fructidorien ; S.fructidorienne ; V.fructidoriser<br />

b. A.fructifiant ; S.fructification ; V.fructifier ; A.fructificateur ; A.fructifère ;<br />

A.fructivore ; S.fructose ; R.fructueusement ; A.fructueux ; S.fructuosité<br />

c. A.frugiforme ; A.frugivore ; S.frugivorisme<br />

d. S.fruit ; S.fruitage ; A.fruiteux ; A.fruitarien ; S.fruitarisme ; S.fruiterie ; A.fruitier ;<br />

S.fruitier ; S.fruitière ; A.fruité ; A.fruticole<br />

(21) a. b appartient à la famille de a ; c appartient à la série de a ; d appartient à la série de<br />

b et à la famille de c<br />

b. b appartient à la série de a ; c appartient à la famille de a ; d appartient à la famille<br />

de b et à la série de c<br />

(22) a. N.fructification:N.identification :: V.fructifier:V.identifier<br />

b. A.fructifiant:A.fructificateur :: A.glorifiant :: A.glorificateur<br />

c. A.fructueux:A.affectueux :: N.infructuosité:N.inaffectuosité


Conclusion et développements futurs 77<br />

d. A.frugivore:A.végétivore :: R.frugalement:R.végétalement<br />

e. A.fruitarien:A.végétarien :: N.fruitarisme:N.végétarisme<br />

f. A.fruitier:A.laitier :: N.fruiterie:N.laiterie<br />

g. R.fructueusement:R.affectueusement :: N.fructuosité:N.affectuosité<br />

(23) a. A.fruité:N.fruste :: A.truité:N.truste<br />

b. N.fruit:N.frumentaire :: A.instruit:A.instrumentaire<br />

c. N.fruiterie:N.friterie :: V.effruiter:V.effriter<br />

<strong>Le</strong>s trois configurations de propagation présentées dans la section 3.2.4 ont été testées<br />

pour ces 22 entrées. <strong>Le</strong>s résultats sont résumés dans la table 3.2. Ils font apparaître une<br />

qualité satisfaisante pour les analogies obtenues à partir des traits formels et dans le graphe<br />

entier. En revanche, la contribution des traits sémantiques est insuffisante. Ces chiffres<br />

confirment la tendance générale qui se dégage des exemples de la figure 3.5. <strong>Le</strong>s traits sémantiques<br />

réduisent d’environ un quart le nombre des analogies collectées ; en contrepartie,<br />

ils améliorent la précision de la méthode.<br />

configuration analogies correctes erreurs<br />

formel 169 163 3.6%<br />

sémantique 5 5 0.0%<br />

complet 130 128 1.5%<br />

Table 3.2 – Nombre d’analogies collectées pour un échantillon de 22 entrées pour les trois<br />

configurations présentées dans la section 3.2.4. La dernière colonne indique le taux d’erreur.<br />

Ces résultats montrent également que la méthode s’appuie avant tout sur les proximités<br />

formelles. De ce fait, ses performances sont directement liées à la taille des entrées, la<br />

proximité formelle étant d’autant plus grande que les mots sont longs. Par exemple, départementaliser<br />

est plus proche de départementalisation que ne l’est créer de création du<br />

fait du rapport entre le nombre de traits qu’ils partagent et le nombre total des traits qu’ils<br />

possèdent en propre. La table 3.3 met en évidence cette corrélation. Elle présente le nombre<br />

d’analogies collectées et le taux d’erreur pour 13 échantillons de 5 entrées sélectionnés aléatoirement.<br />

<strong>Le</strong>s analogies ont été collectées dans le graphe complet. <strong>Le</strong>s entrées dans chaque<br />

échantillon ont toutes la même longueur. Cette dernière varie entre 4 et 16 caractères. On<br />

observe que les analogies collectées pour les mots de 10 lettres et plus sont toutes correctes.<br />

3.5 Conclusion et développements futurs<br />

J’ai présenté dans ce chapitre un modèle informatique qui implémente quelques-uns<br />

des éléments fondamentaux du modèle théorique du chapitre 2. Ce modèle permet de faire<br />

émerger une partie de la structure morphologique du lexique à partir des entrées et des


78 Nouveau paradigme d’analyse morphologique automatique<br />

longueur analogies correctes erreurs<br />

4 29 14 51.7%<br />

5 22 14 36.4%<br />

6 8 7 12.5%<br />

7 10 8 20.0%<br />

8 55 54 1.8%<br />

9 29 27 6.9%<br />

10 30 30 0.0%<br />

11 32 32 0.0%<br />

12 19 19 0.0%<br />

13 11 11 0.0%<br />

14 35 35 0.0%<br />

15 63 63 0.0%<br />

16 39 39 0.0%<br />

Table 3.3 – Nombres d’analogies et taux d’erreur pour 13 échantillons sélectionnés aléatoirement<br />

et composés chacun de 5 entrées. <strong>Le</strong>s entrées dans chaque échantillon sont de<br />

même longueur. <strong>Le</strong>s longueurs varient 4 à 16 caractères. <strong>Le</strong>s analogies obtenues à partir des<br />

entrées de 10 caractères et plus sont toutes correctes.<br />

définitions d’un dictionnaire informatisé, en l’occurrence le TLFi. Ce modèle est purement<br />

lexématique. Il associe deux techniques complémentaires. La première est une mesure de<br />

la proximité morphologique calculée en utilisant un algorithme de marche aléatoire dans<br />

un bigraphe qui intègre de manière uniforme les traits sémantiques et formels des mots. La<br />

marche aléatoire simule la propagation d’une activation dans le graphe lexical. <strong>Le</strong> niveau<br />

d’activation obtenu après cette propagation permet d’identifier les voisins de chaque entrée.<br />

L’autre technique est l’analogie formelle utilisée pour identifier les membres des familles<br />

morphologiques et des séries dérivationnelles à l’intérieur des voisinages morphologiques.<br />

Ce modèle me semble prometteur parce qu’il est avant tout informatique. Sa mise en<br />

œuvre repose sur une définition minimaliste de la parenté morphologique et sur l’hypothèse<br />

que les mots apparentés forment des analogies. Il exploite essentiellement la capacité<br />

de la mémoire et la puissance de calcul des processeurs. Ce modèle est également intéressant<br />

parce que les propriétés sémantiques et formelles sont indépendantes: elles ne sont<br />

connectées que via les entrées. <strong>Le</strong> bigraphe utilisé est ainsi une implémentation relativement<br />

fidèle du modèle à quatre niveaux présenté en section 2.3. L’une des conséquences<br />

de cette indépendance est la capacité du système à traiter de manière uniforme toutes les<br />

relations dérivationnelles, y compris celles qui sont parasynthétiques (voir section 4.5).<br />

Ce travail, encore préliminaire, ouvre un chantier relativement vaste dont l’objectif premier<br />

est la constitution d’une base de données morphologiques à large couverture. J’envisage<br />

d’en réaliser une première version à court terme en utilisant une méthode de bootstrap<br />

en créant dans un premier temps un réseau partiel à partir des entrées les plus longues puis<br />

en le complétant itérativement avec des mots de plus en plus courts. Pour créer cette base,


Conclusion et développements futurs 79<br />

il faudra aussi concevoir une méthode permettant de séparer les familles des séries au sein<br />

des voisinages morphologiques. On pourra utiliser le fait que la famille et la série d’un mot<br />

sont généralement disjoints, qu’ils correspondent approximativement à des composantes<br />

connexes dans les voisinages, que les éléments des familles sont plus fortement interconnectés<br />

que ceux des séries, que ces dernières sont des ensembles de grande taille, etc. Une<br />

fois construit le réseau des paradigmes morphologiques, on pourra le compléter par les paradigmes<br />

lexicaux et traiter la question de l’allomorphie. Ces deux sous-tâches mettent en<br />

jeu de façon cruciale les relations sémantiques. L’amélioration de leur description est un<br />

préalable à leur réussite.<br />

<strong>Le</strong> modèle devra d’autre part être complété en proposant un traitement de la composition<br />

et de la conversion. <strong>Le</strong>s techniques proposées dans ce chapitre peuvent être utilisées<br />

telles quelles pour retrouver les relations morphologiques qui impliquent les mots formés<br />

par ces procédés. En revanche, les paradigmes décrits en section 2.6.1 ne permettent pas<br />

de représenter ces relations. Il faudrait probablement les compléter par des séries compositionnelles<br />

et des séries de converts. Ces dernières ne pourront pas être constituées sans<br />

une bonne caractérisation sémantique des mots. L’intégration des conversions au système<br />

dépend ainsi principalement de la qualité des traits sémantiques utilisés.<br />

<strong>Le</strong> deuxième volet de ce programme est l’amélioration des traits sémantiques qui sera<br />

réalisée en procédant à l’analyse syntaxique des définitions. Il sera ainsi possible de remplacer<br />

les segments répétés extraits des définitions par des fragments redondants de leurs<br />

arbres de dépendances syntaxiques. On pourra par exemple utiliser une chaîne de traitement<br />

linguistique comme celle du projet Alpage (Boullier et al. 2005). Ces données pourront<br />

être complétées par des connaissances distributionnelles similaires aux Voisins de <strong>Le</strong><br />

Monde (Galy et Bourigault 2005).<br />

<strong>Le</strong> troisième volet est l’évaluation du système. Un protocole d’évaluation adapté aux<br />

résultats de l’analyse devra être mis au point. À ma connaissance, il n’existe à l’heure actuelle<br />

aucune ressource de référence du type de celle que je propose. Cette évaluation sera<br />

d’abord réalisée en anglais pour bénéficier des analyses contenues dans la base CELEX<br />

(Baayen et al. 1995). La construction du réseau morphologique anglais pourra être réalisée<br />

en utilisant le dictionnaire informatique GCIDE basé sur l’édition de 1913 du Webster. Elle<br />

se fera d’autre part en français en comparant le réseau morphologique aux résultats d’autres<br />

systèmes comme Linguistica de Goldsmith (2001) ou l’analyseur de Bernhard (2006a, b) qui<br />

a remporté l’édition 2007 de Morpho Challenge pour l’anglais et le finnois (Kurimo et al.<br />

2007). La comparaison avec CELEX et les résultats de ces systèmes impliquera un découpage<br />

des mots et une identification des allomorphes. Cette tâche n’est pas triviale (Langlais<br />

<strong>2009</strong>).<br />

J’envisage également, en collaboration avec Gilles Boyé, d’utiliser le réseau morphologique<br />

comme support pour la description morphologique du français en l’intégrant dans un<br />

système de type Wiki permettant de l’annoter en couches successives (voir section 1.3.5).<br />

<strong>Le</strong> réseau morphologique pourra également être utilisé à des fins lexicographiques pour<br />

normaliser les définitions des mots construits morphologiquement en comparant les proximités<br />

sémantiques calculées à partir des définitions et les proximités morphologiques dans<br />

le réseau. Ce modèle informatique pourra également être utilisé à des fins typologiques


80 Nouveau paradigme d’analyse morphologique automatique<br />

pour comparer les structures des réseaux morphologiques de langues différentes (Prévot<br />

et al. 2008).


CHAPITRE 4<br />

Analyse unifiée de la préfixation en<br />

anti-<br />

4.1 Introduction<br />

L’analyse de la préfixation en anti- présente trois types de difficultés bien connues qui<br />

seront abordées successivement dans ce chapitre. Ces difficultés ont été identifiées dans les<br />

nombreux travaux antérieurs qui traitent de cette préfixation, notamment Rey (1968), Dell<br />

(1970), Zribi-Hertz (1973), Corbin (1980), Durand (1982), Voir (1982), Corbin (1987),<br />

Fradin (1996, 1997a, b), Montermini (2002), <strong>Le</strong>vkovych (2004), Plénat et al. (2004a),<br />

Heyna (2008), Montermini (2008). Ce chapitre présente une analyse unifiée de cette préfixation<br />

1 . Mon analyse n’est naturellement pas complète. <strong>Le</strong> traitement de certaines questions<br />

est seulement esquissé et reste à approfondir. Il va de soi que mes propositions sont<br />

en grande partie inspirées des travaux cités ci-dessus.<br />

<strong>Le</strong> premier point que j’aborde est la variété des séquences susceptibles d’apparaître<br />

après anti-. On trouve en effet parmi ces dernières des noms communs au singulier (1a)<br />

ou au pluriel (1b), des noms propres (1c), des composés VN lexicalisés (1d) ou non (1e),<br />

des syntagmes nominaux sans déterminant (1f) ou avec déterminant (1g), des pronoms<br />

(1h), des interjections (1i), des groupes propositionnels (1j), des adjectifs (1k) et des verbes<br />

(1l). Cette variété soulève plusieurs questions : anti- est-il un préfixe ou une préposition ?<br />

Existe-t-il une préposition anti similaire à contre ? Si c’est un préfixe, quel est le statut des<br />

radicaux syntaxiques et des radicaux au pluriel ? Je détaille en section 4.2 ce petit inventaire<br />

des objets qui apparaissent après anti- et je les compare à ceux que l’on trouve devant<br />

différents suffixes.<br />

(1) a. antilimace ; antihéros ;<br />

b. antirides ; anti-animaux ;<br />

c. anti-Sarkozy ; anti-Sartre ;<br />

1. Je remercie Marc Plénat et Michel Roché pour les exemples et les arguments qu’ils m’ont proposés.<br />

81


82 Analyse unifiée de la préfixation en anti-<br />

d. anti-porte-bagage ;<br />

e. vernis spécial anti-mange-ongles ; la cuillère anti-brûle-la-langue ;<br />

f. anti-gros-lard ; anti-homme de lettres ; anti-crottes de chiens sur les trottoirs ;<br />

g. anti les mecs qui font ça sur route ouverte ;<br />

h. antirien ; anti-ceci ou cela ;<br />

i. antiplouf ; anti-aïe aïe ; antigloups ;<br />

j. anti-ceux-qui-défendent-apple-becs-et-ongles ;<br />

k. antitriste, anti-obèse ;<br />

l. antidéprimer ; anti-manger sain<br />

La deuxième question à laquelle je m’intéresse est l’existence de plusieurs sous-séries<br />

de dérivés en anti- dont les sens sont à première vue relativement distincts. Il y a d’une<br />

part les dérivés du type antilimace ou antirides habituellement paraphrasés au moyen de la<br />

préposition contre (un produit antilimace est un produit contre les limaces) et les dérivés<br />

du type antihéros ou antiroman, généralement paraphrasés en utilisant l’expression « tout<br />

le contraire de » (un antihéros est un personnage qui est tout le contraire d’un héros). Il<br />

existe en outre plusieurs sous-séries plus réduites de dérivés en anti-, notamment celles<br />

des dérivés qui ont un sens spatial comme antisolaire ou Anti-Atlas, celles des termes de la<br />

physique des particules comme antiquark ou antibeau et celles des termes mathématiques<br />

comme antisymétrique ou antiparallèle. Se pose ainsi la question de l’unicité du préfixe<br />

anti- : ces sous-séries relèvent-elles d’un seul préfixe anti- ou de plusieurs ? Et, dans le cas<br />

où il n’y en aurait qu’un, comment s’organisent les sens correspondant à ces sous-séries ?<br />

Quelques éléments de réponse à ces questions sont proposés dans la section 4.3. Suit en<br />

section 4.4 une discussion des aspects catégoriels.<br />

<strong>Le</strong> troisième point abordé est la fameuse question des constructions dites parasynthétiques<br />

: l’existence de dérivés comme antiparlementaire, antigrippal ou antipaternel dont<br />

les radicaux sont des formes adjectivales mais dont le sens est le même que celui des dérivés<br />

qui ont comme radicaux les noms correspondants : antiparlement, antigrippe et antipère.<br />

<strong>Le</strong>s dérivés antiparlementaire, antigrippal ou antipaternel sont traditionnellement analysés<br />

comme des mots construits par parasynthèse, c’est-à-dire par une opération qui comporte<br />

simultanément une préfixation et une suffixation. Par exemple, la parasynthèse qui permet<br />

de créer antiparlementaire se compose d’une préfixation en anti- et d’une suffixation adjectivale<br />

en -aire. Je propose, en section 4.5, une analyse de ces dérivés différente, formulée en<br />

termes d’emprunt de radicaux. Cette analyse s’inscrit dans le cadre du modèle théorique du<br />

chapitre 2, dans la lignée de Plénat (2000), Corbin (2001a), Roché (<strong>2009</strong>). Elle est illustrée<br />

en utilisant les données présentées dans <strong>Le</strong>vkovych (2004) et Plénat et al. (2004a).<br />

Sur le plan méthodologique, l’étude présentée ici se caractérise par son inscription dans<br />

la morphologie extensive (Plénat 2000, Plénat et al. 2002, <strong>Hathout</strong> et al. 2003, 2008, <strong>2009</strong>a) ;<br />

voir aussi Durand (<strong>2009</strong>) pour une mise en perspective épistémologique. Elle s’appuie sur<br />

un corpus étendu de près de 3 000 mots constitué en complétant celui de Plénat et al. (2004a)<br />

et <strong>Le</strong>vkovych (2004). Seule une description globale d’un corpus aussi grand que possible<br />

permet en effet de saisir l’ensemble des conditionnements d’une dérivation. Cette étude se


Anti- est un préfixe 83<br />

distingue aussi par le type d’analyse visé : il s’agit de déterminer la place des dérivés en antidans<br />

le lexique et l’ensemble des relations qu’ils entretiennent avec les autres mots et pas<br />

simplement trouver leurs bases et les relations qu’ils entretiennent avec ces dernières.<br />

4.2 Anti- est un préfixe<br />

Je rappelle tout d’abord qu’il existe en français quelques mots simples 2 dont l’initiale<br />

est anti- comme antichrèse, antimoine ou antiphonaire. Ces mots n’entrent naturellement<br />

pas dans le champ de cette étude. Je rappelle également que la formation des mots en<br />

anti- n’a pas toujours été considérée comme une préfixation. Dans la tradition (Darmesteter<br />

1877) 3 , les préfixes étaient considérés comme des prépositions ou des adverbes et les<br />

mots préfixés analysés comme des composés. Cette conception est par exemple adoptée<br />

par Zribi-Hertz (1973). Pour Rey (1968), anti- est un élément de composition qui a ensuite<br />

été préfixé à des bases autonomes. Ce ne serait donc ni un préfixe ni une préposition. Par<br />

ailleurs, il considère que les dérivés dont le radical est un nom sont des locutions adjectivales.<br />

À l’inverse, anti- est un préfixe pour Dell (1970), Corbin (1980) ou Fradin (1997b).<br />

Ce dernier observe que anti- se préfixe volontiers à des bases autochtones et qu’il dispose<br />

d’une grande productivité. Celle-ci témoigne de sa pleine intégration dans le système morphologique<br />

du français. Fradin en déduit que cette formation n’est pas une composition.<br />

La proximité et les différences qui existent entre les préfixes et les prépositions ont<br />

fait l’objet de travaux très nombreux dont on peut trouver un compte-rendu complet dans<br />

Montermini (2002, 2008) ou Amiot et Montermini (<strong>2009</strong>). Je n’apporte pas ici d’éléments<br />

nouveaux par rapport à ces analyses. Ma contribution se limite à montrer l’étendue de la<br />

diversité des séquences qui comportent l’initiale anti- et à vérifier leur compatibilité avec la<br />

catégorisation de anti- comme un préfixe.<br />

On peut distinguer parmi les dérivés en anti- ceux dont les radicaux ne peuvent pas<br />

fonctionner tels quels comme des compléments de prépositions (sections 4.2.1, 4.2.2, 4.2.3<br />

et 4.2.4) et ceux qui le peuvent (sections 4.2.5, 4.2.6 et 4.2.7).<br />

4.2.1 Radicaux nominaux, adjectivaux et verbaux<br />

<strong>Le</strong> fait que anti- soit utilisé comme un préfixe dans la plupart des mots qui comportent<br />

cette initiale ne fait aucun doute. C’est le cas pour les plus prototypiques d’entre eux dont<br />

les radicaux sont des formes de citation, monolexicales, nominales ou adjectivales comme<br />

antilimace, antihéros (2), antiparlementaire (3), antigélif, antitriste (4) ou antistérile (5). Je<br />

signale que pour Dell (1970), Zribi-Hertz (1973), Durand (1982) entre autres, les dérivés<br />

en anti- ne peuvent pas avoir d’adjectifs simples comme bases. <strong>Le</strong>s deux derniers exemples<br />

infirment cette hypothèse.<br />

(2) Dans le monde des jeux vidéo, on parle souvent des héros de jeux vidéo, mais<br />

rarement des anti-héros. www.jeuxvideo.fr/forum/forum-general/les-anti-heros-<br />

2. Par « mot simple », j’entends ici qu’il n’est pas possible de les analyser en synchronie comme des dérivés<br />

morphologiques.<br />

3. Cité par Dal (2003b).


84 Analyse unifiée de la préfixation en anti-<br />

dans-les-jeux-video-id9654-page1.html<br />

(3) Pepito : le discours anti-parlementaire qui consiste à les considérer comme des paresseux<br />

relève d’un niveau zéro de la réflexion ou au moins de l’information.<br />

societales.blogs.liberation.fr/alain_piriou/2008/05/pacs-et-ogm-qua.html<br />

(4) Trop rigolo, Julie est une potion anti-triste ! julieadore.blogspot.com/<strong>2009</strong>/06/<br />

betty-et-evirgo.html<br />

(5) SANTOFEROL : Préparation concentrée de vitamine E anti-stérile, dite de reproduction.<br />

perso.wanadoo.fr/artese/animaux/prod/ferol.htm<br />

On peut compléter ce premier groupe par les dérivés dont les radicaux sont des formes<br />

verbales comme antitranspirant (6), anticoupant (7) ou antibasculant.<br />

(6) j’ai une veste longue hiver Bogner et un maillot anti-transpirant, touchés en promo.<br />

forum.velovert.com/index.php?showtopic=75533<br />

(7) une veste de sécurité de type « bûcheron » et une paire de bottes de type « anticoupant<br />

» ... www.chaudfontaine.be/Vac/101/02_conseils_communaux.pdf<br />

L’initiale anti- apparaît plus rarement devant des infinitifs comme antidéraper (8), antidéprimer<br />

(9), antimanger (11), antidormir (12), antimordre (78) ou antirire (79). <strong>Le</strong>s deux<br />

premiers exemples sont probablement des « rétroformations » créées à partir de antidérapant<br />

et antidépresseur. Ces infinitifs permettent de régulariser le paradigme dérivationnel<br />

de ces adjectifs et d’en faire des participes présents à part entière. <strong>Le</strong>s premiers restent cependant<br />

très proches des seconds et peuvent dans ces contextes être paraphrasés par (10a)<br />

et (10b). Dans les exemples (11 ; 12), les radicaux manger sain et dormir pourraient aussi<br />

être interprétés comme des propositions infinitives.<br />

(8) — j’ai oublié de préciser que les semelles shopping and dancing de Scholl sont<br />

indispensables pour la survie de tes pieds...<br />

— ... mais qu’il ne faut pas leur faire une confiance exagérée non plus, sauf pour<br />

anti-déraper dans tes chaussures si tu portes des bas. forum.cosmopolitan.fr/cosmo/<br />

tendance-shopping-fashion-look/chaussures-sac-lunettes/existentiellechaussures-question-sujet_391_2.htm<br />

(9) Xanax, toujours à votre service pour vous antidéprimer! www.e-carabin.net/<br />

showthread.php?t=45675&page=3<br />

(10) a. ... sauf comme antidérapant dans tes chaussures ...<br />

b. ... toujours à votre service comme votre antidépresseur.<br />

(11) <strong>Le</strong>s obèses, les fumeurs, les buveurs, les anti-sports, les anti-manger sain, les anti-<br />

"je veux mourir en bonne santé", voilà les nouveaux hérétiques. vitanova.blogspot.<br />

com/2005_04_01_archive.html<br />

(12) mais quand on voit que les transporteurs ne veulent meme pas dépenser<br />

1000€ pour une barre anti-ancastrement ( :colere: :evil: ), je les vois mal équiper<br />

leur tracteur du systeme anti-dormir. www.forum-auto.com/automobile-pratique/<br />

section16/sujet69821.htm


Anti- est un préfixe 85<br />

La découverte de ces dérivés découle directement de l’approche extensive. Ces exemples<br />

sont en effet très rares en comparaison de ceux dont les radicaux sont nominaux ou adjectivaux,<br />

à l’exception bien sûr des dérivés dont les radicaux sont des participes présents. Ils<br />

sont totalement absents des descriptions antérieures de la préfixation en anti-. Par exemple,<br />

Corbin (1980:194) considère l’existence de ces dérivés comme impossible :<br />

« <strong>Le</strong>s verbes et adverbes en anti- sont issus, non d’une préfixation de anti-, mais<br />

d’une suffixation et/ou d’un changement de catégorie d’une base déjà préfixée<br />

par anti-. »<br />

<strong>Le</strong>s seuls dérivés qu’elle envisage sont ceux dont les bases sont des dérivés en anti- comme<br />

antiparasiter, antiseptiser, etc.<br />

On peut d’autre part observer que les dérivés déverbaux de notre corpus tendent à<br />

être construits préférentiellement sur des verbes à agent (i.e. dont le sujet remplit le rôle<br />

d’agent comme antimanger, antimordre, antirire, etc.) plutôt que sur des verbes à patient<br />

(i.e. dont le sujet recevrait le rôle de patient comme antiglisser, antifondre, etc.). L’exemple<br />

de antidormir (12) est à ce titre exceptionnel. Cette contrainte apparaît également dans la<br />

sélection des dérivés dont le radical est un participe : si les participes présents sont nombreux<br />

(antidérapant, antipolluant, etc.), les participes passés sont rares. Je n’ai ainsi pas<br />

trouvé d’antidérapé, d’antipollué, etc. et un exemple comme antivibré (13) me semble être<br />

le participe passé d’un verbe antivibrer qui signifierait ‘rendre antivibrant’.<br />

(13) Nos modèles à double lame sont bien équilibrés, efficaces et bien anti-vibrés. www.<br />

husqvarna.com/fr/landscape-and-groundcare/products/hedge-trimmers/325hd60x<br />

4.2.2 Radicaux pluriels<br />

L’initiale anti- peut aussi apparaître devant des radicaux moins prototypiques que ceux<br />

des exemples (2 ; 3), notamment des formes nominales au pluriel, comme antirides, antilimaces<br />

(14) ou anti-animaux (15). Ces radicaux sont remarquables car les marques de<br />

pluriel n’apparaissent normalement qu’en discours, lorsque les mots sont utilisés dans des<br />

constructions syntaxiques. Notons que les dérivés en (14 ; 15) sont au masculin singulier.<br />

<strong>Le</strong>urs finales ne peuvent donc pas être des marques de flexion contextuelle (Booij 1996).<br />

(14) L’autopsie a décelé du méthiocarbe, un antilimaces, en trop forte quantité pour que<br />

cela soit accidentel. www.ornithomedia.com/phorum/read.php?6,71681<br />

(15) Un lance pierre ou alors tu lui balances un répulsif anti animaux quand tu la vois.<br />

fr.answers.yahoo.com/question/index?qid=<strong>2009</strong>0423220818AAhf6WS<br />

La présence de marques du pluriel sur les radicaux des mots en anti- est massive.<br />

Par exemple, il existe selon Google cinq fois plus de formes anti(-)rides que de formes<br />

anti(-)ride et trois fois plus d’anti(-)animaux que d’anti(-)animal (voir table 4.1).<br />

<strong>Le</strong>s marques de pluriel sur les radicaux dans des exemples comme (14 ; 15) ne permettent<br />

pas d’analyser ces séquences comme des groupes prépositionnels. Dans une grande<br />

majorité de cas, ces marques sont uniquement graphémiques. Elles n’apparaissent qu’à<br />

l’écrit et ne donnent pas lieu à une réalisation phonique, y compris dans des contextes de<br />

liaison comme dans un antirides épatant que personne ne prononce / ˜œ nÃtiöid zepatÃ/.


86 Analyse unifiée de la préfixation en anti-<br />

singulier pluriel<br />

antiride 97 000 520 000<br />

antianimal 470 1 600<br />

Table 4.1 – Comparaison des fréquences des radicaux au singulier et au pluriel. <strong>Le</strong>s chiffres<br />

sont les nombres de pages Web en français indexées par Google contenant ces mots, avec<br />

ou sans séparation entre le préfixe et le radical. Décompte réalisé le 10 octobre <strong>2009</strong>.<br />

Ces marques peuvent cependant apparaître quand la flexion est contextuelle, en l’occurrence<br />

dans un contexte pluriel. Par exemple, des antirides épatants peut être prononcé /de<br />

zÃtiöid zepatÃ/. <strong>Le</strong>s locuteurs ont ainsi la possibilité d’utiliser comme radical la forme<br />

de liaison du pluriel obtenue en ajoutant [z] à la forme libre (Plénat 2008). On rencontre le<br />

même type de flexion contextuelle dans un syntagme comme la lutte anti-sous-marine (96).<br />

L’existence de radicaux plus clairement pluriels comme anti-animaux n’est pas davantage<br />

un argument en faveur d’une analyse prépositionnelle de ces séquences. La sélection de radicaux<br />

au pluriel se retrouve par exemple aussi dans des composés VN comme tue-flics (16)<br />

ou garde-chevaux (16). <strong>Le</strong> recours à une forme différente de celle qui est utilisée par défaut<br />

pour les dérivés préfixés en anti-, en l’occurrence, la forme de citation de la base, ne pose<br />

aucun problème dans le cadre du modèle théorique décrit en section 2.3. <strong>Le</strong>s locuteurs ont<br />

la possibilité de sélectionner comme radical n’importe quelle forme capable d’évoquer la<br />

base du dérivé. Seule compte en effet l’optimalité du dérivé.<br />

(16) <strong>Le</strong>s narcotrafiquants mexicains affectionnent ces pistolets « tue-flics » - comme on<br />

les appelle au Mexique - de luxe. www.lemonde.fr/web/recherche.../1,13-0,37-<br />

1058029,0.html<br />

(17) La toiture du clocher et de l’église vole en éclats tombant sur les chevaux haut-le-pied<br />

cachés non loin de là et tuant un garde-chevaux. www.genemilassoc.fr/charge.php?<br />

f=MTIyOA==<br />

La sélection de ces radicaux est probablement une stratégie utilisée par les locuteurs<br />

pour marquer l’interprétation générique des bases de ces dérivés (Montermini 2002, 2008) :<br />

de même qu’il n’y a pas de différences entre (18a) et (18b), il n’y en a pas entre antilimace et<br />

antilimaces ou entre antiride et antirides. En d’autres termes, le pluriel en (14 ; 15) n’est pas<br />

une marque de nombre mais un indice facilitant l’interprétation générique. Cette analyse<br />

rejoint celle de Heyna (2008) qui considère que ces marques forcent l’interprétation du<br />

nom base comme un nom de classe (N Classe).<br />

(18) a. <strong>Le</strong> lion est un mammifère<br />

b. <strong>Le</strong>s lions sont des mammifères<br />

Un autre argument contre l’analyse de antirides ou anti-animaux comme des groupes<br />

prépositionnels est l’absence de déterminant. Or, sans déterminant, ces radicaux ne peuvent<br />

pas fonctionner comme des syntagmes nominaux classiques. L’importance du déterminant


Anti- est un préfixe 87<br />

apparaît par exemple dans la paraphrase (19a) de un répulsif anti-animaux. Ce même syntagme<br />

ne peut pas être paraphrasé par (19b).<br />

(19) a. ... un répulsif contre les animaux ...<br />

b. ... un répulsif contre animaux ...<br />

4.2.3 Anti-VN<br />

<strong>Le</strong> préfixe anti- se rencontre aussi devant des composés VN comme anti-porte-bagage<br />

(20) ou anti-tourne-tête (21). <strong>Le</strong>s composés étant des lexèmes comme les autres, on a simplement<br />

affaire à des dérivés légèrement moins prototypiques que ceux dont le radical est<br />

monolexical (i.e. une forme simple). <strong>Le</strong>s VN peuvent également comporter des déterminants<br />

comme dans tire-au-flan, crève-la-faim ou tue-l’amour. <strong>Le</strong>s radicaux des dérivés en<br />

(22 ; 23) relèvent de ce type.<br />

(20) Encore un argument dans le camp des anti-porte-bagage. <strong>Le</strong>s modèles sans portebagage<br />

ont une roulette sur le garde-boue. bromptonforum.conceptforum.net/trucset-astuces-f2/b-sans-garde-boue-ca-roule-plie-t1688.htm<br />

(21) mais par contre, ma tête fait le tour du monde et c’est ça qui me tourneboule le ventre<br />

après... bref, au moins, elle m’a donné de "l’anti-tourne-tête" et là, je recommence<br />

à marcher droit... forum.aufeminin.com/world/communaute/forum/forum2__forum=<br />

fitness1&m=52117&whichpage=3.html<br />

(22) Et puis, celles qui ont essayé les vernis "anti-ronge-tes-ongles" pourront te dire que<br />

ça ne marche pas forcément !! www.infobebes.com/htm/bebe/sevrage-impossible,d-<br />

169258.aspx<br />

(23) D*Lires: La cuillère anti-brûle-la-langue On en a tous fait la cruelle expérience. On<br />

réchauffe un bol au micro-ondes, il est tiède mais le liquide est brulant. Du coup, on<br />

se fait griller la langue. cetnia.blogs.com/d_lires/2006/02/la_cuillre_anti.html<br />

Ces exemples ne peuvent pas être considérés comme des syntagmes prépositionnels.<br />

<strong>Le</strong>s VN peuvent notamment servir de radicaux de dérivés suffixés comme dans tournedisqueur<br />

(24) ‘animateur de discothèque’, tire-au-flantisme ou casse-têtesque.<br />

(24) Dentiste pour chiens morts, tourne-disqueuse incontournable de la scène kitch. www.<br />

la-machine-a-machins.com/machins.htm<br />

<strong>Le</strong> fait que les radicaux de certains de ces VN (tourne-tête ; ronge-tes-ongles ; brûle-lalangue)<br />

ne soient pas lexicalisés ne peut pas non plus être invoqué comme argument en<br />

faveur d’une analyse prépositionnelle. On trouve en effet des configurations comparables<br />

dans des dérivés suffixés comme en (25). <strong>Le</strong> fait que ces radicaux soient créés spécialement<br />

pour ces dérivés, ne réduit en rien le statut morphologique de ces derniers. <strong>Le</strong>ur seule<br />

différence avec les radicaux lexicalisés comme porte-bagage est le niveau de complexité<br />

plus élevé de leur construction qui comprend à la fois une préfixation et une composition.<br />

Une autre caractéristique de ces dérivés est qu’ils ne sont normalement pas destinés à entrer<br />

dans le lexique. Il existe cependant des exceptions comme anti-monte-lait (26).


88 Analyse unifiée de la préfixation en anti-<br />

(25) je vois que je mettais trompé, et je vois surtout que Tsunia est une adepte<br />

du gros-bourin-qui-détruit-tout-en-un-claquement-de-doigtisme, forumold.wakfu.<br />

com/topic.php?lang=fr&id=10115...<br />

(26) L’anti-monte-lait est un disque lourd, qui tombe au fond, là où se forment les bulles.<br />

fr.wikipedia.org/wiki/Anti-monte-lait<br />

4.2.4 Anti- devant des syntagmes nominaux sans déterminant<br />

<strong>Le</strong> préfixe anti- peut aussi apparaître devant des syntagmes nominaux sans déterminants.<br />

Comme pour les VN, ces radicaux peuvent soit être lexicalisés comme dans antimaison<br />

de retraite (27) ou dans (28 ; 29), soit ne pas l’être comme dans (30 ; 31) et dans le<br />

premier exemple en (32). <strong>Le</strong>s dérivés dont les radicaux ne sont pas lexicalisés sont similaires<br />

à (25). Ils ne sont normalement pas destinés à entrer dans le lexique. Ces exemples<br />

sont, de ce point de vue, proches des dérivés de la section précédente dont les radicaux sont<br />

des composés morphologiques créés « à la demande » (21 ; 22 ; 23). Ils suggèrent que les locuteurs<br />

peuvent utiliser comme radicaux de constructions morphologiques des séquences<br />

construites par des moyens syntaxiques. Morphologie et syntaxe opèrent ainsi au même<br />

niveau, celui de la production et de la compréhension des énoncés : la morphologie permet<br />

d’exprimer du sens au moyen de mots et de comprendre le sens des mots ; la syntaxe permet<br />

de le faire au moyen de structures syntaxiques et de comprendre le sens de ces dernières.<br />

(27) C’est une utopie réaliste qui commence à s’essaimer un peu partout en France et c’est<br />

surtout une anti-maison de retraite. www.millebabords.org/spip.php?article7615<br />

(28) anti-rond-de-cuir ; anti-jeune premier<br />

(29) <strong>Le</strong> Québec et la Colombie-Britannique sont les seules provinces qui ont des dispositions<br />

anti-briseurs de grève, communément appelées « lois anti-scabs ». ... tempsreel.<br />

nouvelobs.com/actualites/20080707.OBS1839/lsreactions00e5.html?l=7<br />

(30) <strong>Le</strong>s anti-produits-laitiers-à-l’âge-adulte estime qu’en dehors de la croissance (bébéenfant-ado),<br />

le lait n’est plus nécessaire, et peut provoquer (sans aller jusqu’au<br />

cancer) d’importants troubles digestifs. fr.answers.yahoo.com/question/index?qid=<br />

20070917060124AAGXHru<br />

(31) J’ai bien compris que tu étais anti-fil à pendre le linge alors hop, enlevé! www.<br />

vacanceo.com/albums_photos/voir-photo_396772.php<br />

(32) celui-ci est l’anti "homme qui me sied bien", l’anti "celui que je peux croiser dans<br />

un train et y penser pendant toute une journée". mariealix.canalblog.com/.../<br />

14232858.html<br />

4.2.5 Anti- devant des noms propres, des propositions, des interjections et des<br />

onomatopées<br />

Pour des raisons sémantiques (voir section 4.3), les noms propres sont particulièrement<br />

fréquents après anti- : anti-Bush, anti-Aznavour, anti-Besson (33), anti-Boeing, anti-Crédit


Anti- est un préfixe 89<br />

Lyonnais, anti-RPR, anti-FMI (34), etc. La nature dérivationnelle de ces constructions ne<br />

fait aucun doute, même si les noms propres sont référentiellement autonomes et peuvent<br />

être des compléments dans des groupes prépositionnels. <strong>Le</strong>s locuteurs n’ont par exemple<br />

aucun mal à les utiliser comme radicaux de dérivés suffixés (35). Ces radicaux peuvent être<br />

rapprochés des propositions utilisées de façon autonymique comme dans (36) ou dans le<br />

deuxième exemple de (11). Notons que l’on retrouve le même type de radical dans des<br />

dérivés suffixés comme (37).<br />

(33) Je vois déjà les anti-Besson brandir les pancartes et crier aux scandales ! www.uneporte.<br />

net/ONG-BAK,-l-edition-DVD-zone-1-de-Christal-Films_a813.html<br />

(34) La police disperse une manifestation anti-FMI à Istanbul. www.latribune.fr/.../lapolice-disperse-une-manifestation-anti-fmi-a-istanbul.html<br />

(35) moliéresque, chiraquien, gaullisme, jospiniste, juppette<br />

(36) Je demande la création d’une brigade anti "je veux transformer mon os en voiture de<br />

course sans payer un centime et sans rien y connaitre" www.forum-auto.com/pole...<br />

/sujet380039.htm<br />

(37) Au vieux réflexe stalino-je-ne-veux-voir-qu’une-tetesque répond une bordée de ...<br />

cozop.com/frednetick/pim_paf_pouf_chocs_de_neurones_au_ps/proches<br />

<strong>Le</strong>s dérivés en anti- formés sur des onomatopées ou des interjections comme anti-aïe<br />

aïe (38), anti-plouf (39), ou anti-snif (40) sont habituellement ignorés par les études de ce<br />

préfixe. Ils illustrent l’absence de contraintes sur la catégorie des lexèmes dont les formes<br />

sont utilisées comme radicaux. Je signale que des radicaux similaires apparaissent dans des<br />

dérivés suffixés comme vlantesque, pif-pafesque (41), clonguiste ou ploufiste (42).<br />

(38) il ne faut pas resté trop longtemps sur le trône et évité de mangé trop pimenté, prend<br />

un bon bain chaud et mais une crème anti aie aie. fr.answers.yahoo.com/question/<br />

index?qid=20070830075705AAKQZIC<br />

(39) ca c’est parce que tu connais pas le pq anti-plouf!!!mdr...quoique pour la courante<br />

ca marche pas!!! forum.aufeminin.com/world/communaute/forum/forum2__forum=<br />

f382&m=59783&whichpage=6.html<br />

(40) Je suis anti snif, car c’est con de pleurer alors qu’on peut sourire. smile.exprimetoi.<br />

net/fun-time-f13/je-suis-un-anti-t109-255.htm<br />

(41) J’ai même failli être perdu sur certaines portions trop "pif-pafesque". www.melivelo.<br />

fr/forum/viewtopic.php?t=3000...<br />

(42) Est-il un clonguiste mou ou un ploufiste (clonguiste éclaboussé) ? fr.groups.yahoo.<br />

com/group/Fulmedico2000/message/54607<br />

4.2.6 Anti- devant des pronoms<br />

L’analyse des dérivés dont les radicaux sont des pronoms comme antirien (43), anticeci<br />

ou cela (44), antitout (45) est a priori plus problématique. <strong>Le</strong>s pronoms ont un sens<br />

procédural. Ils ne permettent pas de faire référence à des catégories et peuvent apparaître


90 Analyse unifiée de la préfixation en anti-<br />

directement après des prépositions (46). Ces caractéristiques ne permettent cependant pas<br />

de conclure que ces séquences sont des groupes prépositionnels. Rien n’impose en effet<br />

au radical d’un dérivé d’évoquer une catégorie ni d’être totalement spécifié. Cette liberté<br />

s’observe aussi dans des dérivés suffixés comme rienisme (47) ou moiesque (48) dont le caractère<br />

affixal ne peut pas être mis en doute. <strong>Le</strong>s radicaux pronominaux des dérivés préfixés<br />

en anti- peuvent également comporter des propositions comme (49) ou dans le deuxième<br />

exemple de (32).<br />

(43) Et change vite d’antivirus, Avast est un anti-rien ! fr.answers.yahoo.com/question/<br />

index?qid...<br />

(44) Et puis être anti-ceci ou cela, c’est avoir des idées arrêtées et c’est reservé aux nazes qui<br />

ont besoin de se coller une étiquette. fr.answers.yahoo.com/question/index?qid...<br />

(45) Anti-tout, anti-ghettos, anti-lobbies, anti-chapelles, pour résumer libertaire et anticons,<br />

probablement anti-lui-même, comme il l’écrit. www.lepost.fr/article/2008/<br />

08/27/1252204_apres-charlie-hebdo-sine-hebdo.html<br />

(46) Ils ne sont contre personne, mais contre les erreurs qui ont conduit la FRANCE à la<br />

défaite www.cg47.fr/archives/recherche/.../pdf%5C1W141-001.pdf<br />

(47) Toutefois, le refus d’entrer dans l’excès, c’est à dire dans le rienisme, conduit à s’interroger<br />

sans cesse sur la validité du processus fr.wikipedia.org/.../Société_anonyme_<br />

de_production_littérair<br />

(48) <strong>Le</strong> roman est extrêmement descriptif et sa qualité principale se situe, d’un point de vue<br />

purement moiesque (le mien, donc), dans les comparaisons. effetlarsen.site.voila.<br />

fr/salammbo.htm<br />

(49) Il y aurait donc du "racisme langagier", par exemple ; ou du racisme "anti-ceux-quiportent-des-casquettes".<br />

dogmatique.kanak.fr/.../racisme-et-integration-t52.<br />

htm<br />

4.2.7 Anti- devant des syntagmes nominaux comportant un déterminant<br />

<strong>Le</strong> dernier groupe de constructions comportant l’initiale anti- de cet inventaire de radicaux<br />

est celui des syntagmes nominaux introduits par un déterminant. <strong>Le</strong>ur analyse est<br />

plus problématique que celle des précédentes. Plusieurs cas de figures peuvent être distingués.<br />

<strong>Le</strong> premier est celui où le déterminant fait partie d’une expression ou d’un titre<br />

comme anti-la vie (50) ou anti-les ch’tis (51). Dans le premier cas, le radical est une partie<br />

de l’expression usuelle la vie quoi !. Dans le second, il s’agit du titre du film <strong>Le</strong>s Ch’tis.<br />

(50) je lis aussi à gauche à droite des posts anti enfants, anti mecs, anti animaux , anti la<br />

vie quoi. jesuisunique.blogs.com/.../la-clibataire.html<br />

(51) voilà les anti-les ch’ti!voilà la france mesquine,radine,paranoîaque et raciste! www.<br />

allocine.fr/video/player_gen_cmedia=18824509&cfilm=129327.htm


Anti- est un préfixe 91<br />

<strong>Le</strong> deuxième cas est celui où le déterminant marque l’interprétation générique. Il joue alors<br />

le même rôle que les radicaux pluriels présentés en section 4.2.2. Ce type d’emploi peut être<br />

illustré par des dérivés comme anti-les rêves de gonzesses ou anti-la poésie (52) 4 .<br />

(52) Antie les demies mesures, anti les happy end, anti les reves de gonzesse, anti la poesie,<br />

je vous offre des cliches. www.myspace.com/escone<br />

<strong>Le</strong> troisième cas est celui où le déterminant marque la nominalisation du radical comme<br />

dans anti-les anti-corrida (53), anti-corrida étant par défaut un adjectif.<br />

(53) Mais je suis plutot Anti les Anti-corrida. Vous m’horripilez. forum.doctissimo.fr/..<br />

./manifestation-corrida-carcassonne-sujet_8368_1.htm<br />

<strong>Le</strong> dernier cas est celui où le déterminant sert de quantificateur comme en (54 ; 55 ; 56 ; 57)<br />

ou fait partie d’un quantificateur comme en (58).<br />

(54) Comme la plupart des sites anti des chanteurs et chanteuses, on y retrouve des chansons<br />

truquées, des photos modifiées ... echo.levillage.org/169/1087.cbb<br />

(55) Que veut tu beaucoup de gens se définissent malheureusement plus anti une équipe<br />

que pro une autre. www.rmc.fr/.../diouf-dement-pour-gudjohnsen/?...<br />

(56) Nous n’avons absolument pas une posture anti-Ordre (et tu le sais si tu nous lis) mais<br />

foncièrement anti cet Ordre-là. www.physiorama.com/forum/?k=aucunes<br />

(57) mais trouver son nom associé à une diatribe anti-ces-méchantes-molécules-quinous-font-du-mal<br />

est au mieux ironique, plus vraisemblablement désespérant, www.<br />

irenedelse.com/.../du-bon-et-du-mauvais-usage-de-la-chimie/<br />

(58) Etre anti-Bush de la manière dont vous l’exprimez c’est aujourd’hui être anti-une<br />

majorité d’américain. www.les4verites.com/.../comments.php?...id..<br />

L’analyse de ces séquences est rendue difficile par leur structure, identique à celle des<br />

groupes prépositionnels. Elle l’est aussi par le fait qu’il n’existe pas de moyen simple permettant<br />

de repérer des dérivés suffixés dont les radicaux sont introduits par un déterminant.<br />

Il est plus difficile d’exhiber des dérivés qui montrent clairement que ces syntagmes<br />

peuvent servir de radicaux. Notons également qu’il est difficile de trouver des syntagmes<br />

nominaux de ce type comme radicaux d’autres préfixes comme post-, pré-, intra-, infra-,<br />

etc., si l’on excepte pro- (59). La différence entre anti- et pro- d’un côté et ces autres préfixes<br />

est le niveau de langue des discours dans lesquels ils sont utilisés. Ce dernier peut être<br />

très bas pour les deux premiers, permettant ainsi une assez grande souplesse langagière.<br />

(59) Pour ma part, je suis pro les principes d’Hadopi. fallengalaxy.com/forum/<br />

viewtopic.php?id...<br />

On peut néanmoins avancer trois arguments en faveur d’une analyse dérivationnelle<br />

des séquences comme (54 ; 55 ; 56 ; 57 ; 58). <strong>Le</strong> premier est le fait que ces séquences sont<br />

très rares et relativement marquées. Si anti était une préposition, on devrait pouvoir trouver<br />

un nombre très important de configurations de ce type, or ce n’est pas le cas. Ces<br />

4. <strong>Le</strong>s exemples sont reproduits en respectant les graphies originales et notamment les fautes de frappe<br />

comme Antie dans cet exemple, d’orthographe, etc.


92 Analyse unifiée de la préfixation en anti-<br />

séquences sont par exemple totalement absentes dans la base Frantext catégorisée. Cette<br />

dernière contient pourtant 21 108 occurrences de mots préfixés en anti- (avec ou sans séparation<br />

entre le préfixe et le radical). En comparaison, on trouve dans cette base 41 487<br />

occurrences de la préposition contre suivie d’un déterminant pour 7 256 formes de substantifs<br />

précédées par contre- (avec un trait d’union ou sans séparation entre le préfixe et le<br />

radical).<br />

<strong>Le</strong> deuxième argument est que dans les exemples ci-dessus, anti- a le même sens que<br />

dans les dérivés présentés dans les sections précédentes. Or s’il existait une préposition<br />

anti, on pourrait s’attendre à ce qu’elle ait un sens qui lui soit propre, différent de celui du<br />

préfixe anti-. C’est ce qu’on observe par exemple avec le préfixe contre- et la préposition<br />

homonyme. Dal (2003b:189) montre notamment qu’avec les noms déverbaux ou assimilés,<br />

la préposition contre « active préférentiellement sa valeur adversative » et fonctionne<br />

comme un inverseur (De Mulder et Amiot 2003), tandis que le préfixe contre- « dit du référent<br />

du dérivé qu’il construit qu’il constitue une réplique du référent de la base à laquelle<br />

il s’applique ». Cette analyse rejoint le présupposé de secondarité posé par De Mulder et<br />

Amiot (2003:214).<br />

L’identité sémantique qui vient d’être évoquée fournit un troisième argument contre<br />

l’analyse prépositionnelle de anti. Il existe en effet en français une préposition sémantiquement<br />

très proche du préfixe anti- (voir section 4.3.6), que l’on peut utiliser notamment pour<br />

paraphraser ses dérivés. Il s’agit naturellement de contre (Zribi-Hertz 1973, Dal 2003b).<br />

Une éventuelle préposition anti n’aurait de ce fait que peu d’utilité et l’on peut envisager<br />

que dans les exemples (54 ; 55 ; 56 ; 57 ; 58), l’initiale anti est utilisée comme une variante de<br />

la préposition contre qui renforce l’interprétation de ces syntagmes comme des nuisances<br />

(voir section 4.3.5). Anti- est aussi plus approprié pour certaines têtes. Par exemple, dans<br />

(54), le nom site facilite l’utilisation de anti- par rapport à celle de contre. On trouve ainsi<br />

250 000 pages en français indexées par Google qui contiennent la séquence site(s) anti alors<br />

qu’il n’en existe que 75 000 qui contiennent site(s) contre. Notons que le premier chiffre ne<br />

prend pas en compte les dérivés dans lesquels le préfixe n’est pas séparé du radical.<br />

Cette description confirme la classification par Amiot (2004), de anti- comme un préfixe<br />

de type 2, situé entre les préfixes les plus prototypiques, de type 1, comme re- et dé- et<br />

ceux de type 3 qui peuvent être utilisés à la fois comme préfixe et préposition. <strong>Le</strong> préfixe<br />

anti- est sémantiquement proche de la préposition contre, mais il n’est pas en revanche un<br />

concurrent du préfixe contre- qui ne permet pas de construire des adjectifs dénominaux<br />

(Rey 1968, Amiot 2004). Je signale que Fradin (1997b) réfute lui aussi la possibilité que<br />

anti- puisse être une préposition. Son argument principal est que les vraies prépositions<br />

se préfixent facilement à des verbes. Il affirme que cette possibilité est totalement exclue<br />

pour anti-. Plusieurs contre-exemples dans notre corpus (11 ; 12 ; 78 ; 79) infirment cette<br />

assertion.<br />

4.3 La sémantique des dérivés en anti-<br />

La seconde grande question abordée dans ce chapitre est l’organisation des sens des<br />

dérivés en anti- et les conclusions qu’il est possible d’en tirer concernant l’unicité de ce


La sémantique des dérivés en anti- 93<br />

préfixe. <strong>Le</strong>s études antérieures de la préfixation en anti- identifient trois types d’interprétations<br />

pour ses dérivés (Rey 1968, Zribi-Hertz 1973, Durand 1982, Corbin 1987, Fradin<br />

1996, 1997a, b) :<br />

1. un sens locatif que l’on trouve dans des dérivés comme antichambre, et qui peut être<br />

paraphrasé par « qui est situé devant X » où X est la base ;<br />

2. un sens antagoniste que l’on trouve dans antiparlementaire ou antilimace, et qui peut<br />

être paraphrasé par « qui s’oppose à X » ;<br />

3. un sens antonymique que l’on trouve dans antihéros, et qui peut être paraphrasé par<br />

« qui est le contraire de X ». <strong>Le</strong>s dérivés des domaines de la physique des particules et<br />

des mathématiques relèvent de ce sens (Zribi-Hertz 1973).<br />

L’approche extensive permet de raffiner et d’étendre cette description grâce à la découverte<br />

d’exemples jusqu’ici inconnus ou ignorés. Cette extension a été présentée dans une<br />

forme préliminaire dans Plénat et al. (2004a). J’en présente ici une version plus complète qui<br />

organise les sens des dérivés en anti- selon deux critères qui définissent cinq configurations.<br />

<strong>Le</strong> premier critère distingue les dérivés endocentriques de ceux qui sont exocentriques. Il<br />

est utilisé notamment par Zribi-Hertz (1973). <strong>Le</strong>s dérivés endocentriques désignent des notions<br />

(objets, qualités ou événements) de même nature que leurs bases. Ils correspondent<br />

aux altérations au sens de Roché (en préparation). <strong>Le</strong>s exocentriques désignent des notions<br />

de nature différente de celle de leurs bases. Ils correspondent aux transferts au sens<br />

de Roché (en préparation). <strong>Le</strong> second critère distingue trois modes d’interprétation : spatial,<br />

logique et adversatif. Dans le premier, anti- sert à décrire des relations spatiales, dans<br />

le deuxième, des catégories et dans le dernier, des protections contre des nuisances. Ces<br />

trois modes reprennent simplement les trois types d’interprétation préalablement identifiés.<br />

La principale contribution de la présente étude est d’établir que ces deux critères sont<br />

indépendants, que leur croisement définit bien six possibilités et que l’on peut exhiber des<br />

exemplaires pour cinq d’entre d’elles. Dans les études antérieures, les deux critères sont<br />

considérés comme corrélés, comme l’illustrent les exemples présentés dans le tableau 4.2.<br />

Par ailleurs, la description proposée pour les interprétations adversatives est plus fine que<br />

celle que l’on trouve dans les études précédentes. Je n’ai pas réussi à trouver d’exemples<br />

clairs de dérivés dont l’interprétation est logique exocentrique. Cette interprétation est probablement<br />

impossible. Cette incompatibilité pourrait avoir pour origine le fait que, dans ses<br />

emplois logiques, anti- est avant tout un inverseur et qu’il induit donc obligatoirement une<br />

interprétation endocentrique.<br />

<strong>Le</strong>s interprétations endocentriques se caractérisent par l’identité des catégories du dérivé<br />

et sa base (60) 5 et par celle de leurs genres quand la base est nominale. En conséquence,<br />

le dérivé désigne un hyponyme de la base comme le notent Rey (1968), Durand (1982) et<br />

Heyna (2008) à propos des dérivés de la sous-série antihéros.<br />

(60) a. chauffeur > chauffard<br />

b. réforme > réformette<br />

c. pendre > pendouiller<br />

5. Ces exemples sont empruntés à Roché (en préparation).


94 Analyse unifiée de la préfixation en anti-<br />

endocentrique exocentrique<br />

spatial antichambre ?<br />

logique antihéros ?<br />

adversatif ? antiparlementaire<br />

Table 4.2 – <strong>Le</strong> sens des dérivés en anti- est décrit au moyen de deux critères indépendants.<br />

Dans les études précédentes, ces critères étaient considérés comme corrélés, comme le fait<br />

apparaître la distribution des dérivés dans le tableau.<br />

d. célèbre > célébrissime<br />

L’alternance entre les interprétations endocentriques et exocentriques est en fait partagée<br />

par de nombreuses préfixations comme pré- ou sous- (61) (voir la section 2.2 de Aurnague<br />

et Plénat (2008) pour une discussion plus détaillée de cette question). Par exemple,<br />

un sous-préfet est un préfet de rang inférieur (dérivé endocentrique). À l’inverse, un sousmain<br />

est une entité qui n’est pas une main (dérivé exocentrique). <strong>Le</strong> genre du dérivé est<br />

dans ce cas différent de celui de la base. De même, une pré-révolution est une répétition<br />

générale d’une révolution à venir (dérivé endocentrique). La pré-Révolution décrit une période<br />

qui précède la Révolution. Ce n’est pas une révolution et le dérivé est par conséquent<br />

exocentrique.<br />

(61) a. un sous-préfet ; un sous-main<br />

b. une pré-révolution ; la pré-Révolution<br />

<strong>Le</strong> reste de la section est organisé de la manière suivante. Je présente en 4.3.1 quelques<br />

notions générales utilisées pour décrire la sémantique de anti-. <strong>Le</strong>s cinq sous-sections suivantes<br />

sont consacrées aux cinq types d’emplois présents dans notre corpus. Dans la soussection<br />

4.3.7, je présente différents arguments en faveur de l’unicité de la préfixation en<br />

anti-.<br />

4.3.1 Notions générales<br />

À la suite de Heyna (2008), j’adopte dans cette étude les notions de type, d’attracteur et<br />

de satellite pour décrire l’interprétation des bases des dérivés en anti-. J’utilise également la<br />

catégorie de la dynamique des forces pour affiner l’analyse des dérivés adversatifs comme<br />

antilimace ou antiparlementaire.<br />

Types<br />

Selon Berrendonner (1995, 2002), les types sont des noms d’objets intensionnels ou génériques.<br />

<strong>Le</strong>ur définition repose sur l’hypothèse que les univers d’interprétation construits<br />

par les discours sont composés de deux sous-ensembles d’entités : un sous-ensemble R<br />

d’objets extensionnels et un sous-ensemble I d’objets intensionnels ou types. <strong>Le</strong>s éléments


La sémantique des dérivés en anti- 95<br />

de R sont des entités « pensées comme existant in re », c’est-à-dire dans la réalité. <strong>Le</strong>s éléments<br />

de I sont « des êtres conçus comme subsistant in intellectu », i.e. dans l’esprit des<br />

locuteurs. <strong>Le</strong>s types sont des individus comme les autres, aptes à recevoir des prédicats,<br />

et à servir de cibles aux opérations de référence, et tout spécialement aux références génériques<br />

; ce ne sont pas des fonctions applicables sur les choses. Ils servent par ailleurs<br />

d’instrument de catégorisation des objets extensionnels. La notion de type est impliquée<br />

dans toutes les dérivations morphologiques dans lesquelles la base peut être exprimée par<br />

un nom. Par exemple, dans terrain piscinable, la base évoquée par le radical piscine n’est<br />

pas utilisée pour faire référence à une piscine particulière, ni à un quelconque élément de la<br />

classe des piscines, mais à un type, à une piscine abstraite, générique.<br />

Attracteurs et satellites<br />

<strong>Le</strong>s types peuvent aussi donner lieu à une interprétation métonymique et permettre<br />

ainsi de viser un autre objet. Cet objet doit entretenir avec le type une relation de contiguïté<br />

référentielle suffisamment typique (Berrendonner 1990). L’interprétation métonymique<br />

exploite la procédure d’implication discursive qui consiste à placer un objet de<br />

connaissance x dans le savoir commun au locuteur et à son interlocuteur puis à conclure<br />

à l’existence d’un autre objet y en mettant à profit l’existence d’un lieu commun ou d’une<br />

relation de cause à effet reliant x à y ; x doit être un objet de connaissance fortement implanté,<br />

servant de support à des engagements axiologiques intenses et controversés. <strong>Le</strong>s<br />

arguments et les assertions tenues à son propos, de façon répétitive, acquièrent un statut de<br />

lieux communs. <strong>Le</strong> type x condense ainsi l’ensemble des actes d’énonciation typiques ou<br />

symptomatiques tenus à son propos (Berrendonner 1990).<br />

C’est ce qui se passe par exemple pour un nom propre comme Sarkozy qui est un objet<br />

de discussion fortement implanté dans les connaissances partagées des locuteurs et auquel<br />

sont associés des lieux communs nombreux. <strong>Le</strong>s objets y dont l’existence est impliquée par<br />

x = Sarkozy sont dans ce cas : les idées de Sarkozy ; la politique de Sarkozy ; le discours de<br />

Sarkozy ; etc. Il en va de même pour les virus informatiques (x), eux aussi bien connus, et<br />

faisant l’objet d’un grand nombre de lieux communs relatifs à des y comme les symptômes<br />

qui les caractérisent, les dysfonctionnements qu’ils causent, les pertes qu’ils induisent, les<br />

façons dont on peut s’en prémunir, etc.<br />

À la suite de Heyna (2008), j’adopte ici la terminologie de Berrendonner qui propose<br />

d’appeler attracteurs les entités x et satellites les y correspondants. La préfixation en antiexploite<br />

les relations qui s’établissent entre les attracteurs et les satellites pour les dérivés<br />

du type antiparlementaire et antilimace.<br />

La dynamique des forces<br />

La catégorie de la dynamique des forces proposée par Talmy (2000) est un niveau de<br />

description adapté à la sémantique des dérivés adversatifs en anti-. Dans ce cadre, les entités<br />

sont appréhendées à travers les forces qu’elles exercent les unes sur les autres. Par exemple,<br />

le sens d’un énoncé comme (62) peut être décrit comme une interaction entre deux entités,<br />

l’eau et le barrage, exerçant des forces contraires : l’eau exerce une force qui tend à la faire


96 Analyse unifiée de la préfixation en anti-<br />

s’écouler vers l’aval tandis que le barrage exerce une force qui tend à sa propre immobilité<br />

et par suite à celle de l’eau. <strong>Le</strong>s deux forces sont ainsi opposées. De plus, la force exercée<br />

par le barrage l’emporte sur celle de l’eau ce qui a pour conséquence l’immobilité de l’eau.<br />

En d’autres termes, le barrage manifeste sa tendance à l’immobilité aux dépens de l’eau.<br />

Dans la terminologie de Talmy, l’élément qui correspond à la cible 6 est appelé « agoniste »<br />

(l’eau dans l’exemple (62)) et celui qui correspond au site, « antagoniste » (le barrage dans<br />

l’exemple (62)).<br />

(62) <strong>Le</strong> barrage retient l’eau.<br />

Talmy utilise des représentations schématiques pour décrire les forces et les rapports<br />

qui s’établissent entre elles. Ces schémas permettent de représenter :<br />

1. la force agoniste (cercle),<br />

2. la force antagoniste (figure concave),<br />

3. le fait qu’une force tend au déplacement (>) ou à l’immobilité (•),<br />

4. le fait qu’une force soit supérieure (+) ou inférieure à l’autre, et<br />

5. le fait que la résultante (ligne inférieure) soit le déplacement de la cible (>) ou son<br />

immobilité (•).<br />

La figure 4.1 présente la configuration qui correspond à la phrase (62).<br />

<br />

Figure 4.1 – Représentation schématique qui décrit les forces impliquées dans l’interprétation<br />

de la phrase <strong>Le</strong> barrage retient l’eau. La force de l’eau est représentée par le cercle et<br />

celle du barrage par la figure concave. L’eau exerce une force qui tend à son déplacement<br />

(>) et le barrage une force qui tend à son immobilité. La force exercée par le barrage est<br />

supérieure à celle (+) de l’eau. <strong>Le</strong> barrage manifeste sa tendance à l’immobilité aux dépens<br />

de l’eau (• sur la ligne inférieure).<br />

L’intérêt majeur du cadre de la dynamique des forces est qu’il impose l’identification<br />

précise des participants et des interactions qui existent entre eux. Dans le cas d’un dérivé adversatif<br />

comme antilimace, il met en évidence les limaces, l’antilimace et, au second plan, un<br />

agent qui s’en sert. <strong>Le</strong>s limaces exercent une force qui tend à la consommation des plantes.<br />

Cette force nuit aux intérêts d’un agent intentionnel. Pour s’en protéger, ce dernier utilise<br />

un antilimace qui exerce une force opposée à celle des limaces. La limace exerce ainsi une<br />

6. <strong>Le</strong>s termes de cible et de site (Vandeloise 1986) correspondent à ceux de figure et de ground (Talmy 2000).


La sémantique des dérivés en anti- 97<br />

force qui est une nuisance et l’antilimace une force de protection des intérêts de l’agent 7 .<br />

<strong>Le</strong> mécanisme mis en place par l’agent intentionnel peut aboutir à la destruction de l’entité<br />

agoniste, si l’antilimace est par exemple un poison, ou prendre d’autres formes comme des<br />

ondes, un répulsif ou d’autres dispositifs qui éloigneraient les limaces ou les paralyseraient<br />

momentanément. Dans ce dernier cas, on reste très proche du scénario des forces puisque<br />

l’entité agoniste n’est pas détruite. Seule la nuisance, la force qu’elle exerce, est neutralisée.<br />

De manière similaire, un plateau antivibrant permet de prémunir les objets qui se trouvent<br />

sur ce dernier des vibrations, considérées comme des nuisances. <strong>Le</strong>s vibrations exercent<br />

ainsi une force contraire aux intérêts d’un agent qui n’est pas nommé et un plateau antivibrant<br />

une force antagoniste qui préserve ces intérêts. Dans le cas de anti-Sarkozy, le dérivé<br />

a pour référence l’agent. Il exerce lui-même une force destinée à le protéger de ce qu’il<br />

considère comme des nuisances que Nicolas Sarkozy cause à ses intérêts.<br />

4.3.2 Interprétations spatiales endocentriques<br />

L’interprétation spatiale endocentrique concerne les dérivés à sens locatifs relativement<br />

anciens comme en (63), signalés par Rey (1968).<br />

(63) antibust 8 ; antichambre ; antichapelle ; anticour ; anticuisine ; antiposte ; antisalle<br />

Ces dérivés sont tous endocentriques. Ils décrivent des lieux qui se trouvent avant, devant<br />

ou qui donnent accès à un autre lieu, désigné par la base. Ces emplois d’anti- sont généralement<br />

analysés comme des variantes du préfixe anté- qui forme antécambrien, antéposer,<br />

antépénultième ou antédiluvien. C’est notamment le cas dans l’article du TLF consacré à<br />

anté-. Il existe par ailleurs un dérivé à sens temporel, antidater, dans lequel anti- est clairement<br />

une variante de anté- (voir section 2.10.1). Étant le seul à avoir ce sens, il n’est pas<br />

utile de l’intégrer au reste des dérivés préfixés en anti-.<br />

La série de dérivés ci-dessus peut être complétée par les noms de montagne (64), le<br />

nom de ville Antibari 9 et des termes d’anatomie comme (65) ou comme antitrochanter.<br />

Tous ces dérivés désignent des entités qui se trouvent en face de celles qui sont désignées<br />

par leurs bases. Par exemple, l’Anti-Liban est une montagne qui fait face au Mont Liban.<br />

<strong>Le</strong> trochanter et l’anti-trochanter sont des faces articulaires en contact. Elles se font face,<br />

sont opposées du point de vue de leur orientation et exercent l’une sur l’autre des forces<br />

opposées.<br />

(64) Anti-Atlas, Anti-Liban, Anti-Taurus<br />

(65) antitragus ; antilobe ; antithénar ; antiprostate<br />

(66) L’articulation fémoro-pelvienne comprend l’acétabulum sur la ceinture pelvienne et<br />

la tête fémorale (caput femoris) (figure 21), mais aussi le trochanter (trochanter femoris),<br />

et plus précisément sa surface articulaire (facies articularis antitrochanterica)<br />

7. On pourrait aussi considérer que les participants au schéma sont les limaces et l’agent intentionnel.<br />

L’antilimace devient alors un instrument utilisé par l’agent pour produire sa force antagoniste.<br />

8. La poitrine, prise dans le sens de ‘ce qui est à l’avant du buste’.<br />

9. Je remercie Fabio Montermini de m’avoir signalé cet exemple. Antibari est l’ancien nom de la ville de<br />

Bar qui se trouve sur la côté adriatique, sur le territoire du Monténégro, en face de la ville de Bari. Bari est une<br />

ville italienne, située elle aussi sur le bord de l’Adriatique.


98 Analyse unifiée de la préfixation en anti-<br />

avec l’antitrochanter de l’os coxal. wwwbibli.vet-nantes.fr/theses/2003/guillet3-<br />

13/part1.pdf<br />

Ces exemples permettent de connecter l’interprétation spatiales endocentriques aux<br />

autres interprétations de la préfixation en anti-, en faisant ressortir l’idée d’opposition qui<br />

les caractérise. <strong>Le</strong> fait de se trouver devant ou de faire face constitue en effet une forme<br />

d’opposition induite par l’orientation en miroir des entités (Vandeloise 1986). La configuration<br />

est ainsi associée à l’idée de confrontation que l’on retrouve dans les dérivés comme<br />

antiparlementaire. D’autre part, l’orientation en miroir est aussi associée à une inversion<br />

qui rapproche cette interprétation de celle de dérivés comme antihéros. Cette dérivation<br />

n’est plus aujourd’hui productive ce qui explique qu’elle soit ignorée dans la plupart des<br />

études de la préfixation en anti-.<br />

4.3.3 Interprétations spatiales exocentriques<br />

L’interprétation spatiale exocentrique est à l’inverse de la précédente, à la fois productive<br />

et récente. <strong>Le</strong>s dérivés de notre corpus qui relèvent de cette interprétation appartiennent<br />

aux terminologies des satellites, de la médecine et de la géologie (67). Par exemple,<br />

la face anti-Terre d’un satellite (68) et celle qui se trouve de l’autre côté de la face Terre,<br />

c’est-à-dire de celle qui est tournée vers la Terre. De même, le bord anti-mésentérique (69)<br />

est le bord des anses de l’intestin grêle qui se situe du côté opposé au bord mésentérique,<br />

i.e. au bord sur lequel est fixé le mésentère. L’interprétation est légèrement différente pour<br />

la direction anti-apenninique qui est perpendiculaire à la direction des Appennins.<br />

(67) anti-Soleil ; antisolaire ; antispéculaire ; antitumoral ; antipéristaltique ; antiapenninique<br />

(68) <strong>Le</strong> second est de type "tube", pour les satellites disposant d’une interface sur leur face<br />

anti-Terre. www.air-defense.net/index.php?index=20&num_art=203<br />

(69) L’anse est détubulisée en sectionnant longitudinalement le tube digestif sur le bord<br />

antimésentérique au bistouri électrique. linkinghub.elsevier.com/retrieve/pii/<br />

S0003440104000774<br />

Ces dérivés sont exocentriques. Ce sont des adjectifs décrivant des directions dont les<br />

bases sont des noms qui désignent des entités (Terre, Soleil, tumeur, mésentère, Apennins)<br />

ou des activités (mouvement péristaltique). Tous présentent une idée d’opposition qui légitime<br />

l’utilisation du préfixe anti-. Ces exemples font par ailleurs apparaître une configuration<br />

des orientations qui n’est ni en tandem, ni en miroir. Ainsi, la face Terre et la face<br />

anti-Terre d’un satellite sont situées de part et d’autre de ce dernier et présentent une orientation<br />

que l’on pourrait appeler « en dos-à-dos ». Il en va de même du bord mésentérique<br />

et du bord antimésentérique.<br />

<strong>Le</strong>s exemples présentés dans cette section sont relativement rares. Ils sont absents des<br />

études antérieures de la préfixation en anti-. <strong>Le</strong>ur découverte est directement liée à l’approche<br />

extensive adoptée dans la présente étude.


La sémantique des dérivés en anti- 99<br />

4.3.4 Interprétations logiques endocentriques<br />

L’interprétation logique endocentrique concerne l’une des deux grandes sous-séries de<br />

dérivés en anti-, à savoir celle qui contient des exemples comme en (70) ou anti-Sarkozy<br />

en (71). Ces dérivés sont endocentriques. Un antihéros est une sorte de héros, personnage<br />

important d’un œuvre qui est présenté par un critique ou un commentateur comme n’étant<br />

pas un héros comme il faut. Ce n’est pas un personnage attachant, intelligent, courageux,<br />

beau, etc. Un antihéros est donc une entité qui dispose d’un trait classifiant essentiel de<br />

la catégorie des héros, mais dont les traits caractérisants sont inversés. Il en va de même<br />

dans le cas de anti-Sarkozy (71). <strong>Le</strong> nom propre Sarkozy est converti par antonomase en<br />

un type (voir section 4.3.1). Juppé est présenté comme un Sarkozy, en l’occurrence un<br />

homme politique de la droite moderniste, mais un Sarkozy inversé : il a fait « des études<br />

brillantissimes » ; il a « une formation littéraire d’une rare qualité » ; il est « discret, pudique,<br />

avare de ses sentiments » ; il « n’[étale] jamais sa vie privée » ; etc. 10 . Notons que ces dérivés<br />

ont la même catégorie grammaticale que leur base et le même genre lorsque celle-ci est<br />

nominale.<br />

(70) antihéros, antiroman, antijeu, antipape, antipédagogie, antipsychiatrie<br />

(71) Juppé, c’est l’anti-Sarkozy. pascaldecaillet.blog.tdg.ch/archive/2008/03/10/<br />

juppe-l-anti-sarkozy.html<br />

L’inversion des propriétés caractérisantes est bien identifiée dans les études antérieures,<br />

notamment par Rey (1968), Durand (1982), Fradin (1997a, b) ou Heyna (2008). Ces<br />

propriétés sont identifiés comme des propriétés stéréotypiques dans Fradin (1997a, b) et<br />

comme des propriétés prototypiques dans Heyna (2008) 11 . Par ailleurs, les propriétés inversées<br />

sont spécifiques à chaque locuteur et à chaque instance de chaque dérivé. Heyna<br />

(2008) note ainsi que anti- ne précise pas les propriétés qui sont annulées.<br />

Cette interprétation de anti- est très proche de celle du préfixe contre-, lui aussi endocentrique<br />

(72) 12 . Comme anti-, contre- sert d’inverseur (De Mulder et Amiot 2003) mais<br />

il est plus spécialisé que ce dernier. Contre- inverse l’orientation de la base (orientation argumentative,<br />

axiologique, orientation de la courbure, du don, etc.) là où anti- inverse de<br />

façon globale l’ensemble de ses propriétés caractérisantes.<br />

(72) manifestation > contremanifestation<br />

courant > contrecourant<br />

courbe > contrecourbe<br />

hermine > contrehermine<br />

valeur > contrevaleur<br />

<strong>Le</strong>s dérivés endocentriques en anti- dont l’interprétation est logique peuvent aussi être<br />

utilisés pour indiquer l’absence de la base ou l’incompatibilité de ce que désigne le dérivé<br />

avec cette dernière. Par exemple en (73), antipédagogique exprime que le nom recteur est<br />

10. Ces qualités sont extraites de la description de Pascal Décaillet, auteur de l’article dont (71) est le titre.<br />

11. Heyna (2008) considère que dans la série antihéros, les propriétés prototypiques sont annulées et non<br />

inversées.<br />

12. Ces exemples sont empruntés à De Mulder et Amiot (2003).


100 Analyse unifiée de la préfixation en anti-<br />

dépourvu de toute pédagogie et non pas qu’il relève de l’antipédagogie. Cet emploi de antiest<br />

très proche du préfixe a-. On le retrouve également dans les dérivés de la terminologie<br />

des mathématiques comme en (80). L’exemple (74) présente une nuance sémantique légèrement<br />

différente. L’adjectif antipédagogique y est utilisé pour exprimer que le nom recteur<br />

est contraire à la pédagogie.<br />

(73) Ce qui au passage est anti-pédagogique puisque cela revient à laisser ces individus<br />

dans leur démarche peu respectueuses des dispositions d’autrui. amitie-entre-lespeuples.org/spip.php?article673<br />

(74) <strong>Le</strong> ministre de l’Éducation nationale, dénonce le caractère antipédagogique<br />

de l’offre de devoirs proposée par le site « Faismesdevoirs.com »<br />

www.education.gouv.fr/cid23983/xavier-darcos-denonce-la-mise-en-placed-un-marche-du-moindre-effort.html<br />

L’emploi de antihéroïque en (75) présente la même interprétation. Ce dérivé est en effet<br />

utilisé pour évoquer les personnages qui ne sont pas les héros dans les histoires et notamment<br />

les méchants et les traîtres auxquels s’opposent ces derniers.<br />

(75) Je tenais ce discours l’autre jour à un ami, que la moustache est un attribut profondément<br />

anti-héroïque, dans la mesure où les héros moustachus sont sous-représentés<br />

dans les oeuvres de fictions; en outre, les moustachus sont sur-représentés dans les rôles<br />

de traîtres. finpoil.wordpress.com/<strong>2009</strong>/03/16/la-moustache-est-anti-heroique/<br />

Il en va de même pour un adjectif comme anti-obèse (76) qui qualifie des rats qui n’engraissent<br />

pas lorsqu’ils mangent trop. C’est aussi un contre-exemple supplémentaire à l’hypothèse<br />

que les dérivés en anti- ne peuvent pas avoir comme bases des adjectifs simples<br />

(Dell 1970, Zribi-Hertz 1973, Durand 1982).<br />

(76) Régulation du stockage et de l’oxydation des acides gras dans un modèle<br />

de rat anti-obèse : implications du muscle et du complexe adipocyte-foie.<br />

cjc.univ-lyon2.fr/158-Dossiers-acceptes-dans-cadre-20e-Appel-d-Offres-<br />

Centre-Jacques-Cartier.html<br />

L’interprétation logique endocentrique impose peu de contraintes sur les bases des dérivés<br />

en anti-. Ces dernières peuvent être des noms communs (antiroman), des noms propres<br />

(anti-Sarkozy), des syntagmes nominaux sans déterminant comme anti-maison de retraite<br />

(27) ou comme le premier exemple de (32), des pronoms suivis d’une complétive comme le<br />

deuxième exemple de (32). J’ai également trouvé un exemple remarquable (77) dans lequel<br />

le préfixe n’est pas placé devant le radical mais à l’intérieur de ce dernier. <strong>Le</strong> dérivé journal<br />

anti-intime est clairement formé sur l’expression journal intime. Ce mode de marquage<br />

se retrouve dans les constructions du type pêcheurs sous la glace étudiés en détail dans<br />

Kerleroux (2007). Dans pêcheurs sous la glace, ce n’est pas le verbe pêcher qui est suffixé,<br />

mais le syntagme nominal pêche sous la glace : les pêcheurs sous la glace sont les personnes<br />

qui pratiquent la pêche sous la glace. L’exemple (77) peut également être rapproché d’un<br />

adjectif comme peinable de mort construit sur peine de mort (<strong>Hathout</strong> et al. 2003) ou de<br />

noms comme dépendeur d’andouilles ou donneur de leçons respectivement construits sur<br />

dépendre les andouilles et donner des leçons (Roché en préparation).


La sémantique des dérivés en anti- 101<br />

(77) Non, ceci ne sera pas le journal anti intime de ma vie trépidante et passionante.<br />

mistermisfit.canalblog.com/archives/2006/08/06/2418577.html<br />

L’inversion des propriétés caractérisantes peut également concerner de façon exceptionnelle<br />

des activités comme dans antimordre (78) ou antirire (79). On peut noter dans ces<br />

deux exemples la présence d’une explication du sens de ces dérivés.<br />

(78) J’ajoute quand même que j’aime aussi "anti-mordre".<br />

On prend un caramel dur, on le croque vivement jusqu’à avoir une poussiere de caramel<br />

dur en bouche, puis cette poussiere, si vous avez de la salive va fondre puis se<br />

reconstituer au fond des molaires. <strong>Le</strong> plus gros du travail est fait, il suffit ensuite de<br />

mordre tres fort (ah on y revient !) et on attend en mordant. Apres 1 min, on essaie<br />

d’ouvrir la bouche et là on a la sensation de soulever ses dents, de les déchausser :<br />

c’est l’anti-morsure ! condylure.mesdiscussions.net/condylure/DTC/Trucsserieux/<br />

aimez-mordre-dents-sujet_2663_1.htm<br />

(79) AH AH AH. Vous voulez antirire (le contraire de rire) ? Alors lisez ces... enfin de ces<br />

machins là, en-dessous. tapecenomsuperlong.free.fr/blagues.html<br />

L’utilisation de radicaux verbaux est probablement une solution de dernier recours. Dans<br />

l’exemple (78), le locuteur préfère la forme marquée antimordre à une solution plus neutre<br />

comme antimorsure car cette dernière serait ambiguë : on ne saurait s’il veut dire qu’il aime<br />

antimordre ou être antimordu.<br />

Relèvent également de l’interprétation logique endocentrique, les termes de mathématique<br />

comme (80) et les termes de la physique des particules qui nomment les particules qui<br />

appartiennent au monde de l’antimatière (81) et leur propriétés (82).<br />

(80) anticommutatif ; antiréflexif ; antisymétrique ; antiparallèle ; antichaîne<br />

(81) antimatière ; antiparticule ; antiunivers ; antiprotons ; antiquark ; antigluon<br />

(82) antirouge ; antivert ; antibleu ; antibeau ; anticharmé ; antiétrange<br />

Chaque particule de matière se trouve en correspondance avec une antiparticule. Cette<br />

correspondance est étendue à leurs propriétés : à chaque propriété de particules matérielles<br />

correspond une antipropriété des antiparticules correspondantes.<br />

4.3.5 Interprétations adversatives exocentriques<br />

<strong>Le</strong>s dérivés en anti- dont l’interprétation est adversative exocentrique sont à la fois<br />

les plus nombreux et les plus centraux. Ils présentent en outre une grande homogénéité du<br />

point de vue sémantique : (i) leurs bases sont interprétées soit comme des nuisances (83) soit<br />

comme des causes de nuisances (84) ; (ii) ces dérivés décrivent tous la qualité de s’opposer<br />

à ces nuisances. C’est en ce sens qu’ils sont adversatifs. Ils sont aussi exocentriques. Par<br />

exemple, un antivol permet de se protéger contre le vol et ne peut pas être considéré comme<br />

une forme de vol. Un antilimace empêche les limaces de consommer les plantations et ne<br />

peut être conçu comme une sorte de limace, etc. Cette interprétation est confirmée par le<br />

fait que les dérivés de cette sous-série sont des adjectifs alors que leur bases peuvent être<br />

nominales (panne), verbales (dormir) ou adjectivales (triste).


102 Analyse unifiée de la préfixation en anti-<br />

(83) antivol ; antipanne ; antinoyade ; anti-marée noire ; antilèpre ; antidérapant ; anticoupant<br />

; antistérile ; antitriste<br />

(84) antiparlementaire ; antilimace ; antipublicité ; anti-Bush ; anti-Sarkozy ; anti-<br />

Belgique ; antidormir ; antisec<br />

Pour les dérivés dont les bases désignent des nuisances, le sens des premiers est directement<br />

lié à celui des secondes. À l’inverse, pour des dérivés comme en (84), l’identification<br />

de la nuisance met en jeu un mécanisme métonymique : la base fonctionne dans ce cas<br />

comme un attracteur et les nuisances sont l’un de ses satellites (voir section 4.3.1). Deux cas<br />

peuvent être distingués : les nuisances peuvent soit être identifiables soit ne pas l’être. <strong>Le</strong><br />

dérivé antilimace relève du premier cas. <strong>Le</strong> satellite visé est le fait que les limaces mangent<br />

les plantations. La base est dans ce cas l’agent d’un événement qui est considéré comme<br />

une nuisance. Mais il n’est pas toujours possible d’identifier précisément la nuisance visée<br />

et cette dernière peut même ne pas l’être par le locuteur qui utilise le mot. Par exemple<br />

pour antipublicité les sources de nuisances possibles sont nombreuses : interférence avec<br />

les contenus éditoriaux, pollution visuelle, encombrement des boîtes aux lettres, gaspillage<br />

de papier, etc. Cependant, leur identification précise n’est pas essentielle à la bonne interprétation<br />

du mot. Il suffit seulement d’admettre que la publicité est une source de nuisances<br />

ou qu’elle peut être considérée comme telle.<br />

L’interprétation de la base comme une nuisance ou une source de nuisances est l’une<br />

des contributions de cette étude. Elle affine celle de Heyna (2008) qui considère elle aussi<br />

que les bases des dérivés de la sous-série antilimace sont interprétées métonymiquement.<br />

Pour Heyna, les bases de ces dérivés évoquent « confusément » l’un quelconque de leurs<br />

satellites et référent « de façon nébuleuse ». Je propose à l’inverse que anti- impose une restriction<br />

sur les satellites associés à l’attracteur et que l’accès soit limité aux seules nuisances.<br />

On peut également comparer la présente étude à celle de Fradin (1997a) qui s’intéresse aux<br />

adjectifs dont le radical est un participe présent comme antidérapant. Fradin propose une<br />

analyse dans laquelle la fonction sémantique de anti- est d’introduire un causateur destiné<br />

à contrarier l’évenance exprimée par le lexème de base. Cette idée générale est proche<br />

de la description proposée ici. La principale différence entre cette analyse et la mienne est<br />

que j’identifie une nuisance et un agent intentionnel là où Fradin (1997a) introduit une<br />

évenance. Son analyse ne peut, de ce fait, pas être généralisée à des dérivés comme des sentiments<br />

anti-arabes ou une opinion anti-Sarkozy pour lesquels il n’y a aucune évenance<br />

particulière. Dans le premier cas, une personne anti-arabe considère que les arabes sont<br />

des nuisances, de par leur simple présence ou leur simple existence. Dans le second, c’est<br />

la politique, les idées, les propos, le comportement de Nicolas Sarkozy qui sont considérés<br />

comme des nuisances, sans qu’il n’existe d’évenance particulière qui leur soit associée.<br />

L’analyse de Fradin ne permet pas non plus de rendre compte des dérivés qui désignent une<br />

protection passive comme antifroid (85). Des gants antifroid n’agissent pas contre le froid.<br />

Notons cependant que le causateur pourrait être dans ce cas l’agent intentionnel qui se sert<br />

des gants.<br />

(85) mikel, ça a l’air super tes gants antifroid, ça me tente bien, hop je vais sur le site!<br />

www.lerepairedesmotards.com/forum/read.php?f=3&i=284680&t=284680


La sémantique des dérivés en anti- 103<br />

Une analyse en termes de nuisance est ainsi à la fois plus simple et plus efficace. Elle<br />

rend compte d’autre part de façon triviale des connotations axiologiques dépréciatives des<br />

dérivés en anti- comme antiparlementaire et antilimace (Rey 1968, Zribi-Hertz 1973,<br />

Heyna 2008). Notons que dans certains exemples (86), ces valeurs peuvent être explicites.<br />

Cette valeur se retrouve aussi dans la préfixation en contre- (De Mulder et Amiot 2003,<br />

Dal 2003b).<br />

(86) Moi j’ai mon amoureuse, rené char, du vin blanc, bcp de haine et de rage que<br />

je mets au service de mon temps militant anti ces 2 zouaves abjectes. honte à la<br />

france, honte à eux, honte à ceux qui les ont élus.j’ai honte. www.libe.com/php/pages/<br />

pageReactionsList.php?rubId=14&docId=290109&s2=&pp=&next=30<br />

<strong>Le</strong>s emplois adversatifs exocentriques concernent aussi un groupe relativement homogène<br />

de dérivés dont les radicaux sont des adjectifs en -able. Ces dérivés sont bien attestés<br />

comme le montre l’importante liste présentée en (87). Ils sont sémantiquement proches des<br />

participes passés, ce qui explique leur fréquence réduite (voir section 4.2.1).<br />

(87) anti-arrachable ; antiblocable ; antibrisable ; anticoagulable ; anticombustible 13 ; anticonsommable<br />

; anticopiable ; anticrevable ; anticrochetable ; antidéchirable ; antidécrochable<br />

; antidéformable ; antidégondable ; antidégradable ; antidéjantable ; antidéjaugeable<br />

; anti-démontable ; anti-déprimable ; antidévissable ; antidiluable ; antiéjectable<br />

; antifermentiscible ; antifroissable ; anti-inflammable ; anti-irritable ; antimanipulable<br />

; anti-orientable ; anti-oxydable ; antiperçable ; antiperméable ; antipiratable<br />

(23) ; antiprévisible ; antiputréscible ; antirenversable ; antispammable ; antivibrable<br />

(124h)<br />

Ces dérivés (87) servent à exprimer que leur nom recteur est protégé contre une nuisance<br />

donnée comme l’arrachage, le blocage, la coagulation, la consommation, la copie, etc. Ce<br />

sens se distingue nettement de celui des dérivés de la forme in-Xable qui expriment que<br />

leurs noms recteurs ne sont pas Xables et sont eux endocentriques.<br />

4.3.6 Interprétations adversatives endocentriques<br />

<strong>Le</strong>s dérivés adversatifs en anti- peuvent également avoir des emplois endocentriques.<br />

Ces emplois n’ont à ma connaissance jamais encore été décrits. <strong>Le</strong> premier s’observe avec<br />

des dérivés comme (88) lorsqu’ils sont utilisés comme des synonymes de leurs noms bases.<br />

L’antidémêlant est un produit qui s’oppose à l’emmêlement des cheveux, l’antidésherbant<br />

à la prolifération des mauvaises herbes, l’antidésinfectant aux infections, etc. L’interprétation<br />

de ces exemples est endocentrique comme le montrent les exemples (89 ; 90) et (91 ;<br />

92) : la synonymie entre le dérivé et sa base correspond à un niveau maximal d’endocentricité.<br />

Dans tous ces exemples, l’ajout du préfixe anti- sert à renforcer l’idée que le produit<br />

protège contre une nuisance, exactement comme pour les dérivés dont l’interprétation est<br />

exocentrique.<br />

(88) antidécongestionnant, antidémêlant, antidésherbant, antidéperlant, antidésinfectant,<br />

antidésodorisant<br />

13. Rey (1968) signale la présence de anticombustible et antifermentescible dans l’édition de 1877 du Littré.


104 Analyse unifiée de la préfixation en anti-<br />

(89) Cette casquette souple et légère, en microfibres anti-déperlantes, protège<br />

aussi bien du soleil que de la pluie sous les climats les plus extrêmes.<br />

www.randosbalades.fr/article/2007/12/12/20071212-Nouveautes-Chantonssous-la-pluie.php?PHPSESSID=03a920a3eb88c8ab<br />

(90) C’est pourquoi il ne faut jamais laver les vestes et surtout pas à la machine<br />

ou au pressing mais l’usure aidant les mcrofibres déperlantes disparaissent.<br />

club.discount-marine.com/forum/viewtopic.php?p=12347&sid=<br />

5d65620ac9af8d70218a761b87ebd7bf<br />

(91) les vignes avec tous leurs produits nocifs, ben j’ose pas imaginer ce que je dois avoir<br />

comme dose d’anti-désherbant dans le corps ! www.vulgaris-medical.com/forum/<br />

s11917-guaifenesin-fibromyalgie-medicament-miracle-svp.html<br />

(92) moi aussi j’ai de longs cheveux et je n’utilise jamais de sèche-cheveux, trop la flemme,<br />

par contre je suis obligée de mettre un anti démêlant sinon c’est la galère à les coiffer,<br />

j’en ai pour des heures www.forumfr.com/sujet90410-post10-avons-nous-ici-desaccros-du-seche-cheveux.html<br />

4.3.7 Unité de famille<br />

La présentation séparée des cinq interprétations possibles des dérivés en anti- ne doit<br />

pas cacher l’unité de cette préfixation. Cette unité globale est d’une nature familiale plutôt<br />

que hiérarchique. <strong>Le</strong>s différentes interprétations des dérivés en anti- ne s’organisent pas en<br />

une hiérarchie ou une arborescence, avec un sens abstrait général permettant de dériver tous<br />

les autres, mais comme un groupe de sous-sens connexes permettant de passer de proche<br />

en proche de l’un à l’autre, par ressemblance de famille.<br />

L’existence d’un seul préfixe anti- ou de plusieurs est discutée dans différentes études.<br />

Par exemple, Corbin (1980) et Durand (1982) considèrent que les sous-séries antilimace<br />

et antihéros relèvent de deux préfixes différents. De même, Corbin (1987) propose quatre<br />

règles de construction de mots distinctes dont les dérivés se superposent partiellement. À<br />

l’inverse, Rey (1968), Zribi-Hertz (1973) et Heyna (2008) défendent l’idée que tous les<br />

dérivés en anti- sont formés par le même préfixe. Pour Heyna (2008), la différence entre<br />

les dérivés des deux sous-séries provient de la nature référentielle de leurs bases et non du<br />

préfixe lui-même. <strong>Le</strong>s arguments avancés par Zribi-Hertz (1973) sont l’unité phonologique<br />

et sémantique du préfixe qui dans tous les cas réfère à une opposition malgré ses deux<br />

valeurs possibles. Elle note également que « les deux valeurs en question ne se distinguent<br />

pas toujours de manière très tranchée, et peuvent même se mêler dans l’interprétation ».<br />

Je me rallie à la position de Zribi-Hertz. Ses arguments peuvent être complétés par<br />

quelques autres. On peut ainsi noter que les dérivés dont l’interprétation est exocentrique<br />

sont tous des adjectifs. Un deuxième argument est la proximité des interprétations endocentriques<br />

et exocentriques au sein de chaque ensemble d’emplois (spatiaux, logiques et<br />

adversatifs) :<br />

(i) On observe ainsi que le sens des dérivés adversatifs exocentriques et endocentriques<br />

comporte la même valeur axiologique dépréciative et qu’à l’inverse, les dérivés dont


La sémantique des dérivés en anti- 105<br />

l’interprétation est spatiale ou logique en sont dépourvus, et cela indépendamment<br />

du fait qu’ils soient endocentriques ou exocentriques.<br />

(ii) <strong>Le</strong>s dérivés endocentriques et exocentriques au sein de chaque ensemble d’emplois<br />

partagent les mêmes types de bases. <strong>Le</strong>s bases des dérivés dont l’interprétation est<br />

spatiale évoquent la position d’entités matérielles, celles des dérivés dont l’interprétation<br />

est adversative évoquent des nuisances ou des sources de nuisance. <strong>Le</strong>s dérivés<br />

dont l’interprétation est logique partagent même une partie de leurs radicaux (pédagogie,<br />

héros).<br />

(iii) Un troisième argument est l’existence de dérivés polysémiques dont l’interprétation<br />

peut être soit logique, soit adversative comme anti-Sarkozy (71 ; 93). Il existe ainsi<br />

une proximité, au niveau des positions lexicales qui correspondent à ces mots. La<br />

proximité lexicale est renforcée par l’existence de dérivés susceptibles des deux interprétations<br />

en même temps comme antipape 14 (Rey 1968), antipsychiatrie 15 (Durand<br />

1982) ou antipédagogie. Par exemple, un antipape est un pape dont les propriétés<br />

caractérisantes sont inversées puisqu’il n’appartient pas à la papauté catholique romaine.<br />

Mais c’est aussi une personne qui considère cette papauté comme une nuisance,<br />

qui s’oppose à elle et en conteste la légitimité. De même, l’antipédagogie est<br />

une pédagogie basée sur des principes différents de ceux de la pédagogie traditionnelle.<br />

Elle considère aussi cette dernière comme une nuisance, la combat et cherche à<br />

s’imposer à sa place.<br />

(93) La mobilisation anti-Sarkozy continue sur la Toile. www.lemonde.fr/cgi-bin/ACHATS/<br />

acheter.cgi?offre=ARCHIVES&type_item=ART_ARCH_30J&objet_id=987148&clef=<br />

ARC-TRK-NC_01<br />

L’unité de la préfixation en anti- se manifeste aussi dans la possibilité de rattacher ses<br />

principaux emplois au sens originel du préfixe grec anti- que l’on peut traduire par ‘en<br />

face’ :<br />

1. On peut tout d’abord être en face dans le face-à-face. Ce sens correspond à l’affrontement,<br />

à l’opposition d’une force agoniste et d’une force antagoniste que l’on trouve<br />

dans les dérivés dont l’interprétation est adversative comme antiparlementaire ou<br />

antilimace.<br />

2. <strong>Le</strong> face-à-face peut aussi être spatial comme dans le cas de deux maisons qui se font<br />

face, des deux côtés de la rue. Ce sens se retrouve dans les dérivés à sens positionnel<br />

comme Anti-Liban qui fait face au Mont Liban, symétriquement par rapport à la<br />

plaine de la Békaa.<br />

3. On peut être en face d’un miroir. On est alors en face d’une image qui est identique<br />

mais inversée. Cette inversion peut être rapprochée de celle que l’on observe dans le<br />

sens des dérivés dont l’interprétation est logique endocentrique comme antihéros.<br />

14. Je rappelle qu’un antipape est une personne qui a exercé la fonction et porté le titre de pape mais dont<br />

l’avènement à cette charge n’est pas ou plus reconnu aujourd’hui comme régulier et valable par l’Église catholique<br />

romaine (Wikipédia). Antipape figure dans la nomenclature du TLF.<br />

15. L’antipsychiatrie est une théorie psychiatrique qui tend à interpréter la maladie mentale dans une perspective<br />

sociologique (d’après Wikipédia). Antipsychiatrie est une entrée secondaire dans le TLF.


106 Analyse unifiée de la préfixation en anti-<br />

4. Ce qui est en face se trouve devant. Cette relation spatiale est exploitée par les dérivés<br />

anciens comme antichambre 16 .<br />

Il ne s’agit naturellement pas ici de reconstituer l’histoire du préfixe anti-, mais seulement<br />

de montrer que ‘en face’ peut aussi servir de sens de base à anti- et qu’il couvre une bonne<br />

partie de la diversité de ses emplois.<br />

Il se dégage ainsi une unité du préfixe anti- similaire à celle des dérivations en -isme et<br />

en -iste défendue dans Roché (2010a) et à celle de la préposition contre étudiée par De Mulder<br />

et Amiot (2003). De Mulder et Amiot décrivent notamment le sens de cette préposition<br />

comme un réseau sémantique qui comporte un sens abstrait qui correspond à l’idée d’inversion<br />

et quatre sens contextuels.<br />

4.4 Caractérisation catégorielle<br />

La question catégorielle est au centre de nombreuses études de la préfixation en antidu<br />

fait des difficultés d’analyse posées par les constructions parasynthétiques comme antiparlementaire.<br />

L’importance accordée à cette question est une conséquence directe de<br />

la conception traditionnelle de la préfixation comme homocatégorielle par nature. Par<br />

exemple, in- ne formerait que des adjectifs dont les bases sont des adjectifs et re- que des<br />

verbes dont les bases sont des verbes. C’est la position adoptée entre autres par Rey (1968),<br />

Dell (1970), Zribi-Hertz (1973), Voir (1982). Ainsi, anti- ne pourrait pas former seul antiparlementaire<br />

à partir de parlement ; cette formation serait le résultat d’une opération qui<br />

comporte simultanément une préfixation en anti- et une suffixation en -aire. Cette analyse<br />

a été combattue vigoureusement par Corbin (1980, 1987, 2001b) qui défend l’idée que<br />

la finale -aire est un intégrateur paradigmatique et non un affixe dérivationnel. Une autre<br />

solution permettant de contourner cette difficulté est proposée, notamment par Durand<br />

(1982) et Fradin (1997b). Elle repose sur l’observation que les noms et leurs adjectifs de<br />

relation sont quasi identiques d’un point de vue sémantique (Roché <strong>2009</strong>). Cette identité<br />

permet d’analyser les dérivés dont les radicaux sont des adjectifs comme étant simplement<br />

des lexèmes construits sur ces adjectifs. Ce débat semble aujourd’hui dépassé et il est communément<br />

admis que les propriétés catégorielles des affixes sont d’abord définies par leurs<br />

propriétés sémantiques (Corbin 2001b, <strong>Hathout</strong> et al. 2003, Amiot 2008).<br />

La description sémantique élaborée en section 4.3 distingue d’un côté des dérivés endocentriques<br />

et par suite homocatégoriels et de l’autre des dérivés exocentriques qui peuvent<br />

être transcatégoriels. Dans le premier groupe on trouve des couples base : dérivé 17 comme<br />

en (94) dont les deux membres sont de la même catégorie. <strong>Le</strong>s trois catégories majeures,<br />

nom, verbe et adjectif, sont représentées. Dans le second groupe (95), on trouve aussi des<br />

bases qui appartiennent aux trois catégories majeures.<br />

(94) Atlas : anti-Atlas, héros : antihéros, obèse : anti-obèse, réfléxif : antiréflexif,<br />

mordre : antimordre, désherbant : antidésherbant<br />

16. Cette relation pourrait être étendue à la dimension temporelle pour rendre compte du sens du verbe<br />

antidater.<br />

17. Je rappelle que les instances des relations lexicales sont notés x : y.


Radicaux d’emprunt 107<br />

(95) mésentère : antimésentérique, héros : antihéroïque, parlement : antiparlementaire,<br />

triste : antitriste, stérile : antistérile, dormir : antidormir<br />

À l’exception de quelques noms de la terminologie des mathématiques, les dérivés dont<br />

l’interprétation est exocentrique sont à l’origine des adjectifs, y compris ceux qui sont employés<br />

nominalement. Ces noms permettent en effet de nommer des entités d’après leurs<br />

propriétés. Par exemple, un antilimace est produit désigné d’après sa qualité qui est de protéger<br />

des limaces. Plusieurs arguments en faveur de cette analyse peuvent être avancés :<br />

1. <strong>Le</strong> genre des noms comme antirides ou antilimace est toujours le masculin (excepté<br />

lorsqu’ils désignent une femme, comme dans une anti-Sarkozy, ou un animal femelle),<br />

même lorsque la base est un nom féminin ou lorsque le nom désigne une<br />

réalité que l’on peut décrire par un nom féminin. On dit par exemple un antirides<br />

même quand il s’agit d’une crème.<br />

2. <strong>Le</strong>s marques adjectivales sont présentes lorsque les mots sont utilisés comme des<br />

noms. On dit ainsi Jean est un antiparlementaire et non Jean est un antiparlement.<br />

Or le recours au radical adjectival parlementaire serait inutile si ce nom était formé<br />

directement par préfixation en anti- et non par nominalisation de l’adjectif antiparlementaire.<br />

3. Comme le notent Zribi-Hertz (1973) et Durand (1982), les dérivés de cette sous-série<br />

qui sont utilisés comme des noms peuvent être paraphrasés au moyen d’un syntagme<br />

nominal dans lequel ils fonctionnent comme des adjectifs. Par exemple, un antirouille<br />

peut se paraphraser par un produit antirouille.<br />

On ne peut donc pas considérer comme le fait Heyna (2008) que les dérivés de la sous-série<br />

antilimace appartiennent à une catégorie grammaticale qui regroupe les substantifs et les<br />

adjectifs.<br />

On peut aussi noter que les dérivés adjectivaux en anti- s’accordent avec leur nom recteur<br />

selon les schémas flexionnels propres à cette catégorie, et ceci même lorsqu’il n’existe<br />

pas de correspondant féminin à leurs radicaux nominaux. Fradin (1997b:336) et <strong>Le</strong>vkovych<br />

(2004:60) relèvent par exemple l’accord de l’adjectif dans le syntagme la lutte antisous-marine<br />

(96). Cette situation est tout à fait normale : anti-sous-marin est un adjectif à<br />

part entière et se fléchit à ce titre de la même manière que n’importe quel autre mot de sa<br />

catégorie.<br />

(96) <strong>Le</strong>s premiers navires chargés de la lutte anti-sous-marine emportent deux charges, qui<br />

sont larguées par la poupe. fr.wikipedia.org/wiki/Grenade_anti-sous-marine<br />

4.5 Radicaux d’emprunt<br />

<strong>Le</strong> modèle proposé dans le chapitre 2 rend compte très simplement des principaux phénomènes<br />

qui apparaissent dans la dérivation en anti-. Ses capacités sont confirmées par<br />

l’analyse des données présentées dans <strong>Le</strong>vkovych (2004) et Plénat et al. (2004a). Je rappelle<br />

que ces données ont été obtenues par une collecte extensive de dérivés en anti- réalisée notamment<br />

au moyen de Webaffix (<strong>Hathout</strong> et Tanguy 2006) et par une exploration manuelle<br />

du Web.


108 Analyse unifiée de la préfixation en anti-<br />

<strong>Le</strong> préfixe anti- ayant une grande autonomie formelle (voir section 2.10), les contraintes<br />

des sections 2.9 et 2.11, exceptée la contrainte de transparence des séries dérivationnelles<br />

(C2.7, page 51), n’affectent que la sélection des radicaux des dérivés construits par cette<br />

préfixation. <strong>Le</strong>s données confirment que ces radicaux sont empruntés à des adjectifs déjà<br />

présents dans le lexique (contrainte de recyclage (C2.3), page 47) et morphologiquement<br />

proches de la base (contrainte de transparence de la base (C2.6), page 50). Par suite, ces<br />

adjectifs appartiennent aux familles lexicales de ces dérivés et de leurs bases. <strong>Le</strong>s données<br />

montrent aussi que tous les adjectifs de relation peuvent être utilisés et illustrent la variété<br />

des stratégies permettant de satisfaire au mieux le système de contraintes.<br />

4.5.1 Parasynthèse<br />

L’une des questions incontournables que toute étude la préfixation en anti- se doit de<br />

traiter est celle des dérivés dont le radical est une forme adjectivale comme anticancéreux ou<br />

antiparlementaire. Clairement, dans un médicament anticancéreux l’adjectif peut être glosé<br />

par ‘qui s’attaque au cancer’ mais non par ‘qui s’attaque aux cancéreux’ ; de même, dans<br />

une ligue antiparlementaire, le dérivé signifie ‘opposée au parlement’ et non ‘qui combat<br />

les parlementaires’. L’analyse de ces dérivés présente donc une difficulté : leurs sens sont<br />

construits sur ceux des lexèmes cancer et parlement alors que leurs radicaux sont cancéreux<br />

et parlementaire. Cet écart est en partie à l’origine de l’intérêt que les morphologues portent<br />

à la préfixation en anti-. En réalité, ces constructions ne sont en rien particulières et ne<br />

sont intéressantes que parce qu’elles mettent en défaut les conceptions trop simplistes de la<br />

morphologie dérivationnelle, et parce qu’elles permettent d’observer les effets de quelquesunes<br />

des contraintes morpholexicales qui pèsent sur la formation des mots.<br />

Ces constructions sont dites parasynthétiques pour des raisons historiques : elles ont<br />

été initialement analysées comme des mots construits par parasynthèse. L’analyse traditionnelle,<br />

formulée dans un cadre morphématique, consiste à ajouter au dispositif de la<br />

morphologie dérivationnelle un procédé supplémentaire destiné spécifiquement au traitement<br />

de ces constructions. Par exemple, antigrippal est analysé comme un mot construit en<br />

ajoutant en même temps à grippe le préfixe anti- et le suffixe -al. Ainsi, en plus de la dérivation<br />

affixale (préfixation et suffixation), de la conversion et de la composition, il existerait<br />

un procédé nommé parasynthèse qui réalise simultanément une préfixation et une suffixation.<br />

Je ne reviendrai pas ici sur les motivations de cette proposition et ni sur les problèmes<br />

qu’elle engendre. Ils sont discutés en détail par Corbin (1980). L’analyse parasynthétique<br />

est essentiellement utilisée dans les travaux les plus anciens sur la préfixation en anti-, notamment<br />

Rey (1968), Dell (1970), Zribi-Hertz (1973), Voir (1982). Dell (1970) propose<br />

par ailleurs de compléter le procédé parasynthétique par un principe de copie qui soumet<br />

la sélection des suffixes à la pression du lexique existant. Ce principe de nature analogique<br />

rend compte de carrés comme (97a) ou (97b). Il est également invoqué pour les dérivés en<br />

anti- comme en (98) même si dans ce cas l’analogie est seulement formelle, et trompeuse.<br />

(97) a. approuver : approbation :: désapprouver : désapprobation<br />

b. fidèle : fidélité :: infidèle : infidélité<br />

(98) parlement : parlementaire :: anti-parlement : anti-parlementaire


Radicaux d’emprunt 109<br />

Corbin (1980, 1987) rejette l’analyse parasynthétique et réfute l’existence d’un tel procédé.<br />

Elle affirme que les constructions traditionnellement considérées comme parasynthétiques<br />

sont en réalité seulement préfixées, et que le phénomène observé découle d’un ajustement<br />

formel postérieur à la préfixation, induit par le principe de copie. Ce principe serait<br />

à l’origine de la finale adjectivale des dérivés comme anti-parlementaire (Fradin 1996). Corbin<br />

(1987) propose en outre une version étendue du principe de copie permettant de rendre<br />

compte de cas comme (99) dans lesquels l’adjectif de relation ovulatoire n’est pas formé sur<br />

le nom ovulation mais sur un autre mot, en l’occurrence le verbe ovuler. Dans des travaux<br />

ultérieurs, Corbin (2001a, b) développe une analyse proche de celle que je propose ici, dans<br />

laquelle le principe de copie est remplacé par une contrainte de conformité catégorielle<br />

(voir section 2.11.3).<br />

(99) ovulation : ovulatoire :: anti-ovulation : anti-ovulatoire<br />

Je signale qu’il existe aussi entre ces deux extrêmes théoriques (la tradition d’un côté<br />

et l’analyse corbinienne de l’autre), une troisième voie proposée par Roché (<strong>2009</strong>) dans<br />

laquelle une dérivation se compose d’un ensemble d’opérations sémantique, catégorielle et<br />

formelle. Chaque opération peut donner lieu à un marquage visible (overt) ou ne pas avoir<br />

de réalisation phonologique (covert). Par exemple, dératiser est formé par une dérivation<br />

dans laquelle l’opération sémantique est réalisée par le préfixe dé- et l’opération catégorielle<br />

par le suffixe verbal -iser. À l’inverse, dans déverminer, l’opération catégorielle n’a pas de<br />

réalisation.<br />

La position que j’adopte dans la présente étude est que les formes des dérivés en anti-,<br />

traditionnellement analysées comme parasynthétiques, sont en réalité construites en empruntant<br />

leurs radicaux à d’autres mots du lexique.<br />

4.5.2 Radicaux suffixés<br />

<strong>Le</strong> premier point mis en évidence par les données de notre corpus est qu’il n’existe<br />

aucune restriction sur les finales des adjectifs dont les formes sont utilisées comme radicaux.<br />

Tout adjectif de relation dérivé d’un nom peut servir de radical à un dérivé en anti- dont la<br />

base est ce nom. <strong>Le</strong>s contraintes de transparence de la base et de recyclage rendent compte<br />

de cette régularité. La table 4.3 reprend l’inventaire proposé par <strong>Le</strong>vkovych (2004) et Plénat<br />

et al. (2004a).<br />

On pourrait ajouter à cette liste un dérivé comme antipiratable construit sur piratage<br />

(voir (23), page 47), qui fait apparaître que la classe des adjectifs dont les formes sont utilisées<br />

comme radicaux n’est pas limitée aux seuls adjectifs de relation. Tout adjectif suffisamment<br />

saillant et morphologiquement proche de la base peut être sollicité, y compris<br />

un adjectif en -able. En d’autres termes, on utilise généralement une forme de l’adjectif<br />

relationnel car c’est celui qui est le plus proche, mais dans le cas où le lexique mémorisé<br />

n’en contient pas de convenable, la forme d’un autre adjectif proche et suffisamment bien<br />

attesté peut servir de radical de secours. <strong>Le</strong>s contraintes de transparence rendent compte<br />

très simplement de cette possibilité. Elles sont ainsi nettement supérieures à une règle qui<br />

stipulerait que les radicaux des dérivés en anti- sont sélectionnés parmi les formes des adjectifs<br />

de relation de leurs bases. <strong>Le</strong> modèle théorique rend compte également du fait que


110 Analyse unifiée de la préfixation en anti-<br />

finale base radical nominal radical adjectival 2 e base<br />

-ain Rome anti-Rome antiromain •<br />

-aire particule antiparticule antiparticulaire<br />

-ais Finlande anti-Finlande antifinlandais •<br />

-al famille antifamille antifamiliale<br />

-an Perse anti-Perse antipersan •<br />

-ant givre antigivre antigivrant<br />

-aque insomnie anti-insomnie anti-insomniaque •<br />

-ard la Cagoule anti-Cagoule anticagoulard •<br />

-éen Europe anti-Europe anti-européen •<br />

-el carence anticarence anticarenciel<br />

-esque amiante anti-amiante anti-amiantesque<br />

-estre terre antiterre antiterrestre<br />

-eux poussière antipoussière antipoussiéreux<br />

-ien Napoléon anti-Napoléon antinapoléonien •<br />

-ier émeute anti-émeute anti-émeutier •<br />

-if gel antigel antigélif<br />

-ile fièvre antifièvre antifébrile<br />

-in Bysance anti-Bysance antibysantin •<br />

-ique hémorragie antihémorragie antihémorragique<br />

-iste Bonaparte anti-Bonaparte antibonapartiste •<br />

-oire aléa anti-aléa anti-aléatoire<br />

-on Bourgogne anti-Bourgogne antibourguignon •<br />

-ois Chine anti-Chine antichinois •<br />

-ote patrie antipatrie antipatriote •<br />

Table 4.3 – Inventaire partiel des finales des dérivés en anti- dont les radicaux sont des<br />

adjectifs de relation. La présence d’un point dans la dernière colonne indique que le radical<br />

adjectival peut aussi s’utiliser comme un nom. Il exprime, dans ce cas, une deuxième base<br />

possible pour le dérivé.<br />

les dérivés dont le radical est une forme adjectivale ont un sens strictement identique à ceux<br />

qui ont un radical nominal. Ces formes sont simplement associées à une seule et même<br />

position lexicale.<br />

4.5.3 Allomorphie<br />

La contrainte de recyclage intervient aussi dans l’analyse des dérivés dont les radicaux<br />

présentent des allomorphies 18 comme en (100a). Ces allomorphies sont identiques à celles<br />

18. Dans le modèle à quatre niveau, les allomorphies se distinguent des supplétions par le fait que les premières<br />

concernent des mots qui appartiennent à la même famille morphologique et que les secondes s’éta-


Radicaux d’emprunt 111<br />

des adjectifs de relation dérivés par suffixation (100b). D’autres exemples comme Dieu ><br />

antidivin ou asthme > anti-asthmatique présentent des allomorphies semblables.<br />

(100) a. anticarenciel ; antibyzantin ; antifébrile ; anti-aléatoire ; antibourguignon<br />

b. carence > carenciel ; Byzance > byzantin ; fièvre > fébrile ; aléa > aléatoire ; Bourgogne<br />

> bourguignon<br />

4.5.4 Supplétion<br />

<strong>Le</strong>s radicaux adjectivaux des dérivés en anti- ne sont pas tous des adjectifs formés par<br />

suffixation du nom qui exprime leur base. Des formes supplétives peuvent aussi servir de<br />

radicaux comme en (101). Ces exemples montrent que l’adjectif dont les formes servent de<br />

radical n’est pas nécessairement un membre de la famille morphologique de la base et qu’il<br />

peut être recherché, si nécessaire, dans la famille lexicale de cette dernière.<br />

(101) champignon > antifongique ; champignon > antimycosique ; oreillons > anti-ourlien ;<br />

fièvre > antipyrétique<br />

4.5.5 Substitution de suffixes<br />

<strong>Le</strong>s adjectifs de relation des noms peuvent aussi être formés par substitution de suffixes<br />

comme en (102a). Ainsi, vibratoire est lexicalement l’adjectif relationnel de vibration<br />

même si son radical est le thème vibrat- du verbe vibrer. Plus généralement, les adjectifs<br />

de relation des noms en -ion sont souvent formés en substituant à cette finale un suffixe<br />

comme -oire, -if et -ile. Naturellement, les formes des adjectifs de relation des noms en<br />

-ion peuvent aussi être construites par suffixation simple comme en (102b). La substitution<br />

de suffixes n’est pas limitée aux noms en -ion. Elle concerne aussi les dérivés en -isme, -iste,<br />

-ique ou -ien comme en (102c) (Roché 2007).<br />

(102) a. vibration > antivibratoire ; inflammation > anti-inflammatoire ; abrasion > antiabrasif<br />

; érection > anti-érectile<br />

b. gestation > antigestationnel ; gravitation > antigravitationnel<br />

c. jansénisme > antijanséniste ; magnétisme > antimagnétique ; palludisme > antipalludéen<br />

4.5.6 Surcharge<br />

On rencontre également des cas où l’adjectif de relation d’un nom utilise la forme d’un<br />

autre adjectif. Par exemple, électoral est l’adjectif de relation de électeur. Son radical est<br />

issu d’une forme de ce nom. Mais électoral est aussi l’adjectif de relation de élection. Ce<br />

dernier utilise la forme d’un adjectif proche qui se trouve déjà dans le lexique (Roché <strong>2009</strong>).<br />

Cette surcharge se retrouve naturellement aussi au niveau des dérivés en anti- où antiélectoral<br />

signifie ‘qui s’oppose aux élections’ (103). Pour des raisons conceptuelles, le sens<br />

blissent entre des mots qui appartiennent à la même famille lexicale mais à des familles morphologiques différentes.


112 Analyse unifiée de la préfixation en anti-<br />

‘qui s’oppose aux électeurs’ est moins facile à utiliser car il est plus difficile de percevoir les<br />

électeurs comme une nuisance.<br />

(103) Meeting anti-électoral "désertons les urnes, occupons la rue" du 21 mars 2007 voir ...<br />

farennes.free.fr/reunionspubliques.htm<br />

4.5.7 Identité de forme<br />

On rencontre une situation similaire à la surcharge pour des formes comme paysan,<br />

acarien, froid ou parallèle qui peuvent s’utiliser indifféremment comme nom et comme adjectif<br />

19 . <strong>Le</strong>s radicaux des dérivés en anti- qui ont ces noms comme bases (antipaysan (104) ;<br />

anti-acarien (105) ; antifroid (106) ; antiparallèle) satisfont donc trivialement la contrainte<br />

de transparence catégorielle (C2.9) puisque ce sont aussi des formes adjectivales. Pour antifroid,<br />

c’est la spécificité des marques partagées avec des mots de la catégorie des adjectifs,<br />

en l’occurrence avec l’adjectif froid, qui permet la pleine satisfaction de la contrainte.<br />

(104) La consolidation de la politique anti-paysans en Bolivie. www.alencontre.org/<br />

Bolivie/bolivie19.html<br />

(105) ACAR-HOUSSES housses anti acariens pour matelas et literie. www.acarhousses.<br />

com/<br />

(106) Pour les pieds, la CREME ANTI FROID AKILEINE avec ses composants permettant<br />

de garder les pieds au sec, d’activer la micro-circulation et de les réchauffer.<br />

www.tepaseul.fr/category/prends-soin-de-toi/ma-beaute<br />

<strong>Le</strong>s adjectifs précédents ont des formes distinctes au féminin (107 ; 108 ; 109). Parmi ces<br />

dérivés, antifroide (109) est remarquable parce que son radical est une forme de l’adjectif<br />

simple froid, or ces adjectifs sont réputés ne pas pouvoir engendrer de dérivés en anti-<br />

(Dell 1970, Zribi-Hertz 1973, Durand 1982). Elle est également intéressante parce que les<br />

locuteurs la ressentent comme étant légèrement plus marquée que antifroid. Antifroid est<br />

en effet totalement satisfaisant pour l’ensemble des contraintes qui contrôlent la préfixation<br />

en anti-, notamment pour la contrainte de transparence catégorielle. À l’inverse, le radical<br />

de antifroide n’étant pas une forme du nom froid, il est légèrement pénalisé par la contrainte<br />

de transparence de la base.<br />

(107) La politique anti-paysanne du gouvernement Mesa (novembre 2003). www.<br />

alencontre.org/dossier/Bolivie.html<br />

(108) Recouvrez votre matelas et vos oreillers avec des housses anti-acariennes. www.<br />

astrazeneca.fr/AZFR/VotreSante/Pneumologie/DossierPratique/82471.htm<br />

(109) Crème protectice anti-froide. www.bingotrade.ch/pdf/catalogue_2003.pdf<br />

19. <strong>Le</strong> nom et l’adjectif correspondant sont dans une relation de conversion (Roché 2005). Pour Corbin<br />

(2001a), il s’agit d’une suffixation dont le suffixe a été inhibé.


Radicaux d’emprunt 113<br />

4.5.8 Élision<br />

La façon la plus simple de construire un dérivé en anti- consiste à utiliser comme radical<br />

la forme de l’adjectif de relation de sa base. Mais d’autres stratégies existent. L’une<br />

d’elles est l’élision que l’on rencontre pour les dérivés dont la base peut être exprimée par<br />

un composé nominal constitué d’un nom et d’un adjectif (voir section 4.2.4). <strong>Le</strong> nom est<br />

dans ce cas simplement élidé afin de ne conserver que l’adjectif et satisfaire ainsi parfaitement<br />

la contrainte de transparence catégorielle. Par exemple, radiation atomique permet<br />

de former anti-radiation atomique (110) et anti-atomique (111), attaque aérienne de former<br />

anti-attaque aérienne (112) et anti-aérien (113), et politique sécuritaire de former antipolitique<br />

sécuritaire et antisécuritaire. Dans tous les cas, la forme qui a un radical adjectival<br />

est beaucoup plus fréquente que celle qui contient le nom et l’adjectif (table 4.4). La seconde<br />

forme est en effet plus marquée parce qu’elle ne satisfait ni la contrainte de recyclage<br />

(son radical n’est pas une entrée lexicale classique) ni la contrainte de transparence catégorielle<br />

(une séquence nom-adjectif ne ressemble pas suffisamment à un adjectif). À l’inverse<br />

celle dont le radical est une forme adjectivale satisfait ces deux contraintes, mais pas celle de<br />

transparence de la base (C2.6). <strong>Le</strong>s chiffres de la table 4.4 font apparaître que la contrainte<br />

de recyclage (C2.3) pénalise fortement les radicaux qui ne sont pas des mots simples.<br />

N Adj anti-N Adj anti-Adj<br />

attaque aérienne 20 120 000<br />

radiation atomique 6 240 000<br />

politique sécuritaire 3 100 000<br />

Table 4.4 – Comparaison du nombre des formes ayant pour radical l’expression nominale<br />

et l’adjectif. <strong>Le</strong>s chiffres correspondent aux nombres de pages indexées par Google<br />

qui contiennent ces séquences (décompte réalisé le 17 octobre <strong>2009</strong>). Ils font clairement<br />

apparaître que les expressions nominales sont fortement défavorisées face aux formes monolexicales,<br />

plus prototypiques.<br />

(110) <strong>Le</strong> 2e choix celui du nucléaire permettait de rencontrer un agent immoblier offrant<br />

un catalogue d’abris anti-atomique, du plus luxueux ou plus simple, de combinaisons<br />

anti-radiations atomiques et autre dosimètres très pratiques pour mesurer soi-même<br />

son taux de radioactivité. www.greenpeace.org/france/groupes-locaux/bordeaux/<br />

actus/bdx-240207-eprourevolutionenergetique?mode=send<br />

(111) convoqué par l’organisme du don de sang, j’ai appris tout ça !!!!! pas d’hépatite C à<br />

l’époque, ils m’ont acceuillis avec des masques et combinaisons anti atomiques !!!!!!!!!<br />

ils voulaient même pas me faire de prise de sang !!!!!! www.hepatites.net/index.php?<br />

name=PNphpBB2&file=printview&t=1233&start=0<br />

(112) En même temps quand tu vois les journalistes TV français aux 20 heures qui poussent<br />

des cris d’orfraie en présentant des batteries de missiles (soit-disant "anti attaques


114 Analyse unifiée de la préfixation en anti-<br />

aériennes") autour des sites olympiques alors que ce sont des canons atmosmphériques<br />

pour dissiper les nuages... www.planetargonautes.eu/2008/07/les-promesses-n.html<br />

(113) L’armée du Bélarus a constaté que des pièces de batteries de missiles<br />

anti-aériens S-300, de production russe, avaient été volées dans des garnisons<br />

du pays. tf1.lci.fr/infos/monde/2005/0,,3202137,00-pieces-missilesanti-aeriens-disparaissent-belarus-.html<br />

4.5.9 Suffixation d’expressions nominales<br />

Une stratégie plus exceptionnelle pour les dérivés dont les bases peuvent être exprimées<br />

par une séquence adjectif-nom est l’adjectivation de ces derniers par simple suffixation<br />

comme dans grand vicaire > anti-grand vicarial (114) ou Grande Comore > anti-grand<br />

comorien (115). Ces dérivés satisfont à la fois la contrainte de transparence catégorielle et<br />

celle de transparence de la base.<br />

(114) Ses attaques étaient principalement dirigées contre les anciens administrateurs de la<br />

province, qu’il avait si violemment insultés dans ses <strong>Le</strong>ttres Violettes et Noires ou<br />

anti-épiscopales et anti-grand vicariales, touchant les administrations ... clap.jac.<br />

free.fr/livre/bernardines.html<br />

(115) Cette ligne éditoriale est d’autant plus manifeste que le journal se fait constamment<br />

l’écho d’une conspiration anti-grand comorienne. http://www.malango-actualite.<br />

com/kashkazi/archives/57-2006-10-12.pdf<br />

4.5.10 Bases désadjectivales<br />

Outre antifroid (106 ; 109), notre corpus contient plusieurs dérivés dont les radicaux<br />

sont des adjectifs simples (116a). <strong>Le</strong>s bases de ces exemples peuvent être exprimées par des<br />

noms de propriété dérivés de ces adjectifs, comme en témoignent l’existence des formes en<br />

(116b).<br />

(116) a. antitriste (4) ; antistérile (5) ; antisec (120)<br />

b. antistérilité (118) ; antitristesse (117) ; antisécheresse (119)<br />

(117) Déjà à l’époque, on avait parlé pour ce médicament de "pilule du bonheur" ou de<br />

"molécule anti-tristesse" (cf. le Figaro du 27/06/85). www.medcost.fr/html/economie_<br />

sante_eco/eco_110699d.htm<br />

(118) <strong>Le</strong>s cacahuètes donnent la diarrhée, pas très aphrodisiaque ; toutefois, elles fournissent<br />

de la vitamine E, la vitamine anti-stérilité... forum.doctissimo.fr/doctissimo/<br />

aphrodisiaques/cacahuetes-augmente-sperme-sujet_143244_1.htm<br />

(119) bon, le beurre, ça peut faire 1) un anti-froid pas cher pour les lèvres 2) un masque<br />

anti-sècheresse pas cher pour les cheveux... fr.answers.yahoo.com/question/index?<br />

qid=20081110115241AAlEA7H<br />

(120) Et en plus j’utilise qq fois le baume seul comme un masque anti-sec.<br />

forum.aufeminin.com/forum/beaute1/__f4825_beaute1-Existe-t-il-deteintures-naturelles.html


Radicaux d’emprunt 115<br />

<strong>Le</strong>s exemples (4 ; 5 ; 120) n’ont en fait rien d’exceptionnel même s’ils sont ressentis comme<br />

plus marqués que les dérivés à radical nominal ou ceux dont le radical est un adjectif de<br />

relation dérivé comme antiparlementaire. <strong>Le</strong>urs radicaux sont des formes d’adjectifs suffisamment<br />

proches de leurs bases et le fait qu’ils soient les formes des bases de ces dernières<br />

n’a pas d’importance. La principale différence entre les dérivés (4 ; 5 ; 120) et ceux dont le<br />

radical est la forme d’un adjectif dérivé de la base est la distance morphologique légèrement<br />

plus grande pour les premiers (voir section 2.4). <strong>Le</strong> même type de relation se retrouve dans<br />

des dérivés dont la base est un nom de pays lui-même dérivé d’un nom de peuple comme<br />

Russie > antirusse ou Turquie > antiturque (<strong>Le</strong>vkovych 2004, Plénat et al. 2004a, Roché<br />

2005, 2008, <strong>2009</strong>).<br />

4.5.11 Périmètre du voisinage morphologique<br />

La table 4.3 montre qu’à côté des dérivés dont les radicaux sont des formes d’adjectifs<br />

de relation relativement neutres obtenus par suffixation en -al, -el, -ien, -ique, -esque<br />

(121) ou de gentilés en -ain, -ais, -an, -ois, -ote, etc., on trouve des formes d’adjectifs sémantiquement<br />

plus éloignés de la base. Par exemple, piratable dans antipiratable (voir (23),<br />

page 47) qualifie le patient, i.e. l’objet du piratage ; insomniaque dans anti-insomniaque désigne<br />

la personne qui souffre d’insomnie ; poussiéreux dans antipoussiéreux désigne ce qui<br />

est recouvert de poussière. À l’inverse, dans anticagoulard (122), anti-émeutier ou antimusicien,<br />

le radical est un nom qui qualifie l’agent, celui qui participe aux activités de la<br />

Cagoule, à une émeute ou qui joue de la musique. Ces radicaux sont tous suffisamment<br />

proches de leurs bases et suffisamment saillants pour permettre l’identification de ces dernières<br />

(contrainte C2.6).<br />

(121) a. Orient > anti-oriental,<br />

b. ministère > antiministériel<br />

c. Wagner > antiwagnérien<br />

d. ergonomie > anti-ergonomique<br />

e. titan > antititanesque<br />

(122) ... il fut nommé sous-chef de bureau au ministère de l’Intérieur et maintenu à ce<br />

poste par le ministre de l’Intérieur Roger SALENGRO, qui lui aurait confié la responsabilité<br />

du fichier central de la Sûreté nationale en raison de ses convictions républicaines<br />

et anticagoulardes ( 19 ). www.crdp-reims.fr/memoire/enseigner/rene_<br />

bousquet/01_carriere.htm<br />

Notre corpus fait également apparaître que l’essentiel des adjectifs non relationnels<br />

dont les formes sont utilisées comme radicaux servent à désigner des agents. La première<br />

raison qui explique cette préférence est que le sens du préfixe anti- décrit une opposition<br />

à une action (antiblocage) ou à l’agent qui la produit (antibloquant, antibloqueur). La seconde<br />

est que cette opposition est intentionnelle. L’utilisation d’un suffixe agentif permet<br />

de rapprocher l’entité désignée par le dérivé en anti- d’une série de noms d’agents : antibloquant<br />

est proche de la série des adjectifs en -ant et antibloqueur de celle des adjectifs en


116 Analyse unifiée de la préfixation en anti-<br />

-eur. On a ainsi une forme de réanalyse, ou plus exactement de superposition de deux séries<br />

: celle des dérivés en anti- au premier plan et celle des dérivés agentifs au second. Cette<br />

stratégie se retrouve dans les dérivés antidéperlant (89), antidésherbant (91) ou antidémêlant<br />

(92) présentés en section 4.3.6.<br />

Par ailleurs, on observe une grande variabilité entre les locuteurs dans les voisinages<br />

d’un même mot, la saillance des positions lexicales qui l’entourent et les distances qui les<br />

séparent. Il existe par exemple au moins neuf réalisations possibles pour un dérivé en antidont<br />

le sens est ‘qui réduit les vibrations’, ‘qui empêche de vibrer’ (123) 20 et (124). <strong>Le</strong> dernier<br />

radical semble obtenu par conversion du verbe vibrer mais il pourrait être également<br />

analysé comme une forme apocopée de vibration.<br />

(123) antivibration ; antivibrant ; antivibratoire ; antivibratif ; antivibratile ; antivibrateur<br />

; antivibreur ; antivibrable ; antivibre<br />

(124) a. il existe des patins anti-vibrations pour machine à laver. astrosurf.com/<br />

astropratique/013324.html<br />

b. Elles obligent également à monter le moteur sur des blocs anti-vibrants qui<br />

dissipent de l’énergie ... sycomoreen.free.fr/syco_francais/moteurs_pompes_<br />

problematique_archihybrid.html<br />

c. Objet du marché : Table optique anti-vibratoire. www.espci.fr/mpa/appels/<br />

2008/a083fkp/index.html<br />

d. <strong>Le</strong> faux plafond en placo phonique avec suspentes anti vibratives (assez<br />

cher quand même, ... http://www.systemed.fr/Forum/forum_posts.asp?TID=<br />

24488&get=last<br />

e. <strong>Le</strong>s plots anti-vibratiles fournis avec la baignoire ne doivent pas être déposés, ni<br />

modifiés, ni scellés. www.jacobdelafon.com/fr/pro/pdf/pose-balneo.pdf<br />

f. Plots anti-vibrateur poids 150 Kg AAM108 ( lot de 4 ). www.sem-angles.<br />

fr/climatisation/plots-anti-vibrateur-poids-150-kg-aam108-lot-de-4-<br />

A1540271p67S4R4c9216<br />

g. ... de nouvelles consignes de maintenance de leur dispositif antivibreur ont été édictées.<br />

www.senat.fr/questions/base/1993/qSEQ930501225.html<br />

h. <strong>Toulouse</strong>. Theâtre LABEDA - 800 m2 plafond phonique avec plâtre Lafarges avec<br />

tampon antivibrable ( plafond 3 couches ) www.cyberbtp.com/pmp/page4/default.<br />

htm<br />

i. je vais voir pour un rack anti vibre car dans mon boitier je peux mettre env 6 DD<br />

(ca devrait paser !) forum.zebulon.fr/aide-achat-hdd-raptor-t143169.html<br />

4.6 Conclusion<br />

L’étude proposée dans ce chapitre a permis de répondre aux principales questions posées<br />

dans l’introduction. Elle a également permis d’atteindre d’autres objectifs. <strong>Le</strong> premier<br />

20. Je rappelle que antivibré (13) est un participe construit sur un dérivé en anti- (voir section 4.2.1).


Conclusion 117<br />

est de présenter un ensemble important de données originales permettant de renouveler<br />

l’analyse de la préfixation en anti-. <strong>Le</strong> deuxième est d’illustrer la rentabilité de la morphologie<br />

extensive et les gains qu’elle permet de réaliser, y compris sur des questions qui ont<br />

fait l’objet d’études nombreuses et détaillées. L’analyse proposée dans ce chapitre constitue<br />

également un exemple-type d’étude DUMALienne, à la fois sur le plan méthodologique et<br />

sur celui de l’approche pragmatique de la morphologie. La préfixation en anti- a ainsi été<br />

abordée sans a priori théorique, en utilisant toutes les notions et les outils qui permettent<br />

de démêler les conditionnements qui règlent cette construction. <strong>Le</strong> quatrième objectif est<br />

d’illustrer la souplesse et l’efficacité du modèle théorique présenté dans le chapitre 2.<br />

<strong>Le</strong>s grandes lignes de l’analyse de la préfixation en anti- qui vient d’être développée<br />

sont les suivantes :<br />

1. Anti- est un préfixe. <strong>Le</strong>s données ne permettent pas de conclure qu’il existe une préposition<br />

anti. Cependant, certains locuteurs utilisent marginalement anti comme une<br />

préposition synonyme de contre.<br />

2. La sémantique des dérivés en anti- peut être décrite selon deux dimensions. La pre-<br />

spatial<br />

[− axiologique]<br />

logique<br />

[− axiologique]<br />

adversatif<br />

[+ axiologique]<br />

endocentrique exocentrique<br />

[+ adjectif]<br />

Anti-Atlas ; antitragus antimésentérique ; antisolaire ;<br />

anti-Terre<br />

Y se trouve en face de X l’orientation Y est l’opposée de<br />

celle de X<br />

antihéros ; antiparticule ; antichaîne<br />

; antibeau ; anti-obèse ;<br />

antimordre<br />

Y est l’inverse de X ; Y est<br />

un X qui appartient au monde<br />

de l’antimatière ; Y est l’équivalent<br />

de X pour les antiparticules<br />

; Y est la qualité d’être<br />

dépourvu de X, incompatible<br />

avec X ou contraire à X<br />

antidéperlant antiparlementaire ; antilimace ;<br />

antidormir<br />

Y est un synonyme de X Y est la qualité de s’opposer<br />

aux nuisances X ou aux nuisances<br />

causées par X<br />

Table 4.5 – Récapitulation des interprétations des dérivés préfixés en anti-. <strong>Le</strong>s cellules<br />

présentent quelques exemples représentatifs et une glose dans laquelle Y représente le dérivé<br />

et X sa base.


118 Analyse unifiée de la préfixation en anti-<br />

mière distingue les dérivés dont le sens est endocentrique (i.e. qui désignent des notions<br />

de même nature que leurs bases) de ceux dont le sens est exocentrique (i.e. qui<br />

désignent des notions de nature différente de celles de leurs bases). La seconde permet<br />

de séparer trois groupes de sens : spatiaux, logiques et adversatifs. <strong>Le</strong>s sens de<br />

ces dérivés sont résumés dans le tableau 4.5. Ces sens ne peuvent pas être réunis sous<br />

un invariant unique mais ils sont connectés. Ils présentent une unité de famille (i.e.<br />

de type ressemblance de famille) et on peut passer de proche en proche d’un sens à<br />

l’autre.<br />

3. <strong>Le</strong>s formes des dérivés traditionnellement analysés comme parasynthétiques ou en<br />

faisant appel au principe de copie sont en réalité construites en empruntant leurs<br />

radicaux à des voisins morphologiques de leurs bases. Ces emprunts sont destinés à<br />

satisfaire la contrainte de transparence catégorielle.


Conclusion<br />

J’ai présenté dans ce mémoire les grandes lignes de mon parcours scientifique et<br />

quelques-uns de mes chantiers en cours. Ma recherche se caractérise par le fait qu’elle<br />

se distribue dans deux domaines distincts de la linguistique : la morphologie et le traitement<br />

automatique des langues. Mes thématiques de recherche sont cependant relativement<br />

concentrées. Elles s’organisent autour de deux questions essentielles : la découverte de la<br />

structure morphologique du lexique et l’approche extensive en morphologie. <strong>Le</strong>s chantiers<br />

que je viens de présenter délimitent un programme qui permet d’aborder un grand nombre<br />

de questions ouvertes sur la nature de la morphologie, ses relations avec la sémantique et la<br />

phonologie, ou ses interactions avec la syntaxe.<br />

<strong>Le</strong> premier de mes chantiers est un modèle informatique de la morphologie dérivationnelle<br />

établi autour d’une mesure de la proximité morphologique et de l’analogie formelle.<br />

Ce modèle, radicalement lexématique, permet de réaliser des analyses morphologiques<br />

sans avoir recours aux morphèmes, aux affixes, aux exposants morphologiques ni<br />

à aucune représentation de ces notions. La mesure morphologique que j’ai proposée est<br />

calculée en représentant le lexique sous la forme d’un bigraphe et en l’explorant au moyen<br />

d’un algorithme basé sur les marches aléatoires. Elle est utilisée pour identifier des voisinages<br />

morphologiques mais elle pourrait aussi servir à apparier les lexiques de langues<br />

proches comme le français et l’occitan ou de différents états d’une même langue (à partir,<br />

par exemple, de textes originaux en ancien ou en moyen français et d’éditions modernes des<br />

mêmes œuvres). L’analogie formelle permet d’identifier des quadruplets de mots que l’on<br />

peut ensuite étendre en familles et en séries morphologiques. <strong>Le</strong>s premiers résultats obtenus<br />

sont encourageants. Ce modèle constitue un changement de paradigme pour l’analyse<br />

morphologique automatique dont la finalité n’est plus de découvrir la structure morphologique<br />

des mots mais celle du lexique dans son entier. Ce modèle informatique est cependant<br />

loin d’être complet. Il reste à séparer les familles des séries, à améliorer la qualité des traits<br />

sémantiques en procédant à l’analyse des définitions à partir desquelles ils sont extraits, à<br />

proposer un traitement permettant de découvrir les allomorphies, à traiter les conversions<br />

et les compositions, à intégrer des informations relatives à la fréquence des mots et à leur<br />

distribution, à utiliser des formes fléchies, etc. L’amélioration des descriptions sémantiques<br />

119


120 Conclusion<br />

passera aussi par la sélection, parmi ces traits, des meilleurs prédicteurs de la proximité<br />

morphologique.<br />

Ce premier chantier devrait permettre de créer à court terme une base de données morphologiques<br />

à large couverture en utilisant une méthode de bootstrap. La réalisation de la<br />

maquette d’un système de création de bases de données d’exemples morphologiques devrait<br />

suivre rapidement. Il s’agit d’intégrer la base de données morphologiques dans un<br />

système Wiki permettant à ses utilisateurs d’enregistrer et d’exploiter leurs exemples au fur<br />

et à mesure de leur collecte et de leur analyse. À moyen terme, je souhaiterais adapter la<br />

mesure à d’autres types de langues et notamment aux langues gabaritiques comme l’arabe<br />

ou l’hébreu et aux langues agglutinantes comme le finnois ou le turc. La comparaison des<br />

structures morphologiques des langues est aussi une question sur laquelle je souhaite me<br />

pencher. Une autre application possible de ce travail est l’aide à la révision des définitions<br />

des dérivés morphologiques dans les dictionnaires. On pourra en effet définir une mesure<br />

de la cohérence et de l’homogénéité de ces définitions. Cette mesure permettra d’identifier<br />

les définitions qu’il faut réviser et de vérifier l’amélioration apportée par leur révision.<br />

Mon deuxième chantier est la description morphologique dans le cadre de l’approche<br />

extensive proposée par Marc Plénat (2000). J’ai présenté dans le chapitre 4 une étude de la<br />

préfixation en anti- réalisée en utilisant un corpus de 3 000 exemples collectés en grande<br />

partie sur le Web. La sémantique des dérivés en anti- y est analysée en fonction de deux<br />

critères, l’alternance des interprétations endocentriques et exocentriques et les types d’emplois,<br />

spatiaux, logiques et adversatifs. La caractérisation de ces derniers est affinée davantage<br />

en s’appuyant sur la catégorie de la dynamique des forces de Talmy (2000). Selon<br />

l’analyse proposée, les dérivés décrivent la qualité de s’opposer à la base vue comme une<br />

nuisance ou une source de nuisances aux intérêts d’un agent qui n’est pas nommé. <strong>Le</strong> chapitre<br />

présente un nombre important d’exemples et montre comment la forme des dérivés<br />

parasynthétiques découle de contraintes de recyclage et de transparence qui portent sur<br />

l’organisation morphologique du lexique. Ces contraintes sont décrites dans le chapitre 2.<br />

J’entends poursuivre ce travail de description de la sémantique des procédés morphologiques,<br />

notamment en reprenant l’analyse de la suffixation en -able puis en m’intéressant à<br />

celles en -eur et en -if. L’analyse que j’envisage pour -able est esquissée en section 1.3.3. Je<br />

prévois de travailler également sur la conversion, phénomène qui, comme les constructions<br />

parasynthétiques, nous éclaire sur certains types de déformations dans les correspondances<br />

qui s’établissent entre les niveaux sémantique, lexical et formel décrits en section 2.3.<br />

<strong>Le</strong> troisième chantier est le plus récent. Il vise à la définition d’un modèle théorique<br />

de la morphologie dérivationnelle qui permette d’articuler les notions de proximité et de<br />

paradigmes utilisées dans le modèle informatique et les analyses linguistiques formulées<br />

en termes de contraintes lexicales concurrentes. Cette plate-forme est pour l’instant une<br />

ébauche dont un grand nombre d’éléments devront être précisés au fur et à mesure du développement<br />

du modèle informatique et de la description de nouveaux procédés. Parmi les<br />

questions en suspens, il y a le contenu des positions, la représentation des paradigmes, l’articulation<br />

des paradigmes flexionnels et dérivationnels et la nature des objets sémantiques<br />

mis en correspondance avec les positions lexicales. Un autre point qui reste à expliciter<br />

est la place et la représentation des formes et des sens mémorisés. La manière dont ces


Conclusion 121<br />

représentations interviennent dans la construction et l’analyse des mots devra également<br />

être définie. En d’autres termes, il s’agit de préciser la place du lexique mémorisé dans le<br />

lexique mental. L’acquisition de la morphologie est une autre voie de recherche ouverte par<br />

ce modèle théorique. <strong>Le</strong> fait que la structure morphologique du lexique émerge à partir des<br />

données auxquelles les locuteurs sont exposés a notamment comme conséquence que celleci<br />

ne peut se mettre en place que lorsque le nombre des mots mémorisés est suffisamment<br />

important (Calderone et al. 2007).


Bibliographie<br />

Amiot, D. (2004). Préfixes ou prépositions ? <strong>Le</strong> cas de sur(-), sans(-), contre(-) et les autres.<br />

<strong>Le</strong>xique, 16:67–83.<br />

Amiot, D. (2008). La catégorie de la base dans la préfixation en dé-. In B. Fradin, éd.,<br />

La raison morphologique. Hommage à la mémoire de Danielle Corbin, pp. 1–15. John<br />

Benjamins Publishing Company, Amsterdam / Philadelphia.<br />

Amiot, D. et F. Montermini (<strong>2009</strong>). Affixes et mots grammaticaux. In B. Fradin, F. Kerleroux,<br />

et M. Plénat, éds., Aperçus de morphologie du français, pp. 127–141. Presses universitaires<br />

de Vincennes, Saint-Denis.<br />

Amsili, P. et N. <strong>Hathout</strong> (1996). Computational semantics of time/negation interaction.<br />

In Proceedings of the 16th International Conference on Computational Linguistics<br />

(COLING-96). Copenhagen.<br />

Amsili, P. et N. <strong>Hathout</strong> (1998). Systèmes de types pour la (λ-)DRT ascendante. In Actes<br />

de la 5 e conférence annuelle sur le traitement automatique des langues naturelles (TALN-<br />

98), pp. 92–101. Paris.<br />

Anderson, S. R. (1992). A-Morphous Morphology. Cambridge University Press, Cambridge.<br />

Aronoff, M. (1976). Word Formation in Generative Grammar. Linguistic Inquiry Monographs.<br />

MIT Press, Cambridge, Mass.<br />

Aronoff, M. (1994). Morphology by Itself. Stem and Inflectional Classes. Linguistic Inquiry<br />

Monographs. MIT Press, Cambridge, Mass.<br />

Asher, N. (1993). Reference to Abstract Objects in Discourse. Kluwer Academic Publisher,<br />

Dordrecht.<br />

Aurnague, M. et M. Plénat (2008). Sémantique de l’espace et morphologie : le cas de la<br />

préfixation en é-. Bulletin de la Société de Linguistique de Paris, C<strong>II</strong>I(1):201–236.<br />

123


124 Bibliographie<br />

Baayen, H. (1992). Quantitative aspects of morphological productivity. In G. E. Booij<br />

et J. van Marle, éds., Yearbook of Morphology 1991, pp. 109–149. Kluwer Academic<br />

Publishers, Dordrecht.<br />

Baayen, R. H., R. Piepenbrock, et L. Gulikers (1995). The CELEX lexical database (release<br />

2). CD-ROM. Linguistic Data Consortium, Philadelphia, Penn.<br />

Baroni, M., J. Matiasek, et H. Trost (2002). Unsupervised discovery of morphologically<br />

related words based on orthographic and semantic similarity. In Proceedings of the<br />

Workshop on Morphological and Phonological <strong>Le</strong>arning of ACL-2002, pp. 48–57. ACL,<br />

Philadelphia, Penn.<br />

Becker, T. (1994). Back-formation, cross-formation, and ‘bracketing paradoxes’ in paradigmatic<br />

morphology. In G. E. Booij et J. van Marle, éds., Yearbook of Morphology 1993,<br />

pp. 1–25. Kluwer Academic Publishers, Dordrecht.<br />

Benamara, F., N. <strong>Hathout</strong>, P. Muller, et S. Ozdowska, éds. (2007). Actes de la 14 e conférence<br />

sur le traitement automatique des langues naturelles (TALN-2007) et de la 11 e rencontre<br />

des étudiants chercheurs en informatique pour le traitement automatique des langues<br />

(RECITAL-2007). ATALA, CLLE-<strong>ERSS</strong> & IRIT, <strong>Toulouse</strong>.<br />

Bernhard, D. (2006a). Apprentissage de connaissances morphologiques pour l’acquisition<br />

automatique de ressources lexicales. Thèse de doctorat, <strong>Université</strong> Joseph Fourier, Grenoble.<br />

Bernhard, D. (2006b). Automatic acquisition of semantic relationships from morphological<br />

relatedness. In Advances in Natural Language Processing, Proceedings of the 5th International<br />

Conference on NLP, FinTAL 2006, volume 4139 de <strong>Le</strong>cture Notes in Computer<br />

Science, pp. 121–132. Springer Verlag, Berlin / Heidelberg.<br />

Berrendonner, A. (1990). Attracteurs. Cahiers de linguistique française, 11:149–158. Actes<br />

du 4 e colloque de pragmatique de Genève.<br />

Berrendonner, A. (1995). Quelques notions utiles à la sémantique des descripteurs nominaux.<br />

Travaux neuchâtelois de linguistique (TRANEL), 23(9-39).<br />

Berrendonner, A. (2002). Types. In M. Carel, éd., <strong>Le</strong>s facettes du dire : hommage à Oswald<br />

Ducrot, pp. 39–53. Kimé, Paris.<br />

Bertram, R., M. Laine, et K. Karvinen (1999). The interplay of word formation type, affixal<br />

homonymy, and productivity in lexical processing: Evidence from a morphologically<br />

rich language. Journal of Psycholinguistic Research, 28(3):213–226.<br />

Bertram, R., R. Schreuder, et R. H. Baayen (2000). The balance of storage and computation<br />

in morphological processing: The role of word formation type, affixal homonymy, and<br />

productivity. Journal of Experimental Psychology: <strong>Le</strong>arning, Memory, and Cognition,<br />

26(2):489–511.


Bibliographie 125<br />

Blevins, J. P. (2003). Stems and paradigms. Language, 79(4):737–767.<br />

Blevins, J. P. (2006). Word-based morphology. Journal of Linguistics, 42(3):531–573.<br />

Bonami, O. et G. Boyé (2003). Supplétion et classes flexionnelles dans la conjugaison du<br />

français. Langages, 152:102–126.<br />

Bonami, O., G. Boyé, et F. Kerleroux (<strong>2009</strong>). L’allomorphie radicale et la relation flexionconstruction.<br />

In B. Fradin, F. Kerleroux, et M. Plénat, éds., Aperçus de morphologie du<br />

français, pp. 103–125. Presses universitaires de Vincennes, Saint-Denis.<br />

Booij, G. E. (1996). Inherent versus contextual inflection and the split morphology hypothesis.<br />

In G. E. Booij et J. van Marle, éds., Yearbook of Morphology 1995, pp. 1–16.<br />

Kluwer Academic Publishers, Dordrecht.<br />

Booij, G. E. (2002). The Morphology of Dutch. Oxford University Press, Oxford.<br />

Booij, G. E. (2007). Construction morphology and the lexicon. In F. Montermini, G. Boyé,<br />

et N. <strong>Hathout</strong>, éds., Selected Proceedings of the 5th Décembrettes: Morphology in <strong>Toulouse</strong>,<br />

pp. 34–44. Cascadilla Proceedings Project, Somerville, MA.<br />

Booij, G. E. (2008). Paradigmatic morphology. In B. Fradin, éd., La raison morphologique.<br />

Hommage à la mémoire de Danielle Corbin, pp. 29–38. John Benjamins Publishing<br />

Company, Amsterdam / Philadelphia.<br />

Boullier, P., L. Clément, B. Sagot, et E. Villemonte de La Clergerie (2005). Chaînes de traitement<br />

syntaxique. In Actes de la 12 e conférence annuelle sur le traitement automatique<br />

des langues naturelles (TALN-2005), pp. 103–112. ATALA, Dourdan.<br />

Bourigault, D. (1994). LEXTER, un Logiciel d’EXtraction de TERminologie. Application<br />

à l’acquisition de connaissances à partir de textes. Thèse de doctorat, École des Hautes<br />

Études en Sciences Sociales, Paris.<br />

Bourigault, D. (2007). Un analyseur syntaxique opérationnel : SYNTEX. Habilitation à<br />

diriger des recherches, <strong>Université</strong> <strong>Toulouse</strong> <strong>II</strong>-<strong>Le</strong> <strong>Mirail</strong>, <strong>Toulouse</strong>.<br />

Bourigault, D. et C. Fabre (2000). Approche linguistique pour l’analyse syntaxique des<br />

corpus. Cahiers de grammaire, 25:131–151.<br />

Boyé, G. (2010). Régularité et classes flexionnelles dans la conjugaison du français. In<br />

M. Roché, G. Boyé, N. <strong>Hathout</strong>, S. Lignon, et M. Plénat, Des unités morphologiques au<br />

lexique. Manuscrit.<br />

Burzio, L. (2002). Surface-to-surface morphology: when your representations turn into<br />

constraints. In P. Boucher, éd., Many Morphologies, p. 142–177. Cascadilla Press, Somerville,<br />

Mass.


126 Bibliographie<br />

Bybee, J. L. (1985). Morphology. A Study of the Relation between Meaning and Form,<br />

volume 9 de Typological Studies in Language. John Benjamins Publishing Company,<br />

Amsterdam.<br />

Bybee, J. L. (1988). Morphology as lexical organization. In M. Hammond et M. Noonan,<br />

éds., Theoretical Morphology. Approaches in Modern Linguistics, pp. 119–141. Academic<br />

Press, San Diego, CA.<br />

Bybee, J. L. (1995). Regular morphology and the lexicon. Language and cognitive processes,<br />

10(5):425–455.<br />

Béchet, F. (2001). Lia_phon : un système complet de phonétisation de textes. Traitement<br />

automatique des langues, 42(1):47–67.<br />

Calderone, B., I. Herreros, et V. Pirrelli (2007). <strong>Le</strong>arning inflection: The importance of<br />

starting big. Lingue & Linguaggio, 2:175–200.<br />

Chomsky, N. (1981). <strong>Le</strong>ctures on Government and Binding, volume 9 de Studies in Generative<br />

Grammar. Foris, Dordrecht.<br />

Chomsky, N. (1986). Barriers, volume 13 de Linguistic Inquiry Monographs. MIT Press,<br />

Cambridge, Mass.<br />

Claveau, V. et M.-C. L’Homme (2005). Apprentissage par analogie pour la structuration<br />

de terminologie. Utilisation comparée de ressources endogènes et exogènes. In Actes de<br />

la conférence terminologie et intelligence artificielle (TIA-2005). Rouen.<br />

Colmerauer, A. (1990). An introduction to Prolog <strong>II</strong>I. Communications of the ACM,<br />

33(7):69–90.<br />

Corbin, D. (1980). Contradictions et inadéquation de l’analyse parasynthétique en morphologie<br />

dérivationnelle. In A.-M. Dessaux-Berthonneau, éd., Linguistiques et traditions<br />

grammaticales, pp. 181–224. Presses universitaires de Lille, Villeneuve-d’Asq.<br />

Corbin, D. (1987). Morphologie dérivationnelle et structuration du lexique. Max Niemeyer<br />

Verlag, Tübingen.<br />

Corbin, D. (1991). Introduction. La formation des mots : structure et interprétation.<br />

<strong>Le</strong>xique, 10:7–30.<br />

Corbin, D. (1997). La représentation d’une « famille » de mots dans le Dictionnaire dérivationnel<br />

du français et ses corrélats théoriques, méthodologiques et descriptifs. Recherches<br />

linguistiques de Vincennes, 26:5–38.<br />

Corbin, D. (2001a). Du nouveau sur beurre laitier. Note sur une fausse conversion. In<br />

C. Buridant, G. Kleiber, et J.-C. Pellat, éds., Par monts et par vaux. Itinéraires linguistiques<br />

et grammaticaux. Mélanges de linguistique générale et française offerts au professeur<br />

Martin Riegel pour son soixantième anniversaire par ses collègues et amis, volume 45<br />

de Bibliothèque de l’information grammaticale, pp. 127–143. Éditions Peeters, <strong>Le</strong>uven.


Bibliographie 127<br />

Corbin, D. (2001b). Préfixe et suffixes : du sens aux catégories. Journal of French Language<br />

Studies, 11(1):41–69.<br />

Corbin, D. et M. Temple (1994). <strong>Le</strong> monde des mots et des sens construits : catégories<br />

sémantiques, catégories référentielles. Cahiers de lexicologie, 65(2):5–28.<br />

Creutz, M. et K. Lagus (2002). Unsupervised discovery of morphemes. In Proceedings<br />

of the ACL Workshop on Morphological and Phonological <strong>Le</strong>arning, pp. 21–30. ACL,<br />

Philadelphia, Penn.<br />

Creutz, M. et K. Lagus (2005). Unsupervised Morpheme Segmentation and Morphology<br />

Induction from Text Corpora Using Morfessor 1.0. Rapport technique A81, Helsinki<br />

University of Technology.<br />

Dal, G. (2003a). Analogie et lexique construit : La preuve par les textes. Cahiers de grammaire,<br />

28.<br />

Dal, G. (2003b). Arguments pour un préfixe contre-. Recherches linguistiques, 26:173–201.<br />

Dal, G. (2007). <strong>Le</strong>s adverbes de manière en -ment du français : Dérivation ou flexion. In<br />

N. <strong>Hathout</strong> et F. Montermini, éds., Morphologie à <strong>Toulouse</strong>, numéro 37 in LINCOM<br />

Studies in Theoretical Linguistics, pp. 121–147. Lincom Europa, Munich.<br />

Dal, G. (2008). Analogie et lexique construit : Un retour ? In J. Durand, B. Habert, et<br />

B. Laks, éds., Actes du Congrès Mondial de Linguistique Française (CMLF-2008), pp.<br />

1587–1599. ILF, Paris.<br />

Dal, G., N. <strong>Hathout</strong>, et F. Namer (1999). Construire un lexique dérivationnel : Théorie et<br />

réalisation. In P. Amsili, éd., Actes de la 6 e conférence sur le traitement automatique des<br />

langues naturelles (TALN-99), pp. 115–124. ATALA, Cargèse.<br />

Dal, G., N. <strong>Hathout</strong>, et F. Namer (2004). Morphologie constructionnelle et traitement<br />

automatique des langues : <strong>Le</strong> projet MorTAL. <strong>Le</strong>xique, 16:199–229.<br />

Dal, G. et F. Namer (2005). L’exception infirme-t-elle la notion de règle ? Ou le lexique<br />

construit et la théorie de l’optimalité. Faits de langue, 25:123–130.<br />

Darmesteter, A. (1877). De la création actuelle de mots nouveaux dans la langue française.<br />

Vieweg, Paris.<br />

Davis, E. (1988). A logical framework for commonsense predictions of solid objects behavior.<br />

Artificial Intelligence in Engineering, 3(3):125–140.<br />

De Mulder, W. et D. Amiot (2003). Préposition contre préfixe. Recherches linguistiques,<br />

26:203–232.<br />

Dell, F. (1970). <strong>Le</strong>s règles phonologiques tardives et la morphologie dérivationnelle du français.<br />

Thèse de PhD, MIT.


128 Bibliographie<br />

Dell, F. (1995). Consonant clusters and phonological syllabes in French. Lingua, 95:5–26.<br />

Durand, J. (1982). A propos du préfixe anti- et de la parasynthèse en français. In Occasional<br />

Papers from the Language Center, volume 25, pp. 1–35. University of Essex.<br />

Durand, J. (<strong>2009</strong>). On the scope of linguistics: data, intuitions, corpora. In Y. Kawaguchi,<br />

M. Minegishi, et J. Durand, éds., Corpus and Variation in Linguistic Description<br />

and Language Education, pp. 25–52. John Benjamins Publishing Company, Amsterdam/Philadelphia.<br />

Durand, J., B. Laks, et C. Lyche (2002). La phonologie du français contemporain : usages,<br />

variétés et structure. In C. D. Pusch et W. Raible, éds., Romanistische Korpuslinguistik –<br />

Korpora und gesprochene Sprache / Romance Corpus Linguistics – Corpora and Spoken<br />

Language, pp. 93–106. Gunter Narr Verlag, Tübingen.<br />

Durand, J., B. Laks, et C. Lyche (2005). Un corpus numérisé pour la phonologie du français.<br />

In G. Williams, éd., La linguistique de corpus, pp. 205–217. Presses universitaires de<br />

Rennes, Rennes.<br />

Déjean, H. (1998a). Concepts et algorithmes pour la découverte des structures formelles des<br />

langues. Thèse de doctorat, <strong>Université</strong> de Caen.<br />

Déjean, H. (1998b). Morphemes as necessary concept for structures discovery from untagged<br />

corpora. In Proceedings of the Workshop on Paradigms and Grounding in Natural<br />

Language <strong>Le</strong>arning, pp. 295–299. Adelaide.<br />

Fabre, C., F. Floricic, et N. <strong>Hathout</strong> (2004). Collecte outillée pour l’analyse des emplois<br />

discordants des déverbaux en -eur. Communication aux journées d’étude sur La place<br />

des méthodes quantitatives dans le travail du linguiste. <strong>ERSS</strong>, <strong>Université</strong> de <strong>Toulouse</strong><br />

<strong>II</strong>-<strong>Le</strong> <strong>Mirail</strong>.<br />

Fellbaum, C., éd. (1999). WordNet: an Electronic <strong>Le</strong>xical Database. MIT Press, Cambridge,<br />

Mass.<br />

Fradin, B. (1996). On the morphological entities and the copy principle. Acta Linguistica<br />

Hungarica, 43(1–2):111–151.<br />

Fradin, B. (1997a). Esquisse d’une sémantique de la préfixation en anti-. Recherches linguistiques<br />

de Vincennes, 26:87–112.<br />

Fradin, B. (1997b). Une préfixation complexe : le cas de anti-. Neuphilologische Mitteilungen,<br />

XCV<strong>II</strong>I(4):333–349.<br />

Fradin, B., G. Dal, N. <strong>Hathout</strong>, F. Kerleroux, M. Plénat, et M. Roché, éds. (2003a). <strong>Le</strong>s<br />

unités morphologiques, volume 3 de Silexicales. Silex, <strong>Université</strong> de Lille 3, Villeneuved’Asq.<br />

Fradin, B., N. <strong>Hathout</strong>, et F. Meunier (2003b). La suffixation en -ET et la question de la<br />

productivité. Langue Française, 140:56–78.


Bibliographie 129<br />

Fradin, B., F. Kerleroux, et M. Plénat, éds. (<strong>2009</strong>). Aperçus de morphologie du français.<br />

Presses universitaires de Vincennes, Saint-Denis.<br />

Galy, E. et D. Bourigault (2005). Analyse distributionnelle de corpus de langue générale et<br />

synonymie. In G. Williams, éd., Texte et corpus : Actes des 4 es journées de la linguistique<br />

de corpus, pp. 163–174. Lorient.<br />

Gaume, B. (2003). Analogie et proxémie dans les réseaux petits mondes. Revue d’Intelligence<br />

Artificielle, 17(5/6):935–951. « Regards croisés sur l’analogie ».<br />

Gaume, B. (2004). Balades aléatoires dans les petits mondes lexicaux. I3. Information -<br />

Interaction - Intelligence, 4(2).<br />

Gaume, B., K. Duvigneau, O. Gasquet, et M.-D. Gineste (2002). Forms of meaning, meaning<br />

of forms. Journal of Experimental and Theoretical Artificial Intelligence, 14(1):61–<br />

74.<br />

Gaume, B., N. <strong>Hathout</strong>, et P. Muller (2004a). Désambiguisation par proximité structurelle.<br />

In Actes de la 11 e conférence annuelle sur le traitement automatique des langues<br />

naturelles (TALN-2004), pp. 205–214. ATALA, Fez.<br />

Gaume, B., N. <strong>Hathout</strong>, et P. Muller (2004b). Word sense disambiguation using a dictionary<br />

for sense similarity measure. In Proceedings of the 20th International Conference<br />

on Computational Linguistics (Coling 2004), volume <strong>II</strong>, pp. 1194–1200. ACL, Genève.<br />

Gaume, B., F. Venant, et B. Victorri (2006). Hierarchy in lexical organization of natural<br />

language. In D. Pumain, éd., Hierarchy in natural and social sciences, Methodos series,<br />

pp. 121–143. Springer, Dordrecht.<br />

Gaussier, E. (1999). Unsupervised learning of derivational morphology from inflectional<br />

lexicons. In Proceedings of the ACL Workshop on Unsupervised <strong>Le</strong>arning in Natural<br />

Language Processing. College Park, MD.<br />

Gawelko, M. (1975). Évolution des suffixes adjectivaux en français. Polska Akademia Nauk<br />

Komitet Neofilologiczny, Wrocław.<br />

Gentner, D. (1983). Structure-mapping: A theoretical framework for analogy. Cognitive<br />

Science, 7(2):155–170.<br />

Goldsmith, J. (2001). Unsupervised learning of the morphology of natural language. Computational<br />

Linguistics, 27(2):153–198.<br />

Grabar, N., G. Dal, B. Fradin, N. <strong>Hathout</strong>, S. Lignon, F. Namer, C. Plancq, D. Tribout,<br />

F. Yvon, et P. Zweigenbaum (2006a). Productivité quantitative de la suffixation par -Able<br />

dans un corpus journalistique du français. In Actes des 8 es Journées internationales d’analyse<br />

statistique des données textuelles (JADT 2006), pp. 473–485. Presses universitaires de<br />

Franche-Comté, Besançon.


130 Bibliographie<br />

Grabar, N., G. Dal, B. Fradin, N. <strong>Hathout</strong>, S. Lignon, F. Namer, C. Plancq, D. Tribout,<br />

F. Yvon, et P. Zweigenbaum (2006b). Productivité quantitative des suffixation par -ité et<br />

-Able dans un corpus journalistique du français. In Actes de la 13 e conférence annuelle sur<br />

le traitement automatique des langues naturelles (TALN-2006), pp. 167–175. ATALA,<br />

Presses universitaires de Louvain, Louvain.<br />

Grabar, N. et P. Zweigenbaum (1999). Acquisition automatique de connaissances morphologiques<br />

sur le vocabulaire médical. In Actes de la 6 e conférence annuelle sur le traitement<br />

automatique des langues naturelles (TALN-99), pp. 175–184. ATALA, Cargèse.<br />

Gruaz, C. (1997a). Catégories lexématiques et catégories morphémiques dans les familles<br />

synchroniques dérivationnelles du français. Recherches linguistiques de Vincennes,<br />

26:39–59.<br />

Gruaz, C. (1997b). La stratification dérivationnelle dans les familles synchroniques des<br />

mots français contemporains. In <strong>II</strong>I Coloquio Internacional de Lingüística Francesa.<br />

Salamanca.<br />

Harris, Z. (1955). From phoneme to morpheme. Language, 31(2):190–222.<br />

<strong>Hathout</strong>, N. (1996a). <strong>Le</strong>s marqueurs superficiels dans les définitions spécialisées du Trésor<br />

de la Langue Française. In Actes de colloque Informatique et Langue Naturelle (ILN-<br />

96). Nantes.<br />

<strong>Hathout</strong>, N. (1996b). Pour la construction d’une base de connaissances lexicologiques à<br />

partir du Trésor de la Langue Française. <strong>Le</strong>s marqueurs superficiels dans les définitions<br />

spécialisées. Cahiers de <strong>Le</strong>xicologie, 68(1):137–173.<br />

<strong>Hathout</strong>, N. (2000). Morphological pairing based on the Network Model. In Proceedings<br />

of the Workshop on Computational <strong>Le</strong>xicography and Multimedia Dictionaries (COM-<br />

LEX 2000), pp. 35–38. Pyrgos.<br />

<strong>Hathout</strong>, N. (2001). Analogies morpho-synonymiques. Une méthode d’acquisition automatique<br />

de liens morphologiques à partir d’un dictionnaire de synonymes. In D. Maurel,<br />

éd., Actes de la 8 e conférence annuelle sur le traitement automatique des langues naturelles<br />

(TALN-2001), pp. 223–232. ATALA, Tours.<br />

<strong>Hathout</strong>, N. (2002). From WordNet to CELEX: Acquiring morphological links from<br />

dictionaries of synonyms. In Proceedings of the Third International Conference on Language<br />

Resources and Evaluation, pp. 1478–1484. ELRA, Las Palmas de Gran Canaria.<br />

<strong>Hathout</strong>, N. (2003). L’analogie, un moyen de croiser les contraintes et les paradigmes.<br />

Acquisition de connaissances morphologiques à partir de dictionnaires de synonymes.<br />

Revue d’Intelligence Artificielle, 17(5-6):923–934.<br />

<strong>Hathout</strong>, N. (2005). Exploiter la structure analogique du lexique construit : Une approche<br />

computationnelle. Cahiers de lexicologie, 87(2):5–28.


Bibliographie 131<br />

<strong>Hathout</strong>, N. (2008). Acquisition of the morphological structure of the lexicon based on<br />

lexical similarity and formal analogy. In Proceedings of the Coling workshop Textgraphs-<br />

3, pp. 1–8. ACL, Manchester.<br />

<strong>Hathout</strong>, N. (<strong>2009</strong>a). Acquisition morphologique à partir d’un dictionnaire informatisé. In<br />

Actes de la 16 e conférence sur le traitement automatique des langues naturelles (TALN-<br />

<strong>2009</strong>). ATALA, Senlis.<br />

<strong>Hathout</strong>, N. (<strong>2009</strong>b). Acquisition of morphological families and derivational series from<br />

a machine readable dictionary. In F. Montermini, G. Boyé, et J. Tseng, éds., Selected<br />

Proceedings of the 6th Décembrettes: Morphology in Bordeaux. Cascadilla Proceedings<br />

Project, Somerville, Mass.<br />

<strong>Hathout</strong>, N. et C. Fabre (2002). Constitution et exploitation de lexiques de formes déverbales.<br />

Communication aux Journées d’études sur les noms déverbaux. Silex, <strong>Université</strong><br />

Lille 3, Villeneuve-d’Asq.<br />

<strong>Hathout</strong>, N. et F. Montermini, éds. (2007). Morphologie à <strong>Toulouse</strong>. Actes du colloque international<br />

de morphologie 4 es Décembrettes, Lincom Studies in Theoretical Linguistics<br />

37. Lincom Europa, Munich.<br />

<strong>Hathout</strong>, N., F. Montermini, et L. Tanguy (2008). Extensive data for morphology: Using<br />

the World Wide Web. Journal of French Language Studies, 18(1):67–85.<br />

<strong>Hathout</strong>, N. et F. Namer (1997a). Génération (semi)-automatique de ressources lexicales<br />

réutilisables à grande échelle. Conversion des tables du LADL. In Actes des 1ères JST<br />

FRANCIL. AUPELF-UREF, Avignon.<br />

<strong>Hathout</strong>, N. et F. Namer (1997b). (Semi-)automatic generation of ALEP analysis lexicon.<br />

In Proceedings of the 3rd ALEP User Group Workshop. Saarbrücken.<br />

<strong>Hathout</strong>, N. et F. Namer (1998). Automatic construction and validation of French large<br />

lexical resources: Reuse of verb theoretical linguistic descriptions. In Proceedings of<br />

the First International Conference on Language Resources and Evaluation, pp. 627–636.<br />

ELRA, Granada.<br />

<strong>Hathout</strong>, N., F. Namer, et G. Dal (2002). An experimental constructional database: The<br />

MorTAL project. In P. Boucher, éd., Many Morphologies, pp. 178–209. Cascadilla, Somerville,<br />

Mass.<br />

<strong>Hathout</strong>, N., F. Namer, M. Plénat, et L. Tanguy (<strong>2009</strong>a). La collecte et l’utilisation des<br />

données en morphologie. In B. Fradin, F. Kerleroux, et M. Plénat, éds., Aperçus de<br />

morphologie du français, pp. 267–287. Presses universitaires de Vincennes, Saint-Denis.<br />

<strong>Hathout</strong>, N., M. Plénat, et L. Tanguy (2003). Enquête sur les dérivés en -able. Cahiers de<br />

grammaire, 28:49–90.


132 Bibliographie<br />

<strong>Hathout</strong>, N. et M. Roché, éds. (2003). Cahiers de grammaire, 28. <strong>ERSS</strong>, <strong>Toulouse</strong>. « Morphologie<br />

et lexique ».<br />

<strong>Hathout</strong>, N., F. Sajous, et L. Tanguy (<strong>2009</strong>b). Looking for French deverbal nouns in an<br />

evolving Web (a short history of WAC). In Proceedings of Web as Corpus <strong>2009</strong> (WAC5).<br />

San Sebastian.<br />

<strong>Hathout</strong>, N. et L. Tanguy (2002a). Autodétection des Webnéologismes. Communication<br />

au Colloque TALN, Corpus et Web. Maison des Sciences de l’Homme, Saint-Denis.<br />

<strong>Hathout</strong>, N. et L. Tanguy (2002b). Webaffix : Finding and validating morphological links<br />

on the WWW. In Proceedings of the Third International Conference on Language Resources<br />

and Evaluation, pp. 1799–1804. ELRA, Las Palmas de Gran Canaria.<br />

<strong>Hathout</strong>, N. et L. Tanguy (2006). Webaffix : Une boîte à outils d’acquisition lexicale à<br />

partir du Web. Revue québéquoise de linguistique, 32(1):61–84.<br />

Hay, J. B. (2000). Causes and Consequences of Word Structure. Thèse de PhD, Northwestern<br />

University, Evanston, IL.<br />

Hay, J. B. et R. H. Baayen (2005). Shifting paradigms: Gradient structure in morphology.<br />

Trends in Cognitive Sciences, 9(7):342–348.<br />

Hayes, P. J. (1985). Naive physics I: Ontology for liquids. In J. R. Hobbs et R. C. Moore,<br />

éds., Formal Theories of the Commonsense World. Ablex Publishing Corporation, Norwood,<br />

NJ.<br />

Herskovits, A. (1982). Space and the Prepositions in English: Regularities and Irregularities<br />

in a Complex Domain. Thèse de PhD, Stanford University, Stanford, CA.<br />

Heyna, F. (2008). Sémantisme et potentiel argumentatif des dérivés dénominaux en anti-.<br />

Discours, 2. discours.revues.org/index2022.html.<br />

Jackendoff, R. (1975). Morphological and semantic regularities in the lexicon. Language,<br />

51(3):639–671.<br />

Jacquemin, C. (1997). Guessing morphology from terms and corpora. In Proceedings of<br />

20th Annual International ACM SIGIR Conference on Research and Development in<br />

Information Retrieval (SIGIR-97), pp. 156–167. ACM, Philadelphia, PA.<br />

Jacquemin, C. et E. Tzoukermann (1999). NLP for term variant extraction: Synergy between<br />

morphology, lexicon, ans syntax. In T. Strzalkowski, éd., Natural Language Information<br />

Retrieval, pp. 25–74. Kluwer Academic Publishers, Dordrecht.<br />

Jaffar, J. et J.-L. Lassez (1987). Constraint logic programming. In Proceedings of the Fourteenth<br />

ACM Symposium of the Principles of Programming Languages, pp. 111–119. Munich.


Bibliographie 133<br />

Jaffar, J. et M. J. Maher (1994). Constraint logic programming: A survey. Journal of Logic<br />

Programming, 19 & 20:503–581.<br />

Jing, H. et E. Tzoukermann (1999). Information retrieval based on context distance and<br />

morphology. In Proceedings of 22th Annual International ACM SIGIR Conference<br />

on Research and Development in Information Retrieval (SIGIR-99), pp. 90–96. ACM,<br />

Berkeley, CA.<br />

Jurafsky, D. et J. H. Martin (2000). Speech and language processing. Prentice-Hall, Upper<br />

Saddle River, NJ.<br />

Kamp, H. (1981). A theory of truth and semantics representation. In J. Groenendijk,<br />

T. Jansen, et M. Stokhof, éds., Formal Methods in the Study of Language. Mathematical<br />

Centre Tracts, Amsterdam.<br />

Kerleroux, F. (2007). Pêcheurs sous la glace. In E. Delais-Roussarie et L. Labrune, éds.,<br />

Des sons et des sens : données et modèles en phonologie et en morphologie, pp. 141–154.<br />

Hermes-Lavoisier, Paris.<br />

Kohonen, T. (1995). Self-Organizing Maps. Springer Verlag, Berlin / Heidelberg.<br />

Koskiennemi, K. (1983). Two-level model for morphological analysis. In Proceedings of<br />

8th IJCAI, pp. 683–685. Karlsruhe.<br />

Kurimo, M., M. Creutz, et M. Varjokallio (2007). Unsupervised morpheme analysis evaluation<br />

by a comparison to a linguistic gold standard – Morpho Challenge 2007. In<br />

Working Notes for the CLEF 2007 Workshop. clef.isti.cnr.it/2007/working_notes/<br />

kurimo_varjokallioCLEF2007_MC1.pdf.<br />

Kurimo, M. et M. Varjokallio (2008). Unsupervised morpheme analysis evaluation by a<br />

comparison to a linguistic gold standard – Morpho Challenge 2008. In Working Notes<br />

for the CLEF 2008 Workshop. www.clef-campaign.org/2008/working_notes/kurimo1paperCLEF2008.pdf.<br />

Langlais, P. (<strong>2009</strong>). Étude quantitative de liens entre l’analogie formelle et la morphologie<br />

constructionnelle. In Actes de la 16 e conférence sur le traitement automatique des langues<br />

naturelles (TALN-<strong>2009</strong>). ATALA, Senlis.<br />

Langlais, P. et A. Patry (2007). Translating unknown words by analogical learning. In<br />

Proceedings of the Conference on Empirical Methods in Natural Language Processing<br />

and the Conference on Computational Natural Language <strong>Le</strong>arning, EMNLP-CoNLL<br />

2007, pp. 877–886. ACL, Prague.<br />

Langlais, P. et A. Patry (2008). Enrichissement d’un lexique bilingue par apprentissage<br />

analogique. Traitement automatique des langues, 49(1):13–40.<br />

Langlais, P. et F. Yvon (2008). Scaling up analogical learning. In Proceedings of the 22nd International<br />

Conference on Computational Linguistics (COLING 2008), p. 51–54. Manchester.


134 Bibliographie<br />

Langlais, P., F. Yvon, et P. Zweigenbaum (<strong>2009</strong>). Improvements in analogical learning:<br />

Application to translating multi-terms of the medical domain. In Proceedings of the 12th<br />

Conference of the European Chapter of the Association for Computational Linguistics<br />

(EACL-09), p. 487–495. Athène.<br />

<strong>Le</strong>bart, L. et A. Salem (1994). Statistique textuelle. Dunod, Paris.<br />

<strong>Le</strong>bart, L., A. Salem, et L. Berry (1998). Exploring textual data. Kluwer Academic Publishers,<br />

Dordrecht.<br />

<strong>Le</strong>page, Y. (1998). Solving analogies on words: An algorithm. In Proceedings of COLING-<br />

ACL-98, volume 2, pp. 728–735. Montréal.<br />

<strong>Le</strong>page, Y. (2000). Languages of analogical strings. In Proceedings of the 18th International<br />

Conference on Computational Linguistics (COLING-2000), pp. 488–494. ACL,<br />

Saarbrücken.<br />

<strong>Le</strong>page, Y. (2003). De l’analogie rendant compte de la commutation en linguistique. Habilitation<br />

à diriger des recherches, <strong>Université</strong> Joseph Fourier, Grenoble.<br />

<strong>Le</strong>vkovych, O. (2004). <strong>Le</strong>s mots français en anti-. Mémoire de DEA, <strong>Université</strong> de <strong>Toulouse</strong><br />

<strong>II</strong>-<strong>Le</strong> <strong>Mirail</strong>, <strong>Toulouse</strong>.<br />

Lignon, S. (2000). La suffixation en -ien. Aspects sémantiques et phonologiques. Thèse de<br />

doctorat, <strong>Université</strong> de <strong>Toulouse</strong> <strong>II</strong>-<strong>Le</strong> <strong>Mirail</strong>, <strong>Toulouse</strong>.<br />

Lignon, S. (2010). Entre histoire et morphophonologie, quelle distribution pour -éen vs<br />

-ien. In M. Roché, G. Boyé, N. <strong>Hathout</strong>, S. Lignon, et M. Plénat, Des unités morphologiques<br />

au lexique. Manuscrit.<br />

Lignon, S. et M. Plénat (<strong>2009</strong>). Échangisme suffixal et contraintes phonologiques. In<br />

B. Fradin, F. Kerleroux, et M. Plénat, éds., Aperçus de morphologie du français, pp. 65–<br />

81. Presses universitaires de Vincennes, Saint-Denis.<br />

Lombard, A. (1964). <strong>Le</strong> rôle des semi-voyelles et leur concurrence avec les voyelles correspondantes<br />

dans la prononciation parisienne. CWK Gleerup, Lund.<br />

McCarthy, J. et A. Prince (1993). Prosodic Morphology: Constraint Interaction and Satisfaction.<br />

Technical report 3, Rutgers University Center for Cognitive Science, New<br />

Brunswick, NJ.<br />

Meunier, F., G. Dal, B. Fradin, et N. <strong>Hathout</strong> (2007). Rôle de la productivité des procédés<br />

morphologiques dans la reconnaissance de lexèmes complexes. In N. <strong>Hathout</strong> et F. Montermini,<br />

éds., Morphologie à <strong>Toulouse</strong>. Actes du colloque international de morphologie 4 es<br />

Décembrettes, numéro 37 in LINCOM Studies in Theoretical Linguistics, pp. 291–312.<br />

Lincom Europa, Munich.


Bibliographie 135<br />

Miller, G. A., R. Beckwith, C. Fellbaum, D. Gross, et K. J. Miller (1990). Introduction to<br />

WordNet: An on-line lexical database. International Journal of <strong>Le</strong>xicography, 3(4):335–<br />

391.<br />

Montermini, F. (2002). <strong>Le</strong> système préfixal en italien comtemporain. Thèse de doctorat,<br />

<strong>Université</strong> de Paris X - Nanterre & Università degli Studi di Bologna, Paris / Bologne.<br />

Montermini, F. (2008). Il lato sinistro della morfologia. La prefissazione in italiano e nelle<br />

lingue del mondo. FrancoAngeli, Milan.<br />

Montermini, F., G. Boyé, et N. <strong>Hathout</strong>, éds. (2007). Selected Proceedings of the 5th Décembrettes:<br />

Morphology in <strong>Toulouse</strong>, Cascadilla Proceedings Project. Cascadilla Press,<br />

Somerville, MA.<br />

Moreau, F., V. Claveau, et P. Sébillot (2007). Automatic morphological query expansion<br />

using analogy-based machine learning. In Proceedings of the 29th European Conference<br />

on Information Retrieval (ECIR 2007), pp. 222–233. Rome.<br />

Morin, Y.-C. (1971). Computer experiments in generative phonology, low-level French<br />

phonology. Natural language studies 11, Department of Computer and Communication<br />

Science, Universty of Michigan, Ann Arbor, MI.<br />

Muller, P., N. <strong>Hathout</strong>, et B. Gaume (2006). Synonym extraction using a semantic distance<br />

on a dictionary. In D. Radev et R. Mihalcea, éds., Proceedings of the HLT/NAACL<br />

Workshop Textgraphs, pp. 65–72. ACL, New York, NY.<br />

Namer, F. (2003a). Acquisition automatique de sens à partir d’opérations morphologiques<br />

en français. Cahiers de grammaire, 28:31–48.<br />

Namer, F. (2003b). WaliM: Valider les unités morphologiques complexes par le Web. In<br />

<strong>Le</strong>s unités morphologiques. Actes du 3 e forum de morphologie, numéro 3 in Silexicales,<br />

pp. 142–150. Presses universitaires de Lille, Villeneuve d’Ascq.<br />

Namer, F. (2005). La morphologie constructionnelle du français et les propriétés sémantiques<br />

du lexique : Traitement automatique et modélisation. Habilitation à diriger des<br />

recherches, <strong>Université</strong> de Nancy 2, Nancy.<br />

Neuvel, S. et S. A. Fulop (2002). Unsupervised learning of morphology without morphemes.<br />

In Proceedings of the ACL Workshop on Morphological and Phonological <strong>Le</strong>arning<br />

2002. ACL, Philadelphia, Penn.<br />

Neuvel, S. et R. Singh (2001). Vive la différence ! What morphology is about. Folia linguistica,<br />

35(3-4):313–320.<br />

New, B., M. Brysbaert, J. Segui, L. Ferrand, et K. Rastle (2004). The processing of singular<br />

and plural nouns in French and English. Journal of Memory and Language, 51(4):568–<br />

585.


136 Bibliographie<br />

Perruchet, P. et A. Vinter (1998). Parser: A model for word segmentation. Journal of<br />

Memory and Language, 39:246–263.<br />

Perruchet, P. et A. Vinter (2002). The self organising consciousness: A framework for implicit<br />

learning. In R. M. French et A. Cleeremans, éds., Implicit <strong>Le</strong>arning and Consciousness.<br />

An empirical, philosophical and computational consensus in the making, pp. 41–67.<br />

Psychology Press, London, UK.<br />

Pirrelli, V. (2007). On the cognitive autonomy of language morphology. In N. <strong>Hathout</strong><br />

et F. Montermini, éds., Morphologie à <strong>Toulouse</strong>. Actes du colloque international de morphologie<br />

4 es Décembrettes, numéro 37 in LINCOM Studies in Theoretical Linguistics,<br />

pp. 245–269. Lincom Europa, Munich.<br />

Pirrelli, V., B. Calderone, I. Herreros, et M. Virgilio (2004). Non-locality all the way<br />

through: Emergent global constraints in the Italian morphological lexicon. In Proceedings<br />

of the Seventh Meeting of the ACL Special Interest Group in Computational Phonology,<br />

pp. 11–19. ACL, Barcelone.<br />

Pirrelli, V. et S. Federici (1994). "Derivational" paradigms in morphonology. In Proceedings<br />

of the 15th International Conference on Computational Linguistics (Coling 1994).<br />

Kyoto, Japon.<br />

Pirrelli, V. et I. Herreros (2007). <strong>Le</strong>arning morphology by itself. In G. E. Booij, L. Ducceschi,<br />

B. Fradin, E. Guevara, A. Ralli, et S. Scalise, éds., Proceedings of the Fifth Mediterranean<br />

Morphology Meeting (MMM5), pp. 269–290. Università degli Studi di Bologna,<br />

Bologne.<br />

Pirrelli, V. et F. Yvon (1999). The hidden dimension: A paradigmatic view of data-driven<br />

NLP. Journal of Experimental & Theoretical Artificial Intelligence, 11(3):391–408.<br />

Plaut, D. C. et L. M. Gonnerman (2000). Are non-semantic morphological effects incompatible<br />

with a distributed connectionist approach to lexical processing? Language and<br />

Cognitive Processes, 15(4/5):445–485.<br />

Ploux, S. et B. Victorri (1998). Constructions d’espaces sémantiques à l’aide de dictionnaires<br />

de synonymes. Traitement automatique des langues, 39(1):161–182.<br />

Plénat, M. (1988). Morphologie des adjectifs en -able. Cahiers de grammaire, 13:101–132.<br />

Plénat, M. (2000). Quelques thèmes de recherche actuels en morphophonologie française.<br />

Cahiers de lexicologie, 77:27–62.<br />

Plénat, M. (2005). Brèves remarques sur les déverbaux en -ette. In F. Lambert et H. Nølke,<br />

éds., La syntaxe au coeur de la grammaire. Recueil offert en hommage pour le 60 e anniversaire<br />

de Claude Muller, pp. 245–258. Presses universitaires de Rennes, Rennes.<br />

Plénat, M. (2008). La liaison « obligatoire » avec et sans enchaînement. In J. Durand,<br />

B. Habert, et B. Laks, éds., Actes du Congrès Mondial de Linguistique Française (CMLF-<br />

2008), pp. 1657–1667. ILF, Paris.


Bibliographie 137<br />

Plénat, M. (<strong>2009</strong>). <strong>Le</strong>s contraintes de taille. In B. Fradin, F. Kerleroux, et M. Plénat,<br />

éds., Aperçus de morphologie du français, pp. 47–63. Presses universitaires de Vincennes,<br />

Saint-Denis.<br />

Plénat, M., N. <strong>Hathout</strong>, et O. <strong>Le</strong>vkovych (2004a). Morphologie et recyclage : <strong>Le</strong> cas de<br />

anti-. Communication aux 3 es Décembrettes. <strong>Toulouse</strong>.<br />

Plénat, M., N. <strong>Hathout</strong>, et A. Ruttik (2004b). <strong>Le</strong>s noms déverbaux en -ette du français.<br />

Communication au Colloque international sur les noms déverbaux. Silex, <strong>Université</strong> de<br />

Lille 3, Villeneuve-d’Asq.<br />

Plénat, M. et M. Roché (2003). Prosodic constraints on suffixation in French. In G. E.<br />

Booij, J. DeCesaris, A. Ralli, et S. Scalise, éds., Topics in Morphology. Selected Papers<br />

from the Third Mediterranean Morphology Meeting, pp. 285–299. Universitat Pompeu<br />

Fabra, Barcelone.<br />

Plénat, M., L. Tanguy, S. Lignon, et N. Serna (2002). La conjecture de Pichon. Corpus,<br />

1:105–150.<br />

Prince, A. et P. Smolensky (1993). Optimality Theory: Constraint Interaction in Generative<br />

Grammar. Technical report 2, Rutgers University Center for Cognitive Science, New<br />

Brunswick, NJ.<br />

Prévot, L., B. Gaume, C.-R. Huang, C.-J. Chen, et S.-K. Hsieh (2008). Building and aligning<br />

Chinese and French paradigmatic graphs. In Proceedings of the 18th International<br />

Congress of Linguists (CIL 18). Séoul.<br />

Rajman, M., J. <strong>Le</strong>comte, et P. Paroubek (1997). Format de description lexicale pour le<br />

français. Partie 2 : Description morpho-syntaxique. Rapport technique, EPFL & INaLF.<br />

GRACE GTR-3-2.1.<br />

Rey, A. (1968). Un champs préfixal : <strong>Le</strong>s mots français en anti-. Cahiers de lexicologie,<br />

12(1):37–57.<br />

Roché, M. (1997). Briard, bougeoir et camionneur. Dérivés aberrants, dérivés possibles. In<br />

D. Corbin, B. Fradin, B. Habert, F. Kerleroux, et M. Plénat, éds., Mots possibles et mots<br />

existants. 1 res rencontres du forum de morphologie, volume 1 de Silexicales, pp. 241–250.<br />

Villeneuve-d’Asq.<br />

Roché, M. (2003a). De la « bonne formation » des dérivés en -on. Cahiers de grammaire,<br />

28:91–112.<br />

Roché, M. (2003b). L’interfixe est-il une unité morphologique ? In B. Fradin, G. Dal,<br />

N. <strong>Hathout</strong>, F. Kerleroux, M. Plénat, et M. Roché, éds., <strong>Le</strong>s unités morphologiques. Actes<br />

du 3 e forum de morphologie, pp. 169–178. <strong>Université</strong> de Lille 3, Villeneuve d’Ascq.


138 Bibliographie<br />

Roché, M. (2005). Sur une classe d’adjectifs par conversion. In I. Choi-Jonin, M. Bras,<br />

A. Dagnac, et M. Rouquier, éds., Questions de classification en linguistique : Méthodes et<br />

descriptions. Mélanges offerts au Professeur Christian Molinier, pp. 321–347. Peter Lang,<br />

Berne.<br />

Roché, M. (2007). Logique lexicale et morphologie : La dérivation en -isme. In F. Montermini,<br />

G. Boyé, et N. <strong>Hathout</strong>, éds., Selected Proceedings of the 5th Décembrettes:<br />

Morphology in <strong>Toulouse</strong>, pp. 45–58. Cascadilla Press, Somerville, Mass. www.lingref.<br />

com/cpp/decemb/5/paper1614.pdf.<br />

Roché, M. (2008). Structuration du lexique et principe d’économie : <strong>Le</strong> cas des ethniques.<br />

In J. Durand, B. Habert, et B. Laks, éds., Actes du Congrès Mondial de Linguistique<br />

Française (CMLF-2008), pp. 1571–1585. ILF, Paris.<br />

Roché, M. (<strong>2009</strong>). Pour une morphologie lexicale. In La morphologie lexicale est-elle<br />

possible ?, volume 17 de Mémoires de la Société de Linguistique, Nouvelle Série. Éditions<br />

Peeters, <strong>Le</strong>uven.<br />

Roché, M. (2010a). Quel traitement unifié pour les dérivations en -isme et en -iste ? In<br />

M. Roché, G. Boyé, N. <strong>Hathout</strong>, S. Lignon, et M. Plénat, Des unités morphologiques au<br />

lexique. Manuscrit.<br />

Roché, M. (2010b). Quelle morphologie ? In M. Roché, G. Boyé, N. <strong>Hathout</strong>, S. Lignon,<br />

et M. Plénat, Des unités morphologiques au lexique. Manuscrit.<br />

Roché, M. (en préparation). Propositions en morphologie lexicale. Carnets de grammaire,<br />

CLLE-<strong>ERSS</strong>, <strong>Toulouse</strong>.<br />

Roché, M., G. Boyé, N. <strong>Hathout</strong>, S. Lignon, et M. Plénat (2010). Des unités morphologiques<br />

au lexique. Manuscrit.<br />

Rumelhart, D. E. et J. L. MacClelland (1986). On learning the past tenses of English verbs.<br />

Implicit rules or parallele distributed processing? In J. L. MacClelland et D. E. Rumelhart,<br />

éds., Parallele Distributed Processing: Explorations in the Microstructure of Cognition,<br />

volume 2, pp. 216–261. MIT Press.<br />

Sajous, F. et L. Tanguy (2006). Repérage de créations lexicales sur le Web francophone.<br />

Communication à la Journée d’étude de l’ATALA sur « <strong>Le</strong> Web comme ressource pour le<br />

TAL ». Paris.<br />

Schone, P. et D. S. Jurafsky (2000). Knowledge-free induction of morphology using latent<br />

semantic analysis. In Proceedings of the Conference on Natural Language <strong>Le</strong>arning 2000<br />

(CoNLL-2000), pp. 67–72. Lisbon.<br />

Seidenberg, M. S. et L. M. Gonnerman (2000). Explaining derivational morphology as the<br />

convergence of codes. Trends in Cognitive Sciences, 4:353–361.


Bibliographie 139<br />

Skousen, R. (1989). Analogical Modeling of Language. Kluwer Academic Publishers, Dordrecht.<br />

Skousen, R. (1992). Analogy and Structure. Kluwer Academic Publishers, Dordrecht.<br />

Stroppa, N. (2005). Définitions et caractérisations de modèles à base d’analogies pour l’apprentissage<br />

automatique des langues naturelles. Thèse de doctorat, École nationale supérieure<br />

des télécommunications, Paris.<br />

Stroppa, N. et F. Yvon (2005). An analogical learner for morphological analysis. In Proceedings<br />

of the 9th Conference on Computational Natural Language <strong>Le</strong>arning (CoNLL-<br />

2005), pp. 120–127. ACL, Ann Arbor, MI.<br />

Stroppa, N. et F. Yvon (2006). Du quatrième de proportion comme principe inductif : une<br />

proposition et son application à l’apprentissage de la morphologie. Traitement automatique<br />

des langues, 47(2):33–59.<br />

Talmy, L. (2000). Toward a Cognitive Semantics. MIT Press, Cambridge, Mass.<br />

Tanguy, L. et N. <strong>Hathout</strong> (2002a). Webaffix : Un outil d’acquisition morphologique dérivationnelle<br />

à partir du Web. In J.-M. Pierrel, éd., Actes de la 9 e conférence annuelle sur<br />

le traitement automatique des langues naturelles (TALN-2002), pp. 245–254. ATALA,<br />

Nancy.<br />

Tanguy, L. et N. <strong>Hathout</strong> (2002b). Webaffix, un outil pour l’étude de la morphologie sur<br />

le web. Communication aux Journées de Morphologie de l’<strong>ERSS</strong>. <strong>Toulouse</strong>.<br />

Tanguy, L. et N. <strong>Hathout</strong> (2003). <strong>Le</strong> français sur internet : recherche automatique de néologismes.<br />

Communication à Multimédia, Internet et Etudes Françaises 2. Vancouver.<br />

Tanguy, L. et N. <strong>Hathout</strong> (2007). Perl pour les linguistes. Programmes en perl pour exploiter<br />

les données langagières. Hermès science-Lavoisier, Paris.<br />

Toussaint, Y., F. Namer, C. Jacquemin, B. Daille, J. Royauté, et N. <strong>Hathout</strong> (1998). Une<br />

approche linguistique et statistique pour l’analyse de l’information en corpus. In Actes<br />

de la 5 e conférence annuelle sur le traitement automatique des langues naturelles (TALN-<br />

98), pp. 182–191. Paris.<br />

Van den Bosch, A. et W. Daelemans (1999). Memory-based morphological analysis. In<br />

Proceedings of the 37th Annual Meeting of the Association of Computational Linguistics.<br />

College Park, MD.<br />

Vandeloise, C. (1986). L’espace en français : sémantique des prépositions spatiales. Seuil,<br />

Paris.<br />

Victorri, B. (1994). The use of continuity in modeling semantic phenomena. In C. Fuchs<br />

et B. Victorri, éds., Continuity in linguistic semantic, pp. 241–251. John Benjamins Publishing<br />

Company, Amsterdam / Philadelphia.


140 Bibliographie<br />

Voir, M. (1982). <strong>Le</strong>s préfixes transcatégoriels. Cahiers de lexicologie, 42(2):31–46.<br />

Xu, J. et W. B. Croft (1998). Corpus-based stemming using co-occurrence of word variants.<br />

ACM Transaction on Information Systems, 16(1):61–81.<br />

Yarowsky, D. et R. Wicentowski (2000). Minimally supervised morphological analysis by<br />

multimodal alignment. In Proceedings of the Association of Computational Linguistics<br />

(ACL-2000), pp. 207–216. Hong Kong.<br />

Yvon, F. (2006). Des apprentis pour le traitement automatique des langues. Habilitation à<br />

diriger des recherches, <strong>Université</strong> Pierre et Marie Curie, Paris.<br />

Yvon, F., N. Stroppa, A. Delhay, et L. Miclet (2004). Solving analogical equations on words.<br />

Rapport interne D005, École Nationale Supérieure des Télécommunications, Paris.<br />

Zribi-Hertz, A. (1973). Recherches sur la préfixation productive en français moderne. Thèse<br />

de doctorat de 3 e cycle, <strong>Université</strong> Paris 8.<br />

Zweigenbaum, P. et N. Grabar (1999). Automatic acquisition of morphological knowledge<br />

for medical language processing. In W. Horn, Y. Shahar, G. Lindberg, S. Andreassen, et<br />

J. Wyatt, éds., Artificial Intelligence in Medicine, <strong>Le</strong>cture Notes in Artificial Intelligence,<br />

pp. 416–420. Springer-Verlag, Berlin.<br />

Zweigenbaum, P. et N. Grabar (2003a). Corpus-based associations provide additional morphological<br />

variants to medical terminologies. In M. Musen, éd., AMIA Annual Fall Symposium<br />

2003, pp. 768–772. Washington, DC.<br />

Zweigenbaum, P. et N. Grabar (2003b). <strong>Le</strong>arning derived words from medical corpora. In<br />

9th Conference on Artificial Intelligence in Medicine Europe, pp. 189–198. Chypre.<br />

Zweigenbaum, P., F. Hadouche, et N. Grabar (2003). Apprentissage de relations morphologiques<br />

en corpus. In Actes de la 10 e conférence annuelle sur le traitement automatique<br />

des langues naturelles (TALN-2003), pp. 285–294. ATALA, Batz-sur-mer.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!