Variabilité et traitement automatique des langues
Par cette contribution, nous souhaitons proposer une analyse de la variation, principalement diatopique, appliquée aux
séquences figées, grâce à une ressource que nous avons développée pour le Traitement Automatique des Langues (TAL). Le grand nombre de
variantes qui apparaissent dans les corpus nous a conduit à effectuer une analyse exhaustive de ces constructions afin de permettre aux
utilisateurs et aux applications TAL, d’utiliser correctement ces séquences figées. Les données textuelles auxquelles
les méthodes et outils du TAL doivent faire face sont variées, volumineuses et de qualités plus ou moins inégales. Enfin, pour accéder au sens des textes, le TAL est confronté aux difficultés que sont les caractéristiques intrinsèques des langues naturelles.
Article outline
- Introduction
- 1.Les difficultés du TAL
- 1.1Le non-dit
- 1.2La polysémie
- 1.3Le figement
- 2.Le traitement du figement : constat
- 2.1Difficultés
- 2.2La variabilité linguistique
- 3.Projet
- 3.1Constitution du corpus
- 3.2La ressource
- Conclusion
- Remarques
-
Œuvres citées
-
Dictionnaires
Article language: French
References
Œuvres citées
Buscaldi, D., Grezka, A. & Lejeune, G.
2017
Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du deft 2017. Actes du 13e Défi Fouille de Texte (DEFT 2017),
TALN 2017 (Orléans, France), 65–76.
Cartier, E.
2010 Repérage automatique des expressions figées : état des lieux, perspectives. In
P. Mogorron &
S. Mejri (éds),
Opacité, idomaticité, traduction (
Rencontre Méditerranéennes 3), 79–98. Universidad de Alicante.
Colson, J.-P.
2010 La traduction spécialisée basée sur les corpus : une expérience dans le domaine informatique.
Synergies Tunisie, 21, 115–123.
Constant, M.
2012 Mettre les expressions multi-mots au cœur de l’analyse automatique de textes : sur l’exploitation de ressources symboliques externes. Traitement du texte et du document. Thèse d’HDR. Université Paris-Est.
[URL]
Gadet, F.
1997 Le français populaire. Paris: PUF.
Gadet, F.
2007 La variation sociale en français. Paris: Ophrys.
Gayral, F.
2001 Traitement automatique et polysémie des verbes.
Syntaxe et sémantique, 2 (1), 241–257.
Grezka, A.
2006 Les prédicats de perception. Traitement de la polysémie (Les sens des sens). Thèse de doctorat en Sciences du Langage, Université Paris XIII, Villetaneuse.
Grezka, A.
2009 La polysémie des verbes de perception visuelle. Paris: L’Harmattan.
Grezka, A. & Viguier, M.-H.
(eds.) 2017 Figement en mouvement et complexité en devenir : regards sur quelques problèmes liés aux structures défigées et complexes.
Études de linguistique appliquée, 1861.
Grezka, A., Niziołek, M. & Buscaldi, D.
2019 Description de quelques procédés linguistiques de l’ironie, par le biais des tweets sur les transports en commun en français et en polonais.
Studia Romanica Posnaniensia, 46 (1), 43–64.
Gross, G.
1996 Les expressions figées en français : noms composés et autres locutions. Paris: Ophrys.
Gross, G.
2012 Manuel d’analyse linguistique – Approche sémantico-syntaxique du lexique. Villeneuve-d’Ascq: Presses universitaires du Septentrion.
Kerbrat-Orecchioni, C.
1986 L’implicite. Paris: A. Colin.
Klein, J. & Lamiroy, B.
2016 Pour une analyse diatopique des expressions verbales figées : une approche variationniste. In:
S. Mejri &
G. Gross (éds),
Phraséologie et profils combinatoires. Lexique, syntaxe et sémantique, 91–102. Paris: Champion.
Labov, W.
1966 The social stratification of English in New York City. Washington DC: Centre for Applied Linguistics.
Labov, W.
1976
Sociolinguistique (Traduction française de Labov (1972) Sociolinguistic patterns
. Philadelphie: University of Pennsylvania Press). Paris: Minuit.
Lamiroy, B.
2008 Le figement : à la recherche d’une définition.
Zeitschrift für Französische Sprache und Literatur, Beiheft 361, 85–99.
Lamiroy, B. (coord.), Klein, J. R., Labelle, J., Leclère, C., Meunier, A. & Rossari, C.
2010 Les expressions verbales figées de la francophonie : Belgique, France, Québec, Suisse. Paris: Ophrys.
Mathieu-Colas, M.
2009
Morfetik, une ressource lexicale pour le TAL.
Cahiers de Lexicologie, 941, 137–146.
Mejri, S.
2003 Le figement lexical.
Cahiers de lexicologie, 821, 23–39.
Reforgiato Recupero, D., Alam, M., Buscaldi, D., Grezka, A. & Tavazoee, F.
2019 Frame-Based Detection of Figurative Language in Tweets [Application Notes].
IEEE Computational Intelligence Magazine, 14 (4), 77–88.
Sinclair, J.
1991 Corpus, Concordance, Collocation. Oxford: Oxford University Press.
Victorri, B.
1997 La polysémie : un artefact de la linguistique.
Revue de sémantique et pragmatique, 21, 41–62.
Dictionnaires
Avanzi, M.
2017 Atlas du français de nos régions, Armand colin.
Avanzi, M.
2019 Parlez-vous (les) français ? ; Atlas des expressions de nos régions, Armand colin.
Boulanger, J.-C., Dugas, J.-Y. et B. de Bessé
(dir.) 1992 Dictionnaire québécois d’aujourd’hui : langue française, histoire, géographie/culture, Montréal, DicoRobert inc.
Delcourt, C.
1998 Dictionnaire du français de Belgique, 21 volumes, Le Cri.
Desruisseaux, P.
1995 Le Dictionnaire des expressions québécoises, Bibliothèque québécoise.
Gazaille, M.-P.
2019 Pour les Nuls – : Le parler québécois, Guide de conversation Pour les Nuls, 2
e édition.
Rézeau, P.
2001 (éd.).
InaLF, Dictionnaire des régionalismes de France, Géographie et histoire d’un patrimoine linguistique, Bruxelles, De Boeck- Duculot (Larcier).
Cited by
Cited by 1 other publications
Ganfi, Vittorio, Valentina Piunno & Lunella Mereu
This list is based on CrossRef data as of 18 june 2024. Please note that it may not be complete. Sources presented here have been supplied by the respective publishers.
Any errors therein should be reported to them.