Variabilité et traitement automatique des langues
Par cette contribution, nous souhaitons proposer une analyse de la variation, principalement diatopique, appliquée aux
séquences figées, grâce à une ressource que nous avons développée pour le Traitement Automatique des Langues (TAL). Le grand nombre de
variantes qui apparaissent dans les corpus nous a conduit à effectuer une analyse exhaustive de ces constructions afin de permettre aux
utilisateurs et aux applications TAL, d’utiliser correctement ces séquences figées. Les données textuelles auxquelles
les méthodes et outils du TAL doivent faire face sont variées, volumineuses et de qualités plus ou moins inégales. Enfin, pour accéder au sens des textes, le TAL est confronté aux difficultés que sont les caractéristiques intrinsèques des langues naturelles.
Article outline
- Introduction
- 1.Les difficultés du TAL
- 1.1Le non-dit
- 1.2La polysémie
- 1.3Le figement
- 2.Le traitement du figement : constat
- 2.1Difficultés
- 2.2La variabilité linguistique
- 3.Projet
- 3.1Constitution du corpus
- 3.2La ressource
- Conclusion
- Remarques
-
Œuvres citées
-
Dictionnaires
Article language: French
References (31)
Œuvres citées
Buscaldi, D., Grezka, A. & Lejeune, G. 2017.
Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du deft 2017. Actes du 13e Défi Fouille de Texte (DEFT 2017), TALN 2017 (Orléans, France), 65–76.
Cartier, E. 2010. Repérage automatique des expressions figées : état des lieux, perspectives. In P. Mogorron & S. Mejri (éds), Opacité, idomaticité, traduction (Rencontre Méditerranéennes 3), 79–98. Universidad de Alicante.
Colson, J.-P. 2010. La traduction spécialisée basée sur les corpus : une expérience dans le domaine informatique. Synergies Tunisie, 21, 115–123.
Constant, M. 2012. Mettre les expressions multi-mots au cœur de l’analyse automatique de textes : sur l’exploitation de ressources symboliques externes. Traitement du texte et du document. Thèse d’HDR. Université Paris-Est. [URL]
Gadet, F. 1997. Le français populaire. Paris: PUF.
Gadet, F. 2007. La variation sociale en français. Paris: Ophrys.
Gayral, F. 2001. Traitement automatique et polysémie des verbes. Syntaxe et sémantique, 2 (1), 241–257. 

Grezka, A. 2006. Les prédicats de perception. Traitement de la polysémie (Les sens des sens). Thèse de doctorat en Sciences du Langage, Université Paris XIII, Villetaneuse.
Grezka, A. 2009. La polysémie des verbes de perception visuelle. Paris: L’Harmattan.
Grezka, A. & Viguier, M.-H. (eds.) 2017. Figement en mouvement et complexité en devenir : regards sur quelques problèmes liés aux structures défigées et complexes. Études de linguistique appliquée, 1861.
Grezka, A., Niziołek, M. & Buscaldi, D. 2019. Description de quelques procédés linguistiques de l’ironie, par le biais des tweets sur les transports en commun en français et en polonais. Studia Romanica Posnaniensia, 46 (1), 43–64. 

Gross, G. 1996. Les expressions figées en français : noms composés et autres locutions. Paris: Ophrys.
Gross, G. 2012. Manuel d’analyse linguistique – Approche sémantico-syntaxique du lexique. Villeneuve-d’Ascq: Presses universitaires du Septentrion.
Kerbrat-Orecchioni, C. 1986. L’implicite. Paris: A. Colin.
Klein, J. & Lamiroy, B. 2016. Pour une analyse diatopique des expressions verbales figées : une approche variationniste. In: S. Mejri & G. Gross (éds), Phraséologie et profils combinatoires. Lexique, syntaxe et sémantique, 91–102. Paris: Champion.
Labov, W. 1966. The social stratification of English in New York City. Washington DC: Centre for Applied Linguistics.
Labov, W. 1976.
Sociolinguistique (Traduction française de Labov (1972) Sociolinguistic patterns
. Philadelphie: University of Pennsylvania Press). Paris: Minuit.
Lamiroy, B. 2008. Le figement : à la recherche d’une définition. Zeitschrift für Französische Sprache und Literatur, Beiheft 361, 85–99.
Lamiroy, B. (coord.), Klein, J. R., Labelle, J., Leclère, C., Meunier, A. & Rossari, C. 2010. Les expressions verbales figées de la francophonie : Belgique, France, Québec, Suisse. Paris: Ophrys.
Mathieu-Colas, M. 2009.
Morfetik, une ressource lexicale pour le TAL. Cahiers de Lexicologie, 941, 137–146.
Mejri, S. 2003. Le figement lexical. Cahiers de lexicologie, 821, 23–39.
Reforgiato Recupero, D., Alam, M., Buscaldi, D., Grezka, A. & Tavazoee, F. 2019. Frame-Based Detection of Figurative Language in Tweets [Application Notes]. IEEE Computational Intelligence Magazine, 14 (4), 77–88. 

Sinclair, J. 1991. Corpus, Concordance, Collocation. Oxford: Oxford University Press.
Victorri, B. 1997. La polysémie : un artefact de la linguistique. Revue de sémantique et pragmatique, 21, 41–62.
Dictionnaires
Avanzi, M. 2017. Atlas du français de nos régions, Armand colin.
Avanzi, M. 2019. Parlez-vous (les) français ? ; Atlas des expressions de nos régions, Armand colin.
Boulanger, J.-C., Dugas, J.-Y. et B. de Bessé (dir.). 1992. Dictionnaire québécois d’aujourd’hui : langue française, histoire, géographie/culture, Montréal, DicoRobert inc.
Delcourt, C. 1998. Dictionnaire du français de Belgique, 21 volumes, Le Cri.
Desruisseaux, P. 1995. Le Dictionnaire des expressions québécoises, Bibliothèque québécoise.
Gazaille, M.-P. 2019. Pour les Nuls – : Le parler québécois, Guide de conversation Pour les Nuls, 2e édition.
Rézeau, P. 2001 (éd.). InaLF, Dictionnaire des régionalismes de France, Géographie et histoire d’un patrimoine linguistique, Bruxelles, De Boeck- Duculot (Larcier).
Cited by (1)
Cited by one other publication
Ganfi, Vittorio, Valentina Piunno & Lunella Mereu
This list is based on CrossRef data as of 22 october 2024. Please note that it may not be complete. Sources presented here have been supplied by the respective publishers.
Any errors therein should be reported to them.