The corpus in language sciences, a place for verifying language issues

Authors

DOI:

https://doi.org/10.18778/2392-0718.12.02

Keywords:

corpus, language sciences, choice and limits, homogeneity and representativeness, reliability

Abstract

The subject of the article addresses the question of corpus in language sciences. It highlights the main aspects relating to the constitution of a well-considered corpus to serve as a theoretical basis. This presentation is a synthesis of approaches allowing beginning researchers to constitute, delimit and explore certain aspects of language in order to launch well-founded scientific research. It shows that the results of research in language sciences should be drawn from the tangible data of a corpus before formulating any new theory, invalidating or calling into question another. The material in terms of content calls upon the opinions of corpus specialists with regard to the assigned definitions, the role of corpus for linguistic studies, its choice, its delimitation, its homogeneity, its representativeness, the nature of its components and its constraints. This article gradually shows the main facets to take into account in the constitution of the corpus in order to allow researchers to guarantee the reliability of the results.

References

ADAM, J.-M. & VIPREY J.-M. (2009). Corpus de textes, textes en corpus. Problématique et présentation. Corpus, 8, pp. 5-25.
Google Scholar DOI: https://doi.org/10.4000/corpus.1672

BRONCKART, J.-P. (2008). Genres de textes, types de discours et degrés de langue. Hommage à François Rastier. Texto [en ligne]. Dialogues et débats. URL : https://www.revue-texto.net/index.php?id=86
Google Scholar

CAPT,V., JACQUIN, J. & MICHELI, R. (2009). Les sphères de contextualisation. Réflexion méthodologique sur les passages de texte à texte(s) et la constitution des corpus. Corpus, 8, pp. 129-147.
Google Scholar DOI: https://doi.org/10.4000/corpus.1685

CHARAUDEAU, P. (2009). Dis-moi quel est ton corpus, je te dirai quelle est ta problématique. Corpus, 8, pp. 37-66.
Google Scholar DOI: https://doi.org/10.4000/corpus.1674

CISLARU, G., SITRI, F. (2012). De l’émergence à l’impact social des discours : hétérogénéités d’un corpus. Langages, Armand Colin, pp.59-72.
Google Scholar DOI: https://doi.org/10.3917/lang.187.0059

CNRTL (Centre National des Ressources Textuelles et Lexicales). https://www.cnrtl.fr/definition/corpus [7/05/2021].
Google Scholar

COMBY, É., MOSSET, Y. (2016). Le corpus à l’interface des humanités et des sciences sociales. Dans Corpus de textes : composer, mesurer, interpréter. Lyon : ENS Éditions. http://books.openedition.org/enseditions/7341 DOI : https://doi.org/10.4000/books.enseditions.7341
Google Scholar DOI: https://doi.org/10.4000/books.enseditions.7341

DALBERA, J-P. (2002). Le corpus entre données, analyse et théorie. Corpus, 1. http://journals.openedition.org/corpus/10 ; DOI : https://doi.org/10.4000/corpus.10
Google Scholar DOI: https://doi.org/10.4000/corpus.10

GARRIC, N. (2012). Construire et maîtriser l’hétérogénéité par la variation des données, des corpus et des méthodes. Langages 3,187, pp. 73-92. DOI : 10.3917/lang.187.0073
Google Scholar DOI: https://doi.org/10.3917/lang.187.0073

HABERT, B. (2000). Des corpus représentatifs : de quoi, pour quoi, comment ? In BILGER, M., editor, Linguistique sur corpus. Études et réflexions, number 31 in Cahiers de l’université de Perpignan, pp. 11-58. Perpignan : Presses Universitaires de Perpignan.
Google Scholar

LE PETIT ROBERT. DICTIONNAIRE ALPHABETIQUE ET ANALOGIQUE DE LA LANGUE FRANÇAISE(1989). dirigé par Alain Rey et Josette Rey-Debove. Paris : Société du Nouveau Littré/Le Robert.
Google Scholar

MAGNANI, E. (2017). Qu’est-ce qu’un corpus ? Compte-rendu de la journée d’études. https://irht.hypotheses.org/3187 [18/04/2021].
Google Scholar

MAYAFFRE, D. (2002). Les corpus réflexifs : entre architextualité et hypertextualité. Corpus, 1. http://corpus.revues.org/11 ; DOI : https://doi.org/10.4000/corpus.11
Google Scholar DOI: https://doi.org/10.4000/corpus.11

MAYAFFRE, D. (2010). Vers une herméneutique matérielle numérique. Corpus textuels, Logométrie et Langage politique, mémoire pour l’Habilitation à diriger des recherches, Université Nice-Sophia Antipolis. http://tel.archives-ouvertes.fr/tel-00655380 [28/09/2017].
Google Scholar

MELLET,S.(2002). Corpus et recherches linguistiques. Corpus, 1. http://journals.openedition.org/corpus/7 ; DOI : https://doi.org/10.4000/corpus.7
Google Scholar DOI: https://doi.org/10.4000/corpus.7

MOIRAND, S. (2018). L’apport de petits corpus à la compréhension des faits d’actualité. Corpus, 18. http://journals.openedition.org/corpus/3519 ; DOI : https://doi.org/10.4000/corpus.3519
Google Scholar DOI: https://doi.org/10.4000/corpus.3519

PINCEMIN, B. (2012). Hétérogénéité des corpus et textométrie. Langages, 187, pp. 13-26. DOI : https://doi.org/10.3917/lang.187.0013
Google Scholar DOI: https://doi.org/10.3917/lang.187.0013

RASTIER, F. (2004). Enjeux épistémologiques de la linguistique de corpus. Texto ! http://www.revue-texto.net/1996-2007/Inedits/Rastier/Rastier_Enjeux.html [10/09/2021].
Google Scholar

RASTIER, F. (2005). Enjeux épistémologiques de la linguistique de corpus. In WILLIAMS, G. (éd.). La linguistique de corpus. Rennes : Presses Universitaires de Rennes, pp. 31-45.
Google Scholar

TOGNINI-BONELLI, E. (2001). Corpus Linguistics at Work. Studies in corpus linguistics, 6. https://irht.hypotheses.org/3187#identifier_3_3187 [11/02/2021].
Google Scholar DOI: https://doi.org/10.1075/scl.6

TREFFORT, C. (2014). Le corpus du chercheur, une quête de l’impossible ? Quelques considérations introductives. Le corpus. Son contour, ses limites et sa cohérence, Annales de Janua, Actes des Journées d’études. http://annalesdejanua.edel.univ-poitiers.fr/index.php?id=725 [28/07/2021].
Google Scholar

VETULANI, G. (2000).Quelques exemples d’analyse des corpus en vue de la traduction. Studia Romanica Posnaniensia, 25/26, pp. 317-325.
Google Scholar DOI: https://doi.org/10.14746/strop.2000.2526.029

Published

2024-10-30

How to Cite

Ferhat, S. (2024). The corpus in language sciences, a place for verifying language issues. E-Scripta Romanica, 12, 11–27. https://doi.org/10.18778/2392-0718.12.02

Issue

Section

Articles