The corpus in language sciences, a place for verifying language issues
DOI:
https://doi.org/10.18778/2392-0718.12.02Keywords:
corpus, language sciences, choice and limits, homogeneity and representativeness, reliabilityAbstract
The subject of the article addresses the question of corpus in language sciences. It highlights the main aspects relating to the constitution of a well-considered corpus to serve as a theoretical basis. This presentation is a synthesis of approaches allowing beginning researchers to constitute, delimit and explore certain aspects of language in order to launch well-founded scientific research. It shows that the results of research in language sciences should be drawn from the tangible data of a corpus before formulating any new theory, invalidating or calling into question another. The material in terms of content calls upon the opinions of corpus specialists with regard to the assigned definitions, the role of corpus for linguistic studies, its choice, its delimitation, its homogeneity, its representativeness, the nature of its components and its constraints. This article gradually shows the main facets to take into account in the constitution of the corpus in order to allow researchers to guarantee the reliability of the results.
References
ADAM, J.-M. & VIPREY J.-M. (2009). Corpus de textes, textes en corpus. Problématique et présentation. Corpus, 8, pp. 5-25.
Google Scholar
DOI: https://doi.org/10.4000/corpus.1672
BRONCKART, J.-P. (2008). Genres de textes, types de discours et degrés de langue. Hommage à François Rastier. Texto [en ligne]. Dialogues et débats. URL : https://www.revue-texto.net/index.php?id=86
Google Scholar
CAPT,V., JACQUIN, J. & MICHELI, R. (2009). Les sphères de contextualisation. Réflexion méthodologique sur les passages de texte à texte(s) et la constitution des corpus. Corpus, 8, pp. 129-147.
Google Scholar
DOI: https://doi.org/10.4000/corpus.1685
CHARAUDEAU, P. (2009). Dis-moi quel est ton corpus, je te dirai quelle est ta problématique. Corpus, 8, pp. 37-66.
Google Scholar
DOI: https://doi.org/10.4000/corpus.1674
CISLARU, G., SITRI, F. (2012). De l’émergence à l’impact social des discours : hétérogénéités d’un corpus. Langages, Armand Colin, pp.59-72.
Google Scholar
DOI: https://doi.org/10.3917/lang.187.0059
CNRTL (Centre National des Ressources Textuelles et Lexicales). https://www.cnrtl.fr/definition/corpus [7/05/2021].
Google Scholar
COMBY, É., MOSSET, Y. (2016). Le corpus à l’interface des humanités et des sciences sociales. Dans Corpus de textes : composer, mesurer, interpréter. Lyon : ENS Éditions. http://books.openedition.org/enseditions/7341 DOI : https://doi.org/10.4000/books.enseditions.7341
Google Scholar
DOI: https://doi.org/10.4000/books.enseditions.7341
DALBERA, J-P. (2002). Le corpus entre données, analyse et théorie. Corpus, 1. http://journals.openedition.org/corpus/10 ; DOI : https://doi.org/10.4000/corpus.10
Google Scholar
DOI: https://doi.org/10.4000/corpus.10
GARRIC, N. (2012). Construire et maîtriser l’hétérogénéité par la variation des données, des corpus et des méthodes. Langages 3,187, pp. 73-92. DOI : 10.3917/lang.187.0073
Google Scholar
DOI: https://doi.org/10.3917/lang.187.0073
HABERT, B. (2000). Des corpus représentatifs : de quoi, pour quoi, comment ? In BILGER, M., editor, Linguistique sur corpus. Études et réflexions, number 31 in Cahiers de l’université de Perpignan, pp. 11-58. Perpignan : Presses Universitaires de Perpignan.
Google Scholar
LE PETIT ROBERT. DICTIONNAIRE ALPHABETIQUE ET ANALOGIQUE DE LA LANGUE FRANÇAISE(1989). dirigé par Alain Rey et Josette Rey-Debove. Paris : Société du Nouveau Littré/Le Robert.
Google Scholar
MAGNANI, E. (2017). Qu’est-ce qu’un corpus ? Compte-rendu de la journée d’études. https://irht.hypotheses.org/3187 [18/04/2021].
Google Scholar
MAYAFFRE, D. (2002). Les corpus réflexifs : entre architextualité et hypertextualité. Corpus, 1. http://corpus.revues.org/11 ; DOI : https://doi.org/10.4000/corpus.11
Google Scholar
DOI: https://doi.org/10.4000/corpus.11
MAYAFFRE, D. (2010). Vers une herméneutique matérielle numérique. Corpus textuels, Logométrie et Langage politique, mémoire pour l’Habilitation à diriger des recherches, Université Nice-Sophia Antipolis. http://tel.archives-ouvertes.fr/tel-00655380 [28/09/2017].
Google Scholar
MELLET,S.(2002). Corpus et recherches linguistiques. Corpus, 1. http://journals.openedition.org/corpus/7 ; DOI : https://doi.org/10.4000/corpus.7
Google Scholar
DOI: https://doi.org/10.4000/corpus.7
MOIRAND, S. (2018). L’apport de petits corpus à la compréhension des faits d’actualité. Corpus, 18. http://journals.openedition.org/corpus/3519 ; DOI : https://doi.org/10.4000/corpus.3519
Google Scholar
DOI: https://doi.org/10.4000/corpus.3519
PINCEMIN, B. (2012). Hétérogénéité des corpus et textométrie. Langages, 187, pp. 13-26. DOI : https://doi.org/10.3917/lang.187.0013
Google Scholar
DOI: https://doi.org/10.3917/lang.187.0013
RASTIER, F. (2004). Enjeux épistémologiques de la linguistique de corpus. Texto ! http://www.revue-texto.net/1996-2007/Inedits/Rastier/Rastier_Enjeux.html [10/09/2021].
Google Scholar
RASTIER, F. (2005). Enjeux épistémologiques de la linguistique de corpus. In WILLIAMS, G. (éd.). La linguistique de corpus. Rennes : Presses Universitaires de Rennes, pp. 31-45.
Google Scholar
TOGNINI-BONELLI, E. (2001). Corpus Linguistics at Work. Studies in corpus linguistics, 6. https://irht.hypotheses.org/3187#identifier_3_3187 [11/02/2021].
Google Scholar
DOI: https://doi.org/10.1075/scl.6
TREFFORT, C. (2014). Le corpus du chercheur, une quête de l’impossible ? Quelques considérations introductives. Le corpus. Son contour, ses limites et sa cohérence, Annales de Janua, Actes des Journées d’études. http://annalesdejanua.edel.univ-poitiers.fr/index.php?id=725 [28/07/2021].
Google Scholar
VETULANI, G. (2000).Quelques exemples d’analyse des corpus en vue de la traduction. Studia Romanica Posnaniensia, 25/26, pp. 317-325.
Google Scholar
DOI: https://doi.org/10.14746/strop.2000.2526.029
Downloads
Published
How to Cite
Issue
Section
License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.