Długość przeciętnego polskiego wyrazu w tekstach pisanych w świetle analizy korpusowej

Autor

DOI:

https://doi.org/10.18778/0860-6587.27.09

Słowa kluczowe:

język polski, glottodydaktyka, słownictwo, przeciętne słowo, trudność tekstu

Abstrakt

W niniejszym artykule podjęto próbę znalezienia odpowiedzi na pytanie: Jak długi jest przeciętny polski wyraz? W tym celu w trakcie dwóch badań przeanalizowano 90 próbek tekstów zaczerpniętych z Narodowego Korpusu Języka Polskiego zawierających po 1000 słów W czasie badań kontrolowano średnią liczbę znaków w każdej próbce, jak również medianę liczby znaków na wyraz. Uzyskane wyniki pozwoliły na określenie długości przeciętnego polskiego wyrazu (PW), która wynosi 6 znaków. Przeliczono też liczbę znaków we wszystkich próbkach i ujęto ją za pomocą PW, porównując długość tekstu wyrażoną słowami faktycznymi i przeciętnymi. Zastosowane procedury statystyczne umożliwiły odrzucenie hipotezy zerowej o braku różnicy między użyciem wyrazów konkretnych, a PW jako miary długości tekstu. W podsumowaniu przedstawiono możliwe zastosowania tego modelu dla celów (glotto)dydaktycznych.

Bibliografia

Alderson J., 2000, Assessing Reading, Cambridge. DOI: https://doi.org/10.1017/CBO9780511732935

Andersen S., 2002, Speakers´s information content: length-frequency correlation as partial correlation, “Glottometrica”, nr 3, s. 90–109.

Broda B., Ogrodniczuk M., Nitoń B., Gruszczyński W., 2014, Measuring Readibility of Polish Texts: Baseline Experiments, w: N. Calzolari i in. (red.), Materiały z konferencji LREC 2014 (9th International Conference on Language Resources and Evaluation, Rejkiawik, 26–31 maja 2014), Rejkiavik, s. 573–580.

Brysbaert M., 2019, How many words do we read per minute? A review and meta-analysis of reading rate, [online], https://psyarxiv.com/xynwg/ [29.05.2020] DOI: https://doi.org/10.31234/osf.io/xynwg

Carver R.P., 1972, Evidence for the invalidity of the Miller-Coleman Readability Scale, „Journal of Reading Behavior”, nr 4(3), s. 42–47. DOI: https://doi.org/10.1080/10862967109546999

Carver R.P., 1976, Word Length, Prose Difficulty and Reading Rate, „Journal of Reading Behavior”, nr 8(2), s. 193–204. DOI: https://doi.org/10.1080/10862967609547176

Carver R.P., 1977–1978, Toward a Theory of Reading Comprehension and Rauding, „Reading Research Quarterly”, nr 13(1), s. 8–63. DOI: https://doi.org/10.2307/747588

Carver R.P., 1982, Optimal rate of reading prose, „Reading Research Quarterly”, nr 18(1), s. 56–88. DOI: https://doi.org/10.2307/747538

Carver R.P., 1983, Is reading rate constant or flexible?, „Reading Research Quarterly”, nr 18(2), s. 190–215. DOI: https://doi.org/10.2307/747517

Charzyńska E., Dębowski Ł., 2015, Empirical verification of the Polish formula of text difficulty, „Cognitive Studies”, nr 15, s. 125–132, https://doi.org/10.11649/cs.2015.010 DOI: https://doi.org/10.11649/cs.2015.010

Cooper C.R., Petrosky A.R., 1976, A Psycholinguistic View of the Fluent Reading, „Journal of Reading”, nr 20(3), s. 184–207.

Defrancis J., 1996, Graphemic indeterminacy in writing systems, „Word”, nr 477(3), s. 365–377, https://doi.org/10.1080/00437956.1996.11432455 DOI: https://doi.org/10.1080/00437956.1996.11432455

De Saussure F., 1961, Kurs językoznawstwa ogólnego, Warszawa.

Dębowski Ł., Nitoń B., Broda B., Charzyńska E., 2015, Jasnopis – A Program to Compute Readibility of Texts in Polish based on Psycholinguistic Research, w: B. Sharp, W. Lubaszewski, R. Delmonte (red.), Natural Language Processing and Cognitive Science, Proceedings 2015, Kraków, s. 51–61.

DuBay W.H., 2004, The Principles of Readability [online], https://eric.ed.gov/?id=ED490073 [11.05.2020]

Ellis N.C., 2002, Frequency Effects in Language Processing: A Review with Implications for Theories of Implicit and Explicit Language Acquisition, „Studies in Second Language Acquisition”, nr 24(2), s. 143–188, https://doi.org/10.1017/S0272263102002024 DOI: https://doi.org/10.1017/S0272263102002024

Górski R.L., 2012, Zastosowanie korpusów w badaniu gramatyki, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 291–301.

Górski R.L., Łaziński M., 2012, Reprezentatywność i zrównoważenie korpusu, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 25–37.

Grabe W., 1991, Current Developments in Second Language Reading Research, „TESOL Quarterly”, nr 25(3), s. 357–406. DOI: https://doi.org/10.2307/3586977

Grabe W., 2009, Reading in a Second Language, Cambridge. DOI: https://doi.org/10.1093/oxfordhb/9780195384253.013.0006

Gruszczyński W. i in., 2015, Measuring Readability of Polish Texts, w: Z. Vetulani, J. Mariani (red.), Materiały Konferencji LTC 2015 (7th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Poznań, 27–29 listopada 2015), Poznań, s. 445–449.

Huey E.B., 1908, The Psychology and Pedagogy of Reading, New York.

Juel C., Minden-Cupp C., 2000, Learning to read words: Linguistic units and instructional strategies, „Reading Research Quarterly”, nr 35(4), s. 458–492. DOI: https://doi.org/10.1598/RRQ.35.4.2

Kuhn M., Schwanenflugel P., Meisinger E., 2010, Aligning Theory and Assessment of Reading Fluency: Automaticity, Prosody, and Definitions of Fluency, „Reading Research Quarterly”, nr 45(2), s. 230–251. DOI: https://doi.org/10.1598/RRQ.45.2.4

Lado, R., 1955, Patterns of Difficulty in Vocabulary, „Language Learning”, nr 6(1), s. 23–41, https://doi.org/10.1111/j.1467-1770.1955.tb00829.x DOI: https://doi.org/10.1111/j.1467-1770.1955.tb00829.x

Laufer B., 1990, Why Some Words are More Difficult Than Others, „IRAL”, nr 28(4), s. 293–307, https://doi.org/10.1515/iral.1990.28.4.293 DOI: https://doi.org/10.1515/iral.1990.28.4.293

Lewandowska-Tomaszczyk B., 2011, Nowe wyzwania w jakościowej i ilościowej metodologii analizy języka, „Biuletyn Polskiego Towarzystwa Językoznawczego”, nr 67, s. 141–165.

Lewandowska-Tomaszczyk B. i in., 2012, Narodowy Korpus Języka Polskiego: geneza i dzień dzisiejszy, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 3–9.

Perfetti C., 2007, Reading Ability: Lexical Quality to Comprehension, „Scientific Studies of Reading”, nr 11(4), s. 357–383, https://doi.org/10.1080/10888430701530730 DOI: https://doi.org/10.1080/10888430701530730

Piekot T., Zarzeczny G., Moroń E., 2019, Standard „plain language” w polskiej sferze publicznej, w: M. Zaśko-Zielińska, K. Kredens (red.), Lingwistyka kryminalistyczna. Teoria i praktyka, Wrocław, s. 197–214.

Ratner N.B., Berko Gleason J., Narasimhan B., 2005, Wprowadzenie do psycholingwistyki – wiedza użytkowników języka, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 15–60.

Reeves L.M., Hirsch-Pasek K., Golinkoff R., 2005, Słowa i znaczenia – od pojęć pierwotnych do złożonych struktur, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 173–240.

Rey A., Ziegler J.C., Jacobs A.M., 2000, Graphemes are perceptual reading units, „Cognition”, nr 75(1), s. 1–12, https://doi.org/10.1016/S0010-0277(99)00078-5 DOI: https://doi.org/10.1016/S0010-0277(99)00078-5

Seidenberg M., 2017, Language at the speed of sight: How we read, why so many can’t, and what can be done about it, Nowy Jork.

Seretny A., 2006, Wskaźnik czytelności tekstu jako pomoc w określaniu stopnia jego trudności, „Ling-Varia”, nr 2(2), s. 87–98.

Seretny A., 2011, Kompetencja leksykalna uczących się języka polskiego jako obcego w świetle badań ilościowych, Kraków.

Seretny A., 2016, Stopień trudności słowa w perspektywie glottodydaktycznej, „Języki Obce w Szkole”, nr 60(1), s. 18–25.

Sigurd B., Eeg-Olofsson M., van de Weijer J., 2004, Word Length, Sentence Length and Frequency – Zipf Revisited, „Studia Linguistica”, nr 58(1), s. 37–52. DOI: https://doi.org/10.1111/j.0039-3193.2004.00109.x

Taylor S.E., 1965, Eye Movements in Reading: Facts and Fallacies, „American Educational Research Journal”, nr 2(4), s. 187–202. DOI: https://doi.org/10.3102/00028312002004187

Wolf M., Vellutino F., Berko Gleason J., 2005, Psycholingwistyczna analiza czynności czytania, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 439–477.

Wyllys R., 1981, Empirical and Theoretical Bases of Zipf’s Law, „Library Trends”, nr 30(1), s. 53–64.

Yeni-Koshian G., 2005, Percepcja mowy, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 121–173.

http://certyfikatpolski.pl/o-egzaminie/przykladowe-testy-zbiory-zadan/ [08.05.2020].

https://cke.gov.pl/egzamin-osmoklasisty/arkusze/2019-2 [09.05.2020].

http://nkjp.pl/ [07.05.2020].

Pobrania

Opublikowane

23.12.2020

Jak cytować

Moździerz, Tomasz. 2020. “Długość przeciętnego Polskiego Wyrazu W Tekstach Pisanych W świetle Analizy Korpusowej ”. Acta Universitatis Lodziensis. Kształcenie Polonistyczne Cudzoziemców 27 (December): 177-92. https://doi.org/10.18778/0860-6587.27.09.