Długość przeciętnego polskiego wyrazu w tekstach pisanych w świetle analizy korpusowej
DOI:
https://doi.org/10.18778/0860-6587.27.09Słowa kluczowe:
język polski, glottodydaktyka, słownictwo, przeciętne słowo, trudność tekstuAbstrakt
W niniejszym artykule podjęto próbę znalezienia odpowiedzi na pytanie: Jak długi jest przeciętny polski wyraz? W tym celu w trakcie dwóch badań przeanalizowano 90 próbek tekstów zaczerpniętych z Narodowego Korpusu Języka Polskiego zawierających po 1000 słów W czasie badań kontrolowano średnią liczbę znaków w każdej próbce, jak również medianę liczby znaków na wyraz. Uzyskane wyniki pozwoliły na określenie długości przeciętnego polskiego wyrazu (PW), która wynosi 6 znaków. Przeliczono też liczbę znaków we wszystkich próbkach i ujęto ją za pomocą PW, porównując długość tekstu wyrażoną słowami faktycznymi i przeciętnymi. Zastosowane procedury statystyczne umożliwiły odrzucenie hipotezy zerowej o braku różnicy między użyciem wyrazów konkretnych, a PW jako miary długości tekstu. W podsumowaniu przedstawiono możliwe zastosowania tego modelu dla celów (glotto)dydaktycznych.
Bibliografia
Alderson J., 2000, Assessing Reading, Cambridge.
Google Scholar
DOI: https://doi.org/10.1017/CBO9780511732935
Andersen S., 2002, Speakers´s information content: length-frequency correlation as partial correlation, “Glottometrica”, nr 3, s. 90–109.
Google Scholar
Broda B., Ogrodniczuk M., Nitoń B., Gruszczyński W., 2014, Measuring Readibility of Polish Texts: Baseline Experiments, w: N. Calzolari i in. (red.), Materiały z konferencji LREC 2014 (9th International Conference on Language Resources and Evaluation, Rejkiawik, 26–31 maja 2014), Rejkiavik, s. 573–580.
Google Scholar
Brysbaert M., 2019, How many words do we read per minute? A review and meta-analysis of reading rate, [online], https://psyarxiv.com/xynwg/ [29.05.2020]
Google Scholar
DOI: https://doi.org/10.31234/osf.io/xynwg
Carver R.P., 1972, Evidence for the invalidity of the Miller-Coleman Readability Scale, „Journal of Reading Behavior”, nr 4(3), s. 42–47.
Google Scholar
DOI: https://doi.org/10.1080/10862967109546999
Carver R.P., 1976, Word Length, Prose Difficulty and Reading Rate, „Journal of Reading Behavior”, nr 8(2), s. 193–204.
Google Scholar
DOI: https://doi.org/10.1080/10862967609547176
Carver R.P., 1977–1978, Toward a Theory of Reading Comprehension and Rauding, „Reading Research Quarterly”, nr 13(1), s. 8–63.
Google Scholar
DOI: https://doi.org/10.2307/747588
Carver R.P., 1982, Optimal rate of reading prose, „Reading Research Quarterly”, nr 18(1), s. 56–88.
Google Scholar
DOI: https://doi.org/10.2307/747538
Carver R.P., 1983, Is reading rate constant or flexible?, „Reading Research Quarterly”, nr 18(2), s. 190–215.
Google Scholar
DOI: https://doi.org/10.2307/747517
Charzyńska E., Dębowski Ł., 2015, Empirical verification of the Polish formula of text difficulty, „Cognitive Studies”, nr 15, s. 125–132, https://doi.org/10.11649/cs.2015.010
Google Scholar
DOI: https://doi.org/10.11649/cs.2015.010
Cooper C.R., Petrosky A.R., 1976, A Psycholinguistic View of the Fluent Reading, „Journal of Reading”, nr 20(3), s. 184–207.
Google Scholar
Defrancis J., 1996, Graphemic indeterminacy in writing systems, „Word”, nr 477(3), s. 365–377, https://doi.org/10.1080/00437956.1996.11432455
Google Scholar
DOI: https://doi.org/10.1080/00437956.1996.11432455
De Saussure F., 1961, Kurs językoznawstwa ogólnego, Warszawa.
Google Scholar
Dębowski Ł., Nitoń B., Broda B., Charzyńska E., 2015, Jasnopis – A Program to Compute Readibility of Texts in Polish based on Psycholinguistic Research, w: B. Sharp, W. Lubaszewski, R. Delmonte (red.), Natural Language Processing and Cognitive Science, Proceedings 2015, Kraków, s. 51–61.
Google Scholar
DuBay W.H., 2004, The Principles of Readability [online], https://eric.ed.gov/?id=ED490073 [11.05.2020]
Google Scholar
Ellis N.C., 2002, Frequency Effects in Language Processing: A Review with Implications for Theories of Implicit and Explicit Language Acquisition, „Studies in Second Language Acquisition”, nr 24(2), s. 143–188, https://doi.org/10.1017/S0272263102002024
Google Scholar
DOI: https://doi.org/10.1017/S0272263102002024
Górski R.L., 2012, Zastosowanie korpusów w badaniu gramatyki, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 291–301.
Google Scholar
Górski R.L., Łaziński M., 2012, Reprezentatywność i zrównoważenie korpusu, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 25–37.
Google Scholar
Grabe W., 1991, Current Developments in Second Language Reading Research, „TESOL Quarterly”, nr 25(3), s. 357–406.
Google Scholar
DOI: https://doi.org/10.2307/3586977
Grabe W., 2009, Reading in a Second Language, Cambridge.
Google Scholar
DOI: https://doi.org/10.1093/oxfordhb/9780195384253.013.0006
Gruszczyński W. i in., 2015, Measuring Readability of Polish Texts, w: Z. Vetulani, J. Mariani (red.), Materiały Konferencji LTC 2015 (7th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Poznań, 27–29 listopada 2015), Poznań, s. 445–449.
Google Scholar
Huey E.B., 1908, The Psychology and Pedagogy of Reading, New York.
Google Scholar
Juel C., Minden-Cupp C., 2000, Learning to read words: Linguistic units and instructional strategies, „Reading Research Quarterly”, nr 35(4), s. 458–492.
Google Scholar
DOI: https://doi.org/10.1598/RRQ.35.4.2
Kuhn M., Schwanenflugel P., Meisinger E., 2010, Aligning Theory and Assessment of Reading Fluency: Automaticity, Prosody, and Definitions of Fluency, „Reading Research Quarterly”, nr 45(2), s. 230–251.
Google Scholar
DOI: https://doi.org/10.1598/RRQ.45.2.4
Lado, R., 1955, Patterns of Difficulty in Vocabulary, „Language Learning”, nr 6(1), s. 23–41, https://doi.org/10.1111/j.1467-1770.1955.tb00829.x
Google Scholar
DOI: https://doi.org/10.1111/j.1467-1770.1955.tb00829.x
Laufer B., 1990, Why Some Words are More Difficult Than Others, „IRAL”, nr 28(4), s. 293–307, https://doi.org/10.1515/iral.1990.28.4.293
Google Scholar
DOI: https://doi.org/10.1515/iral.1990.28.4.293
Lewandowska-Tomaszczyk B., 2011, Nowe wyzwania w jakościowej i ilościowej metodologii analizy języka, „Biuletyn Polskiego Towarzystwa Językoznawczego”, nr 67, s. 141–165.
Google Scholar
Lewandowska-Tomaszczyk B. i in., 2012, Narodowy Korpus Języka Polskiego: geneza i dzień dzisiejszy, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 3–9.
Google Scholar
Perfetti C., 2007, Reading Ability: Lexical Quality to Comprehension, „Scientific Studies of Reading”, nr 11(4), s. 357–383, https://doi.org/10.1080/10888430701530730
Google Scholar
DOI: https://doi.org/10.1080/10888430701530730
Piekot T., Zarzeczny G., Moroń E., 2019, Standard „plain language” w polskiej sferze publicznej, w: M. Zaśko-Zielińska, K. Kredens (red.), Lingwistyka kryminalistyczna. Teoria i praktyka, Wrocław, s. 197–214.
Google Scholar
Ratner N.B., Berko Gleason J., Narasimhan B., 2005, Wprowadzenie do psycholingwistyki – wiedza użytkowników języka, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 15–60.
Google Scholar
Reeves L.M., Hirsch-Pasek K., Golinkoff R., 2005, Słowa i znaczenia – od pojęć pierwotnych do złożonych struktur, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 173–240.
Google Scholar
Rey A., Ziegler J.C., Jacobs A.M., 2000, Graphemes are perceptual reading units, „Cognition”, nr 75(1), s. 1–12, https://doi.org/10.1016/S0010-0277(99)00078-5
Google Scholar
DOI: https://doi.org/10.1016/S0010-0277(99)00078-5
Seidenberg M., 2017, Language at the speed of sight: How we read, why so many can’t, and what can be done about it, Nowy Jork.
Google Scholar
Seretny A., 2006, Wskaźnik czytelności tekstu jako pomoc w określaniu stopnia jego trudności, „Ling-Varia”, nr 2(2), s. 87–98.
Google Scholar
Seretny A., 2011, Kompetencja leksykalna uczących się języka polskiego jako obcego w świetle badań ilościowych, Kraków.
Google Scholar
Seretny A., 2016, Stopień trudności słowa w perspektywie glottodydaktycznej, „Języki Obce w Szkole”, nr 60(1), s. 18–25.
Google Scholar
Sigurd B., Eeg-Olofsson M., van de Weijer J., 2004, Word Length, Sentence Length and Frequency – Zipf Revisited, „Studia Linguistica”, nr 58(1), s. 37–52.
Google Scholar
DOI: https://doi.org/10.1111/j.0039-3193.2004.00109.x
Taylor S.E., 1965, Eye Movements in Reading: Facts and Fallacies, „American Educational Research Journal”, nr 2(4), s. 187–202.
Google Scholar
DOI: https://doi.org/10.3102/00028312002004187
Wolf M., Vellutino F., Berko Gleason J., 2005, Psycholingwistyczna analiza czynności czytania, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 439–477.
Google Scholar
Wyllys R., 1981, Empirical and Theoretical Bases of Zipf’s Law, „Library Trends”, nr 30(1), s. 53–64.
Google Scholar
Yeni-Koshian G., 2005, Percepcja mowy, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 121–173.
Google Scholar
http://certyfikatpolski.pl/o-egzaminie/przykladowe-testy-zbiory-zadan/ [08.05.2020].
Google Scholar
https://cke.gov.pl/egzamin-osmoklasisty/arkusze/2019-2 [09.05.2020].
Google Scholar
http://nkjp.pl/ [07.05.2020].
Google Scholar
Pobrania
Opublikowane
Jak cytować
Numer
Dział
Licencja
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa – Użycie niekomercyjne – Bez utworów zależnych 4.0 Międzynarodowe.