Average length Polish word

Authors

DOI:

https://doi.org/10.18778/0860-6587.27.09

Keywords:

Polish language, applied linguistics, language learning/teaching, average length Polish word

Abstract

Considering the fact that words vary in length within a language and between different languages the author has conducted the research, inspired by Carver’s model of a standard-length word, to answer the question: What is the average length of a Polish word? To achieve that goal, ninety samples, a 1000-words-long each, drawn from the National Corpora of Polish Language have been examined. The texts belonged to different genres and had different publication channel. The average length of a Polish word was established to be 6 characters. Using that value, the number of average words (AV) has been calculated for each analyzed sample. The number of actual words has been juxtaposed with the number of AV. The procedure made possible to reject the null hypothesis and validate the new unit of text measurement. In the last part of the article a number of possible uses of the new concept have been enumerated.

References

Alderson J., 2000, Assessing Reading, Cambridge. DOI: https://doi.org/10.1017/CBO9780511732935

Andersen S., 2002, Speakers´s information content: length-frequency correlation as partial correlation, “Glottometrica”, nr 3, s. 90–109.

Broda B., Ogrodniczuk M., Nitoń B., Gruszczyński W., 2014, Measuring Readibility of Polish Texts: Baseline Experiments, w: N. Calzolari i in. (red.), Materiały z konferencji LREC 2014 (9th International Conference on Language Resources and Evaluation, Rejkiawik, 26–31 maja 2014), Rejkiavik, s. 573–580.

Brysbaert M., 2019, How many words do we read per minute? A review and meta-analysis of reading rate, [online], https://psyarxiv.com/xynwg/ [29.05.2020] DOI: https://doi.org/10.31234/osf.io/xynwg

Carver R.P., 1972, Evidence for the invalidity of the Miller-Coleman Readability Scale, „Journal of Reading Behavior”, nr 4(3), s. 42–47. DOI: https://doi.org/10.1080/10862967109546999

Carver R.P., 1976, Word Length, Prose Difficulty and Reading Rate, „Journal of Reading Behavior”, nr 8(2), s. 193–204. DOI: https://doi.org/10.1080/10862967609547176

Carver R.P., 1977–1978, Toward a Theory of Reading Comprehension and Rauding, „Reading Research Quarterly”, nr 13(1), s. 8–63. DOI: https://doi.org/10.2307/747588

Carver R.P., 1982, Optimal rate of reading prose, „Reading Research Quarterly”, nr 18(1), s. 56–88. DOI: https://doi.org/10.2307/747538

Carver R.P., 1983, Is reading rate constant or flexible?, „Reading Research Quarterly”, nr 18(2), s. 190–215. DOI: https://doi.org/10.2307/747517

Charzyńska E., Dębowski Ł., 2015, Empirical verification of the Polish formula of text difficulty, „Cognitive Studies”, nr 15, s. 125–132, https://doi.org/10.11649/cs.2015.010 DOI: https://doi.org/10.11649/cs.2015.010

Cooper C.R., Petrosky A.R., 1976, A Psycholinguistic View of the Fluent Reading, „Journal of Reading”, nr 20(3), s. 184–207.

Defrancis J., 1996, Graphemic indeterminacy in writing systems, „Word”, nr 477(3), s. 365–377, https://doi.org/10.1080/00437956.1996.11432455 DOI: https://doi.org/10.1080/00437956.1996.11432455

De Saussure F., 1961, Kurs językoznawstwa ogólnego, Warszawa.

Dębowski Ł., Nitoń B., Broda B., Charzyńska E., 2015, Jasnopis – A Program to Compute Readibility of Texts in Polish based on Psycholinguistic Research, w: B. Sharp, W. Lubaszewski, R. Delmonte (red.), Natural Language Processing and Cognitive Science, Proceedings 2015, Kraków, s. 51–61.

DuBay W.H., 2004, The Principles of Readability [online], https://eric.ed.gov/?id=ED490073 [11.05.2020]

Ellis N.C., 2002, Frequency Effects in Language Processing: A Review with Implications for Theories of Implicit and Explicit Language Acquisition, „Studies in Second Language Acquisition”, nr 24(2), s. 143–188, https://doi.org/10.1017/S0272263102002024 DOI: https://doi.org/10.1017/S0272263102002024

Górski R.L., 2012, Zastosowanie korpusów w badaniu gramatyki, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 291–301.

Górski R.L., Łaziński M., 2012, Reprezentatywność i zrównoważenie korpusu, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 25–37.

Grabe W., 1991, Current Developments in Second Language Reading Research, „TESOL Quarterly”, nr 25(3), s. 357–406. DOI: https://doi.org/10.2307/3586977

Grabe W., 2009, Reading in a Second Language, Cambridge. DOI: https://doi.org/10.1093/oxfordhb/9780195384253.013.0006

Gruszczyński W. i in., 2015, Measuring Readability of Polish Texts, w: Z. Vetulani, J. Mariani (red.), Materiały Konferencji LTC 2015 (7th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Poznań, 27–29 listopada 2015), Poznań, s. 445–449.

Huey E.B., 1908, The Psychology and Pedagogy of Reading, New York.

Juel C., Minden-Cupp C., 2000, Learning to read words: Linguistic units and instructional strategies, „Reading Research Quarterly”, nr 35(4), s. 458–492. DOI: https://doi.org/10.1598/RRQ.35.4.2

Kuhn M., Schwanenflugel P., Meisinger E., 2010, Aligning Theory and Assessment of Reading Fluency: Automaticity, Prosody, and Definitions of Fluency, „Reading Research Quarterly”, nr 45(2), s. 230–251. DOI: https://doi.org/10.1598/RRQ.45.2.4

Lado, R., 1955, Patterns of Difficulty in Vocabulary, „Language Learning”, nr 6(1), s. 23–41, https://doi.org/10.1111/j.1467-1770.1955.tb00829.x DOI: https://doi.org/10.1111/j.1467-1770.1955.tb00829.x

Laufer B., 1990, Why Some Words are More Difficult Than Others, „IRAL”, nr 28(4), s. 293–307, https://doi.org/10.1515/iral.1990.28.4.293 DOI: https://doi.org/10.1515/iral.1990.28.4.293

Lewandowska-Tomaszczyk B., 2011, Nowe wyzwania w jakościowej i ilościowej metodologii analizy języka, „Biuletyn Polskiego Towarzystwa Językoznawczego”, nr 67, s. 141–165.

Lewandowska-Tomaszczyk B. i in., 2012, Narodowy Korpus Języka Polskiego: geneza i dzień dzisiejszy, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 3–9.

Perfetti C., 2007, Reading Ability: Lexical Quality to Comprehension, „Scientific Studies of Reading”, nr 11(4), s. 357–383, https://doi.org/10.1080/10888430701530730 DOI: https://doi.org/10.1080/10888430701530730

Piekot T., Zarzeczny G., Moroń E., 2019, Standard „plain language” w polskiej sferze publicznej, w: M. Zaśko-Zielińska, K. Kredens (red.), Lingwistyka kryminalistyczna. Teoria i praktyka, Wrocław, s. 197–214.

Ratner N.B., Berko Gleason J., Narasimhan B., 2005, Wprowadzenie do psycholingwistyki – wiedza użytkowników języka, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 15–60.

Reeves L.M., Hirsch-Pasek K., Golinkoff R., 2005, Słowa i znaczenia – od pojęć pierwotnych do złożonych struktur, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 173–240.

Rey A., Ziegler J.C., Jacobs A.M., 2000, Graphemes are perceptual reading units, „Cognition”, nr 75(1), s. 1–12, https://doi.org/10.1016/S0010-0277(99)00078-5 DOI: https://doi.org/10.1016/S0010-0277(99)00078-5

Seidenberg M., 2017, Language at the speed of sight: How we read, why so many can’t, and what can be done about it, Nowy Jork.

Seretny A., 2006, Wskaźnik czytelności tekstu jako pomoc w określaniu stopnia jego trudności, „Ling-Varia”, nr 2(2), s. 87–98.

Seretny A., 2011, Kompetencja leksykalna uczących się języka polskiego jako obcego w świetle badań ilościowych, Kraków.

Seretny A., 2016, Stopień trudności słowa w perspektywie glottodydaktycznej, „Języki Obce w Szkole”, nr 60(1), s. 18–25.

Sigurd B., Eeg-Olofsson M., van de Weijer J., 2004, Word Length, Sentence Length and Frequency – Zipf Revisited, „Studia Linguistica”, nr 58(1), s. 37–52. DOI: https://doi.org/10.1111/j.0039-3193.2004.00109.x

Taylor S.E., 1965, Eye Movements in Reading: Facts and Fallacies, „American Educational Research Journal”, nr 2(4), s. 187–202. DOI: https://doi.org/10.3102/00028312002004187

Wolf M., Vellutino F., Berko Gleason J., 2005, Psycholingwistyczna analiza czynności czytania, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 439–477.

Wyllys R., 1981, Empirical and Theoretical Bases of Zipf’s Law, „Library Trends”, nr 30(1), s. 53–64.

Yeni-Koshian G., 2005, Percepcja mowy, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 121–173.

http://certyfikatpolski.pl/o-egzaminie/przykladowe-testy-zbiory-zadan/ [08.05.2020].

https://cke.gov.pl/egzamin-osmoklasisty/arkusze/2019-2 [09.05.2020].

http://nkjp.pl/ [07.05.2020].

Downloads

Published

2020-12-23

How to Cite

Moździerz, Tomasz. 2020. “Average Length Polish Word ”. Acta Universitatis Lodziensis. Kształcenie Polonistyczne Cudzoziemców 27 (December): 177-92. https://doi.org/10.18778/0860-6587.27.09.