Polsko-bułgarskie korpusy IS PAN i CLARIN-PL

Autor

  • Danuta Roszko Uniwersytet Warszawski
  • Roman Roszko Instytut Slawistyki PAN
  • Wojciech Sosnowski Instytut Slawistyki PAN

DOI:

https://doi.org/10.18778/2544-1795.02.05

Słowa kluczowe:

Polish-Bulgarian Corpora, Parallel Corpora, CLARIN-PL

Abstrakt

Multilingual corpora have found many applications in arts and humanities and social sciences, as well as in translation. A number of ways exist in which multilingual corpora can be used. Translators and CAT users would predominantly use translation memories (TM). Other users can choose from two ways of accessing the resources produced by The Institute of Slavic Studies. In the first method, the user needs to download the open-source TMX translation memories from CLARIN-PL DSpace repository (https://clarin-pl.eu/dspace) and load it into their preferred computer application. One can found free and proprietary applications that facilitate querying multilingual corpora; CLARIN-PL also offers free tools. The other method of accessing the multilingual data produced by The Institute of Slavic Studies does not require any advanced computer skills from the user. CLARIN-PL webpage includes the KonText search engine, which contains also Polish-Bulgarian resources (https://kontext. clarin-pl.eu/). The Polish-Bulgarian corpus contains the following types of resources: (1) fiction literature, (2) specialist literature (literature that is a reflection of the latest technological and cultural developments); and (3) film dialogues, which are the most similar to spoken language.

Bibliografia

Dimitrova L., Koseska-Toszewa V. (2012), Bulgarian-Polish parallel digital corpus and quantification of time, „Cognitive Studies | Études cognitives”, nr 12, s. 199–208. DOI: https://doi.org/10.11649/cs.2012.013.
Google Scholar

Dimitrova L., Koseska-Toszewa V., Roszko D., Roszko R. (2009), Bulgarian-Polish-Lithuanian Corpus – Current Development, [w:] C. Vertan, S. Piperidis, E. Paskaleva, M. Slavcheva (Red.), International Workshop. Multilingual Resources, Technologies and Evaluation for Central and Eastern European Languages held in conjunction with The International Conference RANLP-2009, Proceedings, Borovets, s. 1–8.
Google Scholar

Dimitrova L., Koseska-Toszewa V., Roszko D., Roszko R. (2010), Application of Multilingual Corpus in Contrastive Studies (on the example of the Bulgarian-Polish-Lithuanian Parallel Corpus), „Cognitive Studies | Études cognitives”, nr 10, s. 217–239. DOI: https://dx.doi.org/10.11649/cs.2010.009.
Google Scholar

Dimitrova L., Koseska-Toszewa V., Roszko D., Roszko R. (2014). Trilingual Aligned Corpus – Current State and New Applications, „Cognitive Studies | Études cognitives”, nr 14, s. 13–20. DOI: https://dx.doi.org/10.11649/cs.2014.002.
Google Scholar

Kisiel A., Koseska-Toszewa V., Kotsyba N., Satoła-Staśkowiak J., Sosnowski W. (2016), Polish-Bulgarian-Russian Parallel Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/308).
Google Scholar

Korytkowska M., Koseska-Toszewa V., Roszko R. (2007), Polsko-bułgarska gramatyka konfrontatywna, Wydawnictwo Akademickie Dialog, Warszawa.
Google Scholar

Koseska-Toszewa V. (2013), About Certain Semantic Annotation in Parallel Corpora, „Cognitive Studies | Études cognitives”, nr 13, s. 67–78. DOI: https://doi.org/10.11649/cs.2013.004.
Google Scholar

Koseska-Toszewa V., Dimitrova L., Roszko R. (Red.) (2009), Representing Semantics in Digital Lexicography. Innovative Solutions for Lexical Entry Content in Slavic Lexicography. MONDILEX Fourth Open Workshop. Warszawa, Poland, 29 June – 1 July, 2009. Proceedings, Institute of Slavic Studies, Polish Academy of Sciences, Warsaw.
Google Scholar

Koseska-Toszewa V., Mazurkiewicz A. (2010), Constructing catalogue of temporal situations, „Cognitive Studies | Études cognitives”, nr 10, s. 71–109. DOI: https://doi.org/10.11649/cs.2010.004.
Google Scholar

Koseska V., Penčev J. (Red.) (1988–2009), Gramatyka konfrontatywna bułgarsko-polska, t. I–IX, Sofia–Warszawa.
Google Scholar

Koseska-Toszewa V., Roszko R. (2015), On Semantic Annotation in CLARIN-PL Parallel Corpora, „Cognitive Studies | Études cognitives”, nr 15, s. 211–236. DOI: https://doi.org/10.11649/cs.2015.016.
Google Scholar

Koseska-Toszewa V., Roszko R. (2016). Języki słowiańskie i litewski w korpusach równoległych CLARIN-PL, „Studia z Filologii Polskiej i Słowiańskiej”, nr 51, s. 191–217. DOI: https://doi.org/10.11649/sfps.2016.011.
Google Scholar

Koseska-Toszewa V., Roszko R. (2016). Języki słowiańskie i litewski w korpusach równoległych CLARIN-PL, „Studia z Filologii Polskiej i Słowiańskiej”, nr 51, s. 191–217. DOI: https://doi.org/10.11649/sfps.2016.011.
Google Scholar

Koseska-Toszewa V., Satoła-Staśkowiak J., Sosnowski W. (2013), From the problems of dictionaries and multi-lingual corpora„Cognitive Studies | Études cognitives”, nr 13, s. 113–122. DOI: https://doi.org/10.11649/cs.2013.007.
Google Scholar

Koseska-Toszewa V., Satoła-Staśkowiak J., Sosnowski W. (2013), О работе над книжными и электронными словарями с польским, болгарским и русским языками, [w:] Прикладна лiнгвiстика та лiнгвiстичнi технологiï (MEGALING-2012), s. 124–135.
Google Scholar

Roszko D. (2006), Funkcjonalne odpowiedniki litewskiego perfectum w litewskiej gwarze puńskiej i w języku polskim, Slawistyczny Ośrodek Wydawniczy, Warszawa.
Google Scholar

Roszko D. (2015), Zagadnienia kwantyfikacyjne i modalne w litewskiej gwarze puńskiej (Na tle literackich języków polskiego i litewskiego), Instytut Slawistyki PAN, Warszawa.
Google Scholar

Roszko D., Roszko R. (2009), Morphosyntactic Specifications for Polish and Lithuanian. [Description of Morphosyntactic Markers for Polish and Lithuanian Nouns within MULTEXT-East Morphosyntactic Specifications (Version 3.0 May 10th, 2004)], [w:] Koseska-Toszewa V., Dimitrova L., Roszko R. (Red.) (2009), s. 145–158.
Google Scholar

Roszko D., Roszko R. (2014), A net presentation of Lithuanian sentences containing verbal forms with the grammatical suffix -dav-, „Cognitive Studies | Études cognitives”, nr 14, s. 173–182. DOI: https://doi.org/10.11649/cs.2014.014.
Google Scholar

Roszko D., Roszko R. (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej, [w:] E. Gruszczyńska, A. Leńko-Szymańska (Red.), Polskojęzyczne korpusy równoległe. Polish language Parallel Corpora, Warszawa, s. 119–132. http://repozytorium.ceon.pl/bitstream/handle/123456789/9717/07_Roszko_Roszko.pdf?sequence=1&isAllowed=y, http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf.
Google Scholar

Roszko R. (2004). Semantyczna kategoria określoności/nieokreśloności w języku litewskim (w zestawieniu z językiem polskim), Instytut Slawistyki PAN, Warszawa.
Google Scholar

Roszko R. (2009), Description of Morphosyntactic Markers for Polish Verbs within MULTEXTEast Morphosyntactic Specifications (Version 3.0 May 10th, 2004), [w:] V. Koseska-Toszewa, L. Dimitrova, R. Roszko (Red.) (2009), s. 157–163.
Google Scholar

Roszko D., Roszko R., Sosnowski W., Satoła-Staśkowiak J. (2018), Polish-Bulgarian Parallel Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/536.
Google Scholar

Satoła-Staśkowiak J. (2010), Polsko-bułgarskie odpowiedniości przekładowe czasów przeszłych, Instytut Slawistyki PAN, Warszawa.
Google Scholar

Satoła-Staśkowiak J. (2013), Contemporary Contrastive Studies of Polish, Bulgarian and Russian Neologisms versus Language Corpora, „Cognitive Studies | Études cognitives”, nr 13, s. 143–160. DOI: https://doi.org/10.11649/cs.2013.009.
Google Scholar

Satoła-Staśkowiak J. (2017), Badania nad najmłodszą leksyką słowiańską w oparciu o korpusy językowe, [w:] Д. Благоева, Л. Андрейчин (Red.), Былгарско-полски студии, Българска академия на науките. Институт за български език, s. 32–45.
Google Scholar

Satoła-Staśkowiak J., Koseska-Toszewa V. (2014), Współczesny słownik bułgarsko-polski, Instytut Slawistyki PAN, Warszawa.
Google Scholar

Sosnowski W., 2013. Forms of address and their meaning in contrast in Polish and Russian languages, „Cognitive Studies | Études cognitives”, nr 13, s. 225–235. DOI: https://doi.org/10.11649/cs.2013.015.
Google Scholar

Sosnowski W., Kisiel A., Koseska-Toszewa V. (2017), Leksykon odpowiedniości semantycznych w języku polskim, bułgarskim i rosyjskim, Instytut Slawistyki PAN, Warszawa.
Google Scholar

Sosnowski W., Koseska-Toszewa V. (2015), Multilingualism and Dictionaries, „Cognitive Studies | Études cognitives”, nr 15, s. 43–55. DOI: https://doi.org/10.11649/cs.2015.004.
Google Scholar

Pobrania

Opublikowane

2019-06-05

Jak cytować

Roszko, D., Roszko, R., & Sosnowski, W. (2019). Polsko-bułgarskie korpusy IS PAN i CLARIN-PL. Slavica Lodziensia, 2, 59–70. https://doi.org/10.18778/2544-1795.02.05