Polsko-bułgarskie korpusy IS PAN i CLARIN-PL
DOI:
https://doi.org/10.18778/2544-1795.02.05Słowa kluczowe:
Polish-Bulgarian Corpora, Parallel Corpora, CLARIN-PLAbstrakt
Multilingual corpora have found many applications in arts and humanities and social sciences, as well as in translation. A number of ways exist in which multilingual corpora can be used. Translators and CAT users would predominantly use translation memories (TM). Other users can choose from two ways of accessing the resources produced by The Institute of Slavic Studies. In the first method, the user needs to download the open-source TMX translation memories from CLARIN-PL DSpace repository (https://clarin-pl.eu/dspace) and load it into their preferred computer application. One can found free and proprietary applications that facilitate querying multilingual corpora; CLARIN-PL also offers free tools. The other method of accessing the multilingual data produced by The Institute of Slavic Studies does not require any advanced computer skills from the user. CLARIN-PL webpage includes the KonText search engine, which contains also Polish-Bulgarian resources (https://kontext. clarin-pl.eu/). The Polish-Bulgarian corpus contains the following types of resources: (1) fiction literature, (2) specialist literature (literature that is a reflection of the latest technological and cultural developments); and (3) film dialogues, which are the most similar to spoken language.
Bibliografia
Dimitrova L., Koseska-Toszewa V. (2012), Bulgarian-Polish parallel digital corpus and quantification of time, „Cognitive Studies | Études cognitives”, nr 12, s. 199–208. DOI: https://doi.org/10.11649/cs.2012.013.
Google Scholar
Dimitrova L., Koseska-Toszewa V., Roszko D., Roszko R. (2009), Bulgarian-Polish-Lithuanian Corpus – Current Development, [w:] C. Vertan, S. Piperidis, E. Paskaleva, M. Slavcheva (Red.), International Workshop. Multilingual Resources, Technologies and Evaluation for Central and Eastern European Languages held in conjunction with The International Conference RANLP-2009, Proceedings, Borovets, s. 1–8.
Google Scholar
Dimitrova L., Koseska-Toszewa V., Roszko D., Roszko R. (2010), Application of Multilingual Corpus in Contrastive Studies (on the example of the Bulgarian-Polish-Lithuanian Parallel Corpus), „Cognitive Studies | Études cognitives”, nr 10, s. 217–239. DOI: https://dx.doi.org/10.11649/cs.2010.009.
Google Scholar
Dimitrova L., Koseska-Toszewa V., Roszko D., Roszko R. (2014). Trilingual Aligned Corpus – Current State and New Applications, „Cognitive Studies | Études cognitives”, nr 14, s. 13–20. DOI: https://dx.doi.org/10.11649/cs.2014.002.
Google Scholar
Kisiel A., Koseska-Toszewa V., Kotsyba N., Satoła-Staśkowiak J., Sosnowski W. (2016), Polish-Bulgarian-Russian Parallel Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/308).
Google Scholar
Korytkowska M., Koseska-Toszewa V., Roszko R. (2007), Polsko-bułgarska gramatyka konfrontatywna, Wydawnictwo Akademickie Dialog, Warszawa.
Google Scholar
Koseska-Toszewa V. (2013), About Certain Semantic Annotation in Parallel Corpora, „Cognitive Studies | Études cognitives”, nr 13, s. 67–78. DOI: https://doi.org/10.11649/cs.2013.004.
Google Scholar
Koseska-Toszewa V., Dimitrova L., Roszko R. (Red.) (2009), Representing Semantics in Digital Lexicography. Innovative Solutions for Lexical Entry Content in Slavic Lexicography. MONDILEX Fourth Open Workshop. Warszawa, Poland, 29 June – 1 July, 2009. Proceedings, Institute of Slavic Studies, Polish Academy of Sciences, Warsaw.
Google Scholar
Koseska-Toszewa V., Mazurkiewicz A. (2010), Constructing catalogue of temporal situations, „Cognitive Studies | Études cognitives”, nr 10, s. 71–109. DOI: https://doi.org/10.11649/cs.2010.004.
Google Scholar
Koseska V., Penčev J. (Red.) (1988–2009), Gramatyka konfrontatywna bułgarsko-polska, t. I–IX, Sofia–Warszawa.
Google Scholar
Koseska-Toszewa V., Roszko R. (2015), On Semantic Annotation in CLARIN-PL Parallel Corpora, „Cognitive Studies | Études cognitives”, nr 15, s. 211–236. DOI: https://doi.org/10.11649/cs.2015.016.
Google Scholar
Koseska-Toszewa V., Roszko R. (2016). Języki słowiańskie i litewski w korpusach równoległych CLARIN-PL, „Studia z Filologii Polskiej i Słowiańskiej”, nr 51, s. 191–217. DOI: https://doi.org/10.11649/sfps.2016.011.
Google Scholar
Koseska-Toszewa V., Roszko R. (2016). Języki słowiańskie i litewski w korpusach równoległych CLARIN-PL, „Studia z Filologii Polskiej i Słowiańskiej”, nr 51, s. 191–217. DOI: https://doi.org/10.11649/sfps.2016.011.
Google Scholar
Koseska-Toszewa V., Satoła-Staśkowiak J., Sosnowski W. (2013), From the problems of dictionaries and multi-lingual corpora„Cognitive Studies | Études cognitives”, nr 13, s. 113–122. DOI: https://doi.org/10.11649/cs.2013.007.
Google Scholar
Koseska-Toszewa V., Satoła-Staśkowiak J., Sosnowski W. (2013), О работе над книжными и электронными словарями с польским, болгарским и русским языками, [w:] Прикладна лiнгвiстика та лiнгвiстичнi технологiï (MEGALING-2012), s. 124–135.
Google Scholar
Roszko D. (2006), Funkcjonalne odpowiedniki litewskiego perfectum w litewskiej gwarze puńskiej i w języku polskim, Slawistyczny Ośrodek Wydawniczy, Warszawa.
Google Scholar
Roszko D. (2015), Zagadnienia kwantyfikacyjne i modalne w litewskiej gwarze puńskiej (Na tle literackich języków polskiego i litewskiego), Instytut Slawistyki PAN, Warszawa.
Google Scholar
Roszko D., Roszko R. (2009), Morphosyntactic Specifications for Polish and Lithuanian. [Description of Morphosyntactic Markers for Polish and Lithuanian Nouns within MULTEXT-East Morphosyntactic Specifications (Version 3.0 May 10th, 2004)], [w:] Koseska-Toszewa V., Dimitrova L., Roszko R. (Red.) (2009), s. 145–158.
Google Scholar
Roszko D., Roszko R. (2014), A net presentation of Lithuanian sentences containing verbal forms with the grammatical suffix -dav-, „Cognitive Studies | Études cognitives”, nr 14, s. 173–182. DOI: https://doi.org/10.11649/cs.2014.014.
Google Scholar
Roszko D., Roszko R. (2016), Polsko-litewskie korpusy równoległe. Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej, [w:] E. Gruszczyńska, A. Leńko-Szymańska (Red.), Polskojęzyczne korpusy równoległe. Polish language Parallel Corpora, Warszawa, s. 119–132. http://repozytorium.ceon.pl/bitstream/handle/123456789/9717/07_Roszko_Roszko.pdf?sequence=1&isAllowed=y, http://rownolegle.blog.ils.uw.edu.pl/files/2016/03/0000_Korpusy.pdf.
Google Scholar
Roszko R. (2004). Semantyczna kategoria określoności/nieokreśloności w języku litewskim (w zestawieniu z językiem polskim), Instytut Slawistyki PAN, Warszawa.
Google Scholar
Roszko R. (2009), Description of Morphosyntactic Markers for Polish Verbs within MULTEXTEast Morphosyntactic Specifications (Version 3.0 May 10th, 2004), [w:] V. Koseska-Toszewa, L. Dimitrova, R. Roszko (Red.) (2009), s. 157–163.
Google Scholar
Roszko D., Roszko R., Sosnowski W., Satoła-Staśkowiak J. (2018), Polish-Bulgarian Parallel Corpus, CLARIN-PL digital repository, http://hdl.handle.net/11321/536.
Google Scholar
Satoła-Staśkowiak J. (2010), Polsko-bułgarskie odpowiedniości przekładowe czasów przeszłych, Instytut Slawistyki PAN, Warszawa.
Google Scholar
Satoła-Staśkowiak J. (2013), Contemporary Contrastive Studies of Polish, Bulgarian and Russian Neologisms versus Language Corpora, „Cognitive Studies | Études cognitives”, nr 13, s. 143–160. DOI: https://doi.org/10.11649/cs.2013.009.
Google Scholar
Satoła-Staśkowiak J. (2017), Badania nad najmłodszą leksyką słowiańską w oparciu o korpusy językowe, [w:] Д. Благоева, Л. Андрейчин (Red.), Былгарско-полски студии, Българска академия на науките. Институт за български език, s. 32–45.
Google Scholar
Satoła-Staśkowiak J., Koseska-Toszewa V. (2014), Współczesny słownik bułgarsko-polski, Instytut Slawistyki PAN, Warszawa.
Google Scholar
Sosnowski W., 2013. Forms of address and their meaning in contrast in Polish and Russian languages, „Cognitive Studies | Études cognitives”, nr 13, s. 225–235. DOI: https://doi.org/10.11649/cs.2013.015.
Google Scholar
Sosnowski W., Kisiel A., Koseska-Toszewa V. (2017), Leksykon odpowiedniości semantycznych w języku polskim, bułgarskim i rosyjskim, Instytut Slawistyki PAN, Warszawa.
Google Scholar
Sosnowski W., Koseska-Toszewa V. (2015), Multilingualism and Dictionaries, „Cognitive Studies | Études cognitives”, nr 15, s. 43–55. DOI: https://doi.org/10.11649/cs.2015.004.
Google Scholar
Pobrania
Opublikowane
Jak cytować
Numer
Dział
Licencja
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa – Użycie niekomercyjne – Bez utworów zależnych 4.0 Międzynarodowe.