Corpora methods in studying regional language varieties, exemplified by geographically annotated Ukrainian and Russian corpora

  • Марія Олексіївна Шведова Київський національний лінгвістичний університет
Keywords: corpus linguistics, regional language varieties, regional lexica, Ukrainian language, Russian language of Ukraine


The paper briefly presents existing corpora resources featuring Ukrainian texts as well as the previous experience in corpora-based studies of national language varieties (eg British vs. American English, New world Englishes, varieties of Spanish, Russian language in Belarus). The author has built two large corpora, respectively of the (written standard-oriented) Russian language in Ukraine (the so-called Ukrainian Russian) and of the Ukrainian language. Both corpora feature metatextual annotation by the regions where the texts were created (including, for Ukrainian, different countries of diaspora). The paper describes the main properties of these corpora and features examples of corpora-based lexical studies: borrowings in Ukrainian Russian (as compared to the standard of Russia proper, represented in the Russian National Corpus) and geographically distributed synonyms in Ukrainian.


Author Biography

Марія Олексіївна Шведова, Київський національний лінгвістичний університет

кандидат філологічних наук, докторант кафедри російської
мови та літератури


1. Ахметова М. В. Лексические регионализмы и локализмы в русскоязычном Интернете: проблема сбора материала / М. В. Ахметова // Русский язык и новые технологии. – М., 2014. – С. 155–171.

2. Беликов В. И. К методике корпусного исследования лексики / В. И. Беликов // Русский язык и новые технологии. – М., 2014. – С. 99–130.

3. Романий Г. И. Региональная городская лексика в русском языке: происхождение, типология и ареализация по данным узуса в сети Интернет / Г. И. Романий // Русский язык и новые технологии. – М., 2014. – С. 172–186.

4. Рычкова Л. В. Многоцелевой лингвистический корпус региональных СМИ / Л. В. Рычкова, А. Ю. Станкевич // Информационно-коммуникативные технологии в лингвистике, лингводидактике и межкультурной коммуникации. – Вып. 6. – М., 2014. – С. 488–497.

5. Савчук С. О. Корпус как инструмент для исследования особенностей функционирования русского языка в региональной прессе / С. О. Савчук // Труды института русского языка им. В. В. Виноградова. – М., 2015. – С. 333–365.

6. Шведова М. А. Иноязычные влияния в русской речи Украины (Лексика) / М. А. Шведова // Мовознавчий вісник : Збірник наукових праць / Ред. кол. : Г. І. Мартинова та ін. – Черкаси, 2016. – Вип. 21. – С. 86–92.

7. Mair С. World Englishes and Corpora / С. Mair // M. Filppula et al. (eds.) The Oxford Handbook of World Englishes. Oxford: Oxford University press, 2017.

8. Schmied J. Corpus linguistics and non-native varieties of English / J. Schmied // World Englishes, 1990 – Vol. 9 – No. 3. – pp. 255–268.

9. Werner V. Re-Assessing the Present Perfect: Corpus Studies and Beyond / V. Werner, E. Seoane (eds.) – Berlin : Mouton de Gruyter, 2016.
How to Cite
Шведова, М. О. (2018). Corpora methods in studying regional language varieties, exemplified by geographically annotated Ukrainian and Russian corpora. The Journal of V. N. Karazin Kharkiv National University. Series “Philology”, (77), 33-38. Retrieved from
The ideas of Kharkiv Philological School in Historical Retrospective Review and Modern Linguistic Paradigms