Експертна система оцінювання закономірностей мови методами непараметричної статистики
Анотація
Анотація. В роботі аргументовано, що при проведенні лінгвістичних досліджень мають місце завдання, вирішення яких потребує використання інструментарію непараметричних статистичних методів, зокрема проблеми семантичної відмінності речень.
Будь-яка мова, як система комунікації, характеризується поєднанням дискретних одиниць, особливою структурою та елементами, що пов’язаними між собою. Постійне збільшення їхньої кількості є результатом послідовної еволюції та розвитку мови. Використання статистичних методів у лінгвістиці, безумовно, підвищить ефективність лінгвістичного спостереження, його точність та надійність, а також узгодженість та доказовість лінгвістичних припущень.
Мету наукового дослідження визначено як, розробка експертної системи оцінки закономірностей мови методами непараметричної статистики для будь-якої мови.
Методи дослідження. В роботі використано методи непараметричної статистики, нотація IDEF4, мова програмування C#.
В роботі розроблена спеціалізована експертна система з використанням мови програмування С # для здійснення автоматичного опитування «носіїв» мови та аналізу лексичного значення фраз, яка реалізована у вигляді Desktop-програми для ОС Windows.
Для вибору мови програмування експертної системи сформульовані наступні вимоги: програмний продукт повинен бути реалізований для ОС Windows, забезпечувати якісний і доброзичливий інтерфейс, крім того немає необхідності в розподіленому додатку. Програмний продукт не надає можливість редагувати вихідний документ. У програму зчитується текст в форматах docх, rtf або txt. В алгоритмі передбачені можливості створення нового словника фраз із введенням їх експертних оцінок, перегляд і завантаження існуючих словників.
При роботі програми врахована можливість урахування визначення відповідності декількох фраз з файлів словників з різними експертними оцінками.
У лінгвістичних дослідженнях якісних характеристик текстів досить точні результати дають непараметричні критерії відмінностей мовних елементів. В умовах суцільної діджіталізаціі інформації та її величезних обсягів процес лінгвістичного аналізу тексту, зокрема аналізу тексту на смислову однозначність потребує максимальної автоматизації.
Завантаження
Посилання
/Посилання
B. Strickland, “Language Reflects ‘Core’ Cognition: A New Theory About the Origin of Cross-Linguistic Regularities,” Cognitive Science, vol. 41, pp. 70–101, 2017. Available: https://onlinelibrary.wiley.com/doi/10.1111/cogs.12332
V. V. Zhukovska, “Cognitive-quantitative parametrization of positional properties of English detached impersonal/non-verbal constructions with explicit subject,” Zakarpatski Filolohichni Studii, vol. 17, no. 2, pp. 121–128, 2021. [in Ukrainian] Available: https://dspace.uzhnu.edu.ua/items/54938f63-cea9-43bd-b849-4c925e87811f
V. M. Zayats and M. M. Zayats, “Methods of comparing statistical characteristics in the formation of samples in linguistics,” Scientific Bulletin Journal of Lviv Polytechnic National University "Information Systems and Networks", no. 673, pp. 296–305, 2010. Available: https://ena.lpnu.ua/handle/ntb/6753
Ye. V. Kupriianov, N. S. Uholnikova, and O. M. Yurchenko, Structural linguistics in theory and practice. Kharkiv, Ukraine: NTU “KhPI”, 2024. [in Ukrainian]. Available: https://repository.kpi.kharkov.ua/handle/KhPI-Press/76037
W. Zhang, T. Yoshida, and X. Tang, “Text classification based on multi-word with support vector machine,” Knowledge-Based Systems, vol. 21, no. 8, pp. 879–886, 2008. Available: https://www.sciencedirect.com/science/article/abs/pii/S0950705108000968?via%3Dihub
A. Sitar, “Statistical analysis of phraseologized sentences: an indicator of mutual information association,” Ukrainian Linguistics. Kyiv: Taras Shevchenko National University. vol. 1, no. 46, pp. 114–125, 2016. [in Ukrainian] Available: https://doi.org/10.17721/um/46(2016).103-125
W. Zhang, T. Yoshida, and X. Tang, “Text classification based on multi-word with support vector machine,” Knowledge-Based Systems, vol. 21, no. 8, pp. 879–886, 2008. Available: https://www.researchgate.net/publication/222219356_Text_classification_based_on_multi-word_with_support_vector_machine#fullTextFileContent
V. Lytvyn, V. Vysotska, and M. H. Hrendus, “Method of data expression from the Ukrainian content based on the ontological approach,” Radio Electronics, Computer Science, Control, no. 3, vol. 2362, pp. 53–70, 2018. Available: https://ric.zp.edu.ua/article/view/149991
J. Skeet, C# in Depth, 4th ed. Shelter Island, NY: Manning, 2019. Available: chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://dl.ebooksworld.ir/motoman/Manning.Csharp.in.Depth.4th.Edition.www.EBooksWorld.ir.pdf
B. Strickland, “Language Reflects ‘Core’ Cognition: A New Theory About the Origin of Cross-Linguistic Regularities,” Cognitive Science, vol. 41, pp. 70–101, 2017. Available: https://onlinelibrary.wiley.com/doi/10.1111/cogs.12332
V. V. Zhukovska, “Cognitive-quantitative parametrization of positional properties of English detached impersonal/non-verbal constructions with explicit subject,” Zakarpatski Filolohichni Studii, vol. 17, no. 2, pp. 121–128, 2021. [in Ukrainian] Available: https://dspace.uzhnu.edu.ua/items/54938f63-cea9-43bd-b849-4c925e87811f
V. M. Zayats and M. M. Zayats, “Methods of comparing statistical characteristics in the formation of samples in linguistics,” Scientific Bulletin Journal of Lviv Polytechnic National University "Information Systems and Networks", no. 673, pp. 296–305, 2010. Available: https://ena.lpnu.ua/handle/ntb/6753
Ye. V. Kupriianov, N. S. Uholnikova, and O. M. Yurchenko, Structural linguistics in theory and practice. Kharkiv, Ukraine: NTU “KhPI”, 2024. [in Ukrainian]. Available: https://repository.kpi.kharkov.ua/handle/KhPI-Press/76037
W. Zhang, T. Yoshida, and X. Tang, “Text classification based on multi-word with support vector machine,” Knowledge-Based Systems, vol. 21, no. 8, pp. 879–886, 2008. Available: https://www.sciencedirect.com/science/article/abs/pii/S0950705108000968?via%3Dihub
A. Sitar, “Statistical analysis of phraseologized sentences: an indicator of mutual information association,” Ukrainian Linguistics. Kyiv: Taras Shevchenko National University. vol. 1, no. 46, pp. 114–125, 2016. [in Ukrainian] Available: https://doi.org/10.17721/um/46(2016).103-125
W. Zhang, T. Yoshida, and X. Tang, “Text classification based on multi-word with support vector machine,” Knowledge-Based Systems, vol. 21, no. 8, pp. 879–886, 2008. Available: https://www.researchgate.net/publication/222219356_Text_classification_based_on_multi-word_with_support_vector_machine#fullTextFileContent
V. Lytvyn, V. Vysotska, and M. H. Hrendus, “Method of data expression from the Ukrainian content based on the ontological approach,” Radio Electronics, Computer Science, Control, no. 3, vol. 2362, pp. 53–70, 2018. Available: https://ric.zp.edu.ua/article/view/149991
J. Skeet, C# in Depth, 4th ed. Shelter Island, NY: Manning, 2019. Available: chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://dl.ebooksworld.ir/motoman/Manning.Csharp.in.Depth.4th.Edition.www.EBooksWorld.ir.pdf