Застосування розвідувального аналізу даних для дослідження факторів, що впливають на якість сну

  • Ксенія Базілевич Національний аерокосмічний університет "Харківський авіаційний інститут", вул. Вадима Манька, 17, 61070, Харків https://orcid.org/0000-0001-5332-9545
  • Юрій Парфенюк Харківський національний університет імені В. Н. Каразіна, майдан Свободи 4, 61022, Харків https://orcid.org/0000-0001-5357-1868
Ключові слова: сон, якість сну, машинне навчання, регресія, класифікація, логістична регресія, дерево рішень, eda, python, sleep health dataset

Анотація

Актуальність. Дослідження багатофакторної природи якості сну потребує аналізу великих масивів даних, що неможливо без застосування методів розвідувального аналізу (EDA) для виявлення прихованих закономірностей. У зв’язку з цим, розробка підходів до інтелектуального дослідження чинників впливу на сон є актуальною науково-технічною задачею Мета. Дослідити та виявити взаємозв'язки між наборами фізіологічних, поведінкових та зовнішніх факторів та якістю сну за допомогою exploratory data analysis. Методи дослідження. Дослідження базувалось на методах розвідувального аналізу даних (EDA) для того, щоб в першу чергу дослідити наявність кореляцій між якістю сну та такими змінними, як тривалість сну, рівень стресу й фізична активність. Подальша побудова теплової карти необхідна була для виявлення прихованих залежності та отримання найбільш релевантних ознак. Також було використано модель лінійної регресії, модель дерева рішень, модель логістичної регресії для дослідження факторів, що впливають на якість сну людини. Результати. Представлено результати, які отримані за допомогою розробленого програмного додатку з графічним інтерфейсом для дослідження факторів, що впливають на якість сну людини. Програмний додаток дозволяє виконувати завантаження даних, проводити розвідувальний аналіз, будувати моделі та виводити результати у зручному форматі, підтримує застосування як класифікаційних, так і регресійних алгоритмів, дозволяючи адаптувати її до різних агналітичних завдань. Було проведено аналіз отриманих результатів та виявлено моделі з найбільшою точністю, адаптивністю до складних зв’язків і пояснюваністю. Висновки. Отримані результати підтверджують універсальність методу дерев рішень для аналізу факторів сну. Його точність і прозорість алгоритмів роблять цей підхід оптимальним для моделювання складних взаємозв’язків у межах дослідження. В цілому, аналіз чинників впливу на сон за допомогою методів EDA дозволяє трансформувати складні дані у змістовні аналітичні моделі, що є актуальним завданням для цифрової медицини.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Ксенія Базілевич, Національний аерокосмічний університет "Харківський авіаційний інститут", вул. Вадима Манька, 17, 61070, Харків

к.т.н., доцент, доцент кафедри математичного моделювання та штучного інтелекту

Юрій Парфенюк, Харківський національний університет імені В. Н. Каразіна, майдан Свободи 4, 61022, Харків

PhD, старший  викладач, кафедри теоретичної та прикладної інформатики

Посилання

Hobson J. A. Sleep is of the brain, by the brain and for the brain. Nature. 2005;437(7063):1254–1256. https://doi.org/10.1038/nature04283.

Irish L. A., Kline C. E., Gunn H. E., Hall M. H., Buysse D. J. The role of sleep hygiene in promoting public health: a review of empirical evidence. Sleep Medicine Reviews. 2015;22:23–36. https://doi.org/10.1016/j.smrv.2014.10.001.

Deng Z., Xie L., Wang Y., Li Y., Huang X., Sun L. Application of logistic regression in diagnosis of OSA severity. Sleep and Breathing. 2020;24(4):1379–1387. https://doi.org/10.1007/s11325-020-02029-x.

Korost Ya. V., Shkvarok A. K. Assessment of sleep quality of the population of Ukraine during martial law and the risk of cardiovascular complaints associated with clinically expressed insomnia. Clinical and Preventive Medicine. 2023;(7):68–73. https://doi.org/10.31612/2616-4868.7.2023.09

Ukrinform. Half of Ukrainians have sleep problems. URL: https://www.ukrinform.ua/rubric-society/3958411-polovina-ukrainciv-maut-problemi-zi-snom.html (accessed 12.12.2025).).

Carskadon M. A., Dement W. C. Normal human sleep: an overview. In: Kryger M. H., Roth T., Dement W. C., editors. Principles and Practice of Sleep Medicine. 6th ed. Philadelphia: Elsevier; 2017. p. 15–24.

Freeman D., Sheaves B., Waite F., Harvey A. G. Sleep disturbance and psychiatric disorders: a review of meta-analyses. The Lancet Psychiatry. 2017;4(8):684–698. https://doi.org/10.1016/S2215-0366(17)30150-9.

Khalid M., Klerman E. B., McHill A. W., Phillips A. J. K., Sano A. SleepNet: attention-enhanced robust sleep prediction using dynamic social networks. arXiv preprint. 2024;arXiv:2401.11113. Available from: https://arxiv.org/abs/2401.11113 (accessed 12 Dec 2025).

Tukey J. W. Exploratory Data Analysis. Reading, MA: Addison-Wesley; 1977. 688 p.

Kelleher J. D., Tierney B. Data Science: An Introduction. Cambridge, MA: MIT Press; 2018. 280 p.

Behrens J. T., Yu C. H. Exploratory data analysis. In: Schinka J. A., Velicer W. F., editors. Handbook of Psychology. Vol. 2. Thousand Oaks, CA: SAGE; 2003. p. 33–48.

Provost F., Fawcett T. Data Science for Business. Sebastopol, CA: O’Reilly Media; 2013. 414 p.

Dasgupta A. Practical Data Analysis. Birmingham: Packt Publishing; 2014. 342 p.

Lundgren O., Moneta G. B. Associations of subjective sleep quality with depression, anxiety, and physical symptoms. Scandinavian Journal of Psychology. 2011;52(6):544–550. https://doi.org/10.1111/j.1467-9450.2011.00910.x

Lemma S., Gelaye B., Berhane Y., Worku A., Williams M. A. Sleep quality and its psychological correlates among university students in Ethiopia: a cross-sectional study. BMC Psychiatry. 2012;12:237. https://doi.org/10.1186/1471-244X-12-237

Trujillano J., Gil-Sánchez D., Párraga-Martínez I., Flores-Mateo G. Methodological review of classification trees for risk stratification in health research // Nutrients. – 2025. – Vol. 17, № 11. – Article 1903. – doi: 10.3390/nu17111903.

Rezvani S., Pourpanah F., Lim C. P., Wu Q. M. J. Methods for class-imbalanced learning with support vector machines: a review and an empirical evaluation. Soft Computing. 2024;28:11873–11894. https://doi.org/10.1007/s00500-024-09931-5

Fu W. Exploratory data analysis and machine learning models for stroke prediction. In: Proceedings of the 1st International Conference on Data Analysis and Machine Learning (DAML 2023); 2024. p. 211–217. https://doi.org/10.5220/0012783300003885.

Permana K. E., Iramina K. Enhancing sleep stage classification with single-channel EEG: feature extraction and Random Forest–XGBoost model. IEEE Access. 2025;13:149554–149566. https://doi.org/10.1109/ACCESS.2025.3599828.

Gao Q., Wu K. Automatic sleep staging based on power spectral density and random forest. Journal of Biomedical Engineering. 2023;40(2):280–285, 294. https://doi.org/10.7507/1001-5515.202207047.

Wang Y., Ye S., Xu Z., Chu Y., Zhang J., Yu W. Research on sleep staging based on support vector machine and extreme gradient boosting algorithm. Nature and Science of Sleep. 2024;16:1827–1847. https://doi.org/10.2147/NSS.S467111.

Xu X., Zhang B., Xu T., Tang J. An effective and interpretable sleep stage classification approach using multi-domain EEG and EOG features. Bioengineering. 2025;12(3):286. https://doi.org/10.3390/bioengineering12030286.

Sleep Health and Lifestyle Dataset. Kaggle. Available from: https://www.kaggle.com/datasets/uom190346a/sleep-health-and-lifestyle-dataset (accessed 12 Dec 2025).

Опубліковано
2026-03-30
Як цитувати
Базілевич, К., & Парфенюк, Ю. (2026). Застосування розвідувального аналізу даних для дослідження факторів, що впливають на якість сну. Вісник Харківського національного університету імені В.Н. Каразіна, серія «Математичне моделювання. Інформаційні технології. Автоматизовані системи управління», 69, 6-19. https://doi.org/10.26565/2304-6201-2026-69-01
Розділ
Статті