Принципові напрями розгортання захищеного документообігу на платформах штучного інтелекту

doi:10.26565/1727-6667-2025-1-02

Олександр Валентинович Орлов Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, м. Харків, 61022, Україна https://orcid.org/0000-0001-8995-7383
Євген Олександрович Живило Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, м. Харків, 61022, Україна https://orcid.org/0000-0003-4077-7853
Віктор Олександрович Нестеренко Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, м. Харків, 61022, Україна https://orcid.org/0000-0002-4237-3433

DOI: https://doi.org/10.26565/1727-6667-2025-1-02

Ключові слова: захищений документообіг, штучний інтелект, великі мовні моделі, Ollama, DeepSeek-R1, Docker Desktop, контейнеризація, інформаційна безпека, інтелектуальна обробка документів.

Анотація

У статті досліджено принципові напрями розгортання захищеного документообігу на платформах штучного інтелекту з використанням локальних великих мовних моделей (LLM). Проаналізовано технологічні особливості та функціональні можливості інструментів Ollama та DeepSeek-R1 в контексті забезпечення конфіденційності обробки документів. Розглянуто переваги контейнеризації додатків штучного інтелекту на базі Docker Desktop для підвищення рівня безпеки та ізоляції компонентів системи. Запропоновано концептуальну модель багаторівневої архітектури системи захищеного документообігу, що включає інфраструктурний рівень, рівень обробки документів, рівень захисту даних та рівень моніторингу й реагування. Ідентифіковано ключові безпекові ризики, пов’язані з використанням великих мовних моделей у системах документообігу, та описано методології їх мінімізації, зокрема із застосуванням спеціалізованого інструменту тестування безпеки Garak.
На основі результатів дослідження сформульовано практичні рекомендації щодо розгортання та налаштування систем захищеного документообігу з урахуванням вимог до автономності, масштабованості та регламентованої обробки чутливої інформації. Зокрема, обґрунтовано доцільність використання локальних LLM у середовищах із суворими політиками щодо передачі даних за межі контрольованої зони організації (державні установи, медичні заклади, підприємства оборонного комплексу). Встановлено, що поєднання локальних мовних моделей із контейнеризованою інфраструктурою забезпечує оптимальний баланс між функціональністю, продуктивністю та безпекою.
Результати дослідження демонструють, що інтеграція локальних LLM з контейнеризованою інфраструктурою дозволяє забезпечити оптимальний баланс між функціональністю, продуктивністю та безпекою систем документообігу, особливо в галузях з підвищеними вимогами до конфіденційності даних.
Необхідно зазначити, що перспективою подальших досліджень є формування інтелектуальних, безпечних та гнучких систем публічного управління нового покоління, здатних ефективно функціонувати в умовах складного інформаційного середовища.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Олександр Валентинович Орлов, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, м. Харків, 61022, Україна

доктор наук з державного управління, професор, професор кафедри
публічної політики навчально-наукового інституту «Інститут державного управління»
Харківського національного університету імені В.Н. Каразіна,
майдан Свободи, 4, м. Харків, 61022, Україна

Євген Олександрович Живило, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, м. Харків, 61022, Україна

кандидат наук з державного управління, доцент, докторант кафедри публічної політики
Навчально-наукового інституту «Інститут державного управління»
Харківського національного університету імені В.Н. Каразіна,
майдан Свободи, 4, м. Харків, 61022, Україна

Віктор Олександрович Нестеренко, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, м. Харків, 61022, Україна

аспірант кафедри публічної політики
Навчально-наукового інституту «Інститут державного управління»
Харківського національного університету імені В.Н. Каразіна,
майдан Свободи, 4, м. Харків, 61022, Україна

Посилання

Feretzakis, G., Papaspyridis, K., Gkoulalas-Divanis, A., & Verykios, V.S. (2024). Privacy-Preserving Techniques in Generative AI and Large Language Models: A Narrative Review. Information. 15(11):697. DOI: https://doi.org/10.3390/info15110697

Das, B. C., Amini, M. H., & Wu, Y. (2025). Security and privacy challenges of large language models: A survey. ACM Computing Surveys, 57(6), R. 1-39.

The «Big 8» Trends in Document Management in 2025. (2025, January 27). URL: https://www.adlibsoftware.com/news/the-big-8-trends-in-document-management-in-2025

Guo, D., Zhu, Q., Yang, D., Xie, Z., Dong, K., Zhang, W., ... & Liang, W. (2024). DeepSeek-Coder: When the Large Language Model Meets Programming-The Rise of Code Intelligence. arXiv preprint arXiv:2401.14196. URL: https://arxiv.org/abs/2401.14196

Zhihan, Zhang, Yixin, Cao, Chenchen, Ye, Yunshan, Ma, Lizi, Liao, & Tat-Seng, Chua. (2024). Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 1588-1606, Bangkok, Thailand. Association for Computational Linguistics.

Derczynski, L., Galinkin, E., Martin, J., Majumdar, S., & Inie, N. (2024). garak: A framework for security probing large language models. arXiv preprint arXiv:2406.11036.

Kolchenko, V., Khoma, V., Sabodashko, D., & Perepelytsia, P. (2024). Exploring large language models security threats with automated tools. Social Development and Security, 14(6), 81-96. DOI; https://doi.org/10.33445/sds.2024.14.6.9. URL: https://arxiv.org/abs/2406.11036

Sahana Upadhya et al. A State-of-Art Review of Docker Container Security Issues and Solutions. (2017). American International Journal of Research in Science, Technology, Engineering & Mathematics, 17(1), (December 2016-February 2017), 33-36. URL: https://www.researchgate.net/publication/315823494

Docker Security: 5 Risks and 5 Best Practices for Securing Your Containers URL: https://www.tigera.io/learn/guides/container-security-best-practices/docker-security/

Penubadi, H.R. (2023). Sustainable electronic document security: A comprehensive framework integrating encryption, digital signature and watermarking algorithms, Heritage and Sustainable Development, vol. 5, no. 2, pp. 391-404, URL: https://hsd.ardascience.com/index.php/journal/article/view/359

Jakesch, M. (2022). Assessing the Effects and Risks jf Large Language Models in Ai-Mediated Communication : Cornell University. URL: https://www.jakesch-lab.org/assets/pdf/thesis_jakesch_cornell_phd.pdf

Ollama. (2024). Run Llama 2, Mistral, Gemma and other large language models locally. URL: https://ollama.com

Das, Badhan Chandra, Amini, M. Hadi, & Wu, Yanzhao. (2025). Security and privacy challenges of large language models: A survey. ACM Computing Surveys, 57.6: 1-39. Ollama Models Library. URL: https://ollama.com/library

Ollama Documentation. (2024). Modelfile reference. URL: https://github.com/ollama/ollama/blob/main/docs/modelfile.md

Hoffmann, J., Borgeaud, S., Mensch, A., et al. (2022). Training Compute-Optimal Large Language Models. arXiv:2203.15556. URL: https://arxiv.org/abs/2203.15556

Chen, M., Tworek, J., Jun, H., et al. (2021). Evaluating Large Language Models Trained on Code. arXiv:2107.03374. URL: https://arxiv.org/abs/2107.03374

LM Studio. (2024). Run local large language models. URL: https://lmstudio.ai

Mozilla. (2024). llamafile: Distribute and run LLMs with a single file. URL: https://github.com/Mozilla-Ocho/llamafile

Jan AI. (2024). Run open-source LLMs locally. URL: https://jan.ai

NextChat. (2024). Local ChatGPT-like assistant. URL: https://github.com/next-chat/next-chat

Faraday.dev. (2024). Local AI Development Environment. URL: https://faraday-dev.en.softonic.com/web-apps

Backyard AI. (2024). Self-hosted AI assistant platform. URL: https://backyard.ai/

GPT4All. (2024). Run open-source large language models locally. URL: https://gpt4all.io

Gruber, Johannes B. & Weber, Maximilian. (2024). Rollama: An R package for using generative large language models through Ollama. DOI: doi.org/10.21105/joss.05321. URL: https://arxiv.org/abs/2404.07654

Shyshatskyi, A. (Ed.) (2024). Information and control systems: modelling and optimizations: collective monograph. Kharkiv: Teshnology Center PC, 180. DOI: http://doi.org/10.15587/978-617-8360-04-7. URL: http://monograph.com.ua/pctc/catalog/book/978-617-8360-04-7

Zhyvylo, Ye.O., & Orlov, O.V. (2022, April). The essence of cyber security of the national segment of the state’s cyberspace in the context of crisis management. In: Collection of scientific materials of the 22nd International Scientific Congress «Public administration of the 21st century in the context of hybrid threats», 248-254.

Zhyvylo, Ye., & Shevchenko, D. (2022). Cybersecurity Risk Assessment and Privacy Control in Public Administration Information Systems. Collection of scientific works of the Military Institute of Kyiv National Taras Shevchenko University, (75), 66–77. DOI: https://doi.org/10.17721/2519-481X/2022/75-07. URL: https://miljournals.knu.ua/index.php/zbirnuk/article/view/957