Принципові напрями розгортання захищеного документообігу на платформах штучного інтелекту
Анотація
У статті досліджено принципові напрями розгортання захищеного документообігу на платформах штучного інтелекту з використанням локальних великих мовних моделей (LLM). Проаналізовано технологічні особливості та функціональні можливості інструментів Ollama та DeepSeek-R1 в контексті забезпечення конфіденційності обробки документів. Розглянуто переваги контейнеризації додатків штучного інтелекту на базі Docker Desktop для підвищення рівня безпеки та ізоляції компонентів системи. Запропоновано концептуальну модель багаторівневої архітектури системи захищеного документообігу, що включає інфраструктурний рівень, рівень обробки документів, рівень захисту даних та рівень моніторингу й реагування. Ідентифіковано ключові безпекові ризики, пов’язані з використанням великих мовних моделей у системах документообігу, та описано методології їх мінімізації, зокрема із застосуванням спеціалізованого інструменту тестування безпеки Garak.
На основі результатів дослідження сформульовано практичні рекомендації щодо розгортання та налаштування систем захищеного документообігу з урахуванням вимог до автономності, масштабованості та регламентованої обробки чутливої інформації. Зокрема, обґрунтовано доцільність використання локальних LLM у середовищах із суворими політиками щодо передачі даних за межі контрольованої зони організації (державні установи, медичні заклади, підприємства оборонного комплексу). Встановлено, що поєднання локальних мовних моделей із контейнеризованою інфраструктурою забезпечує оптимальний баланс між функціональністю, продуктивністю та безпекою.
Результати дослідження демонструють, що інтеграція локальних LLM з контейнеризованою інфраструктурою дозволяє забезпечити оптимальний баланс між функціональністю, продуктивністю та безпекою систем документообігу, особливо в галузях з підвищеними вимогами до конфіденційності даних.
Необхідно зазначити, що перспективою подальших досліджень є формування інтелектуальних, безпечних та гнучких систем публічного управління нового покоління, здатних ефективно функціонувати в умовах складного інформаційного середовища.
Завантаження
Посилання
Feretzakis, G., Papaspyridis, K., Gkoulalas-Divanis, A., & Verykios, V.S. (2024). Privacy-Preserving Techniques in Generative AI and Large Language Models: A Narrative Review. Information. 15(11):697. DOI: https://doi.org/10.3390/info15110697
Das, B. C., Amini, M. H., & Wu, Y. (2025). Security and privacy challenges of large language models: A survey. ACM Computing Surveys, 57(6), R. 1-39.
The «Big 8» Trends in Document Management in 2025. (2025, January 27). URL: https://www.adlibsoftware.com/news/the-big-8-trends-in-document-management-in-2025
Guo, D., Zhu, Q., Yang, D., Xie, Z., Dong, K., Zhang, W., ... & Liang, W. (2024). DeepSeek-Coder: When the Large Language Model Meets Programming-The Rise of Code Intelligence. arXiv preprint arXiv:2401.14196. URL: https://arxiv.org/abs/2401.14196
Zhihan, Zhang, Yixin, Cao, Chenchen, Ye, Yunshan, Ma, Lizi, Liao, & Tat-Seng, Chua. (2024). Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 1588-1606, Bangkok, Thailand. Association for Computational Linguistics.
Derczynski, L., Galinkin, E., Martin, J., Majumdar, S., & Inie, N. (2024). garak: A framework for security probing large language models. arXiv preprint arXiv:2406.11036.
Kolchenko, V., Khoma, V., Sabodashko, D., & Perepelytsia, P. (2024). Exploring large language models security threats with automated tools. Social Development and Security, 14(6), 81-96. DOI; https://doi.org/10.33445/sds.2024.14.6.9. URL: https://arxiv.org/abs/2406.11036
Sahana Upadhya et al. A State-of-Art Review of Docker Container Security Issues and Solutions. (2017). American International Journal of Research in Science, Technology, Engineering & Mathematics, 17(1), (December 2016-February 2017), 33-36. URL: https://www.researchgate.net/publication/315823494
Docker Security: 5 Risks and 5 Best Practices for Securing Your Containers URL: https://www.tigera.io/learn/guides/container-security-best-practices/docker-security/
Penubadi, H.R. (2023). Sustainable electronic document security: A comprehensive framework integrating encryption, digital signature and watermarking algorithms, Heritage and Sustainable Development, vol. 5, no. 2, pp. 391-404, URL: https://hsd.ardascience.com/index.php/journal/article/view/359
Jakesch, M. (2022). Assessing the Effects and Risks jf Large Language Models in Ai-Mediated Communication : Cornell University. URL: https://www.jakesch-lab.org/assets/pdf/thesis_jakesch_cornell_phd.pdf
Ollama. (2024). Run Llama 2, Mistral, Gemma and other large language models locally. URL: https://ollama.com
Das, Badhan Chandra, Amini, M. Hadi, & Wu, Yanzhao. (2025). Security and privacy challenges of large language models: A survey. ACM Computing Surveys, 57.6: 1-39. Ollama Models Library. URL: https://ollama.com/library
Ollama Documentation. (2024). Modelfile reference. URL: https://github.com/ollama/ollama/blob/main/docs/modelfile.md
Hoffmann, J., Borgeaud, S., Mensch, A., et al. (2022). Training Compute-Optimal Large Language Models. arXiv:2203.15556. URL: https://arxiv.org/abs/2203.15556
Chen, M., Tworek, J., Jun, H., et al. (2021). Evaluating Large Language Models Trained on Code. arXiv:2107.03374. URL: https://arxiv.org/abs/2107.03374
LM Studio. (2024). Run local large language models. URL: https://lmstudio.ai
Mozilla. (2024). llamafile: Distribute and run LLMs with a single file. URL: https://github.com/Mozilla-Ocho/llamafile
Jan AI. (2024). Run open-source LLMs locally. URL: https://jan.ai
NextChat. (2024). Local ChatGPT-like assistant. URL: https://github.com/next-chat/next-chat
Faraday.dev. (2024). Local AI Development Environment. URL: https://faraday-dev.en.softonic.com/web-apps
Backyard AI. (2024). Self-hosted AI assistant platform. URL: https://backyard.ai/
GPT4All. (2024). Run open-source large language models locally. URL: https://gpt4all.io
Gruber, Johannes B. & Weber, Maximilian. (2024). Rollama: An R package for using generative large language models through Ollama. DOI: doi.org/10.21105/joss.05321. URL: https://arxiv.org/abs/2404.07654
Shyshatskyi, A. (Ed.) (2024). Information and control systems: modelling and optimizations: collective monograph. Kharkiv: Teshnology Center PC, 180. DOI: http://doi.org/10.15587/978-617-8360-04-7. URL: http://monograph.com.ua/pctc/catalog/book/978-617-8360-04-7
Zhyvylo, Ye.O., & Orlov, O.V. (2022, April). The essence of cyber security of the national segment of the state’s cyberspace in the context of crisis management. In: Collection of scientific materials of the 22nd International Scientific Congress «Public administration of the 21st century in the context of hybrid threats», 248-254.
Zhyvylo, Ye., & Shevchenko, D. (2022). Cybersecurity Risk Assessment and Privacy Control in Public Administration Information Systems. Collection of scientific works of the Military Institute of Kyiv National Taras Shevchenko University, (75), 66–77. DOI: https://doi.org/10.17721/2519-481X/2022/75-07. URL: https://miljournals.knu.ua/index.php/zbirnuk/article/view/957
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).