Адаптивне управління контекстом у RAG-системах для персоналізованих АІ-асистентів

doi:10.26565/2304-6201-2025-68-08

Андрій Супрун Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків-22, Україна, 61022 https://orcid.org/0009-0001-3053-9176
Ніна Бакуменко Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків-22, Україна, 61022 https://orcid.org/0000-0003-3496-7167

DOI: https://doi.org/10.26565/2304-6201-2025-68-08

Ключові слова: Retrieval-Augmented Generation, великі мовні моделі, адаптивне управління контекстом, персоналізація користувача

Анотація

Актуальність. Розвиток систем штучного інтелекту на базі великих мовних моделей (LLM) актуалізує проблему ефективного управління контекстом діалогу, оскільки традиційні механізми збереження історії часто призводять до перевантаження контексту та зниження якості генерації відповідей. Ця проблема особливо гостро стоїть у системах Retrieval-Augmented Generation (RAG), де пам'ять діалогу поєднується з динамічним пошуком зовнішніх знань, створюючи додаткове навантаження на обмежене контекстне вікно моделі. Існуючі підходи до управління контекстом не забезпечують адаптивного механізму формування контексту діалогу, який враховує індивідуальні характеристики користувача та доменну специфіку. Мета. Розробка та апробація Adaptive Context Management System (ACMS) для персоналізованих RAG-асистентів, яка поєднує ковзне вікно останніх повідомлень, стислі резюме довготривалої історії та персоналізований пошук знань із бази даних. Методи дослідження. Розроблено мікросервісну архітектуру, що включає AI Orchestrator для координації RAG-процесу, сервіс векторного пошуку на базі PostgreSQL з розширенням pgvector та центральний компонент ACMS для управління контекстом. Запропонований підхід синтезує три стратегії: ковзне вікно для збереження останніх N повідомлень, LLM-компресію старих фрагментів історії в тематичні резюме та персоналізаційний шар для зважування релевантності на основі векторних профілів користувачів. Формування фінального контексту здійснюється через адаптивне змішування історії діалогу та релевантних знань із бази даних з урахуванням індивідуальних профілів користувачів. Результати. Експериментальне оцінювання продемонструвало суттєві переваги адаптивної системи порівняно з базовим підходом. У парних порівняннях адаптивна система виявилася кращою у 62% випадків (Answer Win-Rate = 0,62). Ключовим фактором покращень став персоналізаційний шар, який зменшує повтори та нецільовий вміст з історії діалогу, забезпечує таргетоване підсилення релевантних документів і дозволяє гнучко регулювати баланс між історією та знаннями. Висновки. Розроблена адаптивна система управління контекстом забезпечує ефективне управління контекстом діалогу в RAG-системах для персоналізованих AI-асистентів. Інтеграція стратегій компресії, адаптивного вікна та персоналізації користувача забезпечила підвищення релевантності відповідей на 14% та оптимізацію обсягу контексту на 22%. Експериментальна апробація підтвердила практичну реалізовність запропонованого підходу в різних предметних доменах, а також масштабованість системи при роботі з великими обсягами історичних даних.