Дослідження впливу методів декодування у мовних моделях на коректність планування дій агентів у віртуальних середовищах

  • Ігор Омельченко Харківський національний університет ім. В.Н. Каразіна, майдан Свободи, 4, Харків, Харківська область, 61022 https://orcid.org/0009-0007-4474-4916
  • Володимир Струков Харківський національний університет ім. В.Н. Каразіна. майдан Свободи, 4, Харків, Харківська область, 61022 http://orcid.org/0000-0003-4722-3159
Ключові слова: штучний інтелект, машинне навчання, глибоке навчання, штучні нейронні мережі, інтелектуальні інформаційні системи, автоматизовані інформаційні системи, обробка природної мови, велика мовна модель, промпт, прийняття рішень, агент, віртуальне середовище, Minigrid

Анотація

Актуальність. Знання та навички, отримані великими мовними моделями (LLM) з навчальних даних, можуть бути використані в задачі планування дій автономних агентів. Класичний підхід до генерації тексту може порушувати синтаксис JSON-плану, що ускладнює або робить неможливим синтаксичний розбір та використання такого плану. Можливий підхід до вирішення цієї проблеми полягає у застосуванні методу декодування з обмеженням граматики (GCD), що обмежує множину можливих текстів для генерації відповідно до заданої граматики.

Мета. Дослідити вплив методу декодування з обмеженням граматики GCD (з міркуваннями та без) порівняно з класичним необмеженим декодуванням UCD на відповідність JSON-схемі, точність та час планування дій різними LLM у віртуальних середовищах Minigrid.

Методи дослідження. Методи дослідження: обчислювальний експеримент, порівняльний аналіз. Методи декодування послідовностей в LLM: Unconstrained Decoding (UCD), Grammar-Constrained Decoding (GCD). Використані метрики якості планування: синтаксична валідність (відповідність граматиці/JSON-схемі), тривалість та точність планування.

Результати. Запропоновано використовувати метод декодування з обмеження граматики (GCD) в задачах планування дій агентів з використанням великих мовних моделей (LLM). Підготовлено датасет з прикладами планів для середовищ Minigrid: SimpleKeyDoor, KeyInBox, RandomBoxKey. Проведено порівняння методів Unconstrained Decoding (UCD), Grammar-Constrained Decoding (GCD) та GCD з міркуваннями для 10 відкритих LLM (сімейств Qwen3, DeepSeek-R1, Gemma3, Llama3.2). Використання методу GCD забезпечило валідність згенерованого плану відповідно до граматики, заданої JSON-схемою. Досягнуто скорочення часу планування для моделей Qwen3:4b у 17-25 разів, для Qwen3:30b — у 6-8 разів за рахунок обмеження кількості токенів в ланцюжках міркувань. У середньому застосування методу декодування GCD покращило точність генерації плану.

Висновки. Дослідження демонструє, що застосування методу декодування з обмеженням граматики (GCD) є доцільним в задачах планування дій з використанням LLM. Метод GCD гарантує синтаксичну валідність планів відповідно до JSON-схеми, що складно досягти з методом UCD. Метод GCD дозволяє гнучко визначати довжину ланцюжків міркувань через правила граматики і тим самим контролювати тривалість планування.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Ігор Омельченко, Харківський національний університет ім. В.Н. Каразіна, майдан Свободи, 4, Харків, Харківська область, 61022

Аспірант, кафедра математичного моделювання та аналізу даних

Володимир Струков, Харківський національний університет ім. В.Н. Каразіна. майдан Свободи, 4, Харків, Харківська область, 61022

к.т.н., доцент; завідувач кафедри математичного моделювання та аналізу даних

Посилання

/

Посилання

Опубліковано
2025-10-27
Як цитувати
Омельченко, І., & Струков, В. (2025). Дослідження впливу методів декодування у мовних моделях на коректність планування дій агентів у віртуальних середовищах. Вісник Харківського національного університету імені В.Н. Каразіна, серія «Математичне моделювання. Інформаційні технології. Автоматизовані системи управління», 67, 101-112. https://doi.org/10.26565/2304-6201-2025-67-10
Розділ
Статті