Дослідження процедури перетворення тексту в SQL на основі large language models (LLM) шляхом міждоменного семантичного аналізу

  • Людмила Горбачова Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022 https://orcid.org/0000-0002-6053-7235
  • Максим Хруслов Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022 https://orcid.org/0000-0001-9639-9340
  • Ольга Чуб Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022 https://orcid.org/0000-0002-1216-856X
  • Артем Бережний Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022 https://orcid.org/0000-0001-5407-9015
  • Дмитро Козюберда Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022 https://orcid.org/0009-0005-3088-9685
Ключові слова: Large Language Models (LLM), Natural Language Processing (NLP), Text-to-SQL, Обробка природної мови, Глибоке навчання, Нейронні мережі, Бази даних, Штучний інтелект, Аналіз даних, Автоматизація, Інформаційні системи

Анотація

Theme of work. Research on the Text-to-SQL conversion procedure based on Large Language Models (LLM) through Cross-Domain Semantic Analysis.

Purpose of work. To enhance the accuracy and adaptability of Text-to-SQL conversion using Large Language Models (LLM) through cross-domain semantic analysis, enabling reliable query interpretation across various domains and database structures. Methods of research. Comparative analysis, experimental evaluation, cross-domain semantic testing. Results. The research demonstrates that optimized prompt engineering and fine-tuning significantly improve the accuracy and cross-domain adaptability of Large Language Models for Text-to-SQL conversion. Conclusions. This study confirms that Large Language Models (LLMs) can effectively enhance the Text-to-SQL conversion process when optimized with targeted prompt engineering and fine-tuning. Cross-domain semantic analysis proved essential for enabling LLMs to handle varied database structures and domain-specific terminology, improving versatility and accuracy. The findings highlight the potential of LLMs to make SQL query generation more accessible to non-technical users, promoting broader application of AI in database management. Future work may focus on further refining these models to reduce computational costs and increase processing efficiency.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Людмила Горбачова, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022

студентка кафедри інтелектуальних програмних систем і технологій

Максим Хруслов, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022

завідувач кафедри комп’ютерних систем та робототехніки, кандидат фізико-математичних наук, старший дослідник, доцент

Ольга Чуб, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022

доцент закладу вищої освіти кафедри комп’ютерних систем та робототехніки, кандидат економічних наук

Артем Бережний, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022

старший викладач закладу вищої освіти кафедри комп’ютерних систем та робототехніки, магістр

Дмитро Козюберда, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків-22, Україна, 61022

магістр кібербезпеки, факультет комп’ютерних наук, Харківськийнаціональний університет імені В. Н. Каразіна; співробітник-розробник ТОВ «ЛАДИЗАЙН»

Посилання

/

Посилання

Опубліковано
2025-06-30
Як цитувати
Горбачова, Л., Хруслов, М., Чуб, О., Бережний, А., & Козюберда, Д. (2025). Дослідження процедури перетворення тексту в SQL на основі large language models (LLM) шляхом міждоменного семантичного аналізу. Вісник Харківського національного університету імені В.Н. Каразіна, серія «Математичне моделювання. Інформаційні технології. Автоматизовані системи управління», 66, 37-44. https://doi.org/10.26565/2304-6201-2025-66-03
Розділ
Статті