Розробка моделі нейронної мережі для усунення неоднозначності омографів у текстових даних

  • Єгор Єгоров Харківський національний університет імені В. Н. Каразіна, майдан Свободи, 4, Харків, Україна, 61077 https://orcid.org/0000-0001-8731-7198
  • Сергій Шматков Харківський національний університет імені В. Н. Каразіна, майдан Свободи,4, Харків, Україна, 61077 https://orcid.org/0000-0002-0298-7174
Ключові слова: нейронні мережі, омограф, модель, ембедінг, PYTHON, LSTM

Анотація

У цій науковій статті досліджується створення моделі нейронної мережі, спрямованої на вирішення неоднозначності омографів у текстових даних. Різні типи нейронних мереж ретельно вивчаються на предмет їхнього потенціалу у вирішенні цієї проблеми. Стаття заглиблюється в методологічні аспекти архітектури нейронної мережі, що включає аналіз, проектування, реалізацію, тестування, оцінку та оптимізацію. Важливість кожного етапу цього процесу наголошується на важливості глибокого розуміння типів нейронних мереж та їх застосування, а також розумного вибору технології. Корисність розробленої моделі поширюється на домени, що використовують автоматичне розпізнавання мови, підтримку прийняття рішень на основі тексту, вдосконалення систем пошуку та обробку природної мови. Дослідники та практики в області обробки природної мови та класифікації текстових даних знайдуть цю статтю цінною.

 

Актуальність: у сучасному світі розробка моделі нейронної мережі для вирішення неоднозначності омографів у текстових даних визначається викликами, які стоїть перед галуззю обробки природної мови. Ця модель здатна виправляти помилки, пов'язані з невірним розумінням значень слів у тексті, що забезпечить більшу точність та якість аналізу текстового матеріалу. Використання її можливе в різних сферах, включаючи автоматичне визначення мови, підтримку прийняття рішень на основі текстової інформації, удосконалення систем пошуку та класифікації даних.

Мета: підвищення якості обробки тексту, зокрема, поліпшення точності розпізнавання слів, які мають більше одного значення, за допомогою розробки та впровадження нейронної мережі, яка буде мати можливість усувати неоднозначності омографів у текстових даних в реальному часі.

Методи дослідження: для дослідження обраної області було використано методи системний аналіз, методи глибокого навчання, теорія нейронних мереж, методи обробки та підготовки даних, імітаційне моделювання. Програмне забезпечення розроблено за допомогою мови Python і використані пакети sklearn, keras і т.д..

Результати: головним результатом роботи була розробка моделі нейронні мережі, яка усуває неоднозначності омографів у текстових даних в реальному часі, що дає можливість розвитку її на інших мовах.

Висновки: розглянуто проблему неоднозначності омографів у тектстових даних. Оскільки це завдання обробки природної мови була розроблена модель нейронної мережі з довгою короткостроковою пам’яттю з використанням ембедінгових моделей, LSTM-шару та повнозв’язаних шарів. Дослідження засвідчило важливість інноваційних підходів у вирішенні проблем неоднозначності омографів у текстових даних, а використання нейронних мереж та технологій штучного інтелекту стає обіцяючим напрямком для подальших досліджень та впроваджень у цій області.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Єгор Єгоров, Харківський національний університет імені В. Н. Каразіна, майдан Свободи, 4, Харків, Україна, 61077

магістр

Сергій Шматков, Харківський національний університет імені В. Н. Каразіна, майдан Свободи,4, Харків, Україна, 61077

д.т.н., професор; завідуючий кафедри теоретичної і прикладної системотехніки факультету комп’ютерних наук

Посилання

/

Посилання

Опубліковано
2024-06-21
Як цитувати
Єгоров, Є., & Шматков, С. (2024). Розробка моделі нейронної мережі для усунення неоднозначності омографів у текстових даних. Вісник Харківського національного університету імені В.Н. Каразіна, серія «Математичне моделювання. Інформаційні технології. Автоматизовані системи управління», 62, 30-36. https://doi.org/10.26565/2304-6201-2024-62-03
Розділ
Статті