Методи машинного навчання для вирішенні проблем семантики та контексту при обробці текстових даних

  • Ігор Малига Харківський Національний Університет ім. В.Н. Каразіна, площа Свободи 4, Харків, Україна, 61077 https://orcid.org/0000-0002-5708-7739
  • Сергій Шматков Харківський Національний Університет ім. В.Н. Каразіна, площа Свободи 4, Харків, Україна, 61077 https://orcid.org/0000-0002-0298-7174
Ключові слова: Машинне навчання, обробка природної мови, семантика, контекст, текстові дані, нейронні мережі, трансформатори, BERT, GPT-3, аналіз даних, аналіз настроїв, семантичний аналіз

Анотація

Актуальність. З розширенням можливостей машинного навчання та його впливом на багато аспектів сучасного життя, включаючи обробку природної мови, розуміння семантики та контексту в текстових даних стає все більш актуальним. Семантика та контекст відіграють значну роль у здатності машин розуміти людську мову. Вони є центральними елементами в різних програмах, таких як машинний переклад, аналіз настроїв, виявлення спаму, розпізнавання голосу тощо. Однак цими аспектами часто нехтують або недооцінюють під час обробки текстових даних. Незважаючи на значний прогрес у цій галузі, проблема семантики та контексту залишається невирішеною, що знижує ефективність і точність багатьох систем машинного навчання.

Мета: Основна мета цієї статті — дослідити проблему семантики та контексту в машинному навчанні, а саме в обробці текстових даних. Стаття має на меті визначити основні проблеми, пов’язані з розумінням семантики та контексту, а також те, як вони впливають на різні аспекти обробки тексту. Крім того, буде проаналізовано поточні методи та підходи, які використовуються в галузі машинного навчання для вирішення цих проблем, і визначено їх обмеження.

Методи дослідження. Аналіз, пояснення, класифікація.

Результати. Було встановлено, що незважаючи на значні досягнення в технологіях машинного навчання, проблеми семантики та контексту в обробці текстових даних все ще існують. Вони впливають на якість і точність рішень, що приймаються системами на основі машинного навчання, що може призвести до некоректного аналізу та спотворення даних. Було виявлено, що навіть сучасні моделі на основі трансформаторів можуть зіткнутися з проблемами розуміння семантики та контексту, особливо в складних і багатозначних сценаріях.

Висновки. На основі проведеного дослідження зроблено висновок, що проблема семантики та контексту при обробці текстових даних є суттєвою та потребує подальшого вивчення. Існуючі методи і технології, хоч і показують високі результати в одних завданнях, можуть виявитися недостатніми в інших, особливо складних, ситуаціях. Пропонується продовжити дослідження в даному напрямку, розробити нові методи та підходи, які б змогли ефективно вирішити ці проблеми. Також важливо вивчити, як різні контекстуальні фактори впливають на семантику текстових даних і як ці ефекти можна врахувати при проектуванні та використанні систем машинного навчання.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Ігор Малига, Харківський Національний Університет ім. В.Н. Каразіна, площа Свободи 4, Харків, Україна, 61077

аспірант

Сергій Шматков, Харківський Національний Університет ім. В.Н. Каразіна, площа Свободи 4, Харків, Україна, 61077

д.т.н., професор; завідуючий кафедри теоретичної теоретичної та прикладної системотехніки

Посилання

/

Посилання

Опубліковано
2022-12-26
Як цитувати
Малига, І., & Шматков, С. (2022). Методи машинного навчання для вирішенні проблем семантики та контексту при обробці текстових даних. Вісник Харківського національного університету імені В.Н. Каразіна, серія «Математичне моделювання. Інформаційні технології. Автоматизовані системи управління», 56, 35-42. https://doi.org/10.26565/2304-6201-2022-56-03
Розділ
Статті