Прогнозування економічних рядів на основі аналізу настроїв користувачів Інтернет

  • Катерина Юріївна Кононова Харківський національний університет імені В. Н. Каразіна, Площа Свободи, 4, Харків, Харківська область, 61000, Україна http://orcid.org/0000-0001-6990-5746
  • Антон Олегович Дек Харківський національний університет імені В. Н. Каразіна, Площа Свободи, 4, Харків, Харківська область, 61000, Україна
  • Вадим Вікторович Марков Харківський національний університет імені В. Н. Каразіна, Площа Свободи, 4, Харків, Харківська область, 61000, Україна
  • Максим Вікторович Шпакович Харківський національний університет радіоелектроніки, пр. Науки, 14, Харків, Харківська обл., 61000, Україна
Ключові слова: прогнозування курсу Bitcoin, записи у мікроблогах, стрічки фінансових новин, латентно-семантичний аналіз, аналіз тональності текстів, нейронні мережі

Анотація

У роботі запропоновано комплекс моделей прогнозування економічних часових рядів з урахуванням об’єктивного та суб’єктивного контенту мережі Інтернет. Для аналізу обрана система Bitcoin (BTC) – перша і найбільш популярна на сьогодні криптовалюта. Експоненціальне зростання ринку криптовалют в останні роки обумовлює актуальність прогнозування курсу ВТС. Теоретичну основу дослідження склали положення концепції поведінкових фінансів, в рамках якої передбачається, що поведінка трейдерів ірраціональна, а характер їхніх рішень в істотній мірі залежить від психологічних факторів. Метою дослідження є розробка методології та комплексу моделей прогнозування валютного курсу на основі аналізу фактуального (об'єктивного) та концептуального (суб'єктивного) контенту інтернет. Джерелом фактуальної інформації обрано тематичні статті спеціалізованих новинних порталів, джерелом концептуальної – записи користувачів у мікроблогах. Основу модельного комплексу склали: 1) скрипти парсінгу новинних порталів та мікроблогів; 2) алгоритм формування фактуальних та концептуальних екзогенних змінних на основі латентно-семантичного аналізу, аналізу тональності текстів, оцінки казуальності за Гренджером; 3) математичним інструментарієм прогнозування обрано нейронні мережі прямого розповсюдження сигналу, а також рекурентні мережі з тривалою та короткостроковою пам’яттю (LSTM), множина входів яких формувалася з використанням генетичних алгоритмів. В результаті обробки бази даних новинних стрічок та твітів було сформовано множину екзогенних факторів, до якої увійшли чотири з чотирнадцяти фактуальних змінних – infrastructure, activity, dissemination і expect, а також дві з восьми концептуальних – calm і confusion. Автоматизація пошуку оптимальної архітектури нейронних мереж виконувалася з використанням генетичних алгоритмів: довжина хромосоми дорівнювала числу змінних; особини піддавалися схрещуванню, мутації та відбору на основі якості передбачення моделі. Порівняльний аналіз різних архітектур нейронних мереж дозволив обґрунтувати доцільність використання інтернет-контенту для прогнозування економічних рядів та продемонстрував високу адекватність побудованих моделей.

Завантаження

##plugins.generic.usageStats.noStats##

Посилання

Zheludev I., Smith R., Aste T. When Can Social Media Lead Financial Markets? [Електронний ресурс]. – Режим доступу : http://www.nature.com/articles/srep04213

Zhang X., Fuehres H., Gloor P. Predicting Stock Market Indicators Through Twitter “I hope it is not as bad as I fear” [Електронний ресурс]. – Режим доступу : doi:10.1016/j.sbspro.2011.10.562

Lachanski M. Did Twitter “Calm”-ness Really Predict the DJIA? [Електронний ресурс]. – Режим доступу : http://files.meetup.com/7616132/DC-NLP-2015-07%20Michael%20Lachanski.pdf

Mao Y., Wei W., Wang B. Twitter Volume Spikes: Analysis and Application in Stock Trading [Електронний ресурс]. – Режим доступу : http://nlab.engr.uconn.edu/papers/SNAKDD025.pdf

Preis T., Moat H., Stanley E. Quantifying Trading Behavior in Financial Markets Using Google Trends [Електронний ресурс]. – Режим доступу : http://www.nature.com/articles/srep01684

Ruiz E. J., Hristidis,V., Castillo C., Gionis A., Jaimes, A. Correlating Financial Time Series with Micro Blogging Activity [Електронний ресурс]. – Режим доступу : http://www.cs.ucr.edu/~vagelis/publications/wsdm2012-microblog-financial.pdf

Challet, D., Ayed, A. Predicting financial markets with Google Trends and not so random keyword [Електронний ресурс]. – Режим доступу : https://arxiv.org/pdf/1307.4643v3.pdf

Blockchain [Електронний ресурс]. – Режим доступу : http://blockchain.info

Бейкер К., Нофсингер Дж. Поведенческие финансы. Инвесторы, компании, рынки. Маросейка, 2016.

Coindesk [Електронний ресурс]. – Режим доступу : http://www.coindesk.com/

Алгоритм Портера [Електронний ресурс]. – Режим доступу : http://www.cs.toronto.edu/~frank/csc2501/Readings/R2_Porter/Porter-1980.pdf

Метод ієрархічної агломеративної кластеризації [Електронний ресурс]. – Режим доступу : http://www.mathworks.com/help/stats/hierarchical-clustering.html

Bollen J., Mao H., Zeng X. Twitter mood predicts the stock market [Електронний ресурс]. – Режим доступу : http://arxiv.org/PS_cache/arxiv/pdf/1010/1010.3003v1.pdf

Sloot D. The junk science behind the ‘Twitter Hedge Fund’ [Електронний ресурс]. – Режим доступу : http://sellthenews.tumblr.com/post/21067996377/noitdoesnot

Sharma J., Vyas A. Twitter Sentiment Analysis [Електронний ресурс]. – Режим доступу : http://www.cse.iitk.ac.in/users/cs365/2012/ submissions/jaysha/cs365/projects/report.pdf

Wilson T., Hoffmann P., Somasundaran S., Kessler J., Wiebe J. OpinionFinder: A system for subjectivity analysis [Електронний ресурс]. – Режим доступу : http://people.cs.pitt.edu/~swapna/papers/OpinionFinder-extendedabstract.pdf

Thelwall M., Buckley K., Paltoglou G., Cai D. Sentiment Strength Detection in Short Informal Text [Електронний ресурс]. – Режим доступу : http://www.scit.wlv.ac.uk/~cm1993/papers/SentiStrengthPreprint.doc

Pollock V., Cho D., Reker D, Volavka J. Profile of mood states: the factors and their psychological correlates [Електронний ресурс]. – Режим доступу : http://sci-hub.cc/10.1097/00005053-197910000-00004

Google Books. Ngram Viewer [Електронний ресурс]. – Режим доступу : https://books.google.com/ngrams

WordNet [Електронний ресурс]. – Режим доступу : http://wordnetweb.princeton.edu/perl/webwn

Olah C. Understanding LSTM Networks [Електронний ресурс]. – Режим доступу : http://colah.github.io/posts/2015-08-Understanding-LSTMs/
Опубліковано
2017-03-01
Як цитувати
Кононова, К. Ю., Дек, А. О., Марков, В. В., & Шпакович, М. В. (2017). Прогнозування економічних рядів на основі аналізу настроїв користувачів Інтернет. Вісник Харківського національного університету імені В. Н. Каразіна серія «Економічна», (91), 90-99. вилучено із https://periodicals.karazin.ua/economy/article/view/8072
Розділ
Моделювання, імітація та інформаційні технології в економіці й управлінні