Прогнозування економічних рядів на основі аналізу настроїв користувачів Інтернет
Ключові слова:
прогнозування курсу Bitcoin, записи у мікроблогах, стрічки фінансових новин, латентно-семантичний аналіз, аналіз тональності текстів, нейронні мережі
Анотація
У роботі запропоновано комплекс моделей прогнозування економічних часових рядів з урахуванням об’єктивного та суб’єктивного контенту мережі Інтернет. Для аналізу обрана система Bitcoin (BTC) – перша і найбільш популярна на сьогодні криптовалюта. Експоненціальне зростання ринку криптовалют в останні роки обумовлює актуальність прогнозування курсу ВТС. Теоретичну основу дослідження склали положення концепції поведінкових фінансів, в рамках якої передбачається, що поведінка трейдерів ірраціональна, а характер їхніх рішень в істотній мірі залежить від психологічних факторів. Метою дослідження є розробка методології та комплексу моделей прогнозування валютного курсу на основі аналізу фактуального (об'єктивного) та концептуального (суб'єктивного) контенту інтернет. Джерелом фактуальної інформації обрано тематичні статті спеціалізованих новинних порталів, джерелом концептуальної – записи користувачів у мікроблогах. Основу модельного комплексу склали: 1) скрипти парсінгу новинних порталів та мікроблогів; 2) алгоритм формування фактуальних та концептуальних екзогенних змінних на основі латентно-семантичного аналізу, аналізу тональності текстів, оцінки казуальності за Гренджером; 3) математичним інструментарієм прогнозування обрано нейронні мережі прямого розповсюдження сигналу, а також рекурентні мережі з тривалою та короткостроковою пам’яттю (LSTM), множина входів яких формувалася з використанням генетичних алгоритмів. В результаті обробки бази даних новинних стрічок та твітів було сформовано множину екзогенних факторів, до якої увійшли чотири з чотирнадцяти фактуальних змінних – infrastructure, activity, dissemination і expect, а також дві з восьми концептуальних – calm і confusion. Автоматизація пошуку оптимальної архітектури нейронних мереж виконувалася з використанням генетичних алгоритмів: довжина хромосоми дорівнювала числу змінних; особини піддавалися схрещуванню, мутації та відбору на основі якості передбачення моделі. Порівняльний аналіз різних архітектур нейронних мереж дозволив обґрунтувати доцільність використання інтернет-контенту для прогнозування економічних рядів та продемонстрував високу адекватність побудованих моделей.Завантаження
##plugins.generic.usageStats.noStats##
Посилання
Zheludev I., Smith R., Aste T. When Can Social Media Lead Financial Markets? [Електронний ресурс]. – Режим доступу : http://www.nature.com/articles/srep04213
Zhang X., Fuehres H., Gloor P. Predicting Stock Market Indicators Through Twitter “I hope it is not as bad as I fear” [Електронний ресурс]. – Режим доступу : doi:10.1016/j.sbspro.2011.10.562
Lachanski M. Did Twitter “Calm”-ness Really Predict the DJIA? [Електронний ресурс]. – Режим доступу : http://files.meetup.com/7616132/DC-NLP-2015-07%20Michael%20Lachanski.pdf
Mao Y., Wei W., Wang B. Twitter Volume Spikes: Analysis and Application in Stock Trading [Електронний ресурс]. – Режим доступу : http://nlab.engr.uconn.edu/papers/SNAKDD025.pdf
Preis T., Moat H., Stanley E. Quantifying Trading Behavior in Financial Markets Using Google Trends [Електронний ресурс]. – Режим доступу : http://www.nature.com/articles/srep01684
Ruiz E. J., Hristidis,V., Castillo C., Gionis A., Jaimes, A. Correlating Financial Time Series with Micro Blogging Activity [Електронний ресурс]. – Режим доступу : http://www.cs.ucr.edu/~vagelis/publications/wsdm2012-microblog-financial.pdf
Challet, D., Ayed, A. Predicting financial markets with Google Trends and not so random keyword [Електронний ресурс]. – Режим доступу : https://arxiv.org/pdf/1307.4643v3.pdf
Blockchain [Електронний ресурс]. – Режим доступу : http://blockchain.info
Бейкер К., Нофсингер Дж. Поведенческие финансы. Инвесторы, компании, рынки. Маросейка, 2016.
Coindesk [Електронний ресурс]. – Режим доступу : http://www.coindesk.com/
Алгоритм Портера [Електронний ресурс]. – Режим доступу : http://www.cs.toronto.edu/~frank/csc2501/Readings/R2_Porter/Porter-1980.pdf
Метод ієрархічної агломеративної кластеризації [Електронний ресурс]. – Режим доступу : http://www.mathworks.com/help/stats/hierarchical-clustering.html
Bollen J., Mao H., Zeng X. Twitter mood predicts the stock market [Електронний ресурс]. – Режим доступу : http://arxiv.org/PS_cache/arxiv/pdf/1010/1010.3003v1.pdf
Sloot D. The junk science behind the ‘Twitter Hedge Fund’ [Електронний ресурс]. – Режим доступу : http://sellthenews.tumblr.com/post/21067996377/noitdoesnot
Sharma J., Vyas A. Twitter Sentiment Analysis [Електронний ресурс]. – Режим доступу : http://www.cse.iitk.ac.in/users/cs365/2012/ submissions/jaysha/cs365/projects/report.pdf
Wilson T., Hoffmann P., Somasundaran S., Kessler J., Wiebe J. OpinionFinder: A system for subjectivity analysis [Електронний ресурс]. – Режим доступу : http://people.cs.pitt.edu/~swapna/papers/OpinionFinder-extendedabstract.pdf
Thelwall M., Buckley K., Paltoglou G., Cai D. Sentiment Strength Detection in Short Informal Text [Електронний ресурс]. – Режим доступу : http://www.scit.wlv.ac.uk/~cm1993/papers/SentiStrengthPreprint.doc
Pollock V., Cho D., Reker D, Volavka J. Profile of mood states: the factors and their psychological correlates [Електронний ресурс]. – Режим доступу : http://sci-hub.cc/10.1097/00005053-197910000-00004
Google Books. Ngram Viewer [Електронний ресурс]. – Режим доступу : https://books.google.com/ngrams
WordNet [Електронний ресурс]. – Режим доступу : http://wordnetweb.princeton.edu/perl/webwn
Olah C. Understanding LSTM Networks [Електронний ресурс]. – Режим доступу : http://colah.github.io/posts/2015-08-Understanding-LSTMs/
Zhang X., Fuehres H., Gloor P. Predicting Stock Market Indicators Through Twitter “I hope it is not as bad as I fear” [Електронний ресурс]. – Режим доступу : doi:10.1016/j.sbspro.2011.10.562
Lachanski M. Did Twitter “Calm”-ness Really Predict the DJIA? [Електронний ресурс]. – Режим доступу : http://files.meetup.com/7616132/DC-NLP-2015-07%20Michael%20Lachanski.pdf
Mao Y., Wei W., Wang B. Twitter Volume Spikes: Analysis and Application in Stock Trading [Електронний ресурс]. – Режим доступу : http://nlab.engr.uconn.edu/papers/SNAKDD025.pdf
Preis T., Moat H., Stanley E. Quantifying Trading Behavior in Financial Markets Using Google Trends [Електронний ресурс]. – Режим доступу : http://www.nature.com/articles/srep01684
Ruiz E. J., Hristidis,V., Castillo C., Gionis A., Jaimes, A. Correlating Financial Time Series with Micro Blogging Activity [Електронний ресурс]. – Режим доступу : http://www.cs.ucr.edu/~vagelis/publications/wsdm2012-microblog-financial.pdf
Challet, D., Ayed, A. Predicting financial markets with Google Trends and not so random keyword [Електронний ресурс]. – Режим доступу : https://arxiv.org/pdf/1307.4643v3.pdf
Blockchain [Електронний ресурс]. – Режим доступу : http://blockchain.info
Бейкер К., Нофсингер Дж. Поведенческие финансы. Инвесторы, компании, рынки. Маросейка, 2016.
Coindesk [Електронний ресурс]. – Режим доступу : http://www.coindesk.com/
Алгоритм Портера [Електронний ресурс]. – Режим доступу : http://www.cs.toronto.edu/~frank/csc2501/Readings/R2_Porter/Porter-1980.pdf
Метод ієрархічної агломеративної кластеризації [Електронний ресурс]. – Режим доступу : http://www.mathworks.com/help/stats/hierarchical-clustering.html
Bollen J., Mao H., Zeng X. Twitter mood predicts the stock market [Електронний ресурс]. – Режим доступу : http://arxiv.org/PS_cache/arxiv/pdf/1010/1010.3003v1.pdf
Sloot D. The junk science behind the ‘Twitter Hedge Fund’ [Електронний ресурс]. – Режим доступу : http://sellthenews.tumblr.com/post/21067996377/noitdoesnot
Sharma J., Vyas A. Twitter Sentiment Analysis [Електронний ресурс]. – Режим доступу : http://www.cse.iitk.ac.in/users/cs365/2012/ submissions/jaysha/cs365/projects/report.pdf
Wilson T., Hoffmann P., Somasundaran S., Kessler J., Wiebe J. OpinionFinder: A system for subjectivity analysis [Електронний ресурс]. – Режим доступу : http://people.cs.pitt.edu/~swapna/papers/OpinionFinder-extendedabstract.pdf
Thelwall M., Buckley K., Paltoglou G., Cai D. Sentiment Strength Detection in Short Informal Text [Електронний ресурс]. – Режим доступу : http://www.scit.wlv.ac.uk/~cm1993/papers/SentiStrengthPreprint.doc
Pollock V., Cho D., Reker D, Volavka J. Profile of mood states: the factors and their psychological correlates [Електронний ресурс]. – Режим доступу : http://sci-hub.cc/10.1097/00005053-197910000-00004
Google Books. Ngram Viewer [Електронний ресурс]. – Режим доступу : https://books.google.com/ngrams
WordNet [Електронний ресурс]. – Режим доступу : http://wordnetweb.princeton.edu/perl/webwn
Olah C. Understanding LSTM Networks [Електронний ресурс]. – Режим доступу : http://colah.github.io/posts/2015-08-Understanding-LSTMs/
Опубліковано
2017-03-01
Як цитувати
Кононова, К. Ю., Дек, А. О., Марков, В. В., & Шпакович, М. В. (2017). Прогнозування економічних рядів на основі аналізу настроїв користувачів Інтернет. Вісник Харківського національного університету імені В. Н. Каразіна серія «Економічна», (91), 90-99. вилучено із https://periodicals.karazin.ua/economy/article/view/8072
Номер
Розділ
Моделювання, імітація та інформаційні технології в економіці й управлінні