Застосування графових баз даних для моделювання соціальних графів
Анотація
Стаття присвячена графовим системам керування базами даних. Розглянуті основні характеристики та можливості цих систем. Серед усієї множини завдань, які найкращім чином вирішуються з використанням графової моделі даних, обрані завдання, що виникають при розробці соціальних мереж. Щодо виділеного класу завдань, для дослідження обрані системи керування графовими базами даних, що найпопулярніші на теперішній час − Neo4J, OrientDB та ArangoDB. Приділено увагу таким характеристикам обраних баз даних, як проприєтарне це програмне забезпечення чи вільне, чи має воно сучасну документацію, чи підтримується розробниками, чи є спільнота, де можна одержати відповіді на питання, чи багато часу треба витратити, щоб освоїти цю систему. З використанням мов Cypher, OrientDB SQL та AQL, що є мовами запитів у Neo4J, OrientDB та ArangoDB відповідно, сформовані запити, характерні щодо соціальних мереж, коли треба швидко одержувати результати з великою глибиною пошуку. Реалізоване порівняння швидкості виконання запитів. Для цього з використанням моделі Барабаші-Альберта згенеровано граф, який має 5000 вузлів та 24900 зав’язків. Сформовані тестові завдання для пошуку друзів трьох користувачів з глибиною, яка дорівнює 5. Проведене оцінювання середнього часу для кожного запиту за декілька виконань. Зроблені висновки та сформовані рекомендації щодо найкращого вибору графової бази даних при розробці програмного забезпечення, що реалізує соціальну мережу.
Завантаження
Посилання
/Посилання
E. F. Codd, "A Relational Model of Data for Large Shared Data Banks." Communications of the ACM, vol. 13, pp. 377–387, 1970.
"NoSQL" En.wikipedia.org. Internet: https://eu.wikipedia.org/wiki/NoSQL, Aug 17, 2019 [Oct 25, 2019].
P. Sadalage and M. Fowler, NoSQL distilled. Upper Saddle River, NJ: Addison-Wesley, 2015.
NitrosData, "Usage of graph databases". Internet: http://nitrosdata.ru/2019/02/20/primenenie-grafovyh-baz-dannyh/ [Oct 20, 2019].
"Gartner Identifies Top 10 Data and Analytics Technology Trends for 2019." Internet: https://www.gartner.com/en/newsroom/press-releases/2019-02-18-gartner-identifies-top-10-data-and-analytics-technolo Feb, 2019 [Sep 25, 2019].
I. Robinson, and J. Webber, E. Eifrem, Graph Databases. O’Reilly Media, 2013.
DB-Engines Ranking provided by solid IT. Internet: https://db-engines.com/en/ranking, Sep, 2019. [Sep 30, 2019]
Documentation Neo4j. Internet: https://neo4j.com/docs/ [Oct 27, 2019]
Y.Tymoshenko and V. Lazurik "Rational vs graph databases" Proceedings of the international scientific and technical conference "Computer modeling in high technology", Kharkiv: V. N. Karazin Kharkiv National University, pp. 289-292, 2018. [in Russian]
"OrientDB" En.wikipedia.org. Internet: https://ru.wikipedia.org/wiki/OrientDB, Oct 11, 2019 [Oct 27, 2019].
OrientDB Community. Internet: https://orientdb.org/docs/ [Oct 27, 2019]
"ArangoDB" En.wikipedia.org. Internet: https://en.wikipedia.org/wiki/ArangoDB [Oct 27, 2019]
ArangoDB v3.5.0 Documentation. Internet : https://www.arangodb.com/docs/stable/ , [Oct 27, 2019].
"Barabasi-Albert model" En.wikipedia.org. Internet: https://en.wikipedia.org/wiki/Barab%C3%A1si%E2%80%93Albert_model, Oct 21, 2019 [Oct 27, 2019].
Codd E.F. A Relational Model of Data for Large Shared Data Banks. Communications of the ACM. 13 (6): 377–387. doi:10.1145/362384.362685 (June 1970).
NoSQL: Матеріал з Вікіпедії – вільної енциклоредії. [Електроний ресурс] Режим доступу: https://ru.wikipedia.org/wiki/NoSQL
Мартин Фаулер, Прамодкумар, Дж. Садаладж. NoSQL. Новая методология разработки нереляционных баз данных.: пер. с англ. М.: ООО "И.Д. Вильямс", 2013. 192 с.
NitrosData: Применение графовых баз данных. [Электронный ресурс] Режим доступа: http://nitrosdata.ru/2019/02/20/primenenie-grafovyh-baz-dannyh/
Gartner Identifies Top 10 Data and Analytics Technology Trends for 2019. [Електроний ресурс] Режим доступу: https://www.gartner.com/en/newsroom/press-releases/2019-02-18-gartner-identifies-top-10-data-and-analytics-technolo
Ian Robinson Graph Databases / Ian Robinson, Jim Webber, Emil Eifrem. O’Reilly Media, 2013. 178 p.
DB-Engines Ranking provided by solid IT, September 2019. [Електроний ресурс] Режим доступу: https://db-engines.com/en/ranking
Документація Neo4j. [Електроний ресурс] Режим доступу https://neo4j.com/docs/
Тимошенко Е.С., Лазурик В.М. Реляционные или графовые базы данных: Труды международной науч.-техн. конференции. Компьютерное моделирование в наукоемких технологиях. Харьков: ХНУ им. В.Н.Каразина, 2018 . С. 289-292.
OrientDB: Матеріал з Вікіпедії – вільної енциклоредії. [Електроний ресурс] Режим доступу: https://ru.wikipedia.org/wiki/OrientDB
OrientDB Community. [Електроний ресурс] Режим доступу https://orientdb.org/docs/
ArangoDB: Матеріал з Вікіпедії – вільної енциклоредії. [Електроний ресурс] Режим доступу: https://ru.wikipedia.org/wiki/ ArangoDB
ArangoDB v3.5.0 Documentation. [Електроний ресурс] Режим доступу: https://www.arangodb.com/docs/stable/
Модель Барабаши — Альберт. [Електроний ресурс] Режим доступу: https://ru.wikipedia.org/wiki/Модель_Барабаши_—_Альберт.