Новий підхід у використанні топологічних дескрипторів. Ітерований реберний граф у проблемі фізико-хімічних властивостей насичених вуглеводнів

  • Anton B. Zakharov Харківський національний університет імені В.Н. Каразіна https://orcid.org/0000-0003-1577-7261
  • Vladimir V. Ivanov Харківський національний університет імені В.Н. Каразіна https://orcid.org/0000-0002-9120-8469
Ключові слова: топологічний дескриптор, реберний граф, регресійний аналіз, коефіцієнт детермінації, leave-one-out валідація, Y-scrambling, «забутий» індекс

Анотація

В даній статті представлено новий погляд на проблему опису молекулярних систем. Вивчено здатності ітерованих реберних графів при описі властивостей насичених вуглеводнів. Продемонстровано, що єдиний обраний молекулярний (граф-теоретичний (топологічний) або інформаційний) дескриптор розрахований для послідовності вкладених реберних графів дозволяє достатньо отримати достатньо надійні регресійні рівняння. Таким чином, проблема скорочення дескрипторного набору вирішена в даному підході принаймні частково. Розроблено та реалізовано відповідний програмний пакет (QUASAR) із використанням мови програмування Python 3. У якості тестового прикладу обрані фізико-хімічні властивості ізомерів октану. Серед вивчених властивостей - температура кипіння, критична температура, критичний тиск, ентальпія пароутворення, ентальпія утворення, поверхневий натяг а також в’язкість. Отримані відповідні достатньо прості лінійні регресійні рівняння що включають один, два та три параметри відповідно. Передбачувальна здатність рівнянь вивчена із використанням процедур внутрішньої валідації. За процедурою leave-one-out (LOO) та Y-scrambling доведена адекватність отриманих рівнянь. Наприклад, для регресійної моделі, що отримано для температури кипіння, найкращі рівняння характеризуються коефіцієнтами детермінації R2 = 0.943 та Q2 = 0.918 (процедура LOO), в той час як за процедурою Y-scrambling Q2y-scr<0.3.

Також показано, що вищевказані молекулярні властивості у підході вкладених реберних графів можуть бути описані із використанням загально вживаних топологічних дескрипторів. Взагалі майже кожен обраний топологічний дескриптор може давати адекватні рівняння. Ефективність продемонстровано на прикладі індексів Загребської групи. «Забутий» індекс (ZM3) зарекомендував себе як достатньо універсальний індекс при описанні вищевказаних властивостей.

Завантаження

##plugins.generic.usageStats.noStats##

Посилання

Kubinyi H. QSAR: Hansch analysis and related approaches. VCH: 1993.

Roy K., Kar S., Das N.R. A Primer on QSAR/QSPR Modeling. Fundamental Concepts. Springer: 2015.

Hastie T., Tibshirani R., Wainwright M. Statistical Learning with Scarcity. The Lasso and Generalizations. CRC Press: 2015.

Talete SRL Homepage [online] http://www.talete.mi.it/products/dragon_description.htm (ac-cessed March 10, 2019)

Wiener H. Structural determination of paraffin boiling points. J. Am. Chem. Soc. 1947, 69(1), 17-20.

Randić M. On Characterization of Molecular Branching. J. Am. Chem. Soc. 1975, 97(23), 6609-6615.

Randić M. On Characterization of Chemical Structure. J. Chem. Inf. Comput. Sci. 1997, 37(4), 672-672.

Todeschini R., Consonni V. Handbook of Molecular Descriptors. New York, Wiley-VCH Verlag: 2000, 667.

Stankevic M.I., Stankevic I.V., Zefirov N.S. Topologicheskie indeksy v organicheskoy khimii. Uspechi khimii. 1988, 57(3), 337-366.

Ali A., Trinajstic A. Novel/Old Modification of the first Zagreb Index. Mol. Inf. 2018, 37, 1800008.

Furtula B, Gutman I. A forgotten topological index. J. Math. Chem. 2015, 53, 1184-1190.

Pogliani L. From Molecular Connectivity Indices to Semiempirical Connectivity Terms: Re-cent Trends in Graph Theoretical Descriptors. Chem. Rev. 2000, 100, 3827-3858.

Zakharov A.B., Dyachenko A.V., Ivanov V.V. Topological characteristics of iterated line graphs in QSAR problem: Octane numbers of saturated hydrocarbons // Journal of Chemomet-rics. 2019, e3169, 1-10.

Yaws C.L.. Yaws' Handbook of Thermodynamic and Physical Properties of Chemical Com-pounds: Physical, Thermodynamic and Transport Properties for 5,000 Organic Chemical Compounds. McGraw-Hill: 2003.

Estrada E. Spectral Moments of the Edge Adjacency Matrix in Molecular Graphs. 1. Defini-tion and Applications to the Prediction of Physical Properties of Alkanes. J. Chem. Inf. Com-put. Sci. 1996, 36, 844-849.

Diudea M.V., Horvath D., Graovac A. Molecular Topology. 15. 3D Distance Matrixes and Related Topological Indices. J. Chem. Inf Comput. Sci. 1995, 35, 129-135.

Diudea M.V., Horvath D., Bonchev D. Molecular Topology. 14. Molord Algorithm and Real Number Subgraph Invariants. Croat. Chem. Acta. 1995, 68, 131-148.

Tropsha A., Gramatica P., Gombar V.K. The Importance of Being Earnest: Validation is the Absolute Essential for Successful Application and Interpretation of QSPR. QSAR Comb. Sci. 2003, 22, 69-77.

Hosamani S., Perigidad D., Jamagoud S. QSPR Analysis of Certain Degree Based Topological Indices // J. Stat. Appl. Pro. 2017, 6(2), 361-371.

Опубліковано
2019-06-14
Цитовано
Як цитувати
Zakharov, A. B., & Ivanov, V. V. (2019). Новий підхід у використанні топологічних дескрипторів. Ітерований реберний граф у проблемі фізико-хімічних властивостей насичених вуглеводнів. Вісник Харківського національного університету імені В. Н. Каразіна. Серія «Хімія», (32), 38-45. https://doi.org/10.26565/2220-637X-2019-32-02