Ентропія послідовностей ДНК і смертність пацієнтів з лейкемією

Ключові слова: ентропія, послідовності ДНК, смертність, лейкемія

Анотація

Вступ. Дезоксирибонуклеїнова кислота (ДНК) не є випадковою послідовністю чотирьох комбінацій нуклеотидів: комплексні огляди літератури переконливо показують довго- та короткодіапазонні кореляції в ДНК, періодичні властивості та кореляційну структуру послідовностей. Методи теорії інформації, зокрема інформаціїна ентропія, мають на увазі кількісну оцінку обсягу інформації, що міститься в послідовностях. Зв’язок між ентропією та виживанням пацієнтів широко поширений у деяких галузях медицини та медичних дослідженнях, таких як: кардіологія, неврологія, хірургія, травма. Таким чином, існує необхідність реалізації переваг методів теорії інформації для дослідження взаємозв'язку між смертністю певної категорії пацієнтів та ентропією їх послідовностей ДНК. Мета. Надати надійну формулу для точного розрахунку ентропії для коротких послідовностей ДНК і показати, як використовувати запропонований аналіз ентропії для вивчення смертності хворих на лейкемію. Матеріали і методи. Використовувалась база даних пацієнта з лейкемією Барселонського університету (UB) з 117 знеособленими записами, які складаються з наступного: дата діагнозу пацієнта, дата смерті пацієнта, діагнози лейкемії, послідовність ДНК пацієнта. Середній час смерті пацієнта після встановлення діагнозів: 99 ± 77 місяців. Формальними характеристиками послідовностей ДНК в БД UB хворих на лейкемію є: середня кількість ДНК основ N = 496 ± 69; min (N) = 297 основ; max (N) = 745 основ. Була запропонована узагальнена форма оцінювача ентропії (EnRE) для коротких послідовностей ДНК та продемонстровані ключові ознаки EnRE. Аналіз виживання був проведений за допомогою статистичного пакета IBM SPSS Statistics 27 методами Каплана-Мейєра та регресії Кокса. Результати. Точність запропонованої формули для розрахунку ентропії була перевірена для різних відрізків часових рядів і різних типів випадкових розподілів з відомими теоретичними значеннями ентропії. Показано, що у всіх випадках для N = 500 відносна похибка при розрахунку точного значення ентропії не перевищує 1 %, при цьому величина кореляції не гірше 0,995. Код алфавіту початкової послідовності ДНК був перетворений в числовий код основ, з використанням правила оптимізації, щоб отримати тільки одне мінімальне і симетричне числове декодування близько нуля, що дає мінімум для  стандартного відхилення EnRE і коефіцієнт варіації. Ентропія EnRE була розрахована для хворих на лейкемію після оптимального цілочисельного декодування в двох спостереженнях: 2 групи, розділені медіаною EnRE = 1,47, та 2 групи, що належать до 1-го (EnRE ≤ 1.448) та 4-го квартилів (EnRE ≥ 1.490). Результат аналізу виживання Каплана-Мейєра та моделювання виживання Кокс-регресій статистично значущі з p < 0,05 для груп поділених медіаною і з p < 0,005 для груп, що уособлюють 1-й та 4-й квартілі. Небезпека смерті для пацієнта з EnRE нижче медіани в 1,556 рази більше, ніж у пацієнта з EnRE понад медіаною та небезпека смерті для пацієнта 1-го ентропійного квартиля (найнижчий EnRE) в 2,143 рази більше, ніж у пацієнта 4-го ентропійного квартиля (найвищий EnRE). Висновки. Перехід від розширених (медіальних) до менших (квартільних) груп пацієнтів з більшою різницею у EnRE підтвердив унікальне значення ентропії послідовностей ДНК для визначення смертності пацієнтів з лейкемією. Це значення статистично доведено підвищенням небезпеки для хворих на лейкемію з меншою ентропією послідовностей ДНК: більша різниця EnRE означає збільшення риску смерті та скорочення тривалості життя після діагнозу в групах пацієнтів з меншою ентропією послідовностей ДНК.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Oleksandr Martynenko , Харківський національний університет імені В. Н. Каразіна

д.фіз-мат.н., професор, професор кафедри гігієни та соціальної медицини Харківського національного  університету імені В. Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022

Pastor Xavier Duran, клініка Університету Барселони

доктор медицини, професор, керівник відділення медичної інформатики, клініка Університету Барселони, вул. Віллароель 170, Барселона, Іспанія, 08036

Frid Santiago Andres, Університет Барселони

доцент кафедри фундаментальної клініки, медичний факультет, Університет Барселони, вул. Казанови 143, Барселона, Іспанія, 08036

Gil Rojas Jessyca, клініка Університету Барселони

дата менеджер, відділення медичної інформатики, клініка Університету Барселони, вул. Віллароель 170, Барселона, Іспанія, 08036

Liudmila Maliarova , Харківський національний університет імені В. Н. Каразіна

асистент кафедри  гігієни та соціальної медицини Харківського національного університету імені В. Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022

Посилання

Li WT. The study of correlation structures of DNA sequences: a critical review. Comput. Chem. 1997; 21 (4): 257–271. DOI: https://doi.org/10.1016/s0097-8485(97)00022-3

Damasevicius R. Complexity estimation of genetic sequences using information-theoretic and frequency analysis methods. Informatica. 2010; 21 (1): 13–30. DOI: https://doi.org/10.15388/Informatica.2010.270

Rowe GW, Trainor LEH. On the informational content of viral DNA. J. Theoretical Biology. 1983; 101: 151–170. DOI: https://doi.org/10.1016/0022-5193(83)90332-6

Vopson MM, Robson SC. A new method to study genome mutations using the information entropy. Physica A. 2012;1-9. DOI: https://doi.org/10.1016/j.physa.2021.126383

Sherwin WB. Entropy and Information Approaches to Genetic Diversity and its Expression: Genomic Geography. Entropy. 2010;12:1765-1798. DOI: https://doi.org/10.3390/e12071765

Chanda P, Costa E, Hu J, Sukumar S, Van Hemert J, Walia R. Information Theory in Computational Biology: Where We Stand Today. Entropy. 2020;22:627-637. DOI: https://doi.org/10.3390/e22060627

Villareal RP, Liu BC, Massumi A. Heart rate variability and cardiovascular mortality. Curr Atheroscler Rep. 2002; 4: 120–127. DOI: https://doi.org/10.1007/s11883-002-0035-18

Rodríguez J, Correa C, Ramírez L. Heart dynamics diagnosis based on entropy proportions: Application to 550 dynamics. Revista Mexicana de Cardiología. 2017; 28 (1): 10–20.

Androulakis AFA, Zeppenfeld K, Paiman EHM, Piers SRD, Wijnmaalen AP, Siebelink HJ, Sramko M, Lamb HJ, van der Geest RJ, de Riva M, Tao Q. Entropy as a Novel Measure of Myocardial Tissue Heterogeneity for Prediction of Ventricular Arrhythmias and Mortality in Post-Infarct Patients. JACC Clin Electrophysiol. 2019 Apr;5 (4): 480–489. DOI: https://doi.org/10.1016/j.jacep.2018.12.005. Epub 2019 Feb 27. PMID: 31000102.

Sykora M, Szabo J, Siarnik P, Turcani P, Krebs S, Lang W, Czosnyka M, Smielewski P. Heart rate entropy is associated with mortality after intracereberal hemorrhage. Journal of the Neurological Sciences. 2020: 418: 117033, ISSN 0022-510X, 1–5: DOI: https://doi.org/10.1016/j.jns.2020.117033

Matsuda E. Entropy Monitoring in Patients Undergoing General Anesthesia. Am J Nurs. 2017 Mar;117(3):62. DOI: https://doi.org/10.1097/01.NAJ.0000513290.22001.8d

Neal-Sturgess C. The Entropy of Morbidity Trauma and Mortality. Arxiv Cornell University. Med. Physics. 2010; 1–20. DOI: https://doi.org/10.48550/arxiv.1008.3695

Norris PR, Anderson SM, Jenkins JM, Williams AE, Morris JAJr. Heart rate multiscale entropy at three hours predicts hospital mortality in 3,154 trauma patients. Shock. 2008 Jul; 30 (1): 17–22. DOI: https://doi.org/10.1097/SHK.0b013e318164e4d0

Papaioannou VE, Chouvarda IG, Maglaveras NK, Baltopoulos GI, Pneumatikos IA. Temperature multiscale entropy analysis: a promising marker for early prediction of mortality in septic patients. Physiol Meas. 2013 Nov;34(11):1449-66. DOI: https://doi.org/10.1088/0967-3334/34/11/1449

Weir BS. Statistical analysis of molecular genetic data. IMA J. of Math. Applied in Medicine and Biology. 1985; 2:1–39.

Shannon CE. A Mathematical Theory of Communication. Bell System Technical Journal. 1948; 27 (3): 379–423. DOI: https://doi.org/10.1002/j.1538-7305.1948.tb01338.x

Lazo A, Rathie P. On the entropy of continuous probability distributions. IEEE Transactions on Information Theory. 1978;24(1). DOI: https://doi.org/10.1109/TIT.1978.1055832

Gini C, Ottaviani G. Università di Roma. Memorie Di Metodologia Statistica. Roma: E.V. Veschi; 1955.

Sánchez-Hechavarría M.E. and etc. Introduction of Application of Gini Coefficient to Heart Rate Variability Spectrum for Mental Stress Evaluation. Arq Bras Cardiol. 2019; [online].ahead print, PP.0-0. DOI: https://doi.org/10.5935/abc.20190185

Firebaugh G. Empirics of World Income Inequality. American Journal of Sociology. 1999; 104 (6): 597–1630. DOI: https://doi.org/10.1086/210218

Shorrocks AF. The Class of Additively Decomposable Inequality Measures. Econometrica. 1980; 48 (3): 613–625. DOI: https://doi.org/10.2307/1913126

Martynenko A, Raimondi G, Budreiko N. Robust Entropy Estimator for Heart Rate Variability. Klin. Inform. Telemed. 2019; 14 (15): 67–73. DOI: https://doi.org/10.31071/kit2019.15.06

Опубліковано
2022-11-28
Як цитувати
Martynenko , O., Duran, P. X., Andres, F. S., Jessyca, G. R., & Maliarova , L. (2022). Ентропія послідовностей ДНК і смертність пацієнтів з лейкемією. Вісник Харківського національного університету імені В. Н. Каразіна. Серія «Медицина», (45). https://doi.org/10.26565/2313-6693-2022-45-02