Ентропія послідовностей ДНК і смертність пацієнтів з лейкемією
Анотація
Вступ. Дезоксирибонуклеїнова кислота (ДНК) не є випадковою послідовністю чотирьох комбінацій нуклеотидів: комплексні огляди літератури переконливо показують довго- та короткодіапазонні кореляції в ДНК, періодичні властивості та кореляційну структуру послідовностей. Методи теорії інформації, зокрема інформаціїна ентропія, мають на увазі кількісну оцінку обсягу інформації, що міститься в послідовностях. Зв’язок між ентропією та виживанням пацієнтів широко поширений у деяких галузях медицини та медичних дослідженнях, таких як: кардіологія, неврологія, хірургія, травма. Таким чином, існує необхідність реалізації переваг методів теорії інформації для дослідження взаємозв'язку між смертністю певної категорії пацієнтів та ентропією їх послідовностей ДНК. Мета. Надати надійну формулу для точного розрахунку ентропії для коротких послідовностей ДНК і показати, як використовувати запропонований аналіз ентропії для вивчення смертності хворих на лейкемію. Матеріали і методи. Використовувалась база даних пацієнта з лейкемією Барселонського університету (UB) з 117 знеособленими записами, які складаються з наступного: дата діагнозу пацієнта, дата смерті пацієнта, діагнози лейкемії, послідовність ДНК пацієнта. Середній час смерті пацієнта після встановлення діагнозів: 99 ± 77 місяців. Формальними характеристиками послідовностей ДНК в БД UB хворих на лейкемію є: середня кількість ДНК основ N = 496 ± 69; min (N) = 297 основ; max (N) = 745 основ. Була запропонована узагальнена форма оцінювача ентропії (EnRE) для коротких послідовностей ДНК та продемонстровані ключові ознаки EnRE. Аналіз виживання був проведений за допомогою статистичного пакета IBM SPSS Statistics 27 методами Каплана-Мейєра та регресії Кокса. Результати. Точність запропонованої формули для розрахунку ентропії була перевірена для різних відрізків часових рядів і різних типів випадкових розподілів з відомими теоретичними значеннями ентропії. Показано, що у всіх випадках для N = 500 відносна похибка при розрахунку точного значення ентропії не перевищує 1 %, при цьому величина кореляції не гірше 0,995. Код алфавіту початкової послідовності ДНК був перетворений в числовий код основ, з використанням правила оптимізації, щоб отримати тільки одне мінімальне і симетричне числове декодування близько нуля, що дає мінімум для стандартного відхилення EnRE і коефіцієнт варіації. Ентропія EnRE була розрахована для хворих на лейкемію після оптимального цілочисельного декодування в двох спостереженнях: 2 групи, розділені медіаною EnRE = 1,47, та 2 групи, що належать до 1-го (EnRE ≤ 1.448) та 4-го квартилів (EnRE ≥ 1.490). Результат аналізу виживання Каплана-Мейєра та моделювання виживання Кокс-регресій статистично значущі з p < 0,05 для груп поділених медіаною і з p < 0,005 для груп, що уособлюють 1-й та 4-й квартілі. Небезпека смерті для пацієнта з EnRE нижче медіани в 1,556 рази більше, ніж у пацієнта з EnRE понад медіаною та небезпека смерті для пацієнта 1-го ентропійного квартиля (найнижчий EnRE) в 2,143 рази більше, ніж у пацієнта 4-го ентропійного квартиля (найвищий EnRE). Висновки. Перехід від розширених (медіальних) до менших (квартільних) груп пацієнтів з більшою різницею у EnRE підтвердив унікальне значення ентропії послідовностей ДНК для визначення смертності пацієнтів з лейкемією. Це значення статистично доведено підвищенням небезпеки для хворих на лейкемію з меншою ентропією послідовностей ДНК: більша різниця EnRE означає збільшення риску смерті та скорочення тривалості життя після діагнозу в групах пацієнтів з меншою ентропією послідовностей ДНК.
Завантаження
Посилання
Li WT. The study of correlation structures of DNA sequences: a critical review. Comput. Chem. 1997; 21 (4): 257–271. DOI: https://doi.org/10.1016/s0097-8485(97)00022-3
Damasevicius R. Complexity estimation of genetic sequences using information-theoretic and frequency analysis methods. Informatica. 2010; 21 (1): 13–30. DOI: https://doi.org/10.15388/Informatica.2010.270
Rowe GW, Trainor LEH. On the informational content of viral DNA. J. Theoretical Biology. 1983; 101: 151–170. DOI: https://doi.org/10.1016/0022-5193(83)90332-6
Vopson MM, Robson SC. A new method to study genome mutations using the information entropy. Physica A. 2012;1-9. DOI: https://doi.org/10.1016/j.physa.2021.126383
Sherwin WB. Entropy and Information Approaches to Genetic Diversity and its Expression: Genomic Geography. Entropy. 2010;12:1765-1798. DOI: https://doi.org/10.3390/e12071765
Chanda P, Costa E, Hu J, Sukumar S, Van Hemert J, Walia R. Information Theory in Computational Biology: Where We Stand Today. Entropy. 2020;22:627-637. DOI: https://doi.org/10.3390/e22060627
Villareal RP, Liu BC, Massumi A. Heart rate variability and cardiovascular mortality. Curr Atheroscler Rep. 2002; 4: 120–127. DOI: https://doi.org/10.1007/s11883-002-0035-18
Rodríguez J, Correa C, Ramírez L. Heart dynamics diagnosis based on entropy proportions: Application to 550 dynamics. Revista Mexicana de Cardiología. 2017; 28 (1): 10–20.
Androulakis AFA, Zeppenfeld K, Paiman EHM, Piers SRD, Wijnmaalen AP, Siebelink HJ, Sramko M, Lamb HJ, van der Geest RJ, de Riva M, Tao Q. Entropy as a Novel Measure of Myocardial Tissue Heterogeneity for Prediction of Ventricular Arrhythmias and Mortality in Post-Infarct Patients. JACC Clin Electrophysiol. 2019 Apr;5 (4): 480–489. DOI: https://doi.org/10.1016/j.jacep.2018.12.005. Epub 2019 Feb 27. PMID: 31000102.
Sykora M, Szabo J, Siarnik P, Turcani P, Krebs S, Lang W, Czosnyka M, Smielewski P. Heart rate entropy is associated with mortality after intracereberal hemorrhage. Journal of the Neurological Sciences. 2020: 418: 117033, ISSN 0022-510X, 1–5: DOI: https://doi.org/10.1016/j.jns.2020.117033
Matsuda E. Entropy Monitoring in Patients Undergoing General Anesthesia. Am J Nurs. 2017 Mar;117(3):62. DOI: https://doi.org/10.1097/01.NAJ.0000513290.22001.8d
Neal-Sturgess C. The Entropy of Morbidity Trauma and Mortality. Arxiv Cornell University. Med. Physics. 2010; 1–20. DOI: https://doi.org/10.48550/arxiv.1008.3695
Norris PR, Anderson SM, Jenkins JM, Williams AE, Morris JAJr. Heart rate multiscale entropy at three hours predicts hospital mortality in 3,154 trauma patients. Shock. 2008 Jul; 30 (1): 17–22. DOI: https://doi.org/10.1097/SHK.0b013e318164e4d0
Papaioannou VE, Chouvarda IG, Maglaveras NK, Baltopoulos GI, Pneumatikos IA. Temperature multiscale entropy analysis: a promising marker for early prediction of mortality in septic patients. Physiol Meas. 2013 Nov;34(11):1449-66. DOI: https://doi.org/10.1088/0967-3334/34/11/1449
Weir BS. Statistical analysis of molecular genetic data. IMA J. of Math. Applied in Medicine and Biology. 1985; 2:1–39.
Shannon CE. A Mathematical Theory of Communication. Bell System Technical Journal. 1948; 27 (3): 379–423. DOI: https://doi.org/10.1002/j.1538-7305.1948.tb01338.x
Lazo A, Rathie P. On the entropy of continuous probability distributions. IEEE Transactions on Information Theory. 1978;24(1). DOI: https://doi.org/10.1109/TIT.1978.1055832
Gini C, Ottaviani G. Università di Roma. Memorie Di Metodologia Statistica. Roma: E.V. Veschi; 1955.
Sánchez-Hechavarría M.E. and etc. Introduction of Application of Gini Coefficient to Heart Rate Variability Spectrum for Mental Stress Evaluation. Arq Bras Cardiol. 2019; [online].ahead print, PP.0-0. DOI: https://doi.org/10.5935/abc.20190185
Firebaugh G. Empirics of World Income Inequality. American Journal of Sociology. 1999; 104 (6): 597–1630. DOI: https://doi.org/10.1086/210218
Shorrocks AF. The Class of Additively Decomposable Inequality Measures. Econometrica. 1980; 48 (3): 613–625. DOI: https://doi.org/10.2307/1913126
Martynenko A, Raimondi G, Budreiko N. Robust Entropy Estimator for Heart Rate Variability. Klin. Inform. Telemed. 2019; 14 (15): 67–73. DOI: https://doi.org/10.31071/kit2019.15.06
Вісник Харківського національного університету імені В. Н. Каразіна, серія Медицина має такі умови авторського права:
1. Автори зберігають авторські права та надають журналу право на першу публікацію разом із роботою, яка одночасно ліцензується згідно з ліцензією Creative Commons Attribution License, яка дозволяє іншим ділитися роботою з визнанням авторства роботи та першої публікації в цьому журналі.
2. Автори можуть укладати окремі додаткові договірні угоди щодо неексклюзивного розповсюдження опублікованої журналом версії роботи з підтвердженням її початкової публікації в цьому журналі.
3. Авторам дозволяється та заохочується публікувати свої роботи в Інтернеті до та під час процесу подання, оскільки це може призвести до продуктивного обміну, а також до раннього та більшого цитування опублікованої роботи.