Разработка метода дифференциальной диагностики железодефицитной анемии и анемии хронических болезней на основе демографических данных и результатов рутинных лабораторных исследований с использованием технологий машинного обучения
https://doi.org/10.17650/1818-8346-2025-20-1-171-181
Аннотация
Введение. Изучение возможностей методов машинного обучения – раздела науки об искусственном интеллекте – актуально для разработки оптимальной скрининг‑стратегии, определения групп риска, применения менее дорогостоящих и более доступных лабораторных тестов для оценки статуса железа в организме.
Цель исследования – подобрать подходящий алгоритм машинного обучения для прогнозирования уровня ферритина сыворотки (ФС) и оценить его применимость для дифференциальной диагностики железодефицитной анемии и анемии хронических болезней.
Материалы и методы. Для создания модели использовали набор данных 9771 пациента c микро‑ и нормоцитарными анемиями. На основе демографических данных (пол и возраст), клинического анализа крови, содержания С‑реактивного белка и известного уровня ФС разработаны регрессионная модель для расчета предполагаемой концентрации ФС у конкретного пациента и с использованием тех же параметров классификационная модель для определения группы уровня ФС, к которой относится пациент: I – < 15 мкг / л; II – 15–100 мкг / л; III – 100–300 мкг / л; Iv – ≥ 300 мкг / л.
Результаты. Полученная регрессионная модель обладает умеренной предиктивной способностью (R2 = 0,70; медианная абсолютная ошибка 10,7 мкг / л), коэффициент корреляции между известным и прогнозируемым уровнем ФС составил r = 0,85 (p < 0,05). Классификационная модель обладает высокой диагностической точностью для разных клинических групп по уровню ФС (площадь под кривой ошибок составила 0,91; 0,79; 0,84; 0,90 и 0,96; 0,76; 0,71; 0,82 для пациентов со сниженным уровнем гемоглобина женского (< 120 г / л) и мужского пола (< 130 г / л) в группах I, II, III, Iv соответственно).
Заключение. Прогнозирование содержания ФС с помощью разработанных моделей может использоваться в качестве точного и клинически значимого инструмента для дифференциальной диагностики железодефицитной анемии (прогнозируемый ФС понижен (< 100 мкг / л), содержание С‑реактивного белка в норме) и анемии хронических болезней (прогнозируемый ФС в норме или повышен (> 100 мкг / л), содержание С‑реактивного белка повышено) в реальной врачебной практике.
Ключевые слова
Об авторах
Н. В. ВарехаРоссия
Николай Вячеславович Вареха
117198; ул. Миклухо-Маклая, 6; Москва
Н. И. Стуклов
Россия
117198; ул. Миклухо-Маклая, 6; Москва
К. В. Гордиенко
Россия
123007; Хорошевское шоссе, 76А; Москва
Р. Р. Гимадиев
Россия
117198; ул. Миклухо-Маклая, 6; 123007; Хорошевское шоссе, 76А; 119002; Большой Власьевский пер., 14, стр. 1; Москва
О. Б. Щеголев
Россия
119002; Большой Власьевский пер., 14, стр. 1; Москва
С. Н. Кислая
Россия
117198; ул. Миклухо-Маклая, 6; Москва
Е. В. Губина
Россия
119002; Большой Власьевский пер., 14, стр. 1; Москва
А. А. Гуркина
Россия
117198; ул. Миклухо-Маклая, 6; Москва
Список литературы
1. Haemoglobin concentrations for the diagnosis of anaemia and assessment of severity. Vitamin and mineral nutrition information system. Geneva: World Health Organization, 2011. 6 p.
2. Министерство здравоохранения Российской Федерации. Железодефицитная анемия. Клинические рекомендации. 2024. Доступно по: https://cr.minzdrav.gov.ru/viewcr/669_2
3. Сахин В.Т., Крюков Е.В., Рукавицын О.А. Анемия хронических заболеваний – особенности патогенеза и попытка классификации. Тихоокеанский медицинский журнал 2019;(1):33–7. DOI: 10.17238/PmJ16091175.2019.1.33–37
4. Hoofnagle A.N. Harmonization of bloodbased indicators of iron status: making the hard work matter. Am J Clin Nutr 2017;106(Suppl 6):1615S–9. DOI: 10.3945/ajcn.117.155895
5. Dogan S., Turkoglu I. Irondeficiency anemia detection from hematology parameters by using decision trees. Int J Sci Technol 2008;3(1):85–92.
6. Azarkhish I., Raoufy M.R., Gharibzadeh S. Artificial intelligence models for predicting iron deficiency anemia and iron serum level based on accessible laboratory data. J Med Syst 2012;36(3):2057–61. DOI: 10.1007/s1091601196683
7. Luo Y., Szolovits P., Dighe A.S., Baron J.M. Using machine learning to predict laboratory test results. Am J Clin Pathol 2016;145(6):778–88. DOI: 10.1093/ajcp/aqw064
8. Pullakhandam S., McRoy S. Classification and explanation of iron deficiency anemia from complete blood count data using machine learning. BioMedInformatics 2024;4(1):661–72. DOI: 10.3390/biomedinformatics4010036
9. Yılmaz Z., Bozkurt M.R. Determination of women iron deficiency anemia using neural networks. J Med Syst 2012;36(5):2941–5. DOI: 10.1007/s1091601197724
10. Kurstjens S., de Bel T., van der Horst A. et al. Automated prediction of low ferritin concentrations using a machine learning algorithm. Clin Chem Lab Med 2022;60(12):1921–8. DOI: 10.1515/cclm20211194
11. Terzi E., Sarıbacak B., Sağlam F., Cengiz M.A. A novel expert system for diagnosis of iron deficiency anemia. Comput Math Methods Med 2022;2022:7352096. DOI: 10.1155/2022/7352096
12. McDermott M., Dighe A.S., Szolovits P. et al. Using machine learning to develop smart reflex testing protocols. J Am Med Inform Assoc 2023;31(2):416–25. DOI: 10.1093/jamia/ocad187
13. WHO guideline on use of ferritin concentrations to assess iron status in individuals and populations. Geneva: World Health Organization, 2020.
14. Schop A., Stouten K., van Houten R. et al. Diagnostics in anaemia of chronic disease in general practice: a realworld retrospective cohort study. BJGP Open 2018;2(3):bjgpopen18X101597. DOI: 10.3399/bjgpopen18x101597
15. Weiss G., Goodnough L. Anemia of chronic disease. N Engl J Med 2005;352(10):1011–23. DOI: 10.1056/NEJMra041809
16. Vakhrushev A., Ryzhkov A., Savchenko M. et al. LightAutoML: AutoML solution for a large financial services ecosystem. arXiv 2021;2109.01528. DOI: 10.48550/arXiv.2109.01528
17. Nick T.G., Campbell K.M. Logistic regression. Methods Mol Biol 2007;404:273–301. DOI: 10.1007/9781597455305_14
18. Ke G., Meng Q., Finley T. et al. LightGBM: a highly efficient gradient boosting decision tree. Advances in neural information processing systems 2017;30:3149–57.
19. Moritz P., Nishihara R., Jordan M. A linearlyconvergent stochastic LBFGS algorithm. Artificial Intelligence and Statistics 2016;249–58.
20. Fushiki T. Estimation of prediction error by using Kfold cross-validation. Statistics and Computing 2011;21:137–46. DOI: 10.1007/s1122200991538
21. Swets J.A., Dawes R.M., Monahan J. Better decisions through science. Sci Am 2000;283(4):82–7. DOI: 10.1038/scientificamerican100082
22. Das K.R., Imon A. A brief review of tests for normality. Am J Theor Appl Stat 2016;5(1):5–12. DOI: 10.11648/j.ajtas.20160501.12
23. Meissel K., Yao E.S. Using Cliff’s delta as a nonparametric effect size measure: an accessible web app and R tutorial. Practical Assessment, Research, and Evaluation 2024;29(1). DOI: 10.7275/pare.1977
24. Федеральная служба государственной статистики. Численность населения Российской Федерации по полу и возрасту на 1 января 2021 года. 2021. Доступно по: https://rosstat.gov.ru/storage/mediabank/Bul_chislen_nasel-pv_01012021.pdf (дата обращения 23. 04. 2022).
Рецензия
Для цитирования:
Вареха Н.В., Стуклов Н.И., Гордиенко К.В., Гимадиев Р.Р., Щеголев О.Б., Кислая С.Н., Губина Е.В., Гуркина А.А. Разработка метода дифференциальной диагностики железодефицитной анемии и анемии хронических болезней на основе демографических данных и результатов рутинных лабораторных исследований с использованием технологий машинного обучения. Онкогематология. 2025;20(1):171-181. https://doi.org/10.17650/1818-8346-2025-20-1-171-181
For citation:
Varekha N.V., Stuklov N.I., Gordienko K.V., Gimadiev R.R., Shchegolev O.B., Kislaya S.N., Gubina E.V., Gurkina A.A. Development of a method for differential diagnosis of iron deficiency anemia and anemia of chronic disease based on demographic data and routine laboratory tests using machine learning technologies. Oncohematology. 2025;20(1):171-181. (In Russ.) https://doi.org/10.17650/1818-8346-2025-20-1-171-181