Разработка прогностической модели для диагностики рака предстательной железы на основе радиомики бипараметрической магнитно-резонансной томографии карт измеряемого коэффициента диффузии и стекинга алгоритмов машинного обучения

Обложка


Цитировать

Полный текст

Аннотация

Обоснование. Рак предстательной железы является одним из наиболее распространённых онкологических заболеваний среди мужчин [1, 2]. За последние годы в мире создан ряд прогностических моделей на основе текстурного анализа изображений бипараметрической магнитно-резонансной томографии. Исследования показали, что радиомические признаки, извлечённые из карт измеряемого коэффициента диффузии, являются наиболее воспроизводимыми [3]. Однако эти модели имеют ограничения по точности, поскольку построены с помощью одного алгоритма машинного обучения, который учитывает только линейную зависимость [4–6].

Цель — повышение точности прогностической модели, диагностирующей рак предстательной железы, за счёт использования стекинга алгоритмов машинного обучения, которые учитывают не только линейные, но и нелинейные зависимости на основе радиомики бипараметрической магнитно-резонансной томографии карт измеряемого коэффициента диффузии.

Материалы и методы. Проведено одноцентровое когортное ретроспективное исследование пациентов с подозрением на рак предстательной железы в отделении рентгеновской диагностики и томографии Объединённой больницы с поликлиникой (Москва) с 2017 по 2023 год. Наличие рака предстательной железы подтверждено биопсией или радикальной простатэктомией. Статистический анализ проводился с использованием Python 3.11.

Результаты. В исследовании приняло участие 67 мужчин в возрасте 60 [54; 66] лет, из них у 57 — рак предстательной железы, а у 10 — доброкачественное образование простаты. Программное обеспечение LIFEx позволило выделить 96 радиомических параметров.

Статистически значимые различия выявлены по: PARAMS_ZSpatialResampling (размер воксела по оси Z) (p=0,001), SHAPE_Sphericity[onlyFor3DROI] (сферичность формы) (p=0,006), SHAPE_Compacity[onlyFor3DROI] (компактность формы) (p=0,004), GLRLM_HGRE (p=0,039), GLRLM_SRHGE (p=0,041), GLRLM_RLNU (p=0,039). GLRLM — матрица длин серий уровня серого. Однофакторная логистическая регрессия показала, что статистически значимо влияли на исход: SHAPE_Compacity[onlyFor3DROI] (R2=15%) и PARAMS_ZSpatialResampling (R2=18%). Методом многофакторной логистической регрессии была построена прогностическая модель, которая учитывает линейные зависимости. Модель включает 3 показателя, которые совместно статистически значимо влияют на исход (R2=23%): SHAPE_Sphericity[onlyFor3DROI], PARAMS_ZSpatialResampling и GLRLM_RLNU.

Для описания нелинейных связей, была построена другая модель на основе алгоритма «Дерево решений». В неё вошли 4 показателя (R2=58%): DISCRETIZED_HISTO_Entropy_log10 (случайность распределения), SHAPE_Sphericity[onlyFor3DROI], PARAMS_ZSpatialResampling и GLRLM_SRE.

Стекинг алгоритмов, состоящий в расчёте среднеарифметического между предсказаниями алгоритмов многофакторной логистической регрессии и «Дерева решений», позволил построить модель, которая учитывает линейные и нелинейные зависимости. Модель включает 5 параметров (R2=77%). Построенная модель легла в основу программы-калькулятора [7], внедрённой в данный момент в практику врача-рентгенолога.

Заключение. Новая модель, построенная на основе карт измеряемого коэффициента диффузии, работает лучше (площадь под ROC-кривой 99,0% [97,7; 100,0]), чем существующие модели с площадью под ROC-кривой 83,6% [78,3; 88,9], которые показывают значительную вариативность (I2=71%). Повышение точности работы модели произошло за счёт применения стекинга технологий машинного обучения, который позволил учесть как линейное, так и нелинейное влияние переменных на исход.

Полный текст

Обоснование. Рак предстательной железы является одним из наиболее распространённых онкологических заболеваний среди мужчин [1, 2]. За последние годы в мире создан ряд прогностических моделей на основе текстурного анализа изображений бипараметрической магнитно-резонансной томографии. Исследования показали, что радиомические признаки, извлечённые из карт измеряемого коэффициента диффузии, являются наиболее воспроизводимыми [3]. Однако эти модели имеют ограничения по точности, поскольку построены с помощью одного алгоритма машинного обучения, который учитывает только линейную зависимость [4–6].

Цель — повышение точности прогностической модели, диагностирующей рак предстательной железы, за счёт использования стекинга алгоритмов машинного обучения, которые учитывают не только линейные, но и нелинейные зависимости на основе радиомики бипараметрической магнитно-резонансной томографии карт измеряемого коэффициента диффузии.

Материалы и методы. Проведено одноцентровое когортное ретроспективное исследование пациентов с подозрением на рак предстательной железы в отделении рентгеновской диагностики и томографии Объединённой больницы с поликлиникой (Москва) с 2017 по 2023 год. Наличие рака предстательной железы подтверждено биопсией или радикальной простатэктомией. Статистический анализ проводился с использованием Python 3.11.

Результаты. В исследовании приняло участие 67 мужчин в возрасте 60 [54; 66] лет, из них у 57 — рак предстательной железы, а у 10 — доброкачественное образование простаты. Программное обеспечение LIFEx позволило выделить 96 радиомических параметров.

Статистически значимые различия выявлены по: PARAMS_ZSpatialResampling (размер воксела по оси Z) (p=0,001), SHAPE_Sphericity[onlyFor3DROI] (сферичность формы) (p=0,006), SHAPE_Compacity[onlyFor3DROI] (компактность формы) (p=0,004), GLRLM_HGRE (p=0,039), GLRLM_SRHGE (p=0,041), GLRLM_RLNU (p=0,039). GLRLM — матрица длин серий уровня серого. Однофакторная логистическая регрессия показала, что статистически значимо влияли на исход: SHAPE_Compacity[onlyFor3DROI] (R2=15%) и PARAMS_ZSpatialResampling (R2=18%). Методом многофакторной логистической регрессии была построена прогностическая модель, которая учитывает линейные зависимости. Модель включает 3 показателя, которые совместно статистически значимо влияют на исход (R2=23%): SHAPE_Sphericity[onlyFor3DROI], PARAMS_ZSpatialResampling и GLRLM_RLNU.

Для описания нелинейных связей, была построена другая модель на основе алгоритма «Дерево решений». В неё вошли 4 показателя (R2=58%): DISCRETIZED_HISTO_Entropy_log10 (случайность распределения), SHAPE_Sphericity[onlyFor3DROI], PARAMS_ZSpatialResampling и GLRLM_SRE.

Стекинг алгоритмов, состоящий в расчёте среднеарифметического между предсказаниями алгоритмов многофакторной логистической регрессии и «Дерева решений», позволил построить модель, которая учитывает линейные и нелинейные зависимости. Модель включает 5 параметров (R2=77%). Построенная модель легла в основу программы-калькулятора [7], внедрённой в данный момент в практику врача-рентгенолога.

Заключение. Новая модель, построенная на основе карт измеряемого коэффициента диффузии, работает лучше (площадь под ROC-кривой 99,0% [97, 7; 100, 0]), чем существующие модели с площадью под ROC-кривой 83,6% [78, 3; 88, 9], которые показывают значительную вариативность (I2=71%). Повышение точности работы модели произошло за счёт применения стекинга технологий машинного обучения, который позволил учесть как линейное, так и нелинейное влияние переменных на исход.

×

Об авторах

Антон Игоревич Кузнецов

Московский авиационный институт (национальный исследовательский университет)

Автор, ответственный за переписку.
Email: drednout5786@yandex.ru
ORCID iD: 0000-0003-2182-5792
SPIN-код: 8824-9080
Россия, Москва

Список литературы

  1. Mottet N., van den Bergh R.C.N., Briers E., et al. EAU-EANM-ESTRO-ESUR-SIOG Guidelines on Prostate Cancer—2020 Update. Part 1: Screening, Diagnosis, and Local Treatment with Curative Intent // Eur Urol. 2021. Vol. 79, N 2. P. 243–262. doi: 10.1016/j.eururo.2020.09.042
  2. Здравоохранение в России. 2021: статистический сборник / под ред. П.А. Смелова, С.Ю. Никитиной. Москва : Федеральная служба государственной статистики, 2021.
  3. Shah V., Turkbey B., Mani H., et al. Decision support system for localizing prostate cancer based on multiparametric magnetic resonance imaging // Med Phys. 2012. Vol. 39, N 7. P. 4093–4103. doi: 10.1118/1.4722753
  4. He D., Wang X., Fu C., et al. MRI-based radiomics models to assess prostate cancer, extracapsular extension and positive surgical margins // Cancer Imaging. 2021. Vol. 21, N 1. P. 46. doi: 10.1186/s40644-021-00414-6
  5. Lu Y., Li B., Huang H., et al. Biparametric MRI-based radiomics classifiers for the detection of prostate cancer in patients with PSA serum levels of 4~10 ng/mL // Front Oncol. 2022. Vol. 12. doi: 10.3389/fonc.2022.1020317
  6. Chen T., Li M., Gu Y., et al. Prostate Cancer Differentiation and Aggressiveness: Assessment With a Radiomic-Based Model vs. PI-RADS v2 // Journal of Magnetic Resonance Imaging. 2019. Vol. 49, N 3. P. 875–884. doi: 10.1002/jmri.26243
  7. Свидетельство о регистрации программы для ЭВМ 2023669718/ 19.09.2023. Щепкина Е.В., Крючкова О.В., Кузнецов А.И. Программное обеспечение для прогнозирования вероятности выявления злокачественных новообразований (рака) предстательной железы у мужчин на основе Мрт-радиомики. Режим доступа: https://www.elibrary.ru/item.asp?id=54657407 Дата обращения: 28.01.2024. EDN: FNYFEB

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Эко-вектор, 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 79539 от 09 ноября 2020 г.


Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах