Приоритетные параметры радиомического анализа для компьютерной томографии при злокачественных новообразованиях головы и шеи: систематический обзор
- Авторы: Васильев Ю.А.1, Нанова О.Г.1, Блохин И.А.1, Решетников Р.В.1, Владзимирский А.В.1, Омелянская О.В.1
-
Учреждения:
- Научно-практический клинический центр диагностики и телемедицинских технологий
- Выпуск: Том 5, № 2 (2024)
- Страницы: 255-268
- Раздел: Систематические обзоры
- Статья получена: 13.11.2023
- Статья одобрена: 04.12.2023
- Статья опубликована: 20.09.2024
- URL: https://jdigitaldiagnostics.com/DD/article/view/623240
- DOI: https://doi.org/10.17816/DD623240
- ID: 623240
Цитировать
Аннотация
Обоснование. Радиомика — новейшее и многообещающее направление современной лучевой диагностики. Число исследований злокачественных новообразований головы и шеи с помощью этого метода увеличивается с каждым годом. Мы провели систематический обзор новейших публикаций (2021–2023) по злокачественным новообразованиям головы и шеи, выполненным на основе компьютерной томографии.
Цель — систематизация данных по используемым параметрам радиомического анализа при раке головы и шеи, выявленным по данным компьютерной томографии.
Материалы и методы. Поиск статей осуществлялся в базе PubMed. Произведены извлечение базовых характеристик отобранных статей и оценка их качества по RQS 2.0 и модифицированному опроснику QUADAS-CAD. Оценили уровень воспроизводимости радиомических параметров, отобранных для прогностических моделей, в разных исследованиях. Для обзора отобрано 11 статей. В большинстве случаев отмечался высокий риск систематической ошибки, связанный с несбалансированностью выборки по демографическим параметрам и уровню патологий.
Результаты. При оценке качества радиомики диапазон баллов для исследованных статей изменяется от 19,44% до 50,00% максимально возможной суммы. Основные проблемы, влекущие за собой снижение качества исследований, обусловлены отсутствием внешней валидации результатов (73% проанализированных статей), а также недоступностью или непрозрачностью исследовательских данных (82%). Воспроизводимость радиомических параметров между исследованиями низкая из-за большого разнообразия используемых методик получения и постобработки изображений, а также извлечения и статистической обработки радиомических параметров.
Заключение. Обсуждается необходимость выделения базового блока устойчивых радиомических параметров для внедрения метода в клиническую практику, что возможно сделать только при стандартизации методов радиомики и создания открытой базы радиомических данных.
Ключевые слова
Полный текст
Обоснование
Радиомика — новейшее направление современной медицины. Основная задача метода — повышение качества диагностики на основе параметров медицинских изображений, невидимых человеческому глазу: радиомических признаков [1]. Радиомический анализ в лучевой диагностике стремительно развивается [2]. Перспектива метода — широкое использование как вспомогательного инструмента для прогнозирования и принятия решений по тактике лечения.
На сегодняшний момент имеются несколько тысяч радиомических параметров [3], относящихся к трём основных группам:
- характеристики кривой, описывающие свойства изображения;
- текстурные параметры, то есть gray-scale матрицы, характеризующие соотношения пикселей;
- параметры формы.
В каждой из групп радиомических признаков выделяют несколько подгрупп.
Количество параметров, использованных в исследованиях, варьирует от нескольких десятков до нескольких тысяч и зависит от способа выделения радиомических признаков: вручную или благодаря алгоритмам машинного обучения [3, 4]. Распределение по основным группам определённых параметров также максимально разнообразно: могут быть включены все группы признаков в разных пропорциях, либо, например, включены только текстурные признаки и не включены параметры формы. Выбор числа радиомических признаков и их состава при ручной обработке («handcrafted features») в настоящий момент зависит в основном от выбранного приложения для анализа и интуиции исследователя.
Перспектива внедрения радиомики как вспомогательного диагностического инструмента во врачебную практику ставит вопрос об унифицировании набора радиомических признаков [5, 6]. Отобранные для широкого практического использования признаки должны быть воспроизводимы между разными исследованиями. Однако имеется целый ряд факторов, различающих эти исследования: анализируемые структуры, тип прогноза, способ получения и обработки изображений, статистические методы анализа радиомических признаков.
Цель
Цель настоящего исследования — систематизация данных по используемым параметрам радиомического анализа при раке головы и шеи, выявленным по данным компьютерной томографии (КТ). Рак шеи и головы, включающий новообразования в области горла, гортани, носа, пазух и рта [7], был выбран как один из самых распространённых видов рака [8], требующий мультимодальной диагностики, начиная с КТ [9–11].
Материалы и методы
Поисковая стратегия
Поиск осуществлялся в базе PubMed. Поисковый запрос ограничивался английским языком. Даты поиска выбраны таким образом, чтобы списки литературы в большинстве своём не перекрывались между нашим и другими исследованиями: с 15 ноября 2020 года по 1 июня 2023 года [12–14].
Поисковый запрос выглядел следующим образом:
«head and neck neoplasms»[MeSH Terms] AND («artificial intelligence»[MeSH Terms] OR («artificial»[All Fields] AND «intelligence»[All Fields]) OR «artificial intelligence»[All Fields] OR («deep learning»[MeSH Terms] OR («deep»[All Fields] AND «learning»[All Fields]) OR «deep learning»[All Fields]) OR («machine learning»[MeSH Terms] OR («machine»[All Fields] AND «learning»[All Fields]) OR «machine learning»[All Fields]) OR («neural networks, computer»[MeSH Terms] OR («neural»[All Fields] AND «networks»[All Fields] AND «computer»[All Fields]) OR «computer neural networks»[All Fields] OR («neural»[All Fields] AND «network»[All Fields]) OR «neural network»[All Fields]) OR «radiomic*»[All Fields]) OR «radiomic features*»[All Fields]) OR «radiomics features*»[All Fields]) AND («node*»[All Fields] OR «lymph node*»[All Fields] OR («nodal»[All Fields] OR «nodally»[All Fields] OR «nodals»[All Fields]) OR «metastas*»[All Fields]).
Критерии включения: оригинальные исследовательские статьи.
Критерии исключения: обзоры, метаанализы, а также клинические случаи, в которых исследовали опухоли шеи и головы радиомическими методами.
Дизайн исследования соответствует методическим рекомендациям PRISMA (Preferred Reporting Items for Systematic reviews and Meta-Analyses) [15].
Названия и абстракты найденных по поисковому запросу статей были независимо проанализированы двумя экспертами. В результате был отобран ряд статей для полнотекстового анализа. В случае расхождений относительно включения статьи в анализ привлекался третий эксперт, принимавший финальное решение. Дополнительный анализ списков литературы включённых работ для выявления публикаций, подходящих для настоящего исследования («snowballing»), не проводился.
Извлечение информации и оценка качества статьи
Из полных текстов отобранных статей извлекали следующую информацию:
- имя первого автора и имя ответственного автора;
- название статьи, год выхода, DOI;
- название журнала, импакт-фактор;
- страна, где выполнили исследование;
- задачи исследования;
- дизайн (проспективное/ретроспективное, одноцентровое/многоцентровое);
- критерии включения/исключения пациентов;
- число пациентов, их пол и возраст;
- локализация опухоли и её тип;
- общее число извлечённых радиомических признаков;
- распределение радиомических признаков по классам (оценивалось или нет); если оценивалось, то рассматривали следующие классы:
— параметры формы (2D и 3D);
— параметры первого типа;
— параметры второго типа: текстурные параметры с несколькими подгруппами (Gray Level Co-occurrence Matrix, GLCM; Gray Level Run Length Matrix, GLRLM; Gray Level Size Zone Matrix, GLSZM; Neighbouring Gray Tone Difference Matrix, NGTDM; Gray Level Dependence Matrix, GLDM);
- способ анализа радиомических признаков:
— использовали машинное обучение или нет;
— в случае «handcrafted radiomics» — использованные статистические методы для отбора радиомических признаков;
- число отобранных авторами радиомических признаков в качестве имеющих предсказательную силу, а также их значимость.
Качество отобранных статей оценено двумя способами: по специализированной для радиомических исследований системе RQS 2.0 (Radiomics Quality Score 2.0) [16] и по универсальной для медицинских исследований системе QUADAS-2 (Quality Assessment of Diagnostic Accuracy Studies 2) [17, 18], модифицированной под задачи искусственного интеллекта — QUADAS-CAD
Анализ радиомических признаков
Из каждой отобранной статьи были извлечены радиомические признаки, определённые авторами как значимые для прогноза. Рассматривались признаки, полученные и на оригинальных изображениях, и на прошедших постпроцессинг. Учитывались признаки, отобранные разными статистическими методами: машинное обучение, регрессионный анализ, дисперсионный анализ, ресэмплинг (resampling), оценка по внутриклассовому коэффициенту корреляции. Если в исследовании тестировали несколько разных гипотез, то осуществлялось извлечение радиомических признаков, приведённых для каждой гипотезы отдельно. В двух исследованиях авторы для всех извлечённых радиомических параметров приводят в открытом доступе статистики, характеризующие устойчивость этих параметров — внутриклассовый коэффициент корреляции [19] и p-level для дисперсионного анализа [20], при этом не проводя редукцию числа параметров. В этих случаях мы, основываясь на приведённых открытых данных, самостоятельно отбирали наиболее устойчивые радиомические параметры для нашего анализа.
Оценивали степень перекрывания наборов значимых радиомических признаков как между исследованиями, так и внутри одного исследования для разных конечных точек.
Результаты
Поиск литературы и отбор работ
По начальному поисковому запросу было получено 804 ссылки, у этих ссылок проанализировали названия и абстракты. В результате 762 ссылки были исключены как неподходящие (рассмотрены другие типы рака, не использовался радиомический анализ). По результатам анализа названия и абстракта включены 42 публикации (рис. 1). Из них в итоговый анализ было включено 11 статей, а 31 статья была исключена (11 статей использовали магнитно-резонансную томографию, 2 — ультразвуковое исследование; 7 исследовали рак щитовидной железы, 1 — рак пищевода; в 10 работах авторы не приводили используемые радиомические параметры).
Рис. 1. Блок-схема систематического поиска литературы. МРТ — магнитно-резонансная томография, УЗД — ультразвуковая диагностика
Базовые характеристики статей
Приложение 1 суммирует базовые характеристики отобранных для обзора статей. Из 11 статей 5 выполнены в Китае [19, 21–24], 3 — в Европе (из них одна — в Италии) [25], и по одной статье — в Португалии/Австрии/Германии [26], Нидерландах [27], США [28], Канаде [20] и Тайланде [29]. Самые высокорейтинговые публикации были в журналах Cancers (импакт-фактор 6.575) [20] и European Radiology (импакт-фактор 6.020) [21]. Все исследования — ретроспективные. Восемь из включённых исследований — одноцентровые [20–23, 25, 27–29], три — многоцентровые [19, 24, 26].
Радиомические признаки использовали для прогноза общей выживаемости [25, 26, 29], выживаемости без прогрессирования [25, 29], выживаемости без отдалённых метастазов [28], риска локорегиональных рецидивов [25, 26, 28], оценки появления отдалённых метастазов [26], предоперационного прогнозирования метастазов в лимфатические узлы [21, 23, 24], классификации увеличенных шейных узлов [22]. В одной работе исследовали влияние устойчивости радиомических параметров на качество радиомических моделей [18]. Различия в свойствах радиомических признаков в зависимости от расположения опухоли исследовали в одной статье [20]. Валидацию ранее построенной модели на других данных проводили в одной работе [27].
Качество включённых работ по шкале RQS 2.0
Приложение 2 суммирует оценку качества статей по специализированной системе для радиомического анализа RQS 2.0 [4]. Диапазон баллов для исследованных статей изменяется от 7 (19,44%) [20] до 18 (50,00%) [22] из возможных 36 (100%) баллов, при среднем значении и стандартном отклонении 10 и 4 соответственно.
В 7 из 11 случаев (64%) процесс получения изображений был хорошо запротоколирован [21–26, 28]. Пять работ (45%) учитывали влияние сегментации (повторная сегментация двумя исследователями, алгоритмы сегментации, внесение случайного шума) на извлечение радиомических признаков [22, 23, 25, 29, 30]. X. Teng и соавт. [20] оценивали надёжность радиомических признаков при мультицентровом характере исследований, а также влияние разных признаков на надёжность моделей в целом. Ни в одной из рассматриваемых работ не проводили анализа устойчивости радиомических признаков к временным вариациям (например, движению органов, увеличению/уменьшению размеров органов). Проблема переобучения моделей и редукция числа радиомических признаков в моделях с выбором наиболее значимых рассматривалась в 10 статьях (91%) [19, 21–29]. Построение моделей на объединённых наборах радиомических и клинических признаков, сопоставление смешанных, радиомических и клинических моделей проводили в 8 работах (73%) [22, 24–30]. Во всех исследованиях (100%) приводятся значения достоверности и качества дискриминации (AUC, p-value, в том числе полученные при ресэмплировании данных) [31]. Достаточно низкие показатели найдены для валидации полученных радиомических моделей. Так, валидацию использовали всего в 3 статьях (27%) [20, 23, 26], из них только в одной работе (9%) использовали валидацию с привлечением данных из другого центра [26]. Кроме того, низкие показатели в плане прозрачности данных: только в двух статьях данные находятся в открытом доступе — сами изображения [25] и извлечённые радиомические признаки [18].
Качество включённых работ по шкале QUADAS-CAD
Табл. 1 и табл. 2 суммируют оценку риска систематической ошибки, данную по QUADAS-CAD [17]. Общий риск систематической ошибки высок в 6 из 11 проанализированных статей (54,5%) [19, 20, 25, 26, 28, 29]. В 5 из 11 статей (45,5%) риск систематической ошибки низкий [21–24, 27]. Риск систематической ошибки из-за несбалансированности данных высокий в 7 исследованиях (64%) [19, 20, 23, 25, 26, 28, 29] и низкий в 4 (36%) [21, 22, 24, 27]. В большинстве случаев этот риск связан с несбалансированностью выборки по демографическим параметрам и характеру патологий. Машинное обучение использовали в шести статьях [19, 20, 22, 24, 26, 28], соответственно, часть вопросов блока D2 имеет отношение только к ним. Вероятность систематической ошибки вследствие выбранного способа использования и интерпретации индексных тестов была высокой в 4 исследованиях (36%) [19, 20, 26, 29], умеренной в 1 случае (9,5%) [28] и низкой в 6 работах (54,5%) [21–25, 27]. В большинстве случаев (64%) риск ошибки, связанный с оценкой референсных стандартов, был низким [19, 21–24, 27, 29]. В некоторых случаях был не ясен уровень компетенций врачей, оценивающих референсные значения; в связи с этим риск систематической ошибки был оценён как высокий (27%) [28] или умеренный (9%) [20, 25, 26]. Высокая вероятность систематических ошибок вследствие гетерогенности данных была обнаружена в 3 исследованиях (27%) [20, 25, 28], а низкая — в 8 исследованиях (73%) [19, 21–24, 26, 27, 29]. Причина неоднозначности оценок в некоторых случаях обусловлена низким уровнем детализации при описании путей анализа данных.
Таблица 1. Опросник по QUADAS-CAD
Домен | Вопросы | Franzese С., 2023 | Gonçalves M., 2022 | Zhao X., 2023 | Teng X., 2022 | Zhang W., 2022 | Yang G., 2022 | Intarak S., 2022 | Morgan H., 2021 | Li J., 2021 | Liu X., 2021 | Zhai T., 2021 |
D1 | Были ли данные (обучающие и тестовые наборы) сбалансированы по тяжести (включая отсутствие) целевой патологии? | нет | нет | да | неясно | да | да | нет | нет | да | нет | да |
Были ли данные (обучающие и тестовые наборы) сбалансированы с точки зрения демографических факторов? | нет | нет | да | неясно | да | нет | нет | неясно | да | нет | да | |
Избежало ли исследование неуместных исключений? | да | нет | да | неясно | да | да | неясно | неясно | да | неясно | да | |
D2 | Если использовалась нейронная сеть, были ли наборы данных обучения и тестирования не пересекающимися или похожими? | – | да | – | неясно | да | – | – | да | да | неясно | – |
Если использовалась нейронная сеть, был ли рационален размер каждого набора данных? | – | нет | – | да | да | – | – | да | да | да | – | |
Если использовался порог патологии, был ли он установлен заранее? | да | – | да | – | да | да | нет | неясно | да | неясно | да | |
Если использовался порог принятия решения (для искусственного интеллекта), был ли он задан заранее? | – | – | – | – | – | – | – | неясно | – | – | – | |
D3 | Может ли референсный стандарт правильно классифицировать целевое состояние? | неясно | неясно | да | да | да | да | да | неясно | да | да | да |
Были ли результаты референсных стандартов подготовлены или проверены с необходимым уровнем экспертизы? | неясно | неясно | да | да | неясно | да | да | неясно | да | неясно | да | |
D4 | Была ли прозрачность в том, как были получены результаты? | неясно | да | да | да | да | да | да | нет | да | да | да |
Все ли данные пациентов имели один и тот же референсный стандарт? | неясно | да | да | да | неясно | да | да | нет | неясно | нет | да |
Таблица 2. Оценка риска смещения по QUADAS-CAD
Первый автор, год | D1 | D2 | D3 | D4 | Общая оценка | Вес (%) |
Franzese С., 2023 | высокий | низкий | некоторые сомнения | высокий | высокий | 2 |
Gonçalves M., 2022 | высокий | высокий | некоторые сомнения | низкий | высокий | 4 |
Zhao X., 2023 | низкий | низкий | низкий | низкий | низкий | 10 |
Teng X., 2022 | высокий | высокий | низкий | низкий | высокий | 32 |
Zhang W., 2022 | низкий | низкий | низкий | низкий | низкий | 6 |
Yang G., 2022 | высокий | низкий | низкий | низкий | низкий | 4 |
Intarak S., 2022 | высокий | высокий | низкий | низкий | высокий | 4 |
Morgan H., 2021 | высокий | некоторые сомнения | высокий | высокий | высокий | 1 |
Li J., 2021 | низкий | низкий | низкий | низкий | низкий | 15 |
Liu X., 2021 | высокий | высокий | некоторые сомнения | высокий | высокий | 14 |
Zhai T., 2021 | низкий | низкий | низкий | низкий | низкий | 6 |
Использованные методы в статьях
Число извлечённых радиомических признаков варьирует от 36 [20] до 5486 [19]. Подробная информация о распределении извлечённых радиомических признаков по классам приводится в 5 статьях [22, 23, 25, 26, 28].
Машинное обучение для радиомического анализа использовали в 6 исследованиях [19, 20, 22, 24, 26, 28]. В остальных 5 работах для оценки значимости радиомических признаков в прогнозах использовали регрессионный анализ [25, 29], дисперсионный анализ (ANOVA) [23], внутриклассовый коэффициент корреляции (ICC) [29], ресэмплирование данных [28], одномерные тесты для попарного сравнения признаков (t-test, Mann–Whitney U test, chi-square test, Fisher exact test) [21, 23, 27].
Число отобранных признаков в статьях варьирует от 2 [25, 27] до 19 [26]. В двух статьях авторы не производят отбор наиболее значимых признаков, а приводят соответствующие статистики для каждого из извлечённых признаков в приложении — ICC [19] и процент повторов признаков в репликах [28].
Анализ воспроизводимости признаков
Всего в 11 исследованиях в качестве валидных для прогностических моделей отобран 191 радиомический признак (см. Приложение 1), среди которых к признакам первого порядка относятся 47. Из них в пяти случаях (11%) один и тот же признак встречается в двух разных исследованиях, в остальных случаях признаки между исследованиями не повторяются. К характеристикам формы относятся 25 радиомических признаков. Из них в пяти случаях (20%) один и тот же признак встречается в двух разных исследованиях. В двух случаях (8%) один и тот же признак встречается в трёх разных исследованиях. В остальных случаях признаки между исследованиями не повторяются. К признакам второго порядка относятся 119 радиомических признаков. Из них в одном (0,8%) случае один и тот же признак встречается в двух разных исследованиях.
В двух статьях радиомические признаки практически полностью воспроизводятся для разных моделей [23, 29]. Ещё в двух исследованиях радиомические признаки не воспроизводятся между разными моделями [25, 28].
Обсуждение
В статье суммированы работы по радиомическому анализу злокачественных новообразований головы и шеи при КТ за 2021–2023 гг. с фокусом на формировании списка часто используемых и надёжных радиомических параметров. В проанализированной литературе наблюдается большое разнообразие использованных подходов: начиная от способов получения изображений и их постобработки, до привлекаемых программ для извлечения радиомических параметров и статистических методов их обработки. Кроме того, при построении прогностических радиомических моделей всегда проводится редукция числа радиомических параметров. Отбор параметров осуществляется самыми разными методами — от одномерных статистических тестов до машинного обучения — и определяется исключительно предпочтениями авторов. Выбранные статистические методы редукции числа признаков также существенно влияют на результат отбора параметров. Одна из основных проблем современной радиомики — сложность генерализации и внедрения в практику успехов отдельных исследований — не решена до настоящего момента, что подчёркивают результаты последнего метаанализа метаанализов [30].
Качество исследований
Анализ в сравнительном аспекте предыдущих систематических обзоров радиомических исследований злокачественных образований головы и шеи [13, 32] и нашего нового исследования обнаруживает ряд методологических проблем, сохраняющихся в течение десятилетия.
Одна из основных проблемных точек радиомических исследований — отсутствие валидации полученных радиомических моделей на внешних данных. В проанализированном нами наборе статей только в одном случае проводили валидацию с привлечением данных из другого центра [33].
Другая ключевая проблема — это непрозрачность данных и недостаточно полное описание методик анализа, что препятствует воспроизведению полученных в таких работах результатов. Хотя не секрет, что воспроизводимость результата — один из базовых критериев научного подхода, а также основа для внедрения метода в практику [34].
Наши выводы согласуются с оценками, данными в других систематических обзорах. Так, во всех четырёх найденных нами обзорах исследований злокачественных образований головы и шеи [12, 13, 32, 35] отмечается недостаток валидации результатов на внешних данных. C. Giannitto и соавт. [13] отмечают также непрозрачность использованных в исследованиях методик, обусловленную недостаточно подробным описанием хода исследования, и отсутствие оценок потенциала внедрения результатов в клиническую практику. A. Guha и соавт. [12] отмечают высокую гетерогенность в методиках, что затрудняет обобщение результатов исследований.
В настоящий момент активно развивается инициатива по стандартизации биомаркёров лучевой диагностики IBSI [36]. C учётом детальности проработки проблемы и числа участников сообщества, данная инициатива может стать прекрасным шагом на пути к решению проблемы непрозначности радиомического анализа. Тщательное планирование клинических испытаний алгоритмов на основе интеллектуальных технологий также может повысить воспроизводимость и надёжность результатов [37].
Создание открытого пространства для радиомических исследований позволит размещать там и отрицательные результаты, которые, как правило, не публикуются в рецензируемых источниках из-за так называемой «положительной систематической ошибки» [38]. Это крайне важно для минимизации систематических ошибок при оценке эффективности радиомического подхода. Дополнительно, благодаря мета-исследованию B. Koca и соавт. [39], можно выделить проблемы преобладания ретроспективного дизайна исследований (95%, 142 из 149) и отсутствия референс-теста в значительной части работ (44%, 66 из 149) [39].
Основной частью рассматриваемого метода являются радиомические параметры, описывающие взаимоотношения между вокселями, 2D- и 3D-характеристики образований и другие их свойства. На текущий момент известно несколько тысяч таких параметров, однако консенсус по диагностической ценности как каждого из них, так и различных их сочетаний не достигнут. В проанализированных статьях наблюдается большой разброс в числе выбранных признаков — от единиц до тысяч. Подробно группы признаков, отражающие разные свойства новообразований, описываются в менее чем половине исследований. А в трёх статьях авторы вообще не заостряют внимание на том, какие именно радиомические параметры попали в модели. Устойчивость радиомических параметров в многоцентровых исследованиях оценивали только в одной работе из проанализированных.
Для возможности внедрения прогностических радиомических моделей в широкую клиническую практику назрела необходимость выделения блока приоритетных параметров, основанных на оценке их устойчивости и воспроизводимости. Нами была сделана попытка выбрать наиболее часто встречающиеся в прогностических моделях радиомические параметры. Результаты показали, что воспроизводимость радиомических параметров крайне низка, что происходит из-за большого разнообразия используемых методик. Это согласуется с предположениями предыдущих исследователей о том, что радиомические параметры могут быть случайны и не воспроизводимы [40]. Рекомендовать какой-то блок радиомических параметров для практического использования в настоящий момент нельзя. Прежде всего должна быть проведена унификация радиомических методик и приняты рекомендуемые стандарты, после чего возможно будет выделение базового блока радиомических параметров с целью внедрения радиомического анализа медицинскую визуализацию [41]. Унификация радиомического анализа также зависит от работ в области стандартизации протоколов исследований и контроля постобработки [42].
Ограничения нашего подхода
Наша работа имеет ряд ограничений, характерных для систематических обзоров. Поскольку нашей задачей было обеспечить максимально широкий обзор существующих на данный момент исследований злокачественных новообразований головы и шеи, в обзор включены исследования и первичных, и вторичных новообразований, а также разных в гистологическом плане опухолей головы и шеи.
Поиск ограничивался базой PubMed и англоязычными работами, что, вероятно, несколько уменьшило число обнаруженных нами исследований.
Во всех исследованиях наблюдалась несбалансированность данных. Были включены только случаи патологий и не были включены непатологические случаи. Кроме того, наблюдается несбалансированность данных по демографическим параметрам.
Всё это позволило провести нам только качественный синтез с использованием описательной статистики, а не полноценный метаанализ. Тем не менее наше исследование выявило основные проблемные точки в современной радиомике и дальнейшее направление исследований в этой области.
Заключение
Радиомика — динамично развивающаяся современная область. Наблюдается нарастающее число исследований с применением радиомических подходов. Мы обнаружили, что основные проблемы в этой области, препятствующие внедрению этого многообещающего метода в клиническую практику, — это низкая прозрачность исследований, отсутствие открытых баз данных и отсутствие унифицированных подходов к радиомическим исследованиям. Основным направлением в развитии радиомики должно быть создание общепринятых стандартов в получении изображений, их обработке и стратегиях моделирования. Важно при проведении исследований использовать инструменты для оценки рисков систематической ошибки, например, QUADAS-2 или его модифицированные для определённых задач варианты, и учитывать рекомендации по снижению этих рисков. Необходимо также, чтобы радиомические данные были общедоступны, как это принято, например, для генетических исследований. Создание блока устойчивых радиомических параметров — необходимое условие для внедрения метода в клиническую практику. Платформа IBSI является хорошим решением для стандартизации и публикации в открытом доступе радиомических данных.
Дополнительная информация
Приложение 1 «Базовые характеристики статей»
DOI: https://doi.org/10.17816/DD623240-4214843
Приложение 2 «Оценка качества радиомики по RQS-2.0»
DOI: https://doi.org/10.17816/DD623240-4214842
Источник финансирования. Данная статья подготовлена авторским коллективом в рамках научно-исследовательской работы «Научное обоснование методов лучевой диагностики опухолевых заболеваний с использованием радиомического анализа» (№ в Единой государственной информационной системе учёта: № 123031500005-2) в соответствии с Приказом от 21.12.2022 № 1196 «Об утверждении государственных заданий, финансовое обеспечение которых осуществляется за счет средств бюджета города Москвы государственным бюджетным (автономным) учреждениям подведомственным Департаменту здравоохранения города Москвы, на 2023 год и плановый период 2024 и 2025 годов» Департамента здравоохранения города Москвы.
Конфликт интересов. Авторы заявляют об отсутствии конфликтов интересов.
Вклад авторов. Авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией). Наибольший вклад распределён следующим образом: Ю.А. Васильев, А.В. Владзимирский, О.В. Омелянская — концепция исследования, согласование финальной версии рукописи; Р.В. Решетников, И.А. Блохин, О.Г. Нанова ― обзор литературы, анализ данных, написание текста статьи.
Об авторах
Юрий Александрович Васильев
Научно-практический клинический центр диагностики и телемедицинских технологий
Email: npcmr@zdrav.mos.ru
ORCID iD: 0000-0002-0208-5218
SPIN-код: 4458-5608
канд. мед. наук
Россия, МоскваОльга Геннадьевна Нанова
Научно-практический клинический центр диагностики и телемедицинских технологий
Автор, ответственный за переписку.
Email: NanovaOG@zdrav.mos.ru
ORCID iD: 0000-0001-8886-3684
SPIN-код: 6135-4872
канд. биол. наук
Россия, МоскваИван Андреевич Блохин
Научно-практический клинический центр диагностики и телемедицинских технологий
Email: i.blokhin@npcmr.ru
ORCID iD: 0000-0002-2681-9378
SPIN-код: 3306-1387
Россия, Москва
Роман Владимирович Решетников
Научно-практический клинический центр диагностики и телемедицинских технологий
Email: reshetnikov@fbb.msu.ru
ORCID iD: 0000-0002-9661-0254
SPIN-код: 8592-0558
канд. физ.-мат. наук
Россия, МоскваАнтон Вячеславович Владзимирский
Научно-практический клинический центр диагностики и телемедицинских технологий
Email: npcmr@zdrav.mos.ru
ORCID iD: 0000-0002-2990-7736
SPIN-код: 3602-7120
д-р мед. наук, профессор
Россия, МоскваОльга Васильевна Омелянская
Научно-практический клинический центр диагностики и телемедицинских технологий
Email: o.omelyanskaya@npcmr.ru
ORCID iD: 0000-0002-0245-4431
SPIN-код: 8948-6152
Россия, Москва
Список литературы
- Rizzo S., Botta F., Raimondi S., et al. Radiomics: the facts and the challenges of image analysis // Eur Radiol Exp. 2018. Vol. 2. doi: 10.1186/s41747-018-0068-z
- Lambin P., Leijenaar R., Deist T., et al. Radiomics: the bridge between medical imaging and personalized medicine // Nat Rev Clin Oncol. 2017. Vol. 14. P. 749–762. doi: 10.1038/nrclinonc.2017.141
- Mayerhoefer M.E., Materka A., Langs G., et al. Introduction to Radiomics // J Nucl Med. 2020. Vol. 61, N 4. P. 488–495. doi: 10.2967/jnumed.118.222893
- Wan Y., Yang P., Xu L., et al. Radiomics analysis combining unsupervised learning and handcrafted features: A multiple-disease study // Medical Physics. 2021. Vol. 48, N 11. P. 7003–7015. doi: 10.1002/mp.15199
- Zwanenburg A., Vallières M., Abdalah M.A., et al. The Image Biomarker Standardization Initiative: Standardized Quantitative Radiomics for High-Throughput Image-based Phenotyping // Radiology. 2020. Vol. 295, N 2. doi: 10.1148/radiol.2020191145
- Berenguer R., Pastor-Juan M., Canales-Vázquez J., et al. Radiomics of CT Features May Be Nonreproducible and Redundant: Influence of CT Acquisition Parameters // Radiology. 2018. Vol. 288, N 2. doi: 10.1148/radiol.2018172361
- Laura Q.M., Chow M.D. Head and Neck Cancer // N Engl J Med. 2020. Vol. 382. P. 60–72. doi: 10.1056/NEJMra1715715
- Sung H., Ferlay J., Siegel R.L., et al. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries // Ca Cancer J Clin. 2021. Vol. 71, N 3. P. 209–249. doi: 10.3322/caac.21660
- Болотина Л.В., Владимирова Л.Ю., Деньгина Н.В., Новик А.В., Романов И.С. Практические рекомендации по лечению злокачественных опухолей головы и шеи // Злокачественные опухоли. 2020. Т. 10, № 3s2-1. С. 93–108. doi: 10.18027/2224-5057-2020-10-3s2-06
- Bossi P., Chan A.T., Licitra L., et al. Nasopharyngeal carcinoma: ESMO-EURACAN Clinical Practice Guidelines for diagnosis, treatment and follow-up // Annals of oncology. 2021. Vol. 32, N 4. P. 452–465. doi: 10.1016/j.annonc.2020.12.007
- Петровичев В.С., Неклюдова М.В., Синицын В.Е., Никитин И.Г. Двухэнергетическая компьютерная томография рака головы и шеи // Digital Diagnostics. 2021. Т. 2, № 3. С. 343–355. doi: 10.17816/DD62572
- Guha A., Connor S., Anjari M., et al. Radiomic analysis for response assessment in advanced head and neck cancers, a distant dream or an inevitable reality? A systematic review of the current level of evidence // BJR. 2019. Vol. 93, N 1106. doi: 10.1259/bjr.20190496
- Giannitto C., Mercante G., Ammirabile A., et al. Radiomics-based machine learning for the diagnosis of lymph node metastases in patients with head and neck cancer: Systematic review // Head & Neck. 2022. Vol. 45, N 2. P. 482–491. doi: 10.1002/hed.27239
- Yu Y., Li X., Li W., Wang H., Wang Y. Pretreatment radiomics power in evaluating neoadjuvant chemotherapy response and outcome for patients with head and neck squamous cell carcinoma: a systematic review and meta-analysis. Preprint. 2023. doi: 10.21203/rs.3.rs-2530190/v1
- Page M.J., McKenzie J.E., Bossuyt P.M., et al. The PRISMA 2020 statement: an updated guideline for reporting systematic reviews // BMJ. 2021. Vol. 372. doi: 10.1136/bmj.n71
- Radiomics Quality Score — RQS 2.0. [Internet]. [дата обращения 01.01.2023]. Доступ по ссылке: https://www.radiomics.world/rqs2
- Kodenko M.R., Vasilev Y.A., Vladzymyrskyy A.V., et al. Diagnostic Accuracy of AI for Opportunistic Screening of Abdominal Aortic Aneurysm in CT: A Systematic Review and Narrative Synthesis // Diagnostics. 2022. Vol. 12, N 12. P. 3197. doi: 10.3390/diagnostics12123197
- Коденко М.Р., Решетников Р.В., Макарова Т.А. Инструмент оценки качества исследований диагностической точности алгоритмов искусственного интеллекта (QUADAS-CAD) // Digital Diagnostics. 2022. Т. 3, № S1. С. 4–5. doi: 10.17816/DD105567
- Teng X., Zhang J., Ma Z., et al. Improving radiomic model reliability using robust features from perturbations for head-and-neck carcinoma // Front. Oncol. 2022. Vol. 12. doi: 10.3389/fonc.2022.974467
- Liu X., Maleki F., Muthukrishnan N., et al. Site-Specific Variation in Radiomic Features of Head and Neck Squamous Cell Carcinoma and Its Impact on Machine Learning Models // Cancers. 2021. Vol. 13, N 15. doi: 10.3390/cancers13153723
- Zhao X., Li W., Zhang J., et al. Radiomics analysis of CT imaging improves preoperative prediction of cervical lymph node metastasis in laryngeal squamous cell carcinoma // European Radiology. 2023. Vol. 33. P. 1121–1131. doi: 10.1007/s00330-022-09051-4
- Zhang W., Peng J., Zhao S., et al. Deep learning combined with radiomics for the classification of enlarged cervical lymph nodes // Journal of Cancer Research and Clinical Oncology. 2022. Vol. 148. P. 2773–2780. doi: 10.1007/s00432-022-04047-5
- Yang G., Yang F., Zhang F., et al. Radiomics Profiling Identifies the Value of CT Features for the Preoperative Evaluation of Lymph Node Metastasis in Papillary Thyroid Carcinoma // Diagnostics. 2022. Vol. 12, N 5. doi: 10.3390/diagnostics12051119
- Li J., Wu X., Mao N., et al. Computed Tomography-Based Radiomics Model to Predict Central Cervical Lymph Node Metastases in Papillary Thyroid Carcinoma: A Multicenter Study // Front. Endocrinol. 2021. Vol. 12. doi: 10.3389/fendo.2021.741698
- Franzese C., Lillo S., Cozzi L., et al. Predictive value of clinical and radiomic features for radiation therapy response in patients with lymph node-positive head and neck cancer // Head & Neck. 2023. Vol. 45, N 5. P. 1184–1193. doi: 10.1002/hed.27332
- Gonçalves M., Gsaxner Ch., Ferreira A., et al. Radiomics in Head and Neck Cancer Outcome Predictions // Diagnostics. 2022. Vol. 12, N 11. doi: 10.3390/diagnostics12112733
- Zhai T., Wesseling F., Langendijk J., et al. External validation of nodal failure prediction models including radiomics in head and neck cancer // Oral Oncology. 2021. Vol. 112. doi: 10.1016/j.oraloncology.2020.105083
- Morgan H.E., Wang K., Dohopolski M., et al. Exploratory ensemble interpretable model for predicting local failure in head and neck cancer: the additive benefit of CT and intra-treatment cone-beam computed tomography features // Quant Imaging Med Surg. 2021. Vol. 11, N 12. P. 4781–4796. doi: 10.21037/qims-21-274
- Intarak S., Chongpison Y., Vimolnoch M., et al. Tumor Prognostic Prediction of Nasopharyngeal Carcinoma Using CT-Based Radiomics in Non-Chinese Patients // Front. Oncol. 2022. Vol. 12. doi: 10.3389/fonc.2022.775248
- Zhong J., Lu J., Zhang G., et al. An overview of meta-analyses on radiomics: more evidence is needed to support clinical translation // Insights Imaging. 2023. Vol. 14. doi: 10.1186/s13244-023-01437-2
- Свидетельство о государственной регистрации программы для ЭВМ № 2022617324/ 19.04.2022. Морозов С.П., Андрейченко А.Е., Четвериков С.Ф., и др. Веб-инструмент для выполнения ROC анализа результатов диагностических тестов: № 2022616046.
- Giraud P., Giraud Ph., Gasnier A., et al. Radiomics and Machine Learning for Radiotherapy in Head and Neck Cancers // Front. Oncol. 2019. Vol. 9. doi: 10.3389/fonc.2019.00174
- Свидетельство о государственной регистрации программы для ЭВМ № 2023619686/ 15.05.2023. Васильев Ю.А., Владзимирский А.В., Омелянская О.В., и др. Веб-инструмент для контроля качества датасетов: № 2023617136.
- Gundersen O.E., Kjensmo S. State of the Art: Reproducibility in Artificial Intelligence // Proceedings of the AAAI Conference on Artificial Intelligence. 2018. Vol. 32, N 1. doi: 10.1609/aaai.v32i1.11503
- Tortora M., Gemini L., Scaravilli A., et al. Radiomics Applications in Head and Neck Tumor Imaging: A Narrative Review // Cancers. 2023. Vol. 15, N 4. doi: 10.3390/cancers15041174
- Image Biomarker Standardisation Initiative (IBSI) [Internet]. [дата обращения: 01.01.2023]. Доступ по ссылке: https://theibsi.github.io/
- Морозов С.П., Владзимирский А.В., Кляшторный В.Г., и др. Клинические испытания программного обеспечения на основе интеллектуальных технологий (лучевая диагностика). Москва, 2019.
- Buvat I., Orlhac F. The Dark Side of Radiomics: On the Paramount Importance of Publishing Negative Results // The Journal of Nuclear Medicine. 2019. Vol. 60, N 11. P. 1543–1544. doi: 10.2967/jnumed.119.235325
- Kocak B., Bulut E., Bayrak O.N., et al. NEgatiVE results in Radiomics research (NEVER): A meta-research study of publication bias in leading radiology journals // European Journal of Radiology. 2023. Vol. 163. doi: 10.1016/j.ejrad.2023.110830
- Berenguer R., Pastor-Juan M.R., Canales-Vázquez J., et al. Radiomics of CT Features May Be Nonreproducible and Redundant: Influence of CT Acquisition Parameters // Radiology. 2018. Vol. 288, N 2. doi: 10.1148/radiol.2018172361
- Морозов С.П., Линденбратен Л.Д., Габай П.Г., и др. Основы менеджмента медицинской визуализации / под ред. С.П. Морозова. Москва : ГЭОТАР-Медиа, 2020. doi: 10.33029/9704-5247-9-MEN-2020-1-424
- Хоружая А.Н., Ахмад Е.С., Семенов Д.С. Роль системы контроля качества лучевой диагностики онкологических заболеваний в радиомике // Digital Diagnostics. 2021. Т. 2, № 2. С. 170–184. doi: 10.17816/DD60393
Дополнительные файлы
