Head and neck CT dataset with lymph node assessment according to the Node-RADS classification



Cite item

Full Text

Abstract

AIM: To prepare a dataset head and neck CT scans with lymph nodes for further use in the development of artificial intelligence tools.

METHODS: We selected patients who underwent CT scans with intravenous contrast enhancement (CE) from 2020 to 2023 were selected for this retrospective study. The selected patients were over 18 years old. Inclusion criteria: presence of a histologically confirmed malignancy, presence of CT with CE. Exclusion criteria: artefacts from dental implants at the level of target lymph nodes (categories 1 and 5 according to Node-RADS), presence of motion artifacts. Two samples were formed: studies with signs of metastatic lymph nodes and without. The studies were performed on Toshiba Aquilion units. The dataset includes images obtained in the venous phase of contrast enhancement: start at 70 seconds when peak density values in the the aorta was 130 HU. All studies were anonymized. The dataset was labeled by three radiologists with more than 3 years of experience. A labeling table was created containing the following data: patient number, sex, age, presence or absence of secondary changes in lymph nodes, bilateral or unilateral lesion, side of lesion, size of the largest lymph node along the short axis, size of the largest lymph node along the long axis, lymph node group, image series and number.

RESULTS: 84 CT studies with intravenous contrast enhancement were selected in accordance with the inclusion and exclusion criteria. Among the selected patients, 61 had signs of metastatic lymph node lesions, while 23 had no signs of secondary lesions. 75 lymph nodes of category Node-RADS 5 were labeled. The dataset contains 84 DICOM files with a total volume of 19.0 GB.

CONCLUSION: A dataset of 84 patients has been prepared and made available in the public domain, containing labels of lymph nodes in the neck according to the Node-RADS classification (categories 1 and 5) in CT scans with intravenous contrast enhancement, as well as clinical data. The collected data can be used to create and test artificial intelligence for detecting and evaluating lymph nodes.

Full Text

Обоснование

В настоящее время активно развиваются алгоритмы искусственного интеллекта (ИИ) и радиомического анализа для анализа злокачественных новообразований области головы и шеи, а также предсказания метастатических изменений лимфатических узлов (ЛУ) [1]. Для того чтобы качественно обучить и провести последующее тестирование алгоритмов ИИ необходимо использовать репрезентативные наборы данных [2].

Определение вторично измененных ЛУ играет важную роль в определении тактики лечения и прогнозировании. Стадирование по N можно проводить с помощью различных модальностей, одной из которых является КТ [3]. Имеется ряд критериев для оценки изменения ЛУ, таких как оценка изменения их формы, размеров и структуры. Попытка стандартизировать данные критерии привела к появлению системы Node-RADS: с помощью этой системы возможна оценка ЛУ по пяти категориям, где Node-RADS 1 – крайне низкая вероятность метастатического поражения, тогда как Node-RADS 5 – крайне высокая [4].

Имеется ряд разработок систем автоматического анализа ЛУ, которые способны эффективно определять вторично измененные ЛУ [5]. Например, алгоритм ИИ, включающий клиническую и радиомическую модели для оценки ЛУ на предоперационном этапе для пациентов с протоковой аденокарциномой поджелудочной железы, с большей точностью выявляет метастатически пораженные ЛУ относительно показателей рентгенологов [6]. Имеется мета-анализ по возможностям ИИ для оценки измененных ЛУ по данным КТ и МРТ при РМЖ: авторы утверждают, что ИИ имеет преимущества относительно традиционного анализа ЛУ врачами-ренгтенологами не только в точности измерений, но и в интерпретации полученных данных [7]. Все это позволяет проводить более объективный воспроизводимый анализ за более короткий временной промежуток.

Оценка ЛУ области головы и шеи является одним из важных направлений в онкологии. По данным систематического обзора алгоритма ИИ для оценки ЛУ данной области можно проводить по трем параметрам: оценка вторично измененных ЛУ, выявление экстранодальной инвазии, предсказания метастатического поражения ЛУ [8]. По данным обзора системы ИИ способны выявлять экстранодальную инвазию лучше врачей-рентгенологов, тогда как в выявлении вторично пораженных ЛУ не были выявлены различия. В другом исследовании при оценке возможностей алгоритмов ИИ для указанных выше параметров система оказалась эффективнее в оценки экстранодальной инвазии нежели выявлении вторичного поражения ЛУ [9].

Для повышения эффективности работы систем ИИ путем их обучения требуется большой объем данных [10, 11, 12]. Использование качественных наборов данных является основой разработки качественных ИИ-алгоритмов [13, 14]. В настоящее время имеется набор данных КТ области шеи для планирования диссекции [15], многоцентровой набор клинических данных пациентов со вторичными ЛУ при плоскоклеточном раке области шеи [16], однако часть из них имеет ограниченный доступ или недостаточный для проведения радиомического анализа объем информации.

Цель

Подготовить набор данных лимфатических узлов по КТ области головы и шеи для дальнейшего использования в разработках систем ИИ.

 

Методы

Дизайн исследования

Ретроспективный одноцентровой анализ результатов КТ области головы и шеи.

Сбор данных

Для исследования были отобраны пациенты амбулаторного звена ГБУЗ «ГКБ им. С.С. Юдина ДЗМ». Всем пациентам была выполнена КТ области головы и шеи (ОГШ) с внутривенным контрастным усилением в период с 2020 по 2023 года с целью оценки распространенности основного заболевания при первичном обследовании в рамках установленной маршрутизации.

Все пациенты, отобранные для исследования, были старше 18 лет.

Критериями включения являлись наличие гистологически подтвержденного диагноза ЗНО, наличие КТ ОГШ с КУ, выполненной до начала лечения, наличие серии изображений, выполненных в венозную фазу контрастирования. К критериям исключения относились наличие артефактов от зубных металлических конструкций на уровне целевых ЛУ 5 категории по Node-RADS, наличие артефактов от зубных металлических конструкций при ЛУ 1 категории по Node-RADS, наличие двигательных артефактов.

Формировались две выборки: исследования с наличием признаков метастатического поражения лимфатических узлов на основании вынесения 5 категории по Node-RADS и без на основании вынесения 1 категории по Node-RADS, т.е. стадия N0 [17].

Оценка ЛУ проводилась на основании классификации Node-RADS. Для набора данных были отобраны ЛУ по двум категориям: Node-RADS 1, к которой относятся неизмененные ЛУ, и Node-RADS 5 – с очень высокой степенью вероятности ЛУ с наличием метастатического поражения.

Протокол сканирования

Все исследования были выполнены на томографах Toshiba Aquilion. Поле сканирования: от дуги аорты до макушки.

Толщина срезов 1мм. Фильтр реконструкции FC08. Напряжение 120kV, параметры тока менялись за счет использования автоматической системы контроля экспозиции.

В набор данных включены изображения, полученные в венозную фазу сканирования: старт сканирования венозной фазы на 70 секунде от достижения пиковых значений плотности в просвете аорты (130HU).

Изображения

Все исследования были выгружены из ЕРИС в формате Digital Imaging and Communications in Medicine (DICOM).

В отобранных исследованиях были удалены все тэги, в которых отображаются персональные данные пациентов.

Разметка лимфатических узлов

Набор данных был поделен на три части для разметки тремя врачами-рентгенологами с опытом работы более 3-х лет. Полученные результаты были валидированы врачом-рентгенологом с опытом работы более 7-и лет.

Была сформирована таблица разметки, в которую были внесены следующие данные: номер пациента, пол, возраст, наличие или отсутствие вторично измененного ЛУ (Node-RADS 5), двустороннее или одностороннее поражение, сторона поражения, размер наиболее крупного ЛУ по короткой оси, размер наиболее крупного ЛУ по длинной оси, группа ЛУ по классификации на основании из расположения [18], серия и номер изображения. Также в таблицу внесены следующие клинические данные: дата выполнения КТ, диагноз,          дата постановки диагноза,            результаты гистологического исследования опухоли,        результаты цитологического исследования ЛУ,        ВПЧ-статус, статус курения.

Дополнительно разметчик отмечал особенности изменений в виде признаков наличия некроза ЛУ, инвазии в сосуды шеи, формирование конгломератов, наличие кальцинирования.

Обоснование размера выборки

Регионарные метастазы в лимфатические узлы встречаются в 41% случаев, таким образом баланс классов составляет 4:6 [19].

С учетом эпидемиологических данных, указывающих на разброс от 25% до 45% в частоте поражения лимфатической системы, выбрана ширина доверительного интервала в 20% [20].

При использовании инструмента https://shiny.ctu.unibe.ch/app_direct/presize/, раздел descriptive - proportion, для формирования набора данных потребуется 84 пациента.

 

Результаты

Было отобрано 84 исследования КТ ОГШ с внутривенным контрастированием.

Из них в соответствии с критериями включения и исключения были отобраны 54 исследования. Мужчин 66, женщин 18.

Средний возраст среди всех пациентов составил 62 ± 11,1 года.

Среди отобранных пациентов у 61 были выявлены признаки метастатического поражения лимфатических узлов (Рисунок 1), и у 23 признаков вторичного поражения выявлено не было (Рисунок 2).

Размечено 75 лимфатических узлов категории Node-RADS 5.

Характеристика полученного набора данных представлена в таблице 1.

Набор данных содержит 84 DICOM файла общим объемом 19,0 ГБ. Все данные опубликованы в свободном доступе и доступны на платформе ГБУЗ «НПКЦ ДиТ ДЗМ» по ссылке: «MosMedData: КТ головы и шеи с оценкой лимфатических узлов по классификации Node-RADS».

 

Обсуждение

Нами сформирован набор данных КТ-изображений ОГШ с внутривенным контрастированием с аннотированными лимфатическими узлами 1 и 5 категорий по классификации Node-RADS. Подготовленный набор данных можно использовать для обучения и тестирования алгоритмов ИИ с целью дальнейшего повышения качества анализа и интерпретации изменений лимфатических узлов среди пациентов с злокачественными новообразования области головы и шеи в зависимости от типа первичной опухоли и локализации изменений.

С использованием полученного набора данных возможно проведение радиомического анализа путем извлечения текстурных характеристик с последующей разработкой статистических моделей для оценки рисков вторичного поражения лимфатических узлов. Также набор данных можно использовать для проверки воспроизводимости между другими наборами данных.

Наличие высокого процента морфологической верификации первичных опухолей (97,6%), а также наличие данных цитологического исследования ЛУ (50%) при наличии изображений КТ, может представлять значительный интерес для разработчиков систем компьютерного зрения. При этом данные цитологического исследования в некоторых из наборов данных отсутствуют, например, TCGA-HNSC и CPTAC-HNSCC [21, 22]. Использование в нашем наборе данных стандартизированной шкалы Node-RADS, а именно категоризация ЛУ на неизмененные (Node-RADS 1) и метастатически пораженные (Node-RADS 5) ЛУ, в совокупности с данными цитологического анализа позволяет проводить более глубокий анализ ЛУ, тогда как в вышеописанных наборах данных, несмотря на включение большего количества пациентов, информация об изменении ЛУ основывается на N-стадии.

В подготовленном нами наборе данных присутствует информация ВПЧ-статуса и статуса курения также могут служить дополнительными клиническими данными для создания прогностических моделей, тогда как в наборе данных HEAD-NECK-RADIOMICS-HN1 аналогичная информация отсутствует [23].

Также имеется крупный набор клинических данных 968 пациентов с первично выявленным плоскоклеточным раком области головы и шеи, разбитый на три отдельных набора. Оценка лимфатических узлов проводилась с применением КТ, МРТ и ПЭТ/КТ, большинству из пациентов была выполнена лимфодиссекция с последующей морфологической верификацией и сравнением данными визуализации [24]. Помимо этого, один из наборов данных сформирован из пациентов с признаками рецидива основного заболевания. Однако сами изображения данных ЛУ, полученные методами визуализации, не представлены для выгрузки. Подготовленный нами набор данных отличается значительно меньшим объемом выборки, однако, помимо клинических данных, содержит данные КТ-визуализации.

 

ОРГАНИЧЕНИЯ

Представленный набор данных имеет ряд ограничений. Отмечалось смещение баланса классов полученной выборки относительно ожидаемых значений, вероятно связанное со спецификой медицинского учреждения со специализацией на онкологических заболеваниях области головы и шеи. Исследования с признаками метастатического поражения лимфатических узлов были отобраны на основании субъективной оценки изменений системы Node-RADS, а именно категории 1 для более вероятно метастатически неизмененных лимфатических узлов, категории 5 - более вероятно пораженных. Отсутствие результатов морфологического анализа отобранных лимфатических узлов способствовало бы формированию более объективного набора данных. К ограничениям также можно отнести небольшой объем набора данных. Все исследования были выполнены в одном медицинском учреждении.

 

Заключение

Подготовлен и представлен в открытом доступе набор данных 84 пациентов, содержащий разметку лимфатических узлов шеи в соответствии с классификацией Node-RADS (1 и 5 категории) при КТ органов головы и шеи с внутривенным контрастным усилением, а также клинические данные. Собранные данные возможно использовать для создания и тестирования алгоритмов ИИ для выявления и оценки лимфатических узлов обрасти головы и шеи при опухолевых заболеваниях данной области.

×

About the authors

Oleg I. Mynko

Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies;
Moscow State Budgetary Healthcare Institution "Moscow City Hospital named after S.S. Yudin, Moscow Healthcare Department", Moscow, Russian Federation

Author for correspondence.
Email: o.mynko@icloud.com
ORCID iD: 0009-0005-3984-4045
SPIN-code: 3556-3510

MD

Russian Federation, Moscow; Moscow

Yuriy A. Vasilev

Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies

Email: npcmr@zdrav.mos.ru
ORCID iD: 0000-0002-5283-5961
SPIN-code: 4458-5608

MD, Dr. Sci. (Medicine)

Russian Federation, Moscow;

Anna P. Gonchar

Moscow State Budgetary Healthcare Institution "Moscow City Hospital named after S.S. Yudin, Moscow Healthcare Department", Moscow, Russian Federation

Email: GoncharAP@zdrav.mos.ru
ORCID iD: 0000-0001-5161-6540
SPIN-code: 3513-9531

MD, Cand. Sci. (Medicine)

Russian Federation, Moscow;

Daria S. Kontorovich

Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies
Moscow State Budgetary Healthcare Institution "Moscow City Hospital named after S.S. Yudin, Moscow Healthcare Department", Moscow, Russian Federation

Email: KontorovichDS@zdrav.mos.ru
ORCID iD: 0000-0002-9189-1835
SPIN-code: 2407-9313
Russian Federation, Moscow; Moscow

Ivan A. Blokhin

Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies

Email: i.blokhin@npcmr.ru
ORCID iD: 0000-0002-2681-9378
SPIN-code: 3306-1387

MD, Cand. Sci. (Medicine)

Russian Federation, Moscow

Roman V. Reshetnikov

Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies

Email: ReshetnikovRV1@zdrav.mos.ru
ORCID iD: 0000-0002-9661-0254
SPIN-code: 8592-0558

Cand. Sci. (Physics and Mathematics)

Russian Federation, Moscow

Valentin A. Nechaev

Moscow State Budgetary Healthcare Institution "Moscow City Hospital named after S.S. Yudin, Moscow Healthcare Department", Moscow, Russian Federation

Email: dfkz2005@gmail.com
ORCID iD: 0000-0002-6716-5593
SPIN-code: 2527-0130

канд. мед. наук

Russian Federation, Moscow;

References

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) Eco-Vector

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 79539 от 09 ноября 2020 г.