Подготовка набора данных компьютерной томографии органов брюшной полости пациентов с аневризмой абдоминального отдела аорты
- Авторы: Коденко М.Р.1,2, Макарова Т.А.3
-
Учреждения:
- Научно-практический клинический центр диагностики и телемедицинских технологий
- Московский государственный технический университет имени Н.Э. Баумана
- Российская медицинская академия непрерывного профессионального образования
- Выпуск: Том 4, № 1S (2023)
- Страницы: 90-92
- Раздел: Материалы конференции
- URL: https://jdigitaldiagnostics.com/DD/article/view/430355
- DOI: https://doi.org/10.17816/DD430355
- ID: 430355
Цитировать
Полный текст
Аннотация
Обоснование: технологии искусственного интеллекта (ИИ) активно внедряют в обработку и анализ диагностических медицинских изображений. Точность и надёжность алгоритмов ИИ определяются объёмом и качеством обучающих наборов данных. В настоящее время существует потребность в увеличении наборов данных открытого доступа, в частности КТ-ангиографических исследований брюшной аорты (КТА). Ограничения существующих наборов данных КТА брюшной аорты: бинарная разметка (классификация исследования в целом), малое количество исследований. Кроме того, большинство исследований не содержит признаков патологии аорты, что, с учётом вариабельности данной патологии, значительно ограничивает их использование для обучения ИИ, так как целевой задачей таких алгоритмов является обнаружение патологии.
Цель: подготовка набора данных КТА пациентов с аневризмой брюшного отдела аорты.
Методы: на примере набора данных КТА-исследований с аневризмой брюшного отдела аорты рассмотрены этапы и особенности создания набора данных для обучения ИИ в соответствии с методическими рекомендациями. На основе базовых диагностических требований для выбранной клинической задачи было сформировано техническое задание на подготовку набора данных, рассчитан необходимый объём выборки и определён оптимальный сценарий разметки. На следующем этапе был выполнен отбор исходных данных КТ органов брюшной полости в Единой радиологической информационной системе, проведены анонимизация данных и полуавтоматическая разметка области интереса (стенка и русло аорты) с применением инструмента 3D Slicer и её верификация экспертом-рентгенологом, документирование промежуточных результатов.
Результаты: рассчитанный объём выборки составил 100 исследований, содержащих артериальную фазу исследования, толщина среза не более 1,2 мм, баланс классов «норма» : «патология» был выбран 1:4. Проведена частичная разметка (50% исследований) данных.
Заключение: разработана методология для подготовки наборов данных КТА. Сформированный набор данных, при соблюдении необходимых процедур, будет выложен в открытый доступ и может быть использован для обучения и тестирования алгоритмов ИИ, проведения научных исследований.
Ключевые слова
Полный текст
Обоснование: технологии искусственного интеллекта (ИИ) активно внедряют в обработку и анализ диагностических медицинских изображений. Точность и надёжность алгоритмов ИИ определяются объёмом и качеством обучающих наборов данных. В настоящее время существует потребность в увеличении наборов данных открытого доступа, в частности КТ-ангиографических исследований брюшной аорты (КТА). Ограничения существующих наборов данных КТА брюшной аорты: бинарная разметка (классификация исследования в целом), малое количество исследований. Кроме того, большинство исследований не содержит признаков патологии аорты, что, с учётом вариабельности данной патологии, значительно ограничивает их использование для обучения ИИ, так как целевой задачей таких алгоритмов является обнаружение патологии.
Цель: подготовка набора данных КТА пациентов с аневризмой брюшного отдела аорты.
Методы: на примере набора данных КТА-исследований с аневризмой брюшного отдела аорты рассмотрены этапы и особенности создания набора данных для обучения ИИ в соответствии с методическими рекомендациями. На основе базовых диагностических требований для выбранной клинической задачи было сформировано техническое задание на подготовку набора данных, рассчитан необходимый объём выборки и определён оптимальный сценарий разметки. На следующем этапе был выполнен отбор исходных данных КТ органов брюшной полости в Единой радиологической информационной системе, проведены анонимизация данных и полуавтоматическая разметка области интереса (стенка и русло аорты) с применением инструмента 3D Slicer и её верификация экспертом-рентгенологом, документирование промежуточных результатов.
Результаты: рассчитанный объём выборки составил 100 исследований, содержащих артериальную фазу исследования, толщина среза не более 1,2 мм, баланс классов «норма» : «патология» был выбран 1:4. Проведена частичная разметка (50% исследований) данных.
Заключение: разработана методология для подготовки наборов данных КТА. Сформированный набор данных, при соблюдении необходимых процедур, будет выложен в открытый доступ и может быть использован для обучения и тестирования алгоритмов ИИ, проведения научных исследований.
Об авторах
Мария Романовна Коденко
Научно-практический клинический центр диагностики и телемедицинских технологий; Московский государственный технический университет имени Н.Э. Баумана
Email: m.r.kodenko@yandex.ru
ORCID iD: 0000-0002-0166-3768
SPIN-код: 5789-0319
Россия, Москва; Москва
Татьяна Андреевна Макарова
Российская медицинская академия непрерывного профессионального образования
Автор, ответственный за переписку.
Email: makarova97.mail@gmail.com
ORCID iD: 0000-0002-6274-5636
Россия, Москва
Список литературы
- Павлов Н.А., Андрейченко А.Е., Владзимирский А.В., и др. Эталонные медицинские датасеты (MosMedData) для независимой внешней оценки алгоритмов на основе искусственного интеллекта в диагностике // Digital Diagnostics. 2021. Т. 2, № 1. С. 49–65. doi: https://doi.org/10.17816/DD60635
- Центр диагностики и телемедицины [интернет]. Набор данных для селф-теста диагностического MosMedData КТ с признаками аневризмы аорты тип III. Дата обращения: 05.06.2023. Доступ по ссылке: https://mosmed.ai/datasets/mosmeddata-kt-s-priznakami-anevrizmi-aorti-tip-iii.
- Aorta segmentation [Internet]. Дата обращения: 05.06.2023. Доступ по ссылке: https://www.kaggle.com/datasets/licethyaneth/aorta-segmentation.
- Регламент подготовки наборов данных с описанием подходов к формированию репрезентативной выборки данных. Ч. 1 : методические рекомендации : [препринт] / сост. С.П. Морозов, А.В. Владзимирский, А.Е. Андрейченко, и др. Москва : ГБУЗ «НПКЦ ДиТ ДЗМ», 2021. 40 с. (Лучшие практики лучевой и инструментальной диагностики ; вып. 103).
- Базовые диагностические требования к результатам работы ИИ [интернет]. Дата обращения: 05.06.2023. Доступ по ссылке: https://mosmed.ai/ai/docs/.
- Homeyer A., Geißler C., Schwen L.O., et al. Recommendations on compiling test datasets for evaluating artificial intelligence solutions in pathology // Mod Pathol. 2022. Vol. 35, N 12. P. 1759–1769. doi: 10.1038/s41379-022-01147-y