Volumetry versus linear diameter lung nodule measurement; an ultra-low-dose CT Lung Cancer Screening Study



Cite item

Abstract

Backgraund: the Dutch-Belgium randomised lung cancer screening trial (NELSON) used a volume-based protocol, and was able to significantly reduce the prevalence of false positive results (2.1%). The aim of this study was to compare the performance of manual linear diameter and semi-automated volumetric nodule measurement, in the MLCS ultra-LDCT pilot study.

Aims: to compare the performance of nodule diameter and volume measurements in a Russian low-dose CT (LDCT) lung cancer screening program.

Materials and methods: all two-hundred and ninety-three individuals with a lung nodule of at least 4 mm on their baseline CT of the Moscow lung cancer screening between February 2017 and February 2018, without verified lung cancer diagnosis until 2020, were included. Radiation dose was selected individually and did not exceed one mSv. All scans were assessed by three blinded readers to measure maximum and minimum transversal nodule diameter and extrapolated volume. As a reference value of size and volume we took the average value obtained from the results of expert measurements. A false-positive nodule was defined as a nodule <6mm/<100mm3. A false-negative nodule was defined as a nodule ≥ 6mm/≥100mm3.

Results: 293 patients were included (166 men, mean age 64.6 ± 5.3years). 199 lung nodules were <6mm/100mm3 and 94 were ≥ 6mm/≥100mm3. For volumetric measurements; 32 [10.9%; FP 4, FN 28], 29 [9.9%; 17 FP, 12 FN], and 30 nodule [10.2%; 6 FP, 24 FN] discrepancies were reported by reader 1, 2 and 3 respectively. For linear diameter measurements; 92 [65.5%; 107 FP, 85 FN], 146 [49.8%; 58 FP, 88 FN] and 102 nodule [34.8%; 23 FP, 79 FN] discrepancies were reported by reader 1, 2 and 3 respectively.

Conclusions: Use of lung nodule volumetry strongly reduces the number of false-positive and false-negative nodules compared to nodule diameter measurements, in an ultra-LDCT lung cancer screening program.

Full Text

Обоснование

Рак легких остается одной из десяти ведущих причин смерти во всем мире, в основном из-за поздней диагностики [1]. Однако исследования показали, что скрининг с помощью низкодозной компьютерной томографии (НДКТ) может значительно снизить смертность от рака легких в популяции высокого риска [2]. Скрининг с помощью НДКТ направлен на выявление рака легких на ранней стадии и включает в себя, главным образом, выявление, классификацию и последующее ведение узлов в легких. Для облегчения выполнения вышеупомянутых задач были разработаны многочисленные руководства по легочным очагам, в том числе I-ELCAP (International Early Lung Cancer Action Program) - международная программа действия для раннего рака легких [3], Lung-RADS (Lung CT Screening Reporting And Data System) - система интерпретации и стандартизации данных при компьютерной томографии органов грудной полости [4], а также рекомендации BTS (British Thoracic Society) - Британского торакального общества [5], EUPS (European Position Statement on Lung Cancer Screening) - Европейского консорциума по скринингу рака лёгких [6] и NCCN (National Comprehensive Cancer Network) - Национальной комплексной онкологической сети [7].

  Согласно результатам голландско-бельгийского исследования скрининга рака лёгких NELSON, измерение объёма (волюметрия) очагов позволяет снизить распространённость ложноположительных результатов до 2,1% [2]. Поэтому волюметрия с использованием полуавтоматической оценки объёма была одобрена и рекомендована в EUPS [6], а позднее и в протоколе NELSON-plus [8]. Это также отражено в клинических рекомендациях BTS по ведению лёгочных очагов, выявленных по данным НДКТ, где говорится, что по возможности волюметрия должна использоваться вместо измерения линейного размера.

  Результаты исследования NELSON продемонстрировали эффективность скрининга рака лёгких с помощью НДКТ. [9] Однако, в исследовании NELSON использовали эффективную дозу облучения от 0,4 до 1,6 мЗв в зависимости от массы тела пациента [10]. В то же время, согласно санитарным правилам и нормативам СанПин 2.6.1.2523-09 "Нормы радиационной безопасности НРБ-99/2009", годовая эффективная доза при проведении рентгенологических профилактических исследований не должна превышать 1 мЗв [11]. По этой причине в пилотном проекте «Московский скрининг рака легкого» (МСРЛ) доза лучевой нагрузки была ограничена значением 0,7 мЗв [12]. Насколько нам известно, до настоящего времени не было проведено ни одного валидационного исследования, в котором бы сравнивались данные волюметрии и оценки максимального линейного размера по данным КТ с дозой облучения менее 1 мЗв (ультра-НДКТ), выполненных в рамках скрининга рака лёгких. Результаты МСРЛ предоставляют бесценную возможность провести подобное исследование [13].

  Целью данной работы является сравнение диагностической точности и согласованности результатов ручного измерения линейного размера с полуавтоматическим измерением объёма очагов по данным МСРЛ.

Цель

Сравнить результаты измерения диаметра и объема очага в Московском скрининге рака легкого с использованием низкодозной компьютерной томографии (НДКТ).

Методы

Дизайн исследования

В настоящей работе анализировали данные, полученные в ходе Московского скрининга рака легкого, с целью сравнить результаты измерения диаметра и объема лёгочного очага с целью определения влияния способа измерения на количество ложноположительных и ложноотрицательных результатов в программе скрининга рака легких методом НДКТ.

Критерии соответствия

Критерии включения: возраст от 50 до 80 лет, стаж курения 30 пачка/лет и более, курение в настоящее время или отказ от курения менее чем 15 лет назад, наличие ультра-НДКТ исследования в указанный период, отсутствие диагноза рака лёгких в анамнезе. Критерии исключения: отсутствие очагов в лёгких по данным проведённого НДКТ-исследования, рак легких в анамнезе, ранее перенесенные операции на легких (за исключением биопсии легких), тяжелые сердечно-сосудистые, иммунологические, респираторные или эндокринные заболевания с ожидаемой продолжительностью жизни менее 5 лет, острые заболевания дыхательной системы, прием антибиотиков в срок не менее 12 недель до проведения НДКТ-исследования, кровохарканье или потеря веса >10 кг в течение года, предшествующего скринингу.

Условия проведения

Данное поперечное ретроспективное исследование включает в себя 293 участника МСРЛ в период с февраля 2017 г. по февраль 2018 г. Схема процесса отбора представлена на рисунке 1. Данное исследование проводилось в рамках приказа №. 49 от 01.02.2017 Департамента здравоохранения г. Москвы.

Продолжительность исследования

Набор данных включает в себя результаты НДКТ-исследований, выполненных в период с февраля 2017 г. по февраль 2018 г.

Описание медицинского вмешательства

Сканирование проводилось в 10 поликлиниках, с использованием одного томографа в каждой поликлинике. Все томографы были модели Toshiba Aquilion 64 (Canon Medical Systems, Япония): 64-срезовые компьютерные томографы с напряжением трубки 135 кВ, током от 15 мА до 25 мА (в зависимости от веса пациента <69 кг - 15 мА, 70-90 кг - 20 мА, >90 кг - 25 мА), временем вращения 0,50 сек, шагом 1,484, толщиной среза 1 мм, шагом среза 1 мм. Размер матрицы составлял 512, а фильтр реконструкции - FC07. На двух томографах использовался вендор-специфический алгоритм итеративной реконструкции (AIDR 3D), остальные восемь томографов использовали фильтрованную обратную проекцию с программным обеспечением квантового шумоподавления (FBP/QDS+). [13] Сохранялись только аксиальные срезы. После сканирования для анализа данных использовались проекции максимальной интенсивности (MIP) и мультипланарные реконструкции.

Время сканирования на задержке дыхания при максимальной глубине вдоха составляло ≤ 10 секунд. Область сканирования определялась по томограмме, от верхушек лёгких до реберно-диафрагмальных синусов. Расстояние от ребер до края области реконструкции изображения составляло менее 1 см. CTDIvol зависел от веса пациентов < 69 кг - 0,8 мГр, 70-90 кг - 1,0 мГр, > 90 кг - 1,2 мГр. Доза облучения подбиралась индивидуально в зависимости от веса пациента.

Основной исход исследования

Всего было измерено 1450 легочных очагов, 878 (61%) солидных и 572 (39%) субсолидных, из которых для каждого пациента был выбран самый крупный очаг. После выбора самого крупного очага в окончательный анализ было включено 293 очага. Распределение очагов для каждого эксперта в зависимости от линейного размера и объёма представлено в таблице 1. После консенсусного решения 199 легочных очагов были классифицированы как доброкачественные (< 6 мм/<100 мм3) и 94 как требующие дальнейшего наблюдения (≥ 6 мм/≥100 мм3).

Этическая экспертиза

Было получено одобрение Независимого локального этического комитета при ФГБУ "Центральная клиническая больница с поликлиникой" (Москва) Управления делами Президента Российской Федерации, от 20.05.2017. Все участники исследования подписали информированное согласие.

Статистический анализ

Линейный размер легочного очага округлялся до ближайшего целого числа. Критерий Хи-квадрат Пирсона использовался для анализа различий в расхождениях, ложноположительных и ложноотрицательных результатах между значениями объёма и линейного размера легочных очагов. Для определения согласия между тремя независимыми экспертами использовалась каппа Флейсса. Мы использовали категории, установленные Landis и Koch (1977), для интерпретации величины этой метрики: плохое (poor) согласие <0, незначительное (slight) согласие 0,00-0,20, посредственное (fair) согласие 0,21-0,40, умеренное (moderate) согласие 0,41-0,60, значительное (substantial) согласие 0,61-0,80 и почти идеальное (almost perfect) согласие >0,81. [14] Все статистические расчеты проводились с использованием SPSS версии 26, статистически значимым считалось значение p < 0,05..

Результаты

Объекты (участники) исследования

Всего в исследование было включено 293 участника, 166 (57%) из которых были мужчинами, в возрасте 50-80 лет (средний возраст 64,6±5,3 лет), средний стаж курения 34,5±10,7 лет.

Основные результаты исследования

Для объемных измерений количество расхождений с референсным стандартом составило 32 [10,9%; FP 4, FN 28], 29 [9,9%; 17 FP, 12 FN] и 30 очагов [10,2%; 6 FP, 24 FN] для экспертов 1, 2 и 3 соответственно. При измерении линейного размера количество некорректных измерений было 192 [65,5%; 107 FP, 85 FN], 146 [49,8%; 58 FP, 88 FN] и 102 очага [34,8%; 23 FP, 79 FN] для экспертов 1, 2 и 3 соответственно (Таблица 2,). При использовании порогового значения в 80 мм3 в соответствии с рекомендациями BTS установлено, что количество некорректных измерений увеличилось: 35 ошибок было зарегистрировано для эксперта 1, 50 для эксперта 2, и 41 для эксперта 3.

Если рассматривать средние показатели трех экспертов, то всего было выявлено 30 (10,2%) ошибок при измерении объёма по сравнению со 147 (50,2%) при измерении линейного размера (p<0,001). При волюметрии было значительно меньше ложноположительных результатов (9, 3,1%), чем при измерении линейного размера (63, 21,5%) (p<0,001), а также значительно меньше ложноотрицательных результатов (21, 7,2% против 84, 28,7% соответственно) (p<0,001).

Анализ согласия между экспертами показал большее согласие при измерении объёма, чем при измерении линейного размера. При измерении объёма каппа Флейсса составила 0,672 (значительное согласие, 95% ДИ 0,670-0,674), тогда как при использовании измерения линейного размера каппа Флейсса составила 0,027 (незначительное согласие, 95% ДИ 0,025-0,029).

Обсуждение

Резюме основного результата исследования

По нашим данным, использование волюметрии вместо линейного размера значительно уменьшило количество ошибочных интерпретаций очагов, при этом уменьшилось количество как ложноположительных, так и ложноотрицательных результатов. Согласие между экспертами было значительно выше при использовании волюметрической классификации по сравнению измерением линейного размера.

Обсуждение основного результата исследования

Наши результаты согласуются с данными исследования NELSON и подтверждают обоснованность применения волюметрии лёгочных очагов для результатов, полученных при помощи ультра-НДКТ. В исследовании Heuvelmans et al. было показано, что при использовании НДКТ размер очага не может быть точно интерпретирован только путем измерения его линейного размера, особенно в спорных случаях [14]. При экстраполяции объема из линейного размера очаги размером 8-10 мм попадали в группы объемом от 50 до 500 мм3, и использование линейного размера приводило к значительному завышению объёма очагов по сравнению с полуавтоматическим измерением объёма. До этого в исследовании Revel et al. также сообщалось о проблеме при анализе очагов малого и среднего размера, оценка внутри-, и межэкспертного согласия показала, что погрешность измерения при оценке двумя разными врачами-рентгенологами достигает 1,73 мм. [14] Далее, согласно исследованию Xie et al., использование полуавтоматических методов для измерения объёма показало более высокую точность по сравнению с ручными измерениями [15]. Кроме того, Европейское общество радиологии (ESR) и Европейское респираторное общество (ERS) рекомендуют применять волюметрию очагов, в том числе с использованием алгоритмов искусственного интеллекта. [16] В другом исследовании, посвященном методологии разметки лёгочных очагов несколькими врачами-рентгенологами установлено, что при измерении диаметра очага количество экспертов влияет на правильность и согласованность оценок. При увеличении числа специалистов, осуществляющих независимую интерпретацию КТ-исследований, наблюдается рост правильности их оценок при снижении согласованности [17].

Ограничения исследования

Bсследование имеет ряд ограничений. Данное исследование является ретроспективным, что может привести к систематической ошибке выборки. Кроме того, данное исследование проводилось на относительно небольшой выборке. Большее число случаев может быть более показательным по отношению к популяции, в которой проводится скрининг рака лёгких. Согласно рекомендациям Lung-RADS, необходимо проводить измерения линейного размера очага по длинной и короткой оси с вычислением среднего значения; однако, целью настоящей работы была проверка результатов исследования NELSON.

Заключение

В заключение, мы продемонстрировали, что использование при интерпретации НДКТ полуавтоматической оценки объёма легочных очагов может значительно снизить количество ложноположительных и ложноотрицательных результатов по сравнению с измерением линейного размера. Этот результат сопровождается увеличением согласия между экспертами и может привести к снижению неизбежного вреда, связанного со скринингом рака лёгких.

×

About the authors

Maria Maksimovna Suchilova

Research and Practical Clinical Center of Diagnostics and Telemedicine Technologies, Department of Health Care of Moscow, Moscow, Russia

Author for correspondence.
Email: maria.suchilova@gmail.com
ORCID iD: 0000-0003-1117-0294
SPIN-code: 4922-1894

Ivan A. Blokhin

Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies, Department of Health Care of Moscow

Email: i.blokhin@npcmr.ru
ORCID iD: 0000-0002-2681-9378
SPIN-code: 3306-1387

MD

Russian Federation, Moscow

Olga Olegovna Aleshina

Email: olya.aleshina.tula@gmail.com
ORCID iD: 0000-0001-9924-0204
SPIN-code: 6004-2422

Victor A. Gombolevskiy

Artificial Intelligence Research Institute

Email: g_victor@mail.ru
ORCID iD: 0000-0003-1816-1315
SPIN-code: 6810-3279

MD, Cand. Sci. (Med.)

Russian Federation, Moscow

Roman V. Reshetnikov

Research and Practical Clinical Center of Diagnostics and Telemedicine Technologies, Department of Health Care of Moscow, Moscow, Russia

Email: reshetnikov@fbb.msu.ru
ORCID iD: 0000-0002-9661-0254
SPIN-code: 8592-0558

Cand. Sci. (Phys.-Math.)

Russian Federation, Moscow; Moscow

Viktor Yur'evich Bosin

Research and Practical Clinical Center of Diagnostics and Telemedicine Technologies, Department of Health Care of Moscow, Moscow, Russia

Email: bosin@npcmr.ru
ORCID iD: 0000-0002-4619-2744
SPIN-code: 3380-7889

Olga V. Omelyanskaya

Research and Practical Clinical Center for Diagnostics and Telemedicine Technologies

Email: o.omelyanskaya@npcmr.ru
ORCID iD: 0000-0002-0245-4431
SPIN-code: 8948-6152
Russian Federation, Moscow

Anton V. Vladzymyrskyy

Moscow Center for Diagnostics and Telemedicine; The First Sechenov Moscow State Medical University (Sechenov University)

Email: a.vladzimirsky@npcmr.ru
ORCID iD: 0000-0002-2990-7736
SPIN-code: 3602-7120

MD, Dr. Sci. (Med.), Deputy Director for Science; professor of the Department of Information and Internet Technologies

Russian Federation, 24 bld.1, Petrovka street,127051 Moscow; 8 bld.2, Trubetskaya street, 119991 Moscow

References

  1. W.H. Organisation, The top 10 causes of death, (2020). https://www.who.int/newsroom/fact-sheets/detail/the-top-10-causes-of-death.
  2. de Koning HJ, van der Aalst CM, de Jong PA, Scholten ET, Nackaerts K, Heuvelmans MA, et al. Reduced Lung-Cancer Mortality with Volume CT Screening in a Randomized Trial. N Engl J Med 2020;382:503–13. https://doi.org/10.1056/NEJMoa1911793.
  3. on behalf of the International Early Lung Cancer Action Program Investigators, Buckstein M, Yip R, Yankelevitz DF, Henschke CI, Rosenzweig K. Radiation therapy for stage I lung cancer detected on computed tomography screening: results from the international early lung cancer action program. J Radiat Oncol 2014;3:153–7. https://doi.org/10.1007/s13566-014-0144-9.
  4. Schooler GR. American College of Radiology LI-RADS in pediatric patients: the good, the bad, and the future. Pediatr Radiol 2019;49:707–9. https://doi.org/10.1007/s00247-019-04351-2.
  5. Callister MEJ, Baldwin DR, Akram AR, Barnard S, Cane P, Draffan J, et al. British Thoracic Society guidelines for the investigation and management of pulmonary nodules: accredited by NICE. Thorax 2015;70:ii1–54. https://doi.org/10.1136/thoraxjnl-2015-207168.
  6. Oudkerk M, Devaraj A, Vliegenthart R, Henzler T, Prosch H, Heussel CP, et al. European position statement on lung cancer screening. The Lancet Oncology 2017;18:e754–66. https://doi.org/10.1016/S1470-2045(17)30861-6.
  7. Wood DE, Kazerooni EA, Baum SL, Eapen GA, Ettinger DS, Hou L, et al. Lung Cancer Screening, Version 3.2018, NCCN Clinical Practice Guidelines in Oncology. J Natl Compr Canc Netw 2018;16:412–41. https://doi.org/10.6004/jnccn.2018.0020
  8. Oudkerk M, Liu S, Heuvelmans MA, Walter JE, Field JK. Lung cancer LDCT screening and mortality reduction — evidence, pitfalls and future perspectives. Nat Rev Clin Oncol 2021;18:135–51. https://doi.org/10.1038/s41571-020-00432-6.
  9. Duffy SW, Field JK. Mortality Reduction with Low-Dose CT Screening for Lung Cancer. N Engl J Med 2020;382:572–3. https://doi.org/10.1056/NEJMe1916361.
  10. Horeweg N, Scholten ET, de Jong PA, van der Aalst CM, Weenink C, Lammers J-WJ, et al. Detection of lung cancer through low-dose CT screening (NELSON): a prespecified analysis of screening test performance and interval cancers. The Lancet Oncology 2014;15:1342–50. https://doi.org/10.1016/S1470-2045(14)70387-0.
  11. Resolution of the Chief State Sanitary Doctor of the Russian Federation of 07.07. 2009 N 47''On approval of SanPiN 2.6. 1.2523-09 (together with''NRB-99/2009. SanPiN 2.6. 1.2523-09. Radiation safety standards. Sanitary rules and regulations''). Registered in the Ministry of Justice of the Russian Federation on August 14, 2009, Number 14534 (No. NRB--99/2009). The Federal Service for Surveillance on Consumer Rights Protection and Human Wellbeing. (In Russ.)
  12. Gombolevsky V.A., Barchuk A.A., Laipan A.S., Vetsheva N.N., Vladzymyrskyy A.V., Morozov S.P. Lung Сancer Screening with Low-Dose Computed Tomography: Management and Efficiency. Radiology - Practice. 2018;(1):28-36. (In Russ.)
  13. Research and Practical Clinical Center of Diagnostics and Telemedicine Technologies, 125124, Moscow, Russia, S. P. M, E. S. K, Research and Practical Clinical Center of Diagnostics and Telemedicine Technologies, 125124, Moscow, Russia, N. N. V, Research and Practical Clinical Center of Diagnostics and Telemedicine Technologies, 125124, Moscow, Russia, et al. Moscow Screening: Lung Cancer Screening With Low-Dose Computed Tomography. Probl Sotsialnoi Gig Zdravookhranenniiai Istor Med 2019;27. https://doi.org/10.32687/0869-866X-2019-27-si1-630-636
  14. Revel M-P, Bissery A, Bienvenu M, Aycard L, Lefort C, Frija G. Are Two-dimensional CT Measurements of Small Noncalcified Pulmonary Nodules Reliable? Radiology 2004;231:453–8. https://doi.org/10.1148/radiol.2312030167.
  15. Xie X, Willemink MJ, Zhao Y, de Jong PA, van Ooijen PMA, Oudkerk M, et al. Inter- and intrascanner variability of pulmonary nodule volumetry on low-dose 64-row CT: an anthropomorphic phantom study. BJR 2013;86:20130160. https://doi.org/10.1259/bjr.20130160.
  16. Landis JR, Koch GG. The Measurement of Observer Agreement for Categorical Data. Biometrics 1977;33:159. https://doi.org/10.2307/2529310.
  17. Kulberg NS, Reshetnikov RV, Novik VP, Elizarov AB, Gusev MA, Gombolevskiy VA, et al. Inter-observer variability between readers of CT images: all for one and one for all. Digital Diagnostics 2021;2:105–18. https://doi.org/10.17816/DD60622.

Supplementary files

There are no supplementary files to display.


Copyright (c) Eco-Vector

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 79539 от 09 ноября 2020 г.


This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies