Analyzing the relationships between sets of numbers by constructing decision trees
- Authors: Leonov V.Y.1, Norokesku M.M.1
-
Affiliations:
- FRC CSC RAS
- Issue: No 4 (2025)
- Pages: 103-121
- Section: COMPUTER METHODS
- URL: https://jdigitaldiagnostics.com/0002-3388/article/view/689635
- DOI: https://doi.org/10.31857/S0002338825040075
- EDN: https://elibrary.ru/BOWNBM
- ID: 689635
Cite item
Abstract
The paper considers the problem: how to analyze statistical relationships between sets of natural numbers. It is assumed that the sets are divided into named ranges. An example of such sets: numerical values of psychological indicators obtained during focus group testing. The analysis is proposed to be performed using decision trees. The purpose of the work is to propose a mathematical tool that allows using decision trees to test hypotheses about the presence or absence of relationships between two or more sets of numbers. The sets are ordered in ascending order and then divided into ranges. A new approach to the analysis of statistical dependencies between sets of numerical values of experimental indicators is proposed. The advantages of the new approach are described in comparison with what was presented earlier in the framework of the development of mathematical and algorithmic software for the analysis of quantitative test results.
Full Text

About the authors
V. Yu. Leonov
FRC CSC RAS
Author for correspondence.
Email: m.nor@ro.ru
Russian Federation, Moscow
M. M. Norokesku
FRC CSC RAS
Email: m.nor@ro.ru
Russian Federation, Moscow
References
- Проаспэт А.Г., Фёдорова А.Е. Разработка алгоритмического обеспечения анализа срединных значений показателей агрессивности // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 167–172.
- Проаспэт А.Г., Кравчени М.С., Пахомов Д.А. Оптимизация методик статистического анализа данных при исследовании показателей агрессивности // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 187–191.
- Проаспэт А.Г., Фёдорова А.Е. Разработка алгоритмического обеспечения анализа корреляций между показателями при проведении психологических исследований // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 172–178.
- Проаспэт А.Г., Фёдорова А.Е. Разработка математического обеспечения анализа корреляций между показателями при проведении психологических исследований // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 178–186.
- Сидняев Н. И. Теория планирования эксперимента и анализ статистических данных: учебник и практикум для вузов. 2-е изд., перераб. и доп. М.: Юрайт, 2023. 495 с.
- Статистическая обработка результатов исследования [электронный ресурс] // Ярославский гос. педагогический ун-т им. К.Д. Ушинского. URL: http://cito-web.yspu.org/link1/metod/met125/node23.html (дата обращения: 17.04.2020).
- Точный критерий Фишера [электронный ресурс] // Медицинская статистика. Библиотека постов MEDSTATISTIC об анализе медицинских данных. URL: https://medstatistic.ru/methods/methods5.html (дата обращения: 28.03.2023).
- Показатели, характеризующие качество корреляционного уравнения [электронный ресурс] // Кубанский гос. ун-т. Режим доступа: https://studfile.net/preview/5964733/page:20/ (дата обращения: 30.03.2023).
- Проверка качества многофакторных регрессионных моделей. Коэффициент детерминации R2. Скорректированный R2. Проверка гипотез с помощью t-статистик и F-статистик [электронный ресурс] // Теория по эконометрике. URL: https://einsteins.ru/subjects/ekonometrika/teoriya-ekonometrika/mnogofaktornyx-regressionnyx (дата обращения: 17.04.2020).
- Дисперсионный анализ [электронный ресурс] // bono esse. Служить добру. записная книжка врача. URL: http://bono-esse.ru/blizzard/Medstat/Statan/stat_da.html (дата обращения: 17.04.2020).
- Обнаружение аномалий в данных сетевого мониторинга методами статистики [электронный ресурс] // Сообщество IT-специалистов. URL: https://habr.com/ru/post/344762/ (дата обращения: 16.04.2020).
- Черткова Е.А. Статистика. Автоматизация обработки информации: учеб. пособие для среднего профессионального образования. 2-е изд., испр. и доп. М.: Юрайт, 2023. 195 с.
- Паронджанов В. Д. Алгоритмические языки и программирование: ДРАКОН: учеб. пособие для вузов. М.: Юрайт, 2021. 436 с.
- Проаспэт А.Г. Методика анализа корреляций результатов исследования агрессивности // Сб. матер. X ежегодной научн. конф. аспирантов МГОТУ. М.: Научный консультант, 2020. С. 100–110.
- Норокеску М.М. Комбинирование и оптимизация методик анализа упорядоченного набора чисел // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2023. С. 177–180.
- Донской В.И. Извлечение оптимизационных моделей из данных: подход на основе решающих деревьев и лесов // ТВИМ. 2017. Т. 4. № 37. URL: https://cyberleninka.ru/article/n/izvlechenie-optimizatsionnyh-modeley-iz-dannyh-podhod-na-osnove-reshayuschih-dereviev-i-lesov (дата обращения: 12.01.2025).
- Колмогорова С. С., Голубятникова Н. О. О применении регуляризации структуры больших данных для распределенной системы сбора и прогнозирования параметров объектов наблюдений // Вестн. ВГТУ. 2022. № 5. URL: https://cyberleninka.ru/article/n/o-primenenii-regulyarizatsii-struktury-bolshih-dannyh-dlya-raspredelennoy-sistemy-sbora-i-prognozirovaniya-parametrov-obektov (дата обращения: 12.01.2025).
- Хашпер Б.Л., Кантор О.Г. Применение методов случайного поиска и методов машинного обучения к задаче оптимизации в многомерном пространстве // Информационные и математические технологии в науке и управлении. 2023. Т. 3. № 31. URL: https://cyberleninka.ru/article/n/primenenie-metodov-sluchaynogo-poiska-i-metodov-mashinnogo-obucheniya-k-zadache-optimizatsii-v-mnogomernom-prostranstve (дата обращения: 12.01.2025).
- Среднее арифметическое, размах, мода и медиана [электронный ресурс] // Calcs.su. URL: https://calcs.su/html/math/grade7/srednee-arifmeticheskoe.html (дата обращения: 16.04.2020).
- Вариация, размах, межквартильный размах, среднее линейное отклонение [электронный ресурс] // Статистический анализ в MS Excel. URL: https://statanaliz.info/statistica/opisanie-dannyx/variatsiya-razmakh-srednee-linejnoe-otklonenie/ (дата обращения: 16.04.2020).
- Носков С.И., Кириллова Т.К., Ведерников В.С. Применение метода антиробастного оценивания для вычисления оценок параметров однородной формы вложенной кусочно-линейной регрессии // Изв. Тульск. гос. ун-та. Технические науки. 2024. № 7. URL: https://cyberleninka.ru/article/n/primenenie-metoda-antirobastnogo-otsenivaniya-dlya-vychisleniya-otsenok-parametrov-odnorodnoy-formy-vlozhennoy-kusochno-lineynoy (дата обращения: 12.01.2025).
- Синицин Ф. Обучение древесных моделей для классификации и регрессии. Эффективное построение решающих деревьев. 2.3. Решающие деревья [электронный ресурс] // Учебник по машинному обучению. URL: https://education.yandex.ru/handbook/ml/article/reshayushchiye-derevya (дата обращения: 01.12.2024)
Supplementary files
