Анализ взаимосвязей между наборами чисел путем построения решающих деревьев
- Авторы: Леонов В.Ю.1, Норокеску М.М.1
-
Учреждения:
- ФИЦ ИУ РАН
- Выпуск: № 4 (2025)
- Страницы: 103-121
- Раздел: КОМПЬЮТЕРНЫЕ МЕТОДЫ
- URL: https://jdigitaldiagnostics.com/0002-3388/article/view/689635
- DOI: https://doi.org/10.31857/S0002338825040075
- EDN: https://elibrary.ru/BOWNBM
- ID: 689635
Цитировать
Полный текст



Аннотация
Рассматривается проблема, как проанализировать статистические взаимосвязи между наборами натуральных чисел. Предполагается, что наборы разбиты на именованные диапазоны, например числовые значения психологических показателей, полученные в ходе тестирования фокус-группы. Анализ предлагается выполнять при помощи решающих деревьев. Цель работы – предложить математический инструмент, позволяющий применить решающие деревья для проверки гипотезы касательно наличия или отсутствия взаимосвязей между двумя и более наборами чисел. Наборы упорядочены по возрастанию и разбиты после этого на диапазоны. Предложен новый подход анализа статистических зависимостей между наборами числовых значений экспериментальных показателей. Изложены преимущества нового подхода по сравнению с тем, что был представлен ранее в рамках разработки математического и алгоритмического обеспечения для анализа количественных результатов тестирований.
Полный текст

Об авторах
В. Ю. Леонов
ФИЦ ИУ РАН
Автор, ответственный за переписку.
Email: m.nor@ro.ru
Россия, Москва
М. М. Норокеску
ФИЦ ИУ РАН
Email: m.nor@ro.ru
Россия, Москва
Список литературы
- Проаспэт А.Г., Фёдорова А.Е. Разработка алгоритмического обеспечения анализа срединных значений показателей агрессивности // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 167–172.
- Проаспэт А.Г., Кравчени М.С., Пахомов Д.А. Оптимизация методик статистического анализа данных при исследовании показателей агрессивности // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 187–191.
- Проаспэт А.Г., Фёдорова А.Е. Разработка алгоритмического обеспечения анализа корреляций между показателями при проведении психологических исследований // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 172–178.
- Проаспэт А.Г., Фёдорова А.Е. Разработка математического обеспечения анализа корреляций между показателями при проведении психологических исследований // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 178–186.
- Сидняев Н. И. Теория планирования эксперимента и анализ статистических данных: учебник и практикум для вузов. 2-е изд., перераб. и доп. М.: Юрайт, 2023. 495 с.
- Статистическая обработка результатов исследования [электронный ресурс] // Ярославский гос. педагогический ун-т им. К.Д. Ушинского. URL: http://cito-web.yspu.org/link1/metod/met125/node23.html (дата обращения: 17.04.2020).
- Точный критерий Фишера [электронный ресурс] // Медицинская статистика. Библиотека постов MEDSTATISTIC об анализе медицинских данных. URL: https://medstatistic.ru/methods/methods5.html (дата обращения: 28.03.2023).
- Показатели, характеризующие качество корреляционного уравнения [электронный ресурс] // Кубанский гос. ун-т. Режим доступа: https://studfile.net/preview/5964733/page:20/ (дата обращения: 30.03.2023).
- Проверка качества многофакторных регрессионных моделей. Коэффициент детерминации R2. Скорректированный R2. Проверка гипотез с помощью t-статистик и F-статистик [электронный ресурс] // Теория по эконометрике. URL: https://einsteins.ru/subjects/ekonometrika/teoriya-ekonometrika/mnogofaktornyx-regressionnyx (дата обращения: 17.04.2020).
- Дисперсионный анализ [электронный ресурс] // bono esse. Служить добру. записная книжка врача. URL: http://bono-esse.ru/blizzard/Medstat/Statan/stat_da.html (дата обращения: 17.04.2020).
- Обнаружение аномалий в данных сетевого мониторинга методами статистики [электронный ресурс] // Сообщество IT-специалистов. URL: https://habr.com/ru/post/344762/ (дата обращения: 16.04.2020).
- Черткова Е.А. Статистика. Автоматизация обработки информации: учеб. пособие для среднего профессионального образования. 2-е изд., испр. и доп. М.: Юрайт, 2023. 195 с.
- Паронджанов В. Д. Алгоритмические языки и программирование: ДРАКОН: учеб. пособие для вузов. М.: Юрайт, 2021. 436 с.
- Проаспэт А.Г. Методика анализа корреляций результатов исследования агрессивности // Сб. матер. X ежегодной научн. конф. аспирантов МГОТУ. М.: Научный консультант, 2020. С. 100–110.
- Норокеску М.М. Комбинирование и оптимизация методик анализа упорядоченного набора чисел // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2023. С. 177–180.
- Донской В.И. Извлечение оптимизационных моделей из данных: подход на основе решающих деревьев и лесов // ТВИМ. 2017. Т. 4. № 37. URL: https://cyberleninka.ru/article/n/izvlechenie-optimizatsionnyh-modeley-iz-dannyh-podhod-na-osnove-reshayuschih-dereviev-i-lesov (дата обращения: 12.01.2025).
- Колмогорова С. С., Голубятникова Н. О. О применении регуляризации структуры больших данных для распределенной системы сбора и прогнозирования параметров объектов наблюдений // Вестн. ВГТУ. 2022. № 5. URL: https://cyberleninka.ru/article/n/o-primenenii-regulyarizatsii-struktury-bolshih-dannyh-dlya-raspredelennoy-sistemy-sbora-i-prognozirovaniya-parametrov-obektov (дата обращения: 12.01.2025).
- Хашпер Б.Л., Кантор О.Г. Применение методов случайного поиска и методов машинного обучения к задаче оптимизации в многомерном пространстве // Информационные и математические технологии в науке и управлении. 2023. Т. 3. № 31. URL: https://cyberleninka.ru/article/n/primenenie-metodov-sluchaynogo-poiska-i-metodov-mashinnogo-obucheniya-k-zadache-optimizatsii-v-mnogomernom-prostranstve (дата обращения: 12.01.2025).
- Среднее арифметическое, размах, мода и медиана [электронный ресурс] // Calcs.su. URL: https://calcs.su/html/math/grade7/srednee-arifmeticheskoe.html (дата обращения: 16.04.2020).
- Вариация, размах, межквартильный размах, среднее линейное отклонение [электронный ресурс] // Статистический анализ в MS Excel. URL: https://statanaliz.info/statistica/opisanie-dannyx/variatsiya-razmakh-srednee-linejnoe-otklonenie/ (дата обращения: 16.04.2020).
- Носков С.И., Кириллова Т.К., Ведерников В.С. Применение метода антиробастного оценивания для вычисления оценок параметров однородной формы вложенной кусочно-линейной регрессии // Изв. Тульск. гос. ун-та. Технические науки. 2024. № 7. URL: https://cyberleninka.ru/article/n/primenenie-metoda-antirobastnogo-otsenivaniya-dlya-vychisleniya-otsenok-parametrov-odnorodnoy-formy-vlozhennoy-kusochno-lineynoy (дата обращения: 12.01.2025).
- Синицин Ф. Обучение древесных моделей для классификации и регрессии. Эффективное построение решающих деревьев. 2.3. Решающие деревья [электронный ресурс] // Учебник по машинному обучению. URL: https://education.yandex.ru/handbook/ml/article/reshayushchiye-derevya (дата обращения: 01.12.2024).
Дополнительные файлы
