Были изучены на практике технологии решения задач интеллектуального анализа данных на примере решения трех задач в программной системе Rpidminer.
В процессе анализа результатов работы было выявлено, что в большинстве случаев ансамбль из нескольких методов решения задачи справляется с ней лучше, чем каждый из них в отдельности, пусть даже это будут алгоритмы не с самой высокой эффективностью, что обуславливается тем, что области, в которых методы не ошибаются «перекрывают» области ошибок других методов, но при использовании методов с низкой эффективностью есть опасность, что при голосовании большинство вынесет ошибочное решение. С этим можно бороться путем увеличения веса классов, которые имеют для нас значение, но таким образом повышается вероятность ошибки второго рода. Также лучше формировать ансамбли из нечетного количества методов во избежание равного распределения голосов.
С задачей классификации лучше всего справлялись методы: Нейронная сеть и k-ближайших соседей.
Также в ходе работы были получены ценные навыки в области интеллектуального анализа данных.
Список используемой литературы
Задачи Data Mining. Информация и знания. [Электронный ресурс] Intuit.ru: Национальный открытый университет «ИНТУИТ». URL: http://www.intuit.ru/studies/courses/6/6/lecture/164 (дата обращения: 19.12.2016).
Обзор методов Data Mining. [Электронный ресурс] intellect-tver.ru: Интеллектуальный анализ данных. Сайт научно-исследовательского семинара студентов кафедры ПО Тверского технического университета. Ekaterina Lepshova, 2012. URL: http://intellect-tver.ru/?p=165 (дата обращения 19.12.2016).
Дьяконов Александр Геннадьевич. Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab (Практикум на ЭВМ кафедры математических методов прогнозирования): Учебное пособие. — М.: Издательский отдел факультета ВМК МГУ имени М. В. Ломоносова, 2010.
RapidMiner Studio Download Page: [Электронный ресурс] https://my.rapidminer.com/nexus/account/index.html#downloads (дата обращения: 15.11.2016).
Обучение Rpidminer. [Информационный ресурс] rapidminer.com: Официальный сайт программного продукта. https://rapidminer.com/getting-started-central/ (дата обращения 17.12.2016).