Апробация составленной прикладной модели с выбранными признаками
Интерпретируем результат. Если результат неудовлетворителен, то возвращаемся к пункту 1 и делаем с учетом предыдущего опыта. Данное средство является бесплатной интегрированной средой и полностью отвечает заданным требованиям к разработке. Прототип реализован на языке программирования C#, ввиду его гибкости и простоты использования. Анализируем через алгоритмы Data Mining. Проверяем работу… Читать ещё >
Апробация составленной прикладной модели с выбранными признаками (реферат, курсовая, диплом, контрольная)
На этапе апробации прикладной модели используется прототип программного средства реализующий алгоритм С4.5 и наивный Байесовский классификатор. Прототип работает на локальном компьютере со своей собственной копией исходной базы данных.
Прототип реализован на языке программирования C#, ввиду его гибкости и простоты использования.
C# - объектно-ориентированный язык программирования, относится к группе языков с С-подобным синтаксисом. Для реализации прототипа он полностью подходит.
Среда программирования для разработки — Microsoft Visual Studio Community 2015. Данная среда является интегрированной средой разработки на языке C#, она предлагает отлаженную, простую для обучения и для серьезной разработки среду программирования.
Данное средство является бесплатной интегрированной средой и полностью отвечает заданным требованиям к разработке.
Полный код программы имеет внушительный размер и в приложении, А и Б можно просмотреть лишь часть его. Прототип не имеет визуального пользовательского интерфейса и представляет из себя консольное приложение.
Предварительно перед запуском алгоритмов C4.5 и наивного Байесовского классификатора необходимо запустить дополнительную программу, которая отвечает за модификацию исходной базы данных, а именно строит дополнительную таблицу с сезонностью отпусков. В дальнейшем в эту программу можно внести изменения, чтобы она могла доставать более сложные метрики для углубленного анализа данных.
В общих чертах прикладная модель работает следующим образом:
- 1. Анализируем исходную базу данных.
- 2. Составляем гипотезу, в которой выделяем список метрик.
- 3. Извлекаем метрики. Часть данных оставляем под тестирование.
- 4. Анализируем через алгоритмы Data Mining. Проверяем работу алгоритма по тестовой выборке.
- 5. 5. Интерпретируем результат. Если результат неудовлетворителен, то возвращаемся к пункту 1 и делаем с учетом предыдущего опыта.
- 6. Реализуем уже автоматическую систему сигнализирования на основе составленной выше модели с удовлетворительными результатами.
Для запуска программ необходимо развернуть резервную копию исходной базы данных «wt. bak». Данный файл необходимо импортировать в СУБД. В Данной магистерской диссертации автор использовал «Microsoft SQL Server Management Studio». Успешно импортированная база данных будет выглядеть как на рис. 2.
Рис. 2. Успешно импортированная исходная база данных
После импорта базы данных необходимо будет запустить программу под названием recreatedDB. Программа проделает необходимые преобразования с базой данной перед использованием алгоритмов Data Mining. Программа не имеет графического интерфейса. Так как это прототип то, необходимо будет перед использованием программы также заменить строку подключения к импортированной ранее базе данных. За строку подключения в коде отвечает переменная «connectionString», расположенная в файле Program. cs. После изменения значения переменной, программу необходимо будет заново скомпилировать и запустить.
После завершения работы вспомогательной программы, необходимо запустить алгоритм C4.5 и наивного байесовского классификатор. За это отвечает программа под названием C4.5_Bayes. В данной программе также необходимо изменить строку подключения, как и у предыдущей вспомогательной программы. У автора магистерской диссертации строка имела вид — @" Data Source = DESKTOP-KQI2HJ0; Initial Catalog=wt; «+ «Integrated Security=SSPI; Pooling=False» ;
Результат работы программы описан ниже.