Экспертная система определения заболевания по хроматограмме образца сыворотки крови
Разбиение хроматограммы на отдельные пики может проводиться как в автоматическом режиме с использованием специальных алгоритмов, так и вручную. При выборе автоматической разметки есть возможность задать набор параметров, описывающих минимальный отмечаемый пик (высоту, ширину и площадь), а также начало и конец обрабатываемой области, канал для разметки и тип используемой базовой линии. Начало… Читать ещё >
Экспертная система определения заболевания по хроматограмме образца сыворотки крови (реферат, курсовая, диплом, контрольная)
Курсовая работа
Экспертная система определения заболевания по хроматограмме образца сыворотки крови
Одной из наиболее актуальных проблем современной аналитической химии является обработка данных, полученных в результате анализа. В настоящее время среди многих методов химического анализа заметное место занимает высокоэффективная жидкостная хроматография (ВЭЖХ) с многоканальным детектированием и, в частности, с многоволновой фотометрией в УФ области спектра. Интересным и важным направлением ВЭЖХ-УФ в последние годы можно считать «стандартизацию» обзорного анализа сыворотки крови человека. После обработки хроматографической и спектральной информации становится возможным отслеживать значимые изменения в составе крови и, тем самым, проводить диагностику ряда заболеваний, включая онкологические.
Нашей задачей является разработка компьютерной системы, способной обрабатывать результаты такого анализа. В этом процессе выделяются два основных этапа: обработка сигнала детектора — сглаживание, приведение к единой временной сетке, удаление выбросов и кластеризация, и последующий анализ полученных компонентов с целью сравнения их с эталоном или идентификации по базе данных «ВЭЖХ-УФ». Процесс кластеризации входного массива данных основывается на технологии построения «отпечатка пальца» образца (англ. «chromatographic fingerprint»). Идентификация компонентов может производиться по времени удерживания и спектральным отношениям, что дает возможность различить более чем 1011 веществ.
РЕАЛИЗАЦИЯ
В ходе работы была реализована программная система, позволяющая проводить начальную обработку хроматограмм, записанных при помощи систем «МилиХром» и «АльфаХром». Под начальной обработкой подразумевается фильтрация хроматограммы, разбиение ее на пики и дальнейшая идентификация компонентов по базе спектральных данных.
Рис. 1. Пример хроматограммы зеленого чая. Уровень шума на различных каналах составляет
Фильтрация
Первым этапом обработки полученных от хроматографа данных является фильтрация (или сглаживание) шумов. Основным препятствием в этом процессе является тот факт, что на хроматограммах всегда имеются два вида шумов: электронный шум, возникающий в результате работы АЦП детектора, и химический шум, являющийся результатом детектирования большого количества случайных примесей, неизбежно имеющихся в любой пробе.
Были реализованы несколько алгоритмов, позволяющих бороться с шумами обоих типов:
Вейвлет-преобразование Хаара
Для построения вейвлета размера N используется функция Хаара:
определенная на интервале. Параметр определяется из соотношений и, параметр равен. Матрица вейвлета строится из значений функции при .
Фильтр Савицкого-Голея
Сглаживающий фильтр Савицкого-Голея позволяет снизить уровень шума не внося значительных искажений в площадь пиков. Значение сглаживающей функции в точке вычисляется по формуле
где — ширина окна фильтра (имеет вид), и — заранее известные весовые параметры:
и т.д.
а)
б)
в)
Рис. 2. а) нефильтрованные данные, б) данные, обработанные фильтром Савицкого-Голея с окном ширины 7, в) данные, обработанные фильтром Савицкого-Голея с окном ширины 15
Медианный фильтр
Медианный фильтр является одним из нелинейных фильтров с конечной импульсной характеристикой. Значения отсчетов внутри окна фильтра сортируются в порядке возрастания (убывания); и значение, находящееся в середине упорядоченного списка, поступает на выход фильтра. В случае четного числа отсчетов в окне выходное значение фильтра равно среднему значению двух отсчетов в середине упорядоченного списка. Затем окно перемещается вдоль фильтруемого сигнала и вычисления повторяются.
Также в работе используются вейвлет-преобразование Добеши-4 и сглаживающий фильтр Гаусса. Применяя их в различных сочетаниях удается снизить уровень шума, не внося значительных изменений в значения площадей пиков. Уровень шумов оценивается как среднеквадратичное отклонение в выборке разности сигналов (приращений) двух соседних точек, очищенной от пиков и случайных выбросов.
Разбиение
Разбиение хроматограммы на отдельные пики может проводиться как в автоматическом режиме с использованием специальных алгоритмов, так и вручную. При выборе автоматической разметки есть возможность задать набор параметров, описывающих минимальный отмечаемый пик (высоту, ширину и площадь), а также начало и конец обрабатываемой области, канал для разметки и тип используемой базовой линии. Начало и конец пика определяются исходя из соотношения значения производной и уровня шума.
В ручном режиме разбиения пользователь может самостоятельно отметить интересующие его пики, изменить тип базовой линии или внести поправки в результат автоматического разбиения.
Поиск по базе данных
В качестве первого шага к решению проблемы идентификации образца реализован механизм поиска соответствующего компонента по базе спектральных данных. Определение компонента производится следующим образом:
1. Определяется нормированный спектр и время удерживания рассматриваемого пика.
2. Из базы данных выбираются все записи, время удерживание которых попадает в заданное окно.
3. Из этих записей выбирается компоненты со спектрами, наиболее близкими к рассматриваемому.
Идентификация может проводиться по каждому пику в отдельности или по всей хроматограмме сразу.
Валидация хроматографа
жидкостный хроматография шум фильтр
В системе предусмотрена возможность проверки корректности работы хроматографа. После анализа специально созданной пробы выполняется обработка полученной хроматограммы и измеряются определенные параметры. Если значения этих параметров отклоняются от эталонных менее чем на заданную величину — хроматограф считается годным для дальнейшей работы с базой данных.
Рис. 4. Пример отчета по валидации хроматографа
Градуировка
В системе реализована система градуировок, позволяющая вычислять концентрацию того или иного вещества в образце, основываясь на данных об объеме пробы, площади соответствующего пика и заранее заданных эталонных концентрациях. Аппроксимация производится с использованием метода наименьших квадратов и имеет вид или, где — количество вещества и — площадь пика.
Рис. 5. Диалог выбора градуировочных параметров
Факторный анализ
Одной из наиболее сложных проблем обработки хроматограмм является разделение перекрывающихся пиков. В ряде случаев эта задача может быть решена путем анализа поведения спектральных отношений. В системе реализованы базовые алгоритмы такого анализа, позволяющие оценить степень перекрывания и разделить пики:
где — значение оптической плотности пика в точке, и — измеренные значения оптической плотности для текущей и опорной длин волн в точке, и — спектральные отношения для первого и второго пика соответственно. Значения и задаются как в точках где перекрытие пиков отсутствует.
ЗАКЛЮЧЕНИЕ
В результате работы была создана готовая легко расширяемая программная платформа, обеспечивающая удобный доступ к хроматографическим данным и вывод результатов анализа на экран. В системе реализованы основные рабочие алгоритмы, позволяющие проводить фильтрацию входных данных, кластеризацию (как в автоматическом режиме, так и вручную), идентификацию веществ по базе спектральных данных, выполнять процедуру валидации хроматографа и обрабатывать хроматограммы в пакетном режиме.
Также в ходе работы было создано приложение, позволяющее генерировать хроматограммы с заданными асимметричными пиками (моделирующимися гауссианой, модифицированной экспоненциальной функцией) и уровнем шума, что дает возможность тестировать новые алгоритмы на сколь угодно большом объеме данных.
Дальнейшая работа будет направлена на поиск более оптимальных методов фильтрации и факторного анализа, однако основной задачей останется разработка и исследование алгоритмов сравнения сложных хроматограмм для выявления схожих фрагментов, что обеспечит возможность широкого применения технологии построения «отпечатка пальца» для реализации системы диагностики заболеваний.
1. N. Dyson, Chromatographic Integration Methods, 2nd ed. (Royal Society of Chemistry, Letchworth, UK, 1998).
2. J. Dolan, Integration Problems (LCGC North America, Volume 27, Number 10, October 2009).
3. Л. Хубер, Применение диодно-матричного детектирования в ВЭЖХ (Москва «Мир», 1993).
4. МультиХром для Windows 9x & NT, версия 1.5x-Е. Руководство пользователя. («АМПЕРСЕНД» 1993;2009, «ЭкоНова» 1997;2009).
5. Savitzky A., Golay M.J.E. Smoothing and differentiation of data by simplified least squares procedures / An. Chem., 1964.
6. Каламбет Ю. А., Михайлова К. В. Оценка величины шума и ее использование при обработке хроматографического сигнала. («Лабораторный журнал» № 1 (1) июль 2002).