Разработка экспертной системы распознавания хроматограмм для классификации образцов

Дипломная работа - Химия

Другие дипломы по предмету Химия

ие двух и более пиков, и т.д. Во-вторых, метод позволяет описать каждый пик набором из десятка чисел, что, с одной стороны значительно сокращает объем данных, а с другой стороны дает возможность ответить на вопросы "идентичны ли представленные образцы, и если нет - то чем они отличаются", "содержится ли в представленном образце данное вещество", а при наличии базы чистых веществ и на вопрос "из каких веществ состоит представленный образец". Именно этот метод мы будем использовать в дальнейшем.

 

2.ФИЛЬТРАЦИЯ ШУМОВ

 

Достоверность любого результата будет приближаться к нулю, если уровень спектральных шумов будет иметь тот же порядок, что и максимальное поглощение на тех же длинах волн. В литературе [3] описаны эксперименты, позволяющие с уверенностью сказать, что относительный уровень шумов менее 2% не оказывает существенного влияния на результат исследования.

Фильтрация может понизить уровень шумов спектра за счет их сглаживания. Влияние того или иного фильтра на результат зависит от его вида. Например, при использовании метода изучения коэффициента корреляции семиразрядный фильтр Савицкого-Голея дает небольшое улучшение [3][13]. Его влияние возрастает при расширении полосы фильтрации. Однако если брать фильтр со слишком широкой полосой, то может потеряться тонкая структура.

Вообще, шум - т.е. нежелательный сигнал детектора - может быть по своей природе как электронным, так и химическим [1]. Шум базовой линии, который мы видим - это то, что остается после фильтрации и сглаживания, убирающих высокие частоты. Разумеется, полностью избавиться от шума нельзя: если его частота близка к частотам известных хроматографических пиков, то фильтры могут удалить эти пики вместе с шумом.

Шум базовой линии размывает основание пика и затрудняет обнаружение начала и конца и вычисление площади пика. Шум в районе вершины пика вызывает ошибки при разделении методом долин, создавая "микропики".

Шум создает определенные ограничения на минимальное количество вещества, которое может быть распознано как отдельный пик. Слишком маленькие пики будут скрыты шумом базовой линии, и извлечь их оттуда будет невозможно. Минимальный полностью распознанный пик позволяет ввести понятие отношения сигнал/шум, которое демонстрирует связь между высотой пика и окружающим этот пик шумом. Руководства ACS (American Cancer Society) 1980-го года определяют два предела: предел детектирования (сигнал/шум = 3), описывающий наименьший пик, который можно выделить из шума, и предел количественного определения (сигнал/шум = 10), описывающий наименьший пик, параметры которого могут быть измерены с достаточной точностью однако надо понимать, что понятие "достаточная точность" довольно расплывчатое, и для каждого конкретного анализа может потребоваться дополнительная корректировка пределов.

Кроме того, существует такое понятие, как "дрейф базовой линии" [1] - изменение положения базовой линии с течением времени, вызванное изменением температуры или другими причинами нестабильности работы хроматографа. Если этот дрейф будет не постоянным в течение серии анализов, то он может вызвать серьезные ошибки при измерении параметров пиков, таких как высота, площадь, и коэффициент асимметричности.

 

 

3.РАЗБИЕНИЕ НА ПИКИ

 

Одной из наиболее важных процедур является разбиение хроматограммы на пики. Процедура поиска параметров пиков называется интегрированием. Интегрирование включает в себя определение особых точек пиков (начало, конец, вершина, долина), построение базовой линии, вычисление таких характеристик пиков, как время удерживания (т.е. время выхода вершины пика), высота и площадь. Обычно величиной, характеризующей содержание компонента в анализируемой смеси, является именно площадь пика. Для ее вычисления необходимо знать начало и конец пика и положение базовой линии.

Сверху пики ограничены хроматографической кривой, а снизу - базовой линией. Слившиеся пики (неразделенные у основания) объединяются в группу, где конец предыдущего пика совпадает с началом следующего (эта общая точка называется долиной). В этом случае базовая линия начинается в точке, относящейся к началу первого пика, и заканчивается в точке, относящейся к концу последнего пика в группе и считается прямой. На данном этапе для разграничения смежных пиков применяются два метода: "метод долин" (базовая линия проводится по долинам группы) и "метод перпендикуляров" (смежные пики разграничиваются вертикальной прямой, соединяющей хроматографическую кривую с базовой линией). Каждый из этих методов имеет свои достоинства и недостатки, которые следует рассмотреть более подробно.

Метод долин, с одной стороны, дает достаточно неплохое приближение, однако имеет ряд существенных недостатков. Во-первых, пик, выглядящий как плечо на склоне более высокого пика, не будет распознан. Во-вторых, может быть проигнорирована большая площадь, лежащая ниже новой базовой линии [2].

Метод перпендикуляров, в свою очередь, дает возможность выделить пики-наездники (пусть и с относительно низкой точностью) и сохранить для дальнейшего изучения всю площадь под хроматографической кривой. Однако этот метод хорошо подходит только для примерно равных по площади пиков: так как начало второго пика оказывается в области первого, а конец первого - в области второго, то ошибка будет минимальной при наименьшей разности площадей перекрывающихся областей. Если же размер пиков сильно отличается (?/p>