Разработка экспертной системы распознавания хроматограмм для классификации образцов

Дипломная работа - Химия

Другие дипломы по предмету Химия

ктора, имеющие вид пиков шириной в 1 точку (до приведения к равномерной сетке) и высотой более 2 шумов. Такие скачки подлежат сглаживанию. Этот шаг можно пропустить по желанию пользователя и сразу перейти к следующему.

Фильтрация шумов

На этом шаге пользователю предлагается выбрать способ фильтрации шума: метод скользящего среднего, фильтр Савицкого-Голея (возможно расширение этого списка) и ширину полосы фильтрации. Фильтры следует применять с осторожностью, так как слишком сильное сглаживание может "сгладить" небольшие пики, поэтому в некоторых случаях фильтры не следует применять вообще. Этот шаг можно пропустить.

Выбор диапазона разметки

Здесь указывается область на хроматограмме, которая подвергнется дальнейшему анализу. Например, пользователь может исключить из рассмотрения первые несколько минут, на которых нет никакой ценной информации, или вообще выбрать только один интересующий его пик. По умолчанию анализируется вся хроматограмма.

Минимальный пик

Чаще всего пользователя интересуют только несколько достаточно крупных пиков. Многочисленные небольшие пики, представляющие собой побочные примеси, затрудняют дальнейший анализ и исключаются из рассмотрения. Критериями отсева здесь служат минимальные допустимые высота и площадь пика, задаваемые на данном шаге.

Максимальный пик

В случае больших концентраций того или иного вещества в образце, могут наблюдаться отклонения от закона Бугера-Ламберта-Бера, т.е. сигнал детектора перестает быть линейной функцией от концентрации. Это делает невозможным дальнейшее исследование спектральных отношений вещества, поэтому слишком высокие (хотя бы на одной длине волны) пики должны быть исключены из рассмотрения. Для хроматографа "Милихром А-02" верхняя граница области линейности сигнала составляет 10 единиц оптической плотности. На данном шаге пользователь может задать собственную верхнюю границу.

Маркеры

На последнем этапе подготовки можно указать один или несколько пиков-маркеров (веществ, время выхода которых заранее известно) и скорректировать таким образом сдвиг всех пиков по времени [10].

На этом мастер подготовки хроматограммы завершает свою работу и передает обработанную хроматограмму мастеру анализа входных данных для выделения пиков, вычисления их параметров и поиска в базе данных наилучшего кандидата.

 

.4 Алгоритм анализа и разметки

 

Выделение групп

На первом шаге выполняется разделение всей хроматограммы на отдельные зоны (группы пиков), как это показано на рис. 6.2. Каждая такая зона представляет собой участок между двумя соседними долинами, лежащими (с учетом уровня шума) на базовой линии и имеющие между собой точки, высота которых превышает минимальную высоту пика.

 

Рис. 6.2. Результат выделения групп пиков на хроматограмме, смоделированной при помощи программы "Хром-П".

 

Поиск долин производится путем исследования поведения численной производной (по всем длинам волн) вида с 2-м порядком аппроксимации и высоты соседних точек. Временная сложность этого алгоритма линейно зависит от величины , где n - количество точек для каждой длины волны, a - количество длин волн.

Наилучшие спектральные отношения

На границах пиков (там, где оптическая плотность близка к нулевой линии), спектральный шум многократно возрастает, т.к. спектральные отношения стремятся к единице. Поэтому пользователю следует выбрать границы для рассмотрения спектральных отношений. Обычно эти отношения рассматриваются на том участке, где оптическая плотность превышает 10% высоты рассматриваемого пика, однако возможно изменение этой планки от 2% до 80%.

Выделение пиков

Для каждой группы, полученной на первом шаге мастера, возможны три основных случая:

.Спектральные отношения всей группы близки к константе (в пределах задаваемой погрешности), как это показано на рис. 6.3. Из этого следует, что эта группа представляет собой единственный (а значит чистый) пик, который сохраняется в промежуточный массив.

 

 

2.Спектральные отношения всей группы представляют собой S-образную кривую, как это показано на рис. 6.4. Это означает, что эта группа состоит из двух неразделенных пиков. Зная спектральные отношения чистых веществ (т.е. в начале первого пика и в конце второго), группа точно разделяется на два пика (см. главу "Разбиение на пики"), которые сохраняются в промежуточный массив.

.Спектральные отношения всей группы имеют более сложную форму. Значит, эта группа состоит из трех или более пиков, и точное их разделение не представляется возможным (т.к. о спектре пиков из середины неизвестно ничего). Тогда к группе применяется метод перпендикуляров или долин (в зависимости от высоты и положения смежных пиков), как это показано на рис. 6.5, и полученные пики сохраняются в промежуточный массив. Метод перпендикуляров дает приемлемый результат в том случае, когда площади разделяемых пиков соизмеримы - тогда "загрязнения" пиков друг другом компенсируются. Если же большой пик пересекается с маленьким (т.е. имеется "пик-наездник"), то применяется метод долин с модифицированием базовой линии.

 

Рис. 6.5. Группа, состоящая из трех неразделенных веществ. Границы пиков, полученные методом перпендикуляров, показаны пунктиром.

 

Проверка на количество точек

Если получившийся пик описан менее чем 10 точками (до перехода к равномерной сетке), то он исключается из рассмотрения