Разработка экспертной системы распознавания хроматограмм для классификации образцов

Дипломная работа - Химия

Другие дипломы по предмету Химия

?апример, как 20:1), то большой пик будет лишь немного "испорчен" маленьким, в то время как маленький получит большой кусок площади большого. В этом случае метод долин может дать значительно более точный результат [2].

Для многоволновых же хроматограмм существует еще один метод, основанный на изучении спектральных отношений. Дело в том, что для чистых веществ оптическая плотность на длине волны прямо пропорциональна плотности на другой длине волны (согласно закону Бугера-Ламберта-Бера):

хроматограмма раствор концентрация фильтрация

 

Любая примесь, элюирующаяся вместе с основным пиком, вызовет отклонение линии относительного поглощения от горизонтальной прямой. Изучая поведение этой линии (см. рисунок 4.1) можно с уверенностью сказать является ли пик чистым или представляет собой смесь нескольких веществ [3].

 

 

Рис. 4.1. Фрагмент смоделированной на компьютере хроматограммы раствора 3-х пептидов с детектированием при четырех длинах волн (210, 220, 240 и 280 нм)

 

Справа показан гомогенный (чистый) пик 1 с постоянными значениями спектральных отношений вдоль всего пика. Слева - два гетерогенных (неразделенных) пика 2 и 3.

В последнем случае, если два пика перекрывают друг друга так, что каждый из них имеет фрагмент (начало первого и конец второго), свободные от примесей, то, зная лишь сумму их сигналов, можно решить обратную задачу и разделить пики точно:

 

 

где - оптическая плотность i-го пика на j-ой длине волны, - сумма сигналов на j-ой длине волны, - спектральное отношение для i-го пика ( в начале первого пика и в конце второго соответственно. Аналогично строятся выражения для трех, четырех и более перекрывающихся пиков.

4.МОДЕЛИРОВАНИЕ ПИКОВ

 

Моделирование хроматографического пика используется для построения на экране хроматограммы по имеющемуся "отпечатку". В основе такой модели всегда лежит функция Гаусса [1]:

 

 

где - высота пика в момент времени , - площадь пика, - время выхода вершины пика (время удерживания), - стандартное отклонение, которое можно выразить как , где - высота пика. Эта формула позволяет строить гауссовы пики с достаточно высокой точностью основываясь всего на трех константах [11].

Однако не все пики можно описать одной лишь функцией Гаусса: если пик асимметричен (т.е. ), то потребуется модификация вышеуказанной формулы экспоненциальной функцией. В результате асимметричный пик будет аппроксимироваться следующей формулой:

 

 

где - высота пика в момент времени , - площадь пика, - время удерживания, - стандартное отклонение, - константа, характеризующая асимметричность, и . Здесь добавляется еще одна константа, благодаря которой теперь можно достаточно точно описать любой пик [1].

Константа может быть вычислена при помощи статистических моментов. Если n-й момент , то очевидно что , однако намного удобнее будет считать, что - это даст нам возможность нормировать последующие моменты. Тогда нормированный первый момент , нормированный второй момент и нормированный третий момент .

В процессе исследования для удобства изучения поведения спектральных отношений была разработана программа "Хром-П" [16], позволяющая моделировать подобным образом хроматограммы пептидов (последовательностей аминокислот), все необходимые параметры которых были вычислены заранее [12].

 

5.АРХИТЕКТУРА СИСТЕМЫ

 

Разработанная нами система имеет архитектуру, проиллюстрированную на рис.6.1:

 

Рис. 6.1. Архитектура экспертной системы.

 

Далее мы подробно рассмотрим механизмы предварительной подготовки и анализа входных данных, а также механизмы вывода и обучения системы.

 

.1 Запись хроматограммы

 

На этом ("нулевом") этапе оператор должен выполнить запись хроматограммы определенным образом подготовленного образца при определенных условиях элюции (скорость потока, состав элюентов, объем пробы, настройки термостата и т.д.). Для этого используется управляющая программа "Альфахром 1.0". Далее полученный файл передается обрабатывающей программе.

 

5.2 Предварительная обработка и проверка условий анализа

 

Перед тем, как перейти к обработке и последующему анализу данных, система выполняет проверку условий, при которых была записана хроматограмма, и правильности хода самого процесса хроматографии - поведения графиков давления и температуры. Если эти условия выполнены, то производится перевод содержимого файла во внутренний формат с обязательным переходом к равномерной сетке с шагом 100 миллисекунд путем вычисления полиномов Лагранжа по 5 точкам. Далее следует переход к следующему этапу.

 

.3 Алгоритм подготовки хроматограммы

 

Мастер подготовки хроматограммы представляет собой 6 последовательно появляющихся диалоговых окон, при помощи которых пользователь может пошагово задать параметры обработки хроматограммы для последующей разметки пиков. На каждом шаге имеется возможность предварительного просмотра результатов действий с выбранными параметрами на экране.

Область шума

На первом шаге пользователю предлагается выделить на хроматограмме область, не содержащую ни одного пика. Это позволит узнать порядок шумов, который может меняться от анализа к анализу. Также эта область может быть выделена автоматически как наиболее близкая к прямой линии.

Удаление выбросов

Выбросы - ошибочные сигналы дете