Разработка экспертной системы распознавания хроматограмм для классификации образцов
Дипломная работа - Химия
Другие дипломы по предмету Химия
?апример, как 20:1), то большой пик будет лишь немного "испорчен" маленьким, в то время как маленький получит большой кусок площади большого. В этом случае метод долин может дать значительно более точный результат [2].
Для многоволновых же хроматограмм существует еще один метод, основанный на изучении спектральных отношений. Дело в том, что для чистых веществ оптическая плотность на длине волны прямо пропорциональна плотности на другой длине волны (согласно закону Бугера-Ламберта-Бера):
хроматограмма раствор концентрация фильтрация
Любая примесь, элюирующаяся вместе с основным пиком, вызовет отклонение линии относительного поглощения от горизонтальной прямой. Изучая поведение этой линии (см. рисунок 4.1) можно с уверенностью сказать является ли пик чистым или представляет собой смесь нескольких веществ [3].
Рис. 4.1. Фрагмент смоделированной на компьютере хроматограммы раствора 3-х пептидов с детектированием при четырех длинах волн (210, 220, 240 и 280 нм)
Справа показан гомогенный (чистый) пик 1 с постоянными значениями спектральных отношений вдоль всего пика. Слева - два гетерогенных (неразделенных) пика 2 и 3.
В последнем случае, если два пика перекрывают друг друга так, что каждый из них имеет фрагмент (начало первого и конец второго), свободные от примесей, то, зная лишь сумму их сигналов, можно решить обратную задачу и разделить пики точно:
где - оптическая плотность i-го пика на j-ой длине волны, - сумма сигналов на j-ой длине волны, - спектральное отношение для i-го пика ( в начале первого пика и в конце второго соответственно. Аналогично строятся выражения для трех, четырех и более перекрывающихся пиков.
4.МОДЕЛИРОВАНИЕ ПИКОВ
Моделирование хроматографического пика используется для построения на экране хроматограммы по имеющемуся "отпечатку". В основе такой модели всегда лежит функция Гаусса [1]:
где - высота пика в момент времени , - площадь пика, - время выхода вершины пика (время удерживания), - стандартное отклонение, которое можно выразить как , где - высота пика. Эта формула позволяет строить гауссовы пики с достаточно высокой точностью основываясь всего на трех константах [11].
Однако не все пики можно описать одной лишь функцией Гаусса: если пик асимметричен (т.е. ), то потребуется модификация вышеуказанной формулы экспоненциальной функцией. В результате асимметричный пик будет аппроксимироваться следующей формулой:
где - высота пика в момент времени , - площадь пика, - время удерживания, - стандартное отклонение, - константа, характеризующая асимметричность, и . Здесь добавляется еще одна константа, благодаря которой теперь можно достаточно точно описать любой пик [1].
Константа может быть вычислена при помощи статистических моментов. Если n-й момент , то очевидно что , однако намного удобнее будет считать, что - это даст нам возможность нормировать последующие моменты. Тогда нормированный первый момент , нормированный второй момент и нормированный третий момент .
В процессе исследования для удобства изучения поведения спектральных отношений была разработана программа "Хром-П" [16], позволяющая моделировать подобным образом хроматограммы пептидов (последовательностей аминокислот), все необходимые параметры которых были вычислены заранее [12].
5.АРХИТЕКТУРА СИСТЕМЫ
Разработанная нами система имеет архитектуру, проиллюстрированную на рис.6.1:
Рис. 6.1. Архитектура экспертной системы.
Далее мы подробно рассмотрим механизмы предварительной подготовки и анализа входных данных, а также механизмы вывода и обучения системы.
.1 Запись хроматограммы
На этом ("нулевом") этапе оператор должен выполнить запись хроматограммы определенным образом подготовленного образца при определенных условиях элюции (скорость потока, состав элюентов, объем пробы, настройки термостата и т.д.). Для этого используется управляющая программа "Альфахром 1.0". Далее полученный файл передается обрабатывающей программе.
5.2 Предварительная обработка и проверка условий анализа
Перед тем, как перейти к обработке и последующему анализу данных, система выполняет проверку условий, при которых была записана хроматограмма, и правильности хода самого процесса хроматографии - поведения графиков давления и температуры. Если эти условия выполнены, то производится перевод содержимого файла во внутренний формат с обязательным переходом к равномерной сетке с шагом 100 миллисекунд путем вычисления полиномов Лагранжа по 5 точкам. Далее следует переход к следующему этапу.
.3 Алгоритм подготовки хроматограммы
Мастер подготовки хроматограммы представляет собой 6 последовательно появляющихся диалоговых окон, при помощи которых пользователь может пошагово задать параметры обработки хроматограммы для последующей разметки пиков. На каждом шаге имеется возможность предварительного просмотра результатов действий с выбранными параметрами на экране.
Область шума
На первом шаге пользователю предлагается выделить на хроматограмме область, не содержащую ни одного пика. Это позволит узнать порядок шумов, который может меняться от анализа к анализу. Также эта область может быть выделена автоматически как наиболее близкая к прямой линии.
Удаление выбросов
Выбросы - ошибочные сигналы дете