Разработка экспертной системы распознавания хроматограмм для классификации образцов

Дипломная работа - Химия

Другие дипломы по предмету Химия

?стикам. Детектор хроматографа "Милихром А-02" может работать в многоволновом режиме, быстро перестраивая монохроматор по циклической программе (до восьми длин волн в цикле) так, что концентрация вещества в элюате, протекающем через фотометрическую ячейку, успевает изменится лишь незначительно. Хроматографический пик при многоволновом детектировании выглядит так, как показано на рис. 1.5.

Кроме того следует отметить, что существуют т.н. диодно-матричные детекторы [5]: в них несколько фотоприемников объединены в матрицу (стоящую после рассеивающей призмы) таким образом, что каждый из них фиксирует излучение на определенной длине волны. Это создает большие трудности в процессе анализа, т.к. при малой интенсивности излучения каждый приемник получает недостаточно света, что сильно повышает уровень шумов. Если же использовать более мощный источник света, то исследуемый образец может начать разлагаться, и на хроматограмме будет показан спектр не самой пробы, а продуктов ее фотолиза. Кроме того, сильное излучение вызывает сильный нагрев матрицы и, как следствие, ее расширение, в результате чего фотоприемники смещаются и начинают фиксировать часть света на соседних длинах волн. Чтобы избежать этого, матрицы приходится жестко термостатировать (вплоть до ?270C).

Информационная ценность многоволнового детектирования заключается в том, что кроме объема удерживания для идентификации вещества можно использовать нормированные величины R = Аln / Аlm (спектральные отношения), измеренные в один момент времени, когда концентрация вещества в растворе неизменная.

Исходя из спектра вещества, легко показать, что

 

 

 

Рис. 1.5. Хроматографический пик, зарегистрированный при 5 длинах волн.

 

Таким образом, набор спектральных отношений отражает "спектральный портрет" вещества и может быть использован для идентификации вещества, а постоянство значений R вдоль хроматографического пика является критерием его "чистоты".

Если мы начали с того, что определили хроматографию как метод разделения веществ, то в современной терминологии этот метод включает в себя и измерение концентрации веществ в образце, и их идентификацию по различным параметрам. Другими словами, хроматография отвечает на вопросы:

1.Сколько различных веществ в образце?

.Есть ли в образце вещества x1, ..., xn из известного нам списка?

.Какова концентрация веществ x1, ..., xn в исходном образце?

Для того, чтобы получить ответы на вопросы 2 и 3, образцы стандартных (эталонных) растворов веществ x1, ..., xn, хроматографируют в стандартных условиях, регистрируя их объемы удерживания, площади пиков и спектральные отношения, причем для каждого измеряемого параметра определяется погрешность измерения [7]. Вся эта процедура называется калибровкой хроматографа. Если калибровочные параметры стабильны во времени, то их сохраняют в виде баз данных. Анализ исследуемой пробы проводят строго в тех же условиях. Полученные данные обрабатывают, учитывая дрейф сигнала детектора, уровень его шумов, неполное разделение пиков и т.п., а затем сравнивают экспериментальные данные со стандартными, взятыми из базы данных. Разработка экспертной системы для проведения сравнительного анализа образцов сложного состава, выполняемого с помощью хроматографа "Милихром А-02", и будет являться нашей задачей. Объектами хроматографического анализа могут быть экстракты различных растений, экстракты крови и других биологических жидкостей, растворы комплексных препаратов. Причем, одинаково ценными в таких анализах являются ответы "эти образцы одинаковые" или "эти образцы разные" даже тогда, когда вещества, входящие в состав образца нам неизвестны. Примером такого сравнительного анализа, когда хроматограмма является "отпечатком пальца" (англ. "chromatographic fingerprint") образца, могут служить хроматограммы образцов зеленого чая, показанные на рис. 1.6.

 

Рис. 1.6. Хроматограммы образцов А и В китайского зеленого чая при грубой (1) и повышенной (2) чувствительности восьмиволнового детектирования.

1.ОСНОВНЫЕ ПОДХОДЫ К ПРОБЛЕМЕ

 

Для решения задачи сравнения двух хроматограмм в мире применяются два основных метода: изучение корреляции двух массивов данных и кластеризация этих массивов и последующее сравнение отдельных пиков. Рассмотрим эти подходы подробнее. В первом случае на основе записанных данных вычисляется коэффициент корреляции двух хроматограмм - чаще всего применяются методы Пирсона и Стьюдента. При значении коэффициента корреляции >0,99 хроматограммы считаются подобными. Коэффициент от 0,99 до 0,90 указывает на некоторое сходство, но результат следует интерпретировать с осторожностью. Значения ниже 0,9 подразумевают, что образцы различны. Данный метод достаточно прост в реализации и имеет достаточно высокую эффективность, однако позволяет ответить лишь на вопрос "идентичны представленные образцы или нет". Кроме того, если возникнет необходимость сохранения хроматограммы представленного образца в базу данных, потребуется запись всех имеющихся точек, т.е. около чисел с плавающей запятой. Второй метод подразумевает разбиение каждой хроматограммы на отдельные пики для получения т.н. "хроматографических отпечатков" ("chromatographic fingerprints"). Этот процесс намного более трудоемкий, однако имеющий два основных преимущества. Во-первых, при обработке учитывается намного больше факторов: дрейф пиков и базовой линии, пересечен