М.Л. ЖМУДЯК, А.Н. ПОВАЛИХИН, А.В. СТРЕБУКОВ, А.В. ГАЙНЕР, А.Л. ЖМУДЯК, Г.Г. УСТИНОВ ДИАГНОСТИКА ЗАБОЛЕВАНИЙ МЕТОДАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ Издательство АлтГТУ БАРНАУЛ 2006 УДК 519.23/.25
ДИАГНОСТИКА ЗАБОЛЕВАНИЙ МЕТОДАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ/ М.Л. Жмудяк, А.Н. Повалихин, А.В. Стребуков, А.В. Гайнер, А.Л. Жмудяк, Г.Г. Устинов;
Алт. гос. тех. ун-т им. И.И. Ползунова. - Барнаул: Изд-во АлтГТУ, 2006.Ц168с.
ISBN 5-7568-0524-9 В книге поставлены и решены задачи: совмещения медицинского и математического подходов к диагностике;
диагностики с учетом многократно определенных диагностических признаков (в частности, диагностики с учетом динамики заболеваний);
оптимальной последовательности обследования, иными словами, нахождения диагностического признака, наиболее необходимого для дальнейшего уточнения диагноза, и др.
В ходе исследований предложены и изучены: диагностика методом наибольшего правдоподобия, алгоритм, повышающий скорость и надежность определения вероятности болезни методом наибольшего правдоподобия;
критерий эффективности диагностики, проведенной расчетными методами;
использование многомерных распределений при диагностике;
имитационные модели болезней для решения методических проблем диагностики и тестирования разрабатываемых методов.
Содержание изложено на 168 страницах, включает 35 рисунков и 30 таблиц, список использованной литературы из 144 публикации.
ISBN 5-7568-0524- й М.Л. Жмудяк, А.Н. Повалихин, А.В. Стребуков, А.В. Гайнер, А.Л. Жмудяк, Г.Г. Устинов, Оглавление Предисловие......................................................................................................................... Введение............................................................................................................................... Термины и обозначения...................................................................................................... Глава 1 Диагностика с использованием искусственного интеллекта и медицинская диагностика желтух............................................................................................................. 1.1 Обзор методов диагностики с помощью искусственного интеллекта................ 1.2 Медицинская диагностика желтух........................................................................ Глава 2 Теоретические разработки.................................................................................. 2.1 Совмещение медицинского и математического подходов к диагностике заболеваний.................................................................................................................... 2.1.1 Кратко о моделировании................................................................................. 2.1.2 Использование условных вероятностей........................................................ 2.1.3 Дополнение статистики и уточнение распределений.................................. 2.2 Использование многомерных распределений...................................................... 2.3 Диагностика методом максимального (наибольшего) правдоподобия............. 2.3.1 Итерационный алгоритм диагностики заболеваний.................................... 2.3.2 Обобщение поперек траекторий..................................................................... 2.3.3 Обобщение по отдельным ДП........................................................................ 2.3.4 Обобщение вдоль траекторий......................................................................... 2.3.5 Диагностирование с использованием чистого критерия максимального правдоподобия........................................................................................................... 2.4 Учет взаимозависимости диагностических признаков и динамики заболеваний в байесовском подходе к диагностике........................................................................ 2.4.1 Использование формулы Байеса..................................................................... 2.4.2 Учет динамики заболеваний при байесовском подходе.............................. 2.4.3 О совмещении методов диагностики............................................................. 2.5 Определение исследования (анализа), наиболее необходимого для диагностики.................................................................................................................... 2.6 Оценка результатов диагностики.......................................................................... 2.6.1 Уровень надежности и неопределенный диагноз......................................... 2.6.2 Критерий эффективности диагностики......................................................... 2.6.3 Влияние отдельного ДП на диагноз............................................................... 2.7 Модельные болезни и исследование на них теоретических вопросов.............. Глава 3 База данных, вероятности и плотности вероятностей диагностических признаков............................................................................................................................ 3.1 Характеристика статистических данных.............................................................. 3.2 Дискретные и непрерывные диагностические признаки, построение гистограмм..................................................................................................................... 3.2.1 Дискретные и непрерывные диагностические признаки............................. 3.2.2 Особенности построения гистограмм непрерывных диагностических признаков................................................................................................................... 3.3 Построение искусственных распределений......................................................... 3.4 Построение многомерных распределений............................................................ 3.5 Особенности работы со статистической базой данных...................................... 3.6 Исследование взаимозависимости диагностических признаков........................ 3.6.1 Независимые и зависимые диагностические признаки в формуле Байеса 3.6.2 Экспертная оценка зависимости признаков................................................ 3.6.3 Наборы (ядра) независимых признаков....................................................... Глава 4 Учет динамики заболеваний при диагностике............................................... 4.1 Методика учета динамики и взаимозависимость диагностических признаков....................................................................................................................................... 4.2 Диагностика при многократном определении признака................................... 4.3 Влияние лечения на динамику заболевания....................................................... Глава 5 Результаты диагностики с применением различных методических приемов........................................................................................................................................... 5.1 Применение уровня надежности и коэффициента эффективности для оценки качества диагностики.................................................................................................. 5.2 Серия экспериментов при различных приемах формирований распределений....................................................................................................................................... 5.3 Серия экспериментов при различных приемах формирования базы данных. 5.5 Серия экспериментов с учетом динамики заболеваний.................................... 5.6 Результаты байесовской диагностики с учетом динамики заболеваний......... Глава 6 Сравнение результатов дифференциальных диагностик методами Байеса, дискриминантного анализа, классификационных деревьев и нейронных сетей...... Заключение....................................................................................................................... Литература........................................................................................................................ Приложение 1 Сходимость итерационного алгоритма и его связь с методом максимального правдоподобия..................................................................................... Приложение 2 Примеры построения гистограмм по различным методикам........... Предисловие Настоящая работа дважды получала поддержку, за которую авторы благодарят проректора АлтГТУ д.ф.-м.н. профессора Б.В. Семкина и организаторов конкурса Ползуновские гранты. Особую благодарность авторы выражают коллегам - научным сотрудникам Р.Х. Ицекзон и О.Н. Зацепиной, помогавшим на всех этапах работы, и О. В. Ловцкой за полезные научные советы.
Раздел 2.3.5 и приложение 1 написаны в приятном сотрудничестве с Г.Ш. Львом.
Адреса для замечаний и предложений: l_jmoudiak@hotmail.com;
pan_brn@list.ru Введение Компьютерная (на математической основе) диагностика заболеваний является для врача таким же инструментом, как расчеты для инженера: расчетная диагностика не заменяет врача, но помогает ему. Поэтому актуально развивать методики диагностики и сравнивать их эффективность.
Авторы старались посмотреть на математические методы диагностики как с математической, так и с медицинской точек зрения, что привело к постановке и решению новых задач. Например, в известных работах для диагностики используются диагностические признаки, определенные в один день, признаки в другие дни в расчетах не участвуют. То есть, не учитывается динамика болезни - важнейший при постановке диагноза фактор. Приведенный пример иллюстрирует актуальность создания методики учета динамики заболеваний, что и сделано в этой работе.
В книге предложены пути совмещения врачебного и математического подходов, поставлены и решены задачи об оптимальной последовательности обследования пациента и др. Применяемые вероятностные и статистические методы с использованием базы данных о прошедших лечение больных, собственно, являются одной из форм обращения к накопленному опыту и, как показано в книге, обеспечивают высокий уровень диагностики.
Термины и обозначения Часто встречающиеся в тексте слова диагностические признаки будем записывать аббревиатурой ДП. Под ДП понимаются симптомы заболевания, клинические анализы, данные инструментальных обследований пациента, а также его пол и возраст.
Другие часто используемые обозначения:
АЛАТ - ферменты аланинаминотрансфераза, АСАТ - ферменты аспартатаминотрансфераза, ММП - метод максимального правдоподобия.
Индексы j =1,2,3,...,n - номер болезни;
i = 1,2,3,...,m - номер ДП;
t = 1,2,3,...,(i) - момент (день), отсчитываемый с начала болезни.
Отсутствие индекса t говорит о том, что есть информация только за один день (момент) или о том, что рассматривается множество величин, относящихся к моментам t1, t2, t3,...,. Обозначение (i) использовано потому, что для разных ДП число дней, в которые ДП определялись, разное.
o - индекс, указывающий, что величина ДП получена обследованием диагностируемого пациента. Отсутствие этого индекса указывает на то, что величина симптома или анализа или другого ДП относится к данным о течении болезни, статистике вариантов течения болезни, статистике величин ДП при болезни j (т.е. отсутствие индекса o говорит о том, что величина не относится к обследованию конкретного пациента, у которого диагностируется болезнь).
Величины - доля больных болезнью j среди больных диагностируемыми болезнями;
j P - распределение вероятностей диагностируемых болезней у пациента, например, P{p1, p2 };
a - величина анализа, рассматривается как переменная (как величина x ) и является общим обозначением любой из возможных величин ДП;
ai - величина i -го ДП, например, СОЭ=28 или лесть боль, т.е. a может быть непрерывной или дискретной величиной;
aoi - конкретное значение i -го ДП, полученное в результате обследования пациента;
t aoi - то же, полученное в день t ;
q - распределение, то есть распределение вероятностей дискретного ДП;
или плотность распределения вероятностей непрерывного ДП (непрерывно распределенного ДП). Аналогично q обозначает распределение сочетания ДП - распределение многомерного ДП. Под вероятностью будем понимать также выборочные оценки соответствующих величин. q обозначает распределение, полученное статистически или моделированием.
t qij(ai ) - распределение i -го ДП при болезни j в момент (день) t ;
распределение определено сбором статистики или относится к модели, к траектории болезни и определяет вероятности или плотности вероятностей при всех значениях ДП. Такое обозначение подчеркивает, что плотность вероятности есть функция от величины a, от величины ДП. Два индекса i в одном обозначении можно не t t употреблять, а использовать более краткие обозначения qtj(ai ) или qij(a), или qij.
t t t qij(aoi ) - вероятность i-го ДП величиной aoi при болезни j в день t.
Вообще говоря, два индекса t в одном обозначении - излишняя информативность, т.к. очевидно, что если ДП величиной aoi определен в день t, то для определения вероятности или плотности вероятностей разумно использовать распределение qtj(ai ) только в этот же день t. То есть можно обойтись t обозначением q (aoi ).
j t t t qij(ai ) ={qij1(ai ),qij2(ai ),qij3(ai ),...,qij(ai )} - совокупность распределений ДП i при болезни j во все моменты (дни) заболевания (или в один из дней, если нет информации о других днях, или распределение ДП i при болезни j, когда информация о моментах (днях) анализов или днях определения других ДП не рассматривается).
t t t qij(aoi ) - средняя ордината распределения вблизи величины aoi, полученной t в результате обследования пациента. Когда интервал вблизи величины aoi мал, t t t qij(aoi ) приближается к qtj(aoi ).
Глава 1 Диагностика с использованием искусственного интеллекта и медицинская диагностика желтух 1.1 Обзор методов диагностики с помощью искусственного интеллекта Анализ литературы показал, что с первых лет применения информационных технологий в здравоохранении одним из ведущих направлений являлись системы поддержки процесса принятия клинических решений, развившиеся в технологии интеллектуальных систем.
В начале восьмидесятых годов в исследованиях по искусственному интеллекту сформировалось самостоятельное направление, получившее название лэкспертные системы [1 - 4 и др.]. Экспертные системы используются для разработки программ, которые при решении задач, трудных для эксперта - человека, получают результаты, не уступающие по качеству и эффективности решениям, получаемым экспертом. Исследователи в области экспертных систем для названия своей дисциплины часто используют также термин линженерия знаний, введенный Е. Фейгенбаумом как привнесение принципов и инструментария исследований из области искусственного интеллекта в решение трудных прикладных проблем, требующих знаний экспертов [7].
Вначале большинство экспертных систем базировалось на правиле продукций:
Если - то, [1 - 4 и др.]. С использованием правила продукций создано много диагностических экспертных систем для конкретных групп болезней [5, 6, 8 - 18 и др.]. Диагностические экспертные системы развивались в направлении их универсализации и расширения возможностей [11 - 18]. Созданы системы, самостоятельно строящие дерево вопросов [12] и т.п.
Одним из популярных методов обнаружения знаний стали алгоритмы поиска ассоциативных правил [19], которые с успехом используются во многих областях, в том числе в задачах медицинского анализа и диагностики [20 - 22].
Использование ассоциативных правил приведено как пример, подтверждающий, что развитие экспертных систем идет в ожидавшемся направлении: универсализации (преодолевается свойственная ранним экспертным системам пригодность только для одной задачи и абсолютная зависимость от эксперта) за счет алгоритмов высокого уровня.
Среди найденных экспертных систем и реализующих их программ имеется и программа: УДифференциальная диагностика желтухФ [23], алгоритм которой, по утверждению авторов этой программы, может помочь развеять сомнения в диагнозе и сократить время диагностики.
Точность определения правильного диагноза экспертными системами имеет большой разброс, а процент правильно определенных диагнозов - невысок. Так, экспертная система медицинской диагностики Diagnos.ru [12] выдает в среднем 70% диагнозов, которые соответствуют истине. Диагностические решения экспертной системы УЭсбадФ в 87% случаев совпадают с клиническим диагнозом [16].
Экспертная система МУТАНТ, созданная сотрудниками ЭВ - Московского университета, позволила получать эффективность только 56% [24]. Впрочем, в источнике говорится о начальных этапах эксплуатации этой системы.
Автоматизированная система ранней диагностики наследственных болезней УДИАГЕНУ, позволяющая идентифицировать свыше 1200 форм, показывает эффективность 90% в сравнении с 60% у врачей медико-генетических консультаций [16].
По результатам обзора складывается впечатление, что заявляемая в публикациях эффективность диагностических программ, основанных на экспертных системах, по-прежнему (как и в годы начала наших исследований) недостаточно высока и изменяется в широких пределах, в основном, от 56 до 90% правильных диагнозов.
Даже во времена, когда экспертные системы были очень распространены и модны, авторам эти системы казались не слишком привлекательными, так как правило продукций Если - то, в общем-то, фельдшерский подходЕ Страшно сказать, но развившиеся в последние годы и действительно эффективные методы диагностики, включая нейронные сети, также в основе фельдшерские, конечно, суперфельдшерские, но все же Е Авторам представлялось, что диагностика должна базироваться на моделировании заболеваний, включая их динамику, и математической оценке близости смоделированных траекторий развития болезни у конкретного больного и наблюдаемых у него диагностических признаков [25, 26].
Диагностика на основе моделирования с учетом патофизиологии процессов, к сожалению, мало распространена по сравнению с другими подходами.
Математические же методы диагностики развиваются очень бурно, опережающими по сравнению с экспертными системами темпами [27 - 88 и др.]. Среди математических методов наиболее постепенно развивается байесовский подход, используемый для диагностики более полувека.
Байесовский подход изложен в книгах Н. Бейли [29, 30], А. Вальда [36], Е.В. Гублера [42, 43], Е.В. Гублера и А.А. Генкина [44], Л. Ластеда [51], С.А. Айвазяна, В.М. Бухштабера, И.С. Енюкова и Л.Д. Мешалкина [55] и др.
Применению байесовского подхода в диагностике посвящены многочисленные статьи [39, 40, 71 - 76, 87 и др.].
Болезни описываются не одним, а несколькими диагностическими признаками. В связи с этим для диагностики широкое применение нашли многомерные статистические методы, такие как факторный, регрессионный, дисперсионный, кластерный, дискриминантный и другие методы анализа данных [31].
Дисперсионный анализ - метод статистического анализа, позволяющий определить достоверность гипотезы о различиях в средних значениях исследуемых величин на основании сравнения дисперсий распределений [32].
Регрессионный анализ - статистический метод для определения связи переменных. Если зависимая переменная является дихотомической или категориальной, необходимо использовать логистическую регрессию.
Факторный анализ - это совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволят выявлять латентные обобщающие характеристики структуры и механизма развития изучаемых явлений и процессов [33].
Факторный анализ является методикой, которая в определенном смысле сама является источником возникновения гипотез. Остановимся вначале на специфическом характере гипотез, порождаемых факторным анализом. Мы исходим из того, что несколько измеряемых переменных сильно коррелируют между собой.
Это означает, что-либо они взаимно определяют друг друга, либо связь между этими переменными обусловливается какой-то третьей величиной, которую непосредственно измерить нельзя. Модель факторного анализа всегда связана с последним предположением, т.е. измеряемая величина является лишь формой проявления величины, остающейся на заднем плане и не поддающейся непосредственному измерению. Возникает задача, можно ли по данным переменным выделить величину, так называемый фактор, который объяснил бы наблюдаемые связи. Слово фактор используется в другом смысле, чем это принято обычно: речь идет о математической величине, получаемой на основе наблюдений.
Факторный анализ заглядывает за кулисы того, что непосредственно измеряется, и стремится определить истинные функциональные величины, лежащие в основе данного явления. Основная цель факторного анализа состоит в выявлении гипотетических величин, или факторов, по небольшому числу экспериментальных данных. Факторы должны быть по возможности простыми и достаточно точно описывать и объяснять наблюдаемые величины. Число выделяемых факторов должно быть меньше набора исходных величин, структура этих факторов и их взаимосвязь должны быть возможно более простыми.
Исходной предпосылкой анализа является наличие взаимосвязи между несколькими одновременно наблюдаемыми переменными. В качестве количественной меры связи между двумя переменными используется коэффициент корреляции. Он может принимать значения от -1 до +1. Если он при этом приближается к нулю, то это свидетельствует об отсутствии линейной связи, и чем более он близок k +1 или k -1, тем более тесная линейная связь существует между переменными. Все вычисленные коэффициенты корреляции располагаются соответствующим образом в корреляционной матрице. При анализе такой корреляционной матрицы получают гипотетические величины, так называемые факторы, которые находятся в определенных взаимоотношениях с переменными.
Факторы представляют собой влияющие величины, не поддающиеся непосредственному измерению, которые могут быть определены только в результате анализа. Примечательно то, что факторный анализ делает возможным выдвижение дифференцированных гипотез о структуре взаимосвязи переменных и факторов, не задаваясь этой структурой заранее и не имея о ней никаких сведений.
Эта структура находится по результатам наблюдений. Полученные гипотезы могут быть проверены в ходе дальнейших экспериментов.
Как в любой прикладной науке, здесь следует обращать внимание на различие между математической моделью и реальным содержанием изучаемого явления.
Вычислительная сторона метода, в которой речь идет только о решении системы уравнений и точности вычислений, является лишь одним аспектом проблемы. Для факторного анализа характерен также статистический подход, применяемый, например, при проверке гипотезы о числе факторов, подлежащих выделению.
Наряду с этим существует еще проблема содержательной интерпретации выделенных факторов, что не имеет места при построении математико статистической модели. Три вышеназванных аспекта - алгебраически вычислительную сторону, статистический подход и интерпретацию факторов - следует учитывать при проведении факторного анализа и разграничивать их [42].
Метод главных компонент. Разработан Хотеллингом [32]. Позволяет при заданной m-мерной корреляционной матрице найти новую ортогональную m-мерную систему координат и именно так, чтобы максимум полной дисперсии лежал в направлении первой главной оси, а максимум оставшейся дисперсии - в направлении второй главной оси и т.д. Метод главных компонент заключается в нахождении последовательности ортогональных осей координат, вдоль которых каждый раз в убывающем порядке определяется максимум полной дисперсии.
Кластерный анализ - это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается некоторым набором переменных. Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами. В отличие от комбинационных группировок кластерный анализ приводит к разбиению на группы с учетом всех группировочных признаков одновременно.
Кластерный анализ объединяет различные процедуры, используемые для проведения классификации. В результате применения этих процедур исходная совокупность объектов разделяется на кластеры или группы (классы) схожих между собой объектов.
Сложность задач кластерного анализа состоит в том, что объединение объектов в группы проводится в пространстве многих измерений.
В целом методы кластеризации делятся на агломеративные (от слова агломерат - скопление) и итеративные дивизивные (от слова division - деление, разделение). В агломеративных или объединительных методах происходит последовательное объединение наиболее близких объектов в один кластер [40].
Исходными данными могут быть собственно объекты и их параметры. Данные для анализа могут быть так же представлены матрицей расстояний между объектами, в которой на пересечении строки с номером i и столбца с номером j записано расстояние между i-м и j-м объектами. Если расстояния не даны сразу, то агломеративные алгоритмы начинают с вычисления расстояния между объектами.
Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве X, разбить множество объектов I на m кластеров (подмножеств) 1,2,...,m так, чтобы каждый объект Ii принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными (несходными).
Дискриминантный анализ - статистический метод, используемый для прогнозирования вероятности какого-либо события. Относится к методам классификации с обучением. Используется для разделения респондентов в различающиеся между собой группы на основе некоторых характеристик.
Дискриминантный анализ является одним из методов многомерного статистического анализа. Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом. Под оптимальным способом понимается либо минимум математического ожидания потерь, либо минимум вероятности ложной классификации. Этот вид анализа является многомерным, так как измеряется несколько параметров объекта, по крайней мере, больше одного, например, температура, влажность в технологическом процессе, давление, состав крови, температура больного и т.д. [43].
При применении дискриминантного анализа обычно имеются несколько переменных, и задача состоит в том, чтобы установить, какие из переменных вносят свой вклад в дискриминацию между совокупностями, определить, имеются ли значимые различия между группами (с точки зрения всех переменных).
Современные версии дискриминантного анализа и реализующих его компьютерных программ сделали технологию дискриминантного анализа доступной широкому кругу пользователей [85].
В медицине дискриминантный анализ успешно применяется для прогнозирования исхода инсульта при различных методах его лечения, выживаемости больных, оперированных по поводу рака почки, и определения срока дожития больных раком почки, имеющих метастазы в различных органах.
Искусственные нейронные сети (сокращенно ИНС) развиваются быстрее других математических методов.
Теория нейронных сетей включает широкий круг вопросов из разных областей науки: биофизики, математики, информатики, схемотехники и технологии. Поэтому понятие нейронные сети детально определить сложно.
Искусственные нейронные сети - совокупность моделей биологических нейронных сетей, представляют собой сеть элементов Ч искусственных нейронов, Ч связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов. Также это набор математических и алгоритмических методов для решения широкого круга задач [41].
Нейронная сеть - система, состоящая из множества работающих параллельно простых обрабатывающих элементов, функция которой определяется структурой сети, силой связей и обработкой, происходящей в вычислительных элементах или узлах [52].
К. Гурни в своей книге, считающейся на западе одной из лучших по введению в теорию ИНС, определяет нейронную сеть как связанный ансамбль единичных обрабатывающих элементов, функциональность которых в широком смысле базируется на работе биологических нейронов. Умение сети обрабатывать данные хранится в силе ее внутренних соединений, или весах, полученных в процессе адаптации (или обучения) сети к набору обучающих данных.
С середины 80-х годов в научном лексиконе появились термины нейроинформатика или нейрокомпьютинг. Нейрокомпьютинг - это технология создания систем обработки информации (например, нейронных сетей), которые способны автономно генерировать методы, правила и алгоритмы обработки в виде адаптивного ответа в условиях функционирования в конкретной информационной среде. Нейрокомпьютинг представляет собой фундаментально новый подход, а рассматриваемые в рамках этого подхода системы обработки информации существенно отличаются от упомянутых ранее систем и методов.
Искусственный нейрон имитирует в первом приближении свойства биологического нейрона. На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона.
Каждый вход умножается на соответствующий вес, аналогичный синаптической силе, и все произведения суммируются, определяя уровень активации нейрона.
Среди всех интересных свойств искусственных нейронных сетей ни одно не захватывает так воображения, как их способность к обучению. Их обучение до такой степени напоминает процесс интеллектуального развития человеческой личности, что может показаться, что достигнуто глубокое понимание этого процесса. Возможности обучения искусственных нейронных сетей ограничены, и нужно решить много сложных задач. Тем не менее, уже получены убедительные достижения, такие как говорящая сеть Сейновского, и возникает много других практических применений.
Цель обучения. Сеть обучается, чтобы для некоторого множества входов давать желаемое (или, по крайней мере, сообразное с ним) множество выходов.
Каждое такое входное (или выходное) множество рассматривается как вектор.
Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал выходной вектор.
Обучение с учителем. Различают алгоритмы обучения с учителем и без учителя. Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой. Обычно сеть обучается на некотором числе таких обучающих пар. Предъявляется выходной вектор, вычисляется выход сети и сравнивается с соответствующим целевым вектором, разность (ошибка) с помощью обратной связи подается в сеть, и веса изменяются в соответствии с алгоритмом, стремящимся минимизировать ошибку. Векторы обучающего множества предъявляются последовательно, вычисляются ошибки и веса подстраиваются для каждого вектора до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемо низкого уровня.
Обучение без учителя. Несмотря на многочисленные прикладные достижения, обучение с учителем критиковалось за свою биологическую неправдоподобность.
Трудно вообразить обучающий механизм в мозге, который бы сравнивал желаемые и действительные значения выходов, выполняя коррекцию с помощью обратной связи. Обучение без учителя является намного более правдоподобной моделью обучения в биологической системе. Развитая Кохоненом и многими другими, она не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами. Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса сети так, чтобы получались согласованные выходные векторы, т.е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Предъявление на вход вектора из данного класса даст определенный выходной вектор, но до обучения невозможно предсказать, какой выход будет производиться данным классом входных векторов.
Практическое использование ИНС для медицинской диагностики (по литературным данным) приводит к исключительно высокому качеству диагностики [79, 82, 83 и др.] Приведенный обзор показывает, что использование методов статистического анализа в медицине результативно и должно развиваться. В настоящее время выдвигают следующие важнейшие медико-биологические проблемы, к которым применимы современные статистические методы: математическое описание поведения физиологической системы во времени;
математическое описание процессов регулирования, например описание реакции живой системы в ответ на химическое воздействие;
проблемы медицинской диагностики и лечения, имеющие целью как можно раньше обнаружить и как можно быстрее ликвидировать отклонение от равновесия в сложной системе;
математическое изучение (в том числе и моделирование) проблем поведения центральной нервной системы и мозга, памяти и обучения и т.д.
Так, например, в клинической практике для объединения признаков в группы идентичные понятию синдром заболевания, а также для иерархической классификации больных применяются факторный и кластерный анализы.
В проанализированных публикациях, в основном, содержатся данные о диагностике одним методом. Нет сколько-нибудь значительной информации о сравнительной эффективности разных методов, нет сравнения разных методов в одинаковых условиях тестирования. Поэтому одна из задач настоящей работы - сравнить диагностику несколькими методами на одних и тех же данных - постановкой диагноза одним и тем же больным.
Сравнение методов - это частная задача. Общим выводом обзора является сравнительно меньшее развитие моделирования и то, что в медицинской диагностике превалируют два подхода: А - использование экспертных систем;
В - использование методов теории вероятностей и математической статистики, и/или формально-математические приемы. Не вдаваясь в тонкости классификации, подчеркнем принципиальное отличие подходов: А - базируется на знаниях и опыте врача, В - на формальной обработке данных (игнорируя мнение врача).
Авторы полагают, что постановочна задача о совмещении подходов А и В.
Действительно, подход А использует знания врача в области физиологии и патофизиологии и т.п., что очень ценно. Однако подход (А) не универсален и не в полной мере использует статистику. (Статистику включает на интуитивном уровне в виде личного опыта и знаний об опыте коллег.) Подход В инвариантен относительно диагностики болезни, позволяет достаточно полно использовать статистическую информацию, т.е. накопленный опыт, но не обращается к знаниям о механизмах взаимосвязи процессов в организме и т.п.
Постановка и варианты решения задачи совмещения подходов А и В являются одной из целей данной работы.
Труды, являющиеся базой для теории диагностики, в основном, рассматривают многомерные распределения [28, 48, 53 - 56 и др.]. В прикладных работах многомерные распределения используются редко [38 и др.]. Поэтому нет ответа на ряд вопросов, связанных с многомерными распределениями при ограниченном количестве данных. Например, неясно, какие именно диагностические признаки (ДП) нужно объединять, когда имеются данные для 2 - 3 - мерных распределений, но нет данных для формирования распределений большей размерности. Не ясно даже, какова эффективность использования многомерных распределений вместо одномерных. (Большинство практических работ по диагностике использует одномерные распределения). Перечисленные и другие вопросы говорят о необходимости исследования диагностики на базе многомерных распределений.
Одномерные распределения используются и при байесовском подходе, данные о распространенности которого приведены выше. При расчете вероятностей болезней по формуле Байеса общепринята гипотеза о взаимонезависимости диагностических признаков между собой. На самом деле, в едином организме диагностические признаки взаимозависимы. Понимание этого присутствует в ряде публикаций. Однако при рассмотрении ДП как независимых результаты диагностики - хорошие. Возможно поэтому взаимозависимость ДП в изученных публикациях не учитывается. Вместе с тем, для повышения качества диагностики необходимо уделить внимание проблеме учета взаимозависимости ДП.
В известных работах для диагностики и прогноза исхода лечения (операции) используются диагностические признаки, определенные в один день, признаки в другие дни в расчетах не участвуют. То есть, не учитывается динамика болезни - важнейший при постановке диагноза фактор. Такой (без учета динамики) подход используется во всех методах диагностики: от Байеса до искусственных нейронных сетей.
Авторам с самого начала работы над этой темой [25, 26] было ясно, что при диагностике необходимо учитывать динамику диагностических признаков [25, 26, 89 - 120], т.к. течение заболевания во времени является одним из основных источников дифференциальной диагностики. В силу изложенного, одной из целей исследования стала разработка методики учета динамики ДП при диагностике заболеваний.
Разработанные методики и компьютерные программы диагностики с учетом динамики заболеваний обладали неплохими диагностическими способностями, то есть процент верных диагнозов был достаточно высок [94, 98]. Дальнейшие исследования показали, что предложенные методы являются нетрадиционной формой метода наибольшего правдоподобия, причем в наших разработках этот метод учитывает динамику заболеваний [90 - 101, 110].
В связи с полученными результатами, включая достаточную эффективность предложенных методов диагностики, был проведен анализ литературы. При анализе литературы авторов интересовали:
применение метода наибольшего правдоподобия для диагностики, особенно, для дифференциальной диагностики заболеваний, учет динамики изменения анализов и симптомов пациента при диагностике заболеваний, эффективность и результаты диагностики, практическое использование компьютерной диагностики, особенно при диагностике желтух.
Метод максимального правдоподобия является одним из широко известных методов, входящих в учебники по теории вероятностей. Этот метод широко применяется в разных областях науки и практической деятельности. Так, метод наибольшего правдоподобия применяется в эконометрии, биометрии, эвентологии, астрономии, компьютерной лингвистике [86, 88, 121].
Метод максимального правдоподобия используется также при автоматическом анализе биологических сигналов и во многих других исследованиях [122 - 129].
Используется метод максимального правдоподобия и в медицине: в компьютерных методах обработки электрокардиограммы [130];
для улучшения прогностической значимости шкалы SAPS (Simplified Acute Physiology Score) в Институте хирургии им. А.В. Вишневского РАМН [131];
при исследовании фактора хронических болей программой Amos 4.0 (Arbuckle, 1999) в James A. Haley VeteransТ Hospital and the University of South Florida [132].
Хотя приведённый выше обзор говорит о значительном применении метода наибольшего правдоподобия в медицинских исследованиях, включая обработку данных, прямого применения этого метода для дифференциальной диагностики не было найдено. Видимо, для дифференциальной диагностики заболеваний метод максимального правдоподобия используется очень редко. Во всех найденных работах метод максимального правдоподобия реализуется в его классической форме, то есть проводится перебор параметров. Алгоритма решения, основанного на разработанном авторами итерационном процессе, не было найдено.
Не удалось обнаружить и работ, в которых метод наибольшего правдоподобия учитывал бы динамику заболевания. Более того, удивительно, что вообще не найдено диагностических методов, учитывающих изменение симптомов, анализов, данных инструментальных исследований во времени.
Разрабатываемые в настоящем исследовании диагностические методы тестировались на диагностике желтух. При этом одним из результатов работ стала программа дифференциальной диагностики механической и паренхиматозной желтух. Данная программа в настоящее время используется в больницах.
Востребованность программы связана с тем, что с больными желтухой приходится встречаться врачам различных специальностей (врач общей практики, инфекционист, хирург, детские врачи). Для этих врачей дифференциальная диагностика механической и паренхиматозной желтух может оказаться затруднительной, и врач в ряде случаев хотел бы согласовать свой диагноз с расчетом вероятности болезни по программе. При механической желтухе нужна операция, часто срочная;
паренхиматозная желтуха лечится терапевтически, и операция принесет вред. Выбор между операцией и консервативным лечением нередко нужно принимать срочно, в условиях неполного (незавершенного) обследования. Особенно программа полезна для тех пациентов, у которых результаты анализов и инструментальных методов исследования противоречивы.
Литературный поиск показал, что очень мало упоминаний о программах, ориентированных на дифференциальную диагностику желтух и, конкретно, на диагностику механической и паренхиматозной желтух.
Одной из найденных программ является упоминавшаяся выше программа Дифференциальная диагностика желтух, автор которой А.В. Устинов, заведующий общетерапевтическим отделением филиала Клинической больницы Управления делами Президента РФ, создал ее в 1997 году (по крайней мере, удалось найти версию, датируемую именно этим годом). В резюме к программе сказано:
ФШирокое распространение заболеваний печени разной этиологии требует ежедневного обращения к данной программе врачей различных специальностей.
Примененный алгоритм может помочь развеять сомнения и сократить время диагностики. В программе имеется большая и подробная программа помощи, содержащая информацию о типах желтух, обмене билирубина и т.п.Ф [23]. Также в сети Internet удалось найти еще одну программу дифференциальной диагностики желтух, условно называемую jaundice.arj (по названию файла архива). Эта программа: Е обладает возможностью распознавания, примерно, по 250 признакам 79 нозологий, в число которых входит и желтуха. Допускается неполнота и неточность входной информации. Автор Нечмиров, домашняя страница в Интернет не указана [133].
Найденные программы основаны на экспертных системах. Следовательно, ограничены субъективностью оценок эксперта. Нет информации об учете динамики заболевания этими экспертными системами, о реальной эксплуатации программ в лечебных учреждениях, о проценте верно поставленных диагнозов.
В изученной литературе не обнаружено математической постановки задачи об оптимальной последовательности обследования пациента - о том, какой именно ДП нужно определить в первую очередь, чтобы наилучшим образом уточнить диагностику и лечение.
Нет в публикациях и информации о модельных болезнях - искусственных болезнях, придуманных для изучения задач диагностики и тестирования создаваемых методов.
И, наконец, во всех встретившихся при поиске работах эффективность диагностики оценивалась как отношение числа правильно поставленных диагнозов к числу всех диагностируемых пациентов. Авторы считают, что возможен более тонкий анализ результатов, что будет показано ниже.
Проведенный анализ литературы подтвердил актуальность и новизну теоретических и практических целей и задач настоящего исследования.
Теоретически задачи включают: совмещение медицинского и математического подходов к диагностике, использование многомерных распределений, диагностика при взаимозависимых симптомах и анализах, диагностика с учетом динамики заболеваний, диагностика методом наибольшего правдоподобия, оптимальная последовательность обследования пациента и др.
Практические задачи: создание универсальной компьютерной диагностической программы и ее использование для дифференциальной диагностики механической и паренхиматозной желтух;
сравнение различных методов диагностики и др.
Разработанные авторами методы и компьютерные программы диагностики и прогноза абсолютно универсальны и пригодны для диагностики и прогноза исхода любых заболеваний, а также могут быть использованы в технике, геологии и других немедицинских областях деятельности. Тестирование и практическое использование предложенных методов и реализующей эти методы программы проводилось на диагностике желтух. Ниже приведен краткий обзор распространенности и медицинской диагностики болезней, сопровождающихся желтухой, и причин появления этого синдрома.
1.2 Медицинская диагностика желтух Болезни печени и внепеченочных желчных путей занимают значительное место в структуре заболеваний человека. Так, вирусные гепатиты А, В, С, D, G, TT и др. - самое распространенное заболевание в мире. Гепатитом болеют 0,5 - 1% всего населения в Европе, 4 - 10% - и в Африке, Азии, Ближнем Востоке (Т.И. Лопаткина, 1997). Заболеваемость вирусным гепатитом B в России за период 1992 - 1996 годы увеличилась в 2 раза и достигла 35,8 больных на 100 тыс. населения. В мире длительное время было 350 млн. человек - носителей вируса гепатита, к 2000 году число их достигло 400 млн. (В.Э.Де Клерк, 2000;
А.А. Ильянкова и соавт., 2001;
Д.Т. Абдурохманов, 2002). В целом в странах СНГ ежегодно регистрируется около 100 тысяч случаев острого гепатита, а фактическая заболеваемость в них, по крайне мере, вдвое выше (Д.К. Львов, 1996).
Ежегодно на планете от вирусного гепатита и его исходов умирает около млн. человек. Каждые 15 - 20 лет от вирусного гепатита и его исходов гибнет больше людей, чем за всю Вторую мировую войну. Из них ежегодно 100 тысяч - от молниеносной формы, еще полмиллиона - в течение острой инфекции, около тысяч - от цирроза печени и 300 тысяч от карциномы печени.
Желчнокаменная болезнь в развитых странах относится к числу наиболее часто встречающихся заболеваний - у 10 - 15% населения. Вирусные гепатиты и желчнокаменная болезнь - основные (но не единственные) причины желтух.
Желтуха - это один из наиболее ярких синдромов, которые часто сопровождают заболевания печени. Основными проявлениями его являются:
пожелтение склер и кожных покровов, кожный зуд, потемнение мочи, обесцвеченный кал. Иктеричность склер и желтушность кожных покровов заметны при уровне сывороточного билирубина 35 - 45 мкмоль/л, т.е. когда нормальные показатели превышены в 2 и более раз.
В основе желтухи лежит нарушение обмена билирубина, приводящее к появлению избыточного его количества в крови. Таким образом, маркером любой желтухи является билирубин (общий, конъюгированный - прямой, неконъюгированный - непрямой).
Диагноз желтухи поставить достаточно просто. Как говорили старые клиницисты, - диагноз написан на лице. Однако врачу недостаточно видеть желтуху, важнейшим является определить причину (вид) желтухи, ибо от этого зависит выбор лечения - оперировать больного или лечить его консервативно.
Процент диагностических ошибок в определении вида желтух достаточно велик и колеблется в широких пределах - от 8 до 30. Кроме того, по данным Алтайского гепатологического центра более 90% пациентов с механической желтухой, нуждающихся в хирургическом лечении, поступают на 15-й день и позднее (рис. 1.2.1). Они лечатся в различных стационарах совершенно с другим диагнозом.
До 5 дн.
8% До 15 дн.
Более 33% 59% Рис. 1.2.1 Длительность желтухи при поступлении в гепатологический центр Хорошо известно, что послеоперационная летальность находится в прямой зависимости от продолжительности желтухи (табл. 1.1).
Таблица 1. Зависимость летальности от продолжительности желтухи Длительность желтухи Летальность, % до 5 дней до до 15 дней 2, более 15 дней 7, Современные методы диагностики многочисленны и не всегда достаточно информативны, порой занимают продолжительное время, что ведет к утяжелению состояния больного и позднему проведению операции. Сложность в диагностике состоит еще и в том, что желтуха появляется не только при заболеваниях печени, но и при поражении других органов и систем: поджелудочной железы, желчного пузыря, системы крови и т.д. Это и создает определенные трудности и ошибки в постановке правильного диагноза и назначения соответствующего лечения. Отсюда видно, что желтуха - один из синдромов, требующих дифференциально диагностического поиска.
Метаболизм билирубина Для того, чтобы понять причины (патогенез) желтух, необходимо иметь представление об обмене билирубина. Билирубин - основной продукт распада гемоглобина, высвобождающегося из стареющих эритроцитов.
В организме здорового человека эритроцит, прожив 120 дней, распадается с образованием гема (белковая часть гемоглобина крови), который попадает в органы ретикулоэндотелиальной системы и в результате трех последовательно идущих реакций превращается в билирубин. В сутки у человека распадается, примерно, 1% циркулирующих эритроцитов: содержание гемоглобина в них равно 6 - 8 г.
Учитывая, что из 1 г гемоглобина образуется 35 - 36 мг билирубина, суточная продукция его теоретически должна составлять 220 - 290 мг. Однако в сутки билирубина образуется несколько больше 250 мг за счет билирубина, образующегося на других путях обмена, - распад миоглобина, свободный тканевой гем, ферменты цитохромы, содержащие гем (цитохром, каталаза, перексидаза и др.).
Это так называемый шунтовой билирубин.
Образующийся на этом этапе неконъюгированный билирубин, будучи высокотоксичным и плохо растворимым веществом, связывается с альбумином плазмы крови. Только очень небольшая часть билирубина способна подвергаться диализу, однако под влиянием веществ, конкурирующих с билирубином за связывание с альбумином, она может увеличиваться. В комплексе альбумин - билирубин неконъюгированный билирубин попадает в систему воротной вены печени.
Печень выполняет три функции в обмене билирубина (рис. 1.2.2):
- захват билирубина печеночной клеткой из крови;
- процесс конъюгации, присоединение глюкуроновой кислоты в эндоплазмотической сети (ретикулуме);
- экскреция водорастворимого конъюгата билирубина в желчные капилляры.
Реакция конъюгации пигмента, протекающая в печени, имеет огромный биологический смысл, превращая высокотоксичный билирубин в малотоксичное, хорошо растворимое соединение билирубин-глюкуронид (конъюгированный билирубин).
Процесс конъюгации и внутриклеточной транспортировки происходит в гепатоците однонаправленно - от капиллярного полюса к билиарному.
Таким образом, конъюгированный билирубин через билиарный полюс гепатоцита выделяется в желчные ходы, а затем в кишечник.
Сосудистый полюс 2. Конъюгация 1. Захват Билиарный полюс 3. Экскреция Рис. 1.2.2 Захват, конъюгация и экскреция гемоглобина в печеночной клетке Функция захвата билирубина гепатоцитом в физиологических условиях высокоэффективна и имеет запас прочности, благодаря чему уровень билирубина в плазме постоянен и не превышает 20 - 22 мкмоль/л.
Повышение уровня билирубина в крови (гипербилирубинемия) возникает в результате:
избыточной продукции билирубина;
уменьшения поглощения билирубина печенью;
уменьшения конъюгации в печени (конъюгации, необходимой для экскреции);
уменьшения экскреции с желчью.
Отсюда желтуху подразделяют на надпеченочную (гемолитическую), печеночную (паренхиматозную) и подпеченочную (обтурационную, механическую).
Гемолитическая развивается при избыточном распаде эритроцитов. Например, при гемолитической желтухе, внутрисосудистом распаде (гемолизе) эритроцитов, при всасывании из обширных тканевых гематом. Образуется настолько много билирубина, что печень становится не способной весь его конъюгировать и выводить. При этом увеличивается уровень неконъюгированного билирубина в крови и накопление его в тканях.
Клиническими проявлениями гемолитической желтухи является умеренная желтушность кожных покровов и склер, цвет желтухи лимонно-желтый, отмечается умеренная бледность. При обследовании находят увеличение селезенки при нормальных размерах печени, отсутствие потемнения мочи и обесцвеченного кала.
Лабораторные критерии представлены в таблице 1.2.
Таблица 1. Лабораторные критерии гемолитической желтухи Лабораторные тесты Их характеристика Число ретикулоцитов Увеличено Микросфероцитоз, макроцитоз, Форма и величина эритроцитов серповидные и др. изменения Продолжительность жизни эритроцитов Укорочена Осмотическая резистентность эритроцитов Снижена Гемоглобин крови Снижен Свободный гемоглобин плазмы крови Присутствует Увеличено за счет непрямого Содержание билирубина в крови (неконъюгированного) Активность ферментов АЛАТ, АСАТ Не изменена Щелочная фосфатаза Показатели в норме Паренхиматозная желтуха возникает при поражении самой печени при таких заболеваниях как острые и хронические вирусные гепатиты, циррозы печени, токсическом поражении печени алкоголем, медикаментами, другими токсинами.
При этом печеночная клетка (гепатоцит) не способна конъюгировать билирубин и в крови накапливается неконъюгированный билирубин. Кроме того, через пораженную мембрану гепатоцита в кровь попадают различные ферменты и другие компоненты клетки.
Клинические проявления паренхиматозной желтухи зависят от вида заболевания. Однако лабораторные тесты имеют общую направленность. Для паренхиматозной желтухи характерны гипербилирубинемия за счет увеличения неконъюгированного (непрямого) билирубина и увеличение активности ферментов - АЛАТ и АСАТ, в то же время активность щелочной фосфатазы остается в пределах нормы.
Причиной механической желтухи является нарушение оттока желчи на различных уровнях: от печеночной клетки до двенадцатиперстной кишки.
Заболеваний, приводящих к обтурации желчных путей, достаточно много. Их можно подразделить на заболевания, создающие препятствие току желчи по желчным путям, - камни, опухоли, рубцовые стриктуры, врожденные аномалии и т.д. и патологические состояния, приводящие к сдавливанию извне: опухоль, воспалительный инфильтрат, хронический панкреатит и т.д.
Выраженная желтуха, кожный зуд, темная моча и обесцвеченный стул - основные клинические критерии нарушения оттока желчи. При механической желтухе в крови накапливается конъюгированный (прямой) билирубин, увеличивается активность щелочной фосфатазы при нормальном уровне активности аминотрансфераз - АСАТ, АЛАТ.
Дифференциальная диагностика желтух строится на анализе и оценке лабораторных и инструментальных данных (табл. 1.3) Таблица 1. Дифференциальная диагностика желтух Тип желтухи Характер Ведущий Нозологические формы Лабораторные показатели основного механизм и синдромы патологичес- развития кого процесса желтухи Надпече- Усиленный Увеличение Гемолитическая анемия. Неконъюгированный ночная. распад образования Обширная гематома билирубин, увеличена Гемолити- эритроцитов билирубина. осмотическая ческая Недостаточная резистентность функция эритроцитов, свободный захвата гемоглобин плазмы Печеночная. Поражение Нарушение Острые и хронические Увеличен Паренхи- гепатоцитов захвата, гепатиты, цирроз неконъюгированный матозная конъюгации, печени, токсические билирубин и активность экскреции поражения, ПБЦ, АЛАТ, АСАТ, пигментные гепатозы Подпечено- Нарушение Нарушение Опухоли, кисты, Увеличены чная. проходимост экскреции, паразиты, камни конъюгированный Механическая и желчных регургитация билирубин и активность путей щелочной фосфатазы.
Не изменена активность АЛАТ, АСАТ Таким образом, казалось бы, нет каких-то трудностей по лабораторным показателям определить вид желтухи. При паренхиматозной и гемолитической желтухе повышается уровень неконъюгированного билирубина, а при механической - конъюгированный - прямой (рис. 1.2.3).
Активность ферментов также характерна при каждом виде желтух. Так, при гемолитической желтухе нет повышения активности АЛАТ, АСАТ и щелочной фосфотазы (ЩФ). В то же время, при паренхиматозной желтухе наблюдается высокая активность АЛАТ, АСАТ и незначительно повышается щелочная фосфотаза. Для механической желтухи характерны, наоборот, высокая активность щелочной фосфатазы и незначительное повышение активности АЛАТ и АСАТ (рис. 1.2.4) Общий Прямой Непрямой Паренхим Гемолит. Механич.
Рис. 1.2.3 Уровень билирубина в зависимости от вида желтухи АЛАТ АСАТ ЩФ Паренхим. Гемолит. Механич.
Рис. 1.2.4 Активность ферментов в сыворотке крови в зависимости от вида желтух Однако, данные показатели характерны для желтух первых 10 - 15 дней. В последующем при механической желтухе в процесс вовлекается печеночная клетка.
Функция ее нарушается и в крови, как при паренхиматозной желтухе, увеличивается содержание неконъюгированного (непрямого) билирубина и нарастает активность аминотрансфераз - АЛАТ и АСАТ.
Исходя из этого, исследование билирубина крови и его фракций, определение активности ферментов (АЛАТ, АСАТ, ЩФ) при желтухах являются скрининговым методом.
Наиболее достоверным признаком паренхиматозной желтухи является определение маркеров вируса гепатита. Число выявленных возбудителей гепатита постоянно растет. Если на протяжении почти ста лет, а первое описание катаральной желтухи было дано в 1883 году, медицине было известно всего три вида вирусного гепатита - гепатит А, гепатит В и гепатит ни А ни В, в настоящее время известны 7 этиологически самостоятельных вирусных гепатитов, которые принято обозначать буквами латинского алфавита: A, B, C, D, E, G, TTV. Выделены вирусы гепатита А, В, С, D, Е - соответственно HAV, HBV, HCV, HDV, HEV.
Антигены вирусов обозначаются символом Ag, антитела к этим антигенам - символом Ab.
Маркеры гепатита A. Острый гепатит А диагностируется на основании обнаружения в сыворотке крови HAV-IgMAb. При этом важно учитывать, что синтез анти-HAV IgM начинается еще до появления первых клинических симптомов и нарастает в острой фазе болезни, а затем содержание антител постепенно снижается, и они исчезают из циркуляции через 3-6 недель болезни.
Маркеры гепатита В. Они наиболее многочисленны. Антигены вируса:
HBsAg - поверхностный антиген гепатита В;
HBsAgIgM - поверхностный антиген гепатита В класса иммуноглобулина М (IgM);
HBeAg - субъединица поверхностного антигена гепатита В;
HBcAg - ядерный антиген гепатита В;
HBV-DNA - ДНК вируса гепатита В;
DNA-p - ДНК-полимераза гепатита В.
Соответствующие антитела к антигенам гепатита В:
HBsAb, HBcAb, HBeAb, HBcIgMAb.
Острый вирусный гепатит В диагностируется при выявлении в сыворотке крови HBsAg и высоких титров HBcAb, являющегося основным маркером заболевания, регистрируемым еще задолго до появления клинических признаков болезни и в течение всего преджелтушного и желтушного периодов. При этом важно учитывать, что при остром течении болезни HBsAg исчезает из крови к концу первого месяца от начала желтухи. Дальнейшее выявление HBsAg указывает на затяжное или хроническое течение болезни. На активную репликацию вируса гепатита B указывает обнаружение в крови HBeAg и ДНК HBV.
Маркеры гепатита С.
HCVAb - антитела к вирусу гепатита С, наличие их указывает на хронический гепатит С при определенной клинике.
HCV-RNA - маркер стадии репликации вируса гепатита С.
Маркеры гепатита D.
HDVAb - антитела к вирусу гепатита D. Они свидетельствуют об активности D-инфекции, которая сопровождает и утяжеляет гепатит В. Выявленные маркеры могут отражать коинфекцию с вирусным гепатитом B или суперинфекцию вируса D на хроническую HBV-инфекцию в стадии репликации или стадии интеграции вируса гепатита B.
Клинически диагностировать гепатиты G и TTV практически невозможно.
Мысль о возможности этих форм вирусных гепатитов должна возникать в том случае, когда у пациента с признаками гепатита получены отрицательные результаты обследования на вирусные гепатиты A, B, C, и в случае, если у таких больных бывает положительный результат на РНК HGV (вирусный гепатит G) или ДНК TTV (вирусный гепатит TTV).
Определение у пациента тех или иных маркеров указывает на то, что он либо болен гепатитом, либо перенес вирусный гепатит, либо является носителем.
Для дифференциальной диагностики наиболее важными являются инструментальные методы исследования: ультразвуковые (УЗИ), рентгенологические, компьютерная томография и др.
Часто используемым и достаточно информативным методом является УЗИ.
Во время ультразвукового исследования обращают внимание на состояние ткани печени, ее трубчатых структур (внутрипеченочных сосудов, внутрипеченочных желчных ходов), размеры печени, селезенки, желчного пузыря, внепеченочных желчных путей (табл. 1.4).
Таблица 1. УЗИ в дифференциальной диагностике желтух УЗИ Вид желтухи признаки Гемолитическая Паренхиматозная Обтурационная Размер печени Несколько Увеличена Редко увеличена увеличена Размеры Увеличение Может быть увеличена Не увеличена селезенки Эхоструктура Обычная или слегка Акустически неоднородная Акустически акустически неоднородная неоднородна Трубчатые Сужение диаметра печеночных Расширение структуры Нормальные вен. Увеличение размеров внутрипеченочных портальной и селезеночных вен желчных ходов, холедоха и желчного пузыря Состояние капсулы Не изменена Утолщена Не изменена печени Другие УЗИ Пигментные камни Дистальное затихание звука Камни в желчном пузыре признаки в желчном пузыре и холедохе, увеличение головки поджелудочной железы Ультразвуковыми признаками паренхиматозной желтухи могут быть увеличение pазмеpов печени, повышение эхогенности паренхимы, ее акустическая неоднородность, появление ярких эхосигналов большей или меньшей интенсивности и pаспpостpаненности, pасшиpение диаметра воротной вены и сужение печеночных вен. Как правило, изменений со стороны желчевыводящих путей нет (рис. 1.2.5).
Наиболее частым ультразвуковым симптомом гемолитической желтухи было увеличение pазмеpов селезенки.
Пpи механической желтухе на ультpасоногpаммах отчетливо видны pасшиpенные мелкие внутpипеченочные желчные ходы (рис. 1.2.6 А). Величина диллятации внутрипеченочных желчных протоков зависела от продолжительности желтухи. При длительности желтухи свыше 10 - 15 дней отмечено более значительное их расширение - от 4 до 8 мм.
А Б Рис. 1.2.5 Ультрасонограммы печени при паренхиматозной желтухе А. Акустическая неоднородность печени и утолщение капсулы.
Б. Увеличение диаметра портальных вен Желчные протоки в отличие от расширенных печеночных вен имеют неправильный ход, звездчатое строение при их слиянии и прослеживаются до периферии.
Желчный пузырь пpи механической желтухе, вызванной обтуpацией дистального отдела холедоха, увеличен в pазмеpах, имеет сфеpическую фоpму, при УЗИ наблюдается выраженное усиление эхосигнала за ним (рис. 1.2.6 Б).
А Б Рис. 1.2.6 Ультрасонограммы печени (А) и желчного пузыря (Б) при механической желтухе Особое внимание при проведении дифференциальной диагностики желтухи уделяется исследованию внепеченочных желчных ходов. Диаметр общего желчного протока, в зависимости от длительности обтурации желчных путей, колеблется от до 26 мм (рис. 1.2.7 А). Наиболее частыми пpичинами непроходимости желчных путей является наличие камней в желчных путях (рис. 1.2.7 Б) и опухоли головки поджелудочной железы.
А Б Рис. 1.2.7 Ультрасонограмма общего желчного протока А. Расширенный, извитой общий желчный проток.
Б. Расширенный общий желчный проток, в просвете которого желчный камень Следует отметить, что УЗИ является скрининговым методом. У большинства больных с помощью УЗИ не удается определить патологию внепеченочных желчных путей - камни в холедохе, опухоли. Поэтому при подозрении на механический характер желтухи применяется прямое введение контрастного вещества в желчные ходы с помощью эндоскопической техники, - метод называется эндоскопическая ретроградная холангиопанкреатография (ЭРХПГ). Метод позволяет определить камни в желчном пузыре, желчных ходах (рис. 1.2.8 А), выявить расширение внутри- и внепеченочных желчных ходов (рис. 1.2.8 Б).
А Б Рис. 1.2.8 Контрастное рентгенологическое исследование желчных путей А. Механическая желтуха, камень в общем желчном протоке и желчном пузыре.
Б. Механическая желтуха, расширение внутрипеченочных желчных ходов В диагностике опухоли головки поджелудочной железы как причины механической желтухи важное место принадлежит компьютерной томографии (рис. 1.2.9).
Рис. 1.2.9. Компьютерная томограмма.
Рак поджелудочной железы. Увеличен размер головки поджелудочной железы.
Увеличен желчный пузырь. Расширены внутрипеченочные желчные ходы Следует отметить огромный поток информации, получаемый врачом при клиническом, лабораторных и инструментальных методах исследования, являющихся базой для постановки правильного диагноза. Использование всех результатов обследования для диагностики требует запоминания и анализа очень большого по объему информационного материала, что не всегда под силу врачу, особенно молодому. Парадоксально то, что увеличение числа методов исследования не уменьшает частоту диагностических ошибок при желтухах.
Выход из создавшейся ситуации можно видеть в разработке и использовании методов и компьютерных программ, которые будут решать дифференциально диагностические задачи с учетом вариабельности, неопределенности результата, обусловленной изменчивостью биологических систем, в случаях как избытка, так и недостаточности клинических, лабораторных, инструментальных данных.
Глава 2 Теоретические разработки Диагностируя, считаем сочетание заболеваний отдельной, самостоятельной болезнью. Если для последней имеются распределения ДП, то суммарная болезнь диагностируется так же, как другие, если данных о ДП нет, сочетание заболеваний исключается из рассмотрения. Возможность описания распределения ДП совокупности болезней по распределениям ДП составляющих болезней - предмет отдельного исследования, выходящего за рамки настоящей монографии.
2.1 Совмещение медицинского и математического подходов к диагностике заболеваний 2.1.1 Кратко о моделировании Выше отмечалось, что диагностика на основе предложенного метода траекторий является и одной из форм совмещения медицинского и математического подходов: медицинский подход используется при моделировании траекторий ДП, а математический - при сравнении траекторий ДП реального больного с траекториями диагностируемых болезней [25, 26, 90, 91, 92, 104].
Когда нет моделей, основанных на медицинских знаниях, на физиологии и патофизиологии, примитивную модель можно построить на основе статистики. При построении основанной на базе данных модели для каждого признака заболевания изучается траектория математического ожидания (т.е. зависимость средних в каждый день заболевания величин признака от времени, прошедшего с начала заболевания). Затем на основании медицинских знаний решается: какими параметрами траектории допустимо варьировать, чтобы описать индивидуальное (у конкретного больного) течение данной ( j -й) болезни. Или, шире, как допустимо изменять траекторию, чтобы отразить индивидуальное течение болезни. При этом в простой форме учитываются и взаимосвязи признаков. Например, повышение траектории одного признака может быть только при повышении другого;
или превышение одного признака над средним уровнем связано с уменьшением другого признака и т.п. Таким образом, получаем модели динамики признаков, и их совокупность можно рассматривать как упрощенную модель болезни. Далее, найденные у больного величины диагностических признаков аппроксимируются траекториями с учетом ограничений, наложенных на форму (течение) траекторий.
Затем постулируется форма распределения признаков (величин анализов) относительно индивидуальных траекторий. За неимением данных о распределении признаков вокруг индивидуальных траекторий во многих случаях допустимо принять, что распределение относительно индивидуальных траекторий такое же, как относительно математических ожиданий - относительно основной траектории болезни. Подчеркнем, что изложенная аппроксимация проводится для каждой ( j-й) болезни. После этого тем или иным методом рассчитывается вероятность болезни.
Очень краткое изложение диагностики с использованием моделей болезней выше приведено, скорее, для сведения о том, что такое направление было предложено [25, 26, 90, 91, 97, 117].
2.1.2 Использование условных вероятностей Другой путь использования знаний физиологии, патофизиологии и т.п.
состоит в том, чтобы задать степень взаимозависимости между симптомами и анализами, исходя из медицинских знаний. Этот путь включения медицинских знаний рассмотрим применительно к использованию формулы Байеса. В обзоре (глава 1) отмечалось, что при расчете вероятностей по формуле Байеса признаки заболеваний необоснованно считаются независимыми. Учет зависимости симптомов не проводится из-за недостаточного объема статистики.
В этой ситуации степень зависимости одних симптомов от других могла бы задаваться на основании знаний медиков. Этим медицинские знания компенсировали бы недостаточный объем статистики. Аналогично на основании медицинских опыта и знаний можно задать условные вероятности одних диагностических признаков относительно других. Задание условных вероятностей и степеней зависимости эквивалентны, так как условные вероятности однозначно пересчитываются в степени зависимости диагностических признаков между собой.
Задание условных вероятностей может быть развито в метод диагностики, суть которого в следующем. Кроме условной вероятности задается допустимый диапазон ее изменения.
При заданных условных вероятностях ставятся (вычисляются) компьютерные диагнозы больным из базы данных. (Напомним, что в базе данных собраны больные с точно установленными диагнозами.) Затем методами нелинейного программирования, например, методами параметрической оптимизации внутри заданного допустимого диапазона изменения условных вероятностей находятся такие величины условных вероятностей, при которых диагностика - наилучшая, - наибольшее количество компьютерных диагнозов верно. Полученный оптимальный набор условных вероятностей используется для диагностики больных [104].
2.1.3 Дополнение статистики и уточнение распределений Поставленная задача совмещения медицинского и математического подходов имеет общий характер как проблема совмещения знаний в предметной области и расчетов на основе статистики, но здесь излагается только отображение указанной задачи на медицинскую диагностику. В медицинской диагностике превалируют два подхода: А - использование экспертных систем;
В - использование методов теории вероятностей и математической статистики, и/или формально-математические приемы. Не вдаваясь в тонкости классификации, подчеркнем принципиальное отличие подходов: А - базируется на знаниях и опыте врача, В - на формальной обработке данных (игнорируя мнение врача).
Очевидно, что постановочна задача о совмещении подходов А и В.
Действительно, подход А использует знания врача в области физиологии и патофизиологии и т.п., что очень ценно. Однако этот (А) подход не универсален и не в полной мере использует статистику. (Статистику включает на интуитивном уровне в виде личного опыта и знаний об опыте коллег.) Подход В позволяет достаточно полно использовать статистическую информацию, т.е. накопленный опыт, но не обращается к знаниям о механизмах взаимосвязи процессов в организме и т.п.
Выше отмечена возможность совмещения подходов А и В путем моделирования болезней. Когда модели болезни нет, предлагается включить медицинские знания в чисто математический подход В через уточнение и дополнение используемой статистики (собранной и используемой базы данных).
Имеющиеся распределения ДП всегда получены (построены) по ограниченным выборкам. Медицинские знания позволяют эти распределения уточнить и дополнить. Таким уточнением и дополнением статистики в математический подход включаются знания врача о физиологии и патофизиологии, течении болезни, воздействии лекарств и т.п.
Предлагаемое уточнение распределений за счет медицинской информации можно дополнить вариационным подходом. Можно задать интервал вероятных кривых распределения каждого ДП. Затем, используя имеющуюся (тестовую) базу данных, внутри интервала выбрать те кривые, при которых диагностика наилучшая.
Расчет вероятностей болезней в известных нам публикациях проводится по одномерным распределениям. Переход к многомерным распределениям снял бы многие проблемы. Но сбор данных, достаточных для построения многомерных распределений, в большинстве случаев непосилен. Вместе с тем, используя доступную статистику, в ряде случаев можно по одномерным распределениям построить многомерные распределения за счет медицинских знаний - вследствие понимания взаимосвязи симптомов и анализов.
Многомерные распределения являются неограниченным потребителем дополнения распределений: если богатая статистика и медицинские знания позволили построить двумерные распределения, более обширные знания позволят построить трехмерные распределения и т.д.
Выше изложены методы совмещения медицинского и математического подходов к диагностике. Начать реализацию предложенных методов рационально с самого простого из них: с дополнения одномерных и двумерных распределений данных (ДП) на основе медицинских знаний.
2.2 Использование многомерных распределений Переход к многомерным распределениям повышает уровень диагностики за счет органического учета взаимозависимости ДП. Этот переход важен, как минимум, для диагностики с расчетом вероятностей болезней по формуле Байеса.
Диагностические признаки заболевания взаимозависимы. Но выявить эти зависимости, опираясь на статистику, трудно, в основном, из-за того, что нужен огромный объем статистических данных. Поэтому распространено грубое приближение: при расчетах по формуле Байеса ДП болезни считаются независимыми, хотя в общем случае в едином организме независимость признаков исключена.
Многомерное распределение органически содержит в себе взаимосвязь признаков заболевания, поэтому построение таких распределений избавляет от необходимости учета взаимозависимости признаков.
Предельный случай - многомерное распределение всех признаков заболевания g (a1, a2, a3, Е, am ), где j - номер болезни, ai (i = 1,2,3,...,m ) - признак j заболевания. Если бы такое распределение удалось построить, то отпала бы необходимость в расчете вероятности болезни по формуле Байеса. Действительно, определив у больного конкретные величины признаков ai : a1 = ao1,a2 = ao2 и т.п., сразу (по зависимости g (a1, a2, a3, Е, am ) получаем плотность вероятности g.
j j Сравнение g у распознаваемых болезней j =1,2,3,...n является достаточной j информацией для вывода о диагнозе.
Вышеприведенное рассуждение представляется тривиальным, но после того, как оно высказано. На самом деле, данное рассуждение - общий подход к использованию многомерных распределений.
Плотность распределения непрерывно распределенных ДП наглядна и ее вычисление однозначно. При сочетании дискретных и непрерывных ДП возникает проблема, которая возникла перед авторами с начала исследований [89, 93]:
допустимо ли на равных рассматривать плотности вероятностей непрерывных ДП и вероятности дискретных ДП? То есть, допустимо ли эти, отличающиеся не только по сути, но в большинстве случаев даже по порядку, величины использовать в одной формуле. В данном случае проанализирована представительность многомерного распределения, включающего и вероятности дискретных ДП и плотности распределения непрерывных ДП. Был рассмотрен академический вариант аппроксимации дискретного распределения непрерывным с помощью кривых плотности вероятности, подобных дельта-функции. Прорабатывались дискретизация непрерывных ДП и проблемы выбора интервалов дискретизации, а также оценки возникающих при дискретизации погрешностей и т. п. В результате было выяснено, что для многомерных распределений проблемы совмещения дискретных и непрерывных ДП вообще нет. Проиллюстрируем это на примере двумерного распределения, в котором один ДП дискретный, а второй непрерывный. Если строить одномерное распределение непрерывного ДП только по величинам этого ДП у тех больных, у которых найдено определенное значение дискретного диагностического признака, то плотность этого выборочного распределения и будет плотностью двумерного распределения. И нет необходимости в дискретизации.
Ордината многомерного распределения зависит от масштабов входящих в него непрерывных распределений. Может быть, эти масштабы нужно связывать со средними квадратическими отклонениями диагностических признаков, по которым построено распределение.
Один из вариантов определения вероятности болезни или комплексного многомерного ДП состоит в вычислении вероятности попадания совокупности определенных признаков заболевания aoi = ( ao1, ao2, ao3, Е, aom ) в заданный гиперпараллелепипед. При этом трудности переходят на задачу задания длины граней параллелепипеда. Не исключено, что длина i-й грани может быть связана с погрешностью измерения i-го ДП [99, 104, 110].
Кроме обычных методов вычисления погрешностей определения дискретных ДП можно предложить следующее. Для дискретного признака вместо его погрешности можно использовать погрешность распределения. Например, пусть у признака (симптома) боль распределение при болезни j: 0,8 - есть боль, 0,2 - нет боли. Величины 0,8 и 0,2 имеют погрешность определения. Эта погрешность может играть роль погрешности признака (данную погрешность предлагается использовать как погрешность дискретного признака).
Заметим, однако, что определенные таким образом погрешности могут оказаться разными у разных болезней. Представляется, что нужно использовать одинаковую погрешность у всех болезней. В качестве одинаковой погрешности можно взять наибольшую погрешность данного признака (среди погрешностей при всех болезнях) [99].
На практике в общем случае нет возможности построить многомерное распределение, включающее все ДП. Обычно статистики хватает для построения двух и трехмерных распределений, которые являются распределениями нового многомерного ДП. В простейшем и практически наиболее значимом случае образуются двумерные признаки: из двух одномерных признаков образуется пара.
Возникает вопрос: стоит ли один и тот же ДП включать в несколько пар. (При объединении диагностических признаков в пары можно предложить разные принципы объединения. C одной стороны, не стоит с одним диагностическим признаком образовывать много пар, чтобы избежать неадекватного повышения его роли. С другой стороны, чем больше пар можно образовать, тем больше связей между диагностическими признаками можно учесть. Конечно, лобразовывать пары, т.е. переходить к двумерным диагностическим признакам, имеет смысл только тогда, когда эти пары можно образовать у всех диагностируемых болезней.) Если рациональна минимизация числа образуемых многомерных диагностических признаков, то в конкуренции ДП на вхождение в многомерный признак очевидно только одно: чем более взаимозависимы ДП, тем рациональнее объединять их в многомерный ДП. Остальные вопросы требуют исследования.
2.3 Диагностика методом максимального (наибольшего) правдоподобия 2.3.1 Итерационный алгоритм диагностики заболеваний В самом начале исследований формула, предложенная авторами для расчета вероятности болезни [90 - 95, 97, 98, 100], считалась оригинальной и имела название формула обобщенных вероятностей [90 - 95, 99]. Позднее был сделан подтвержденный математически вывод, что варианты формулы обобщенных вероятностей являются иной формой метода максимального (наибольшего) правдоподобия (сокращенно ММП) [96, 99, 101, 110].
Метод максимума правдоподобия (термин был впервые использован в работе Фишера, 1922) введен в теорию вероятностей как общий метод оценивания параметров генеральной совокупности с помощью максимизации правдоподобия выборки, обозначенного ниже буквой L [56 и др.].
Покажем, как были получены нетрадиционные формы ММП.
Основная цель настоящего исследования - разработка методов диагностики.
Диагнозом считается наиболее вероятная болезнь, а вероятность болезней рассчитывается по диагностическим признакам, определенным у пациента. Для нахождения вероятностей конкретных величин ДП при каждой болезни была собрана база данных и по ней определены распределения каждого ДП при каждой болезни. Так что распределения дискретных ДП и плотности распределений непрерывных ДП при болезнях известны. Более того, база данных собиралась так, что позволила определить распределения вероятностей (для дискретных ДП) и плотности вероятностей (для непрерывно распределенных ДП) в каждый день болезни.
Итак, известны распределения t t t qij(ai ) ={qij1(ai ),qij2(ai ),qij3(ai ),...,qij(ai )} и диагностические признаки пациента aoi, i = 1,2,3,...,n, следовательно, по этим t t данным для каждого диагностического признака может быть определена qij( aoi ) - вероятность или плотность вероятности ДП.
Для одного и один раз определенного ДП выпишем формулу Байеса t t p qij(aoi) j p =, (2.3.1) j t t p qij(aoi) j j n где - краткая запись суммирования по всем n диагностируемым болезням.
j j = В выписанной формуле Байеса p - вероятность болезни в правой части j уравнения трактуется так же, как и в левой части. Данная трактовка отличается от широко принятой трактовки, согласно которой (Н. Бейли [29, 30]) p в правой j части является не вероятностью, а распространенностью болезни. Широко принятая трактовка обоснована и используется в других разделах. Соглашаясь с общепринятой трактовкой, все же нельзя исключать из исследования иных трактовок. Поэтому в настоящей части публикации исследуется вид формулы Байеса, отвечающий, на наш взгляд, концентрации внимания на вероятности болезни для данного конкретного больного. Учет распространенности болезней может быть сделан дополнительными членами формулы. Однако, до учета распространенности, предлагается завершить исследования диагностики на базе формулы (2.3.1).
Формула (2.3.1) разрешается относительно p. Для более наглядного анализа j этой формулы запишем ее для двух болезней: j =1 и j = 2. Тогда вероятность первой болезни t p1qit1(aoi) p1 =. (2.3.1а) t t p1qit1(aoi)+ p2qit2(aoi) Учтем, что в полной группе из двух болезней p1 + p2 = 1.
Как видно, уравнение (2.3.1а) имеет только два решения:
p1 = 0, p2 = 1 и p1 = 1, p2 = 0.
И задача состоит в отыскании решения, верного с позиций диагностики. В качестве решения предлагается итерационный процесс. Этот же итерационный процесс был использован для практической диагностики, которая осуществлялась по уравнению (2.3.1), переписанному в виде t t pkqij(aoi) j pk +1 =. (2.3.2) j t t pkqij(aoi) j j На практике предложенный итерационный алгоритм расчета всегда сходился и качество диагностики желтух: механической, паренхиматозной и гемолитической, а также здорового состояния пациента - было высоким [94, 98, 109].
Возник вопрос: Всегда ли сходится предложенный итерационный процесс? Математически доказана сходимость предложенного итерационного алгоритма.
Одновременно показано, что метод траекторий эквивалентен (является иной математической формой) методу максимального правдоподобия [100, 110]. Строгое доказательство сходимости итерационного процесса и его связи с ММП приведены в приложении 1. Авторы надеются, что обнаруженная связь байесовского подхода, метода траекторий и ММП позволит глубже понять суть ММП.
С позиций расчета вероятностей гипотез (в данном случае - вероятностей болезней) предложенный итерационный алгоритм имеет преимущества перед известными алгоритмами расчетов вероятностей гипотез по ММП. Преимущество состоит в том, что итерационный алгоритм гарантированно сходится и позволяет найти искомые вероятности при меньшем объеме вычислений [96, 100, 110].
Как ясно из обзора литературы, имеется много публикаций, посвященных расчету вероятностей болезней по известным ДП с помощью формулы Байеса. Во всех найденных публикациях при расчете вероятности болезни используется только одна величина каждого ДП, т.е. для симптома или анализа или инструментального обследования используется только одно его значение. Вместе с тем, в течение болезни и лечения ДП изменяются и определяются не один раз, так что симптом или анализ принимают ряд значений, как бы движутся по характерной для каждой болезни траектории.
В отличие от известных работ, авторам болезнь представлялась не как совокупность определенных один раз ДП, а как совокупность траекторий ДП. Такое представление изображено на рис. 2.1.1. При этом возникла задача: отразить в формуле Байеса не одну, а все измеренные в течение болезни величины ДП.
ДП ДП ДП дни, t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Рис. 2.1.1 Совокупность траекторий ДП Например, пусть в течение болезни один из анализов - билирубин определялся 5 раз: в день поступления в больницу, а также на 3, 5, 8 и 15-й дни болезни. Для каждой определенной величины билирубина по известным распределениям билирубина в каждый день болезни, при каждой из диагностируемых болезней ( j ) находится вероятность появления билирубина Значения ДП данной величины. Задачей является использование всех найденных величин билирубина (при расчете вероятностей по формуле Байеса).
В качестве метода ввода в формулу Байеса всех измерений каждого ДП было предложено обобщение. Обобщение самой величины ДП имеет смысл только тогда, когда данный ДП в течение болезни не меняется. Форма такого обобщения - усреднение.
Вероятностные характеристики изменяющихся ДП можно обобщать как минимум двумя путями. Во-первых, можно обобщать вероятности появления (при болезни j ) диагностических признаков данной величины qij(aoi). Во-вторых, можно обобщать вероятности болезней, рассчитанные по каждому конкретному определению (измерению) диагностического признака, - по формуле (2.3.1).
Последний тип обобщения и рассмотрен в настоящем (2.3) разделе.
В процессе работы проверено несколько методов, отличающихся последовательностью обобщений вероятностей болезней, определенных по значениям ДП, полученных в результате обследования. Под обобщением понимается усреднение вероятностей болезней, рассчитанных по какому-либо параметру. Например, обобщение по дням, - это усреднение вероятностей, найденных по каждому из значений ДП, определенных в разные дни, - во все дни, в которые данный ДП определялся.
Аналогично, обобщение по диагностическим признакам - это усреднение вероятностей болезней, вычисленных по значениям различных ДП, определенных в один день.
Перечислим указанные методы в зависимости от последовательности обобщений:
1) обобщение сначала по диагностическим признакам, затем по дням;
2) предварительное обобщение не проводится, каждое обследование считается определением величины нового симптома;
затем проводится усреднение всех найденных вероятностей;
3) обобщение сначала по дням, затем по диагностическим признакам.
Рассмотрим все эти методы и формы обобщения подробнее.
2.3.2 Обобщение поперек траекторий В данном варианте методики вычисление значений вероятностей болезней осуществлялось сначала во внутреннем цикле по ДП, а затем во внешнем - по дням.
При этом обобщение по ДП происходит по числу представленных ДП в данный день, а после этого по дням - по числу представленных дней. Вычисления производятся по всем m ДП, определенным в данный день, и по всем дням, в которые существует хоть одно значение анализа или симптома обследования пациента или имеется данное инструментального обследования.
t t pkqij(aoi) 1 j pk +1 = (2.3.3) j t t mt pkqij(aoi), t i j j где i - номер ДП среди m рассматриваемых ДП;
j - номер болезни (в рассматриваемой полной группе из n болезней);
t - момент времени (день), в который рассматриваются ДП болезней и пациента;
t t qij (aoi ) - вероятность дискретного ДП или плотность вероятности непрерывно распределенного ДП в день t, причем имеется в виду ДП, полученный обследованием пациента, а вероятность может трактоваться как вероятность принадлежности ДП определенной категории или величины к болезни j;
- суммирование по ДП;
поскольку под знаком суммы стоят величины, i относящиеся к конкретному дню, то суммирование проводится по всем ДП, определенным в этот день (но только в этот день и в рассматриваемом внутреннем цикле суммирование идет по данным одного дня t ).
Принятое обозначение представляется понятным, хотя при желании можно подчеркнуть, что используются только ДП, определенные в день t, введением it =mt индекса t у индекса i : it , а также конкретизировать суммирование, it = подразумевая перенумерацию ДП в каждый день.
pk - вероятность болезни j, полученная в k -м итерационном цикле;
j pk +1 - вероятность болезни j, полученная в k +1-м итерационном цикле;
j mt - суммарное число ДП, определенных в день t;
- суммирование по моментам времени (дням), в которые имеются ДП;
t - (суммарное) число дней, в которые определялись ДП (в которые был определен хотя бы один ДП).
Изложенная методика получила название диагностика поперек траекторий.
2.3.3 Обобщение по отдельным ДП В данной методике все значения ДП обследования пациентов рассматривались по отдельности. Из этого следует специфика определения вероятности болезни - нет возможности что-либо вычислять первым: вероятность болезни по одному дню или по одному ДП. В процессе вычисления все данные обрабатываются вместе, независимо от ДП и дня, которым они принадлежат.
Обобщение происходит по числу существующих значений. В отличие от других методик, здесь порядок вычислений не важен:
t t pkqij(aoi ) j pk +1 =. (2.3.4) j t t m pkqij(aoi ) t i j j Данная методика получила название диагностика по отдельным симптомам.
2.3.4 Обобщение вдоль траекторий В этой методике реализована следующая последовательность вычислений:
значения вероятностей обобщаются по дням - по числу дней, в которые определялись ДП пациента. Обобщение по дням выполняется отдельно для каждого ДП, а затем проводится обобщение по всем ДП.
t t pkqij(aoi ) 1 j pk +1 =. (2.3.5) j t t m i pkqij(aoi ) i t j j Обобщение проводится по дням, в которые были определены ДП.
Поскольку каждый ДП определялся в разное количество дней, более строгой является запись числа дней с индексом i: i. Это указывает на разное число дней, в которые определялись разные ДП, например камень находился двумя обследованиями (рентгеновским и ультразвуковым) в два разных дня, а увеличение печени определялось на каждом обходе - всего 10 раз.
Так как последовательность вычислений включает обобщение по дням для каждого симптома, данная методика получила название диагностика вдоль траекторий.
2.3.5 Диагностирование с использованием чистого критерия максимального правдоподобия Под использованием чистого критерия максимального правдоподобия подразумевается использование критерия в его классическом варианте, изложенном в учебниках. Критерий имел условное название - CMT1 и вычислялся по отдельным ДП:
t t CMT1 = p qij(aoi ), (2.3.6) j i j где - произведение (по всем i-м ДП и всем дням) полных вероятностей i (сумм по всем n болезням вышеописанных величин).
Возможно вычисление критерия максимального правдоподобия также для диагностик - поперек траекторий и вдоль траекторий. Авторами проработаны и другие варианты критерия максимального правдоподобия [99 и др.].
При любой форме записи критерия максимального правдоподобия вероятность болезни можно найти методами нелинейного программирования. Т.е.
этими методами находится сочетание вероятностей болезней, при которых критерий максимален. Среди упомянутых методов эффективны методы: Пауэлла, Нелдера Мида, Гаусса-Зейделя, аппроксимаций и др.
В качестве еще одного метода рационально использовать метод прямого перебора. Прямой перебор в простейшем случае состоит в том, что в уравнение, функцию, обсуждаемый критерий подставляются с небольшим шагом все сочетания варьируемых параметров. В данном случае - сочетания компонент вектора Pj : p, p, p, Е, p.
j =1 j =2 j =3 j =n Начиная с некоторого числа болезней, этот метод по скорости решения задачи уступает большинству методов оптимизации. Но по надежности отыскания оптимума он, пожалуй, лучший. Прямой перебор наиболее информативен для выяснения типа гиперповерхности функции цели - вида критерия наибольшего правдоподобия как функции.
По сравнению с другими методами прямой перебор позволяет наиболее наглядно продемонстрировать теоретическое доказательство того, что задача имеет одно решение: критерий наибольшего правдоподобия как функция имеет один максимум.
Для реализации прямого перебора нужен алгоритм генерации сочетаний варьируемых параметров. На перебираемые, варьируемые (независимые) переменные, которыми являются вероятности болезней, имеются естественные ограничения: вероятности болезней неотрицательны и их сумма равна единице.
Отсюда следуют варианты алгоритмов перебора, выбора сочетаний вероятностей.
Вероятность одной из болезней, например n -й, можно определить как разность j =n- p = 1- p, (2.3.7) j =n j j = где p - вероятность j -й болезни, n - число болезней, p - вероятность n -й j j =n болезни.
j =n- Условия p 0 или p 1 позволяют ограничить массив сочетаний j=n j j = перебираемых вероятностей.
Существуют и другие варианты алгоритма набора (генерации) сочетаний вероятностей болезней.
В полученной области сочетаний вероятностей определяются величины критерия наибольшего правдоподобия и находится оптимальное сочетание вероятностей, т.е. сочетание, при котором критерий наибольшего правдоподобия максимален. Такое сочетание обозначим Pmax = { p, p, p, Е, p }. (2.3.8) j =1 j =2 j =3 j =n Прямой перебор можно усовершенствовать: сначала его стоит проводить с крупным шагом по p, а затем в районе Pmax повторить с уменьшенным шагом и j т.д. до нужной точности. Ограничение района Pmax проводится так, чтобы была гарантия нахождения максимума в этом районе.
Сочетание величин вероятностей болезней, при котором критерий максимального правдоподобия достигает наибольшего значения, считается вероятностями болезней. На наш взгляд, основание считать найденные по этому условию вероятности наиболее правдоподобными - в следующем: при этом сочетании вероятностей болезней - наибольшая вероятность наблюдать имеющиеся у больного ДП вместе (наибольшая вероятность наблюдать имеющийся набор ДП).
В случае прямого перебора вероятностей двух болезней допускается существование (формальное) двухмерного пространства наборов вероятностей, измерениями которого являются вероятности болезней p и p. Это j =1 j = пространство сочетаний вероятностей можно представить двухмерной плоскостью с теми же измерениями. Проводится перебор всех сочетаний вероятностей с целью нахождения их оптимального сочетания (набора). Критерием оценки качества набора (правильности, близости к реальному) служит критерий максимального правдоподобия. Его наибольшее значение для конкретного набора из всех сочетаний (наборов) и будет свидетельствовать о наиболее правдоподобном выборе вероятностей. Вышеописанные действия, необходимые для получения достоверных сочетаний вероятностей, мы называли поиск максимального СМТ, или, более полно, поиск максимального значения критерия максимального правдоподобия методом перебора вероятностей на плоскости наборов вероятностей.
Естественно, перебор всех возможных наборов вероятностей неосуществим.
Реально перебираются вероятности с определенным шагом (нами использованы последовательные шаги - 2%, 1%, 0,5%).
Поиск максимального значения критерия с использованием методов оптимизации пока не реализован.
2.4 Учет взаимозависимости диагностических признаков и динамики заболеваний в байесовском подходе к диагностике 2.4.1 Использование формулы Байеса В данной работе исследуется байесовский подход к диагностике заболеваний, вероятность болезни каждого пациента рассчитывается по классической формуле Байеса qij(aoi ) j i p =. (2.4.1) j qij(aoi ) j j i Левая часть равенства - вероятность j-й болезни пациента. В числителе: - j доля больных болезнью j среди больных диагностируемыми болезнями;
qij(aoi ) - плотность распределения (или вероятность) i-го ДП величиной aoi при j-й болезни. (Имеется в виду плотность распределения вероятности непрерывно распределенного ДП или вероятность ДП, принимающего только дискретные значения, так сказать, дискретного ДП). То есть, если при обследовании пациента величина i-го ДП равна aoi, то по распределению находится плотность распределения непрерывного ДП (или вероятность дискретного ДП) qij, соответствующая величине aoi. - произведение всех i-х признаков от 1 до m.
i В знаменателе сумма таких произведений для всех диагностируемых болезней j (от j =1 до j = n).
Если плотность (вероятность) признака при первой болезни больше плотности (вероятности) признака при второй болезни (qi1 > qi2 ), то очевидно, что этот признак более характерен для первой болезни. Формула (2.4.1) рассчитывает вероятности болезней, исходя из соотношения плотностей (вероятностей) распределения всех признаков в совокупности.
При диагностике заболеваний по формуле Байеса в качестве априорной вероятности используется - относительная частота (доля) больных болезнью j j среди больных диагностируемыми болезнями. В начале исследований возникал вопрос: Нужно ли учитывать распространенность болезни при диагностике конкретного больного? Высказывались соображения типа: Для диагностируемого пациента важны его ДП, а не то, как часто больные подозреваемой болезнью доставляются в данную больницу.
Развеять сомнения помог анализ предельных случаев. Представим, что больной живет на севере типа Земли Франца-Иосифа, и что диагноз ему ставит другой полярник, имеющий все приборы для определения диагностических признаков и компьютерную программу диагностики. Пусть оба участника мысленного эксперимента вообще северные жители, никогда не бывавшие на юге и даже не встречавшиеся с людьми и товарами из южных стран, пусть даже последний корабль с материка приходил год назад.
В этих условиях у больного оказались ДП, более свидетельствующие о диагнозе Денге лихорадка, чем о пневмонии. Денге лихорадка распространена только в тропиках и субтропиках, переносчик комар определенного вида, инкубационный период 3 - 3,5 дня.
Представляется очевидным, что для получения правильного диагноза в расчете нужно использовать относительную частоту тропической болезни, приняв эту частоту небольшой. Приведенный пример говорит о необходимости учитывать л .
j 2.4.2 Учет динамики заболеваний при байесовском подходе Простой смысл формулы Байеса (2.4.1): вероятность при болезни j наблюдать у больного ДП i = 1,2,3,...,m вместе, отнесенная к сумме таких вероятностей у всех диагностируемых болезней (у полной группы болезней) [103].
Формула (2.4.1) выписана для независимых ДП. Пусть в формулу входят два взаимозависимых признака, тогда вместо вероятности второго ДП нужно указать условную вероятность второго ДП относительно первого. (Основываясь на условных вероятностях или на степени взаимозависимостей, начальные и предельные значения которых укажет врач, можно проработать методику диагностики, которая совместит математические методы со знаниями врача и будет лобучаться на базе данных с известными диагнозами.) Если два ДП абсолютно зависимы, условная вероятность равна единице, и нужно указывать только вероятность первого ДП.
Отсюда сразу следует, что не изменяющиеся в какой-либо период ДП, например, камни в желчном протоке нужно (в этот период) вводить в формулу Байеса один раз, независимо от того, сколько раз его определяли (наблюдали) и в какие дни это было.
Для двух изменяющихся ДП в грубом приближении второй признак можно локруглить или до сильно зависимого, или независимого от первого. Степень зависимости второго ДП от первого можно определить методами математической статистики по базе данных.
Сильно зависимые ДП рационально усреднять в один признак. В главе 4 будет приведено исследование взаимозависимости последовательно определенных (в разные дни болезни) величин одного и того же диагностического признака. Данное исследование количественно подтверждает очевидное: ДП, повторно определенный в ближайшие дни, сильно зависит от определенного в первый день. В последующие дни эта зависимость быстро ослабевает.
В настоящей работе для признака, измеренного (определенного) многократно, и для механической и паренхиматозной желтух использовано следующее допущение: считаются сильно взаимозависимыми значения анализов и симптомов первых двух дней. Эти значения усредняются и представляются как 1-й ДП, анализы и симптомы за следующие 3 дня усредняются во 2-й ДП, за следующие 5 дней усредняются в 3-й признак. Образованные вышеуказанным усреднением 1, 2, 3-й (и так далее) ДП в формуле (2.4.1) отражаются как независимые признаки.
Таким образом, учитывается динамика заболевания. Не повторно определенные, а разные ДП считаются, как и в других работах, независимыми, хотя это неверно.
Вышеизложенную методику будем называть 2-м приближением, чтобы отличать от 1-го приближения (см. предыдущий раздел), согласно которому все повторно определенные ДП (за исключением неизменных) считаются отдельными, независимыми признаками. В этом перечислении за нулевое приближение взята общепринятая методика, согласно которой все ДП считаются независимыми, а повторные определения (динамика) признаков игнорируются.
Основа предложенной методики учета динамики в том, что повторно определенные величины одного и того же ДП рассматриваются как разные ДП и учитывается их (этих разных ДП) взаимозависимость [97, 99, 103]. В настоящей работе учет взаимозависимости приближенный, но переход к точному учету - дело техники. Важно, что найдена принципиальная основа учета динамики.
2.4.3 О совмещении методов диагностики Некоторые из перечисленных выше и в обзоре методов диагностики совместимы. Например, нейронные сети в качестве исходной информации могут использовать не сами ДП, а их вероятности и плотности вероятностей. Не менее перспективным представляется вместо ДП использовать вероятности болезней, рассчитанные по каждому ДП. (Прежде всего, стоит изучить использование байесовской вероятности, так как формула Байеса позволяет объективно использовать в одной формуле и вероятности и плотности вероятностей.) Аналогично кластерные методы могут базироваться на вероятностных оценках [97].
2.5 Определение исследования (анализа), наиболее необходимого для диагностики Задача оптимальной последовательности обследования пациента была поставлена и решалась авторами в 1995 году [25, 26], а в 2000 году получен и опубликован [101] приводимый ниже алгоритм нахождения ДП, который необходимо определить в первую очередь для уточнения диагноза. Решение состоит в нахождении конкретного типа следующего ДП (анализа, симптома, инструментального обследования) на основе имеющейся базы данных (сделанных анализов и уже определенных симптомов). Иными словами, основная цель - найти какой именно следующий анализ нужно сделать или какой симптом нужно определить.
Для решения задачи предложена [25, 26] функция цели (жизнеспособность) Z - количество и качество оставшейся (для пациента) продолжительности жизни.
Постулируется, что максимум этого параметра - Zmax для каждого пациента достигается при правильном определении его болезни j = j( truth ) и дальнейшем лечении по существующим методам лечения. Здесь j = j( truth ) - номер болезни или сочетания болезней или набора болезней, в зависимости от задачи. Любые другие неверно определенные значения j j( truth ) приведут к другому курсу лечения и к не большему, т.е. к меньшему или такому же значению.
Решение состоит в поиске оптимального (наиболее необходимого) ДП, назовем его X , т.е. ДП (анализа), при котором функция цели Z максимальна.
Таким образом, целью оптимизации является Zmax, а варьируемым параметром номер ДП. Эквивалентной функцией цели является Z, а эквивалентной целью оптимизации maxZ, где Z - увеличение Z вследствие проведения следующего анализа. Полезно вычислять обе функции цели Z и Z.
ДП (анализ) X максимизирует не вероятность истинной болезни Pj = j( truth ), а функцию Z. При этом оптимален x, не только увеличивающий вероятность j( truth ) - истинной болезни, но и выявляющий наличие или отсутствие наиболее опасных из нераспознанных болезней, следовательно, болезней, лечение которых не проводится.
Как отмечалось в [25, 26], для оптимизации могут быть использованы и иные, чем Z, функции цели. Например, для дифференциации между двумя болезнями функция цели равна P - разности вероятностей этих болезней. Эта же функция позволяет найти X, в наибольшей мере решающий вопрос о выборе между двумя диагнозами.
Для определения Z и других функций цели используется методика расчета вероятностей Pj возможных болезней. Расчет вероятностей болезней может быть выполнен, как показано в предыдущем разделе, по Байесу или иным методом и здесь используется как известная стандартная операция. Перейдем к определению max Z и X. Пусть проводится диагностика j = 1,2,3,..., n болезней и известны вероятности этих болезней Pj. Болезнью j = 1 будем считать норму, отсутствие болезней.
p = 1, (2.5.1) j j n здесь =.
j j = Указанное выше начальное распределение болезней получено по результатам диагностики на базе m определенных ранее анализов, инструментальных обследований и симптомов. Номера этих ДП обозначим буквой i 1 i m. В принципе, p,j = 1,2,3,...,n могут быть взяты и из других источников, например, j по мнению врачей.
Пусть также осталось y ДП, еще не использованных для диагностики:
am+1,am+2,...,am+k,...,am+ y. (2.5.2) Номера еще не использованных ДП здесь и далее обозначены буквой k. Для каждого из этих ДП 1 k y (также как и для каждого из m ДП) известны условные функции распределения вероятностей для дискретных симптомов и анализов и плотности распределения вероятностей для непрерывно распределенных симптомов и анализов. Т.е. известны, например, из статистических данных q ( ai ) и q ( ak ), (2.5.3) j j где i =1,2,3,...,m;
k = m +1,m + 2,m + 3,...,y.
min max Пусть также известен интервал изменения ak, т.е. ak и ak.
Предположим, что сделан дополнительный k-й анализ и получена величина ak = ako. (Это только предположение, анализ еще не сделан.) После того как (гипотетически) сделан k-й анализ и получена величина ako, вычислим (уже на основе m + 1 анализов!) новые вероятности болезней.
{ai(i =1,2,3,...,m)+ ako} pnew(ako)( j = 1,2,3,...,n). (2.5.4) j Еще раз отметим, что процедура (2.5.4) выполняется при конкретном значении предполагаемой величины aok, например, при aok =5. Найденные величины pnew j не зависят от начальных или определенных на предыдущей итерации вероятностей болезней.
Теперь по формуле полной вероятности найдем вероятность того, что в результате гипотетического анализа k будет получена величина aok (например, aok =5).
Qk ( aok ) = p ( aok )q ( ak ). (2.5.5) j j j Для непрерывных симптомов и анализов также используем формулу (2.5.5), подставляя справа плотности вероятности q ( ak ) и получая (слева) плотность j вероятности k-го ДП для величины этого ДП, равной aok.
Теперь повторим вычисления по формулам (2.5.4) и (2.5.5) для всех (дискретных или непрерывных) значений aok. В результате получим функции Qk ( ak ) и pnew( ak ) (2.5.6) j для всех ak [ak min,ak max].
Подчеркнем, что для каждого значения ak = aok имеется распределение pnew( ako ), т.е. pnew( ako ),pnew( ako ), pnew( ako ),..., pnew ( ako ). Аналогично по j j =1 j =2 j =3 j =n формуле (2.5.5) и методике расчета вероятностей болезней получим распределения или плотности вероятности и распределения pnew в виде (2.5.6) для всех y j симптомов (1 k y ).
Далее перейдем к вычислению функции цели Z. Возможны три принципа вычисления Z. Для их иллюстрации представим, что имеется три болезни, вероятности которых равны p1, p2, p3, причем p2 > p1 и p2 > p3. Согласно принятому выше, введем диагноз D как наиболее вероятную болезнь D = j{max(p j =1,2,3,...,n)}. В данном примере D это болезнь № 2. Теперь j представим, что имеется три группы больных. Первая группа с относительным количеством больных p1, вторая с относительным количеством больных p2, третья с относительным количеством больных p3. Первый принцип вычисления Z состоит в следующем. Полагаем, что все три группы больных лечатся согласно диагнозу D.
Т.е. правильно лечится группа p2 и неправильно группы p1 и p3. Величина Z для всех групп разная (группы считаются состоящими из одинаковых пациентов).
Z для всех больных при результате анализа ao вычисляется как Z( ao ) = p ( ao )ZD, j, (2.5.7) j j где, за исключением аномальных случаев, ZD, j =2 > ZD, j =1ZD, j =2 > ZD, j =3.
Это принцип наиболее близок к практике: больного лечат по диагнозу понимаемому как наиболее вероятная болезнь (хотя, впрочем, не исключается и комбинированное лечение, но это отдельная тема).
Второй принцип отражает известные методики теории вероятностей. А именно группы составляют из наугад взятых больных. Относительное количество больных в группах p1, p2, p3. Первую группу лечат от болезни 1, вторую - от болезни 2, третью - от болезни 3.
Третий принцип целиком теоретический. Его можно представить так. Пусть, например, случайно в первую группу попали именно больные болезнью 1, во вторую - болезнью 2, тогда третью группу составят больные болезнью 3. Напомним, что все больные, из которых формируются группы, имеют абсолютно одинаковые анализы. Поэтому, сознательно сформировать группы, в каждой из которых больные одной болезнью, невозможно. Третий принцип лечения состоит в том, что больные каждой группы лечатся от той болезни, которой они больны, т.е. проводится лечение по 3м диагнозам. Обсуждаемый принцип лечения может быть использован как теоретический эталон, как база для сравнения эффективности лечения, диагностики и т.п.
Выпишем формулы расчета Z при лечении по первому принципу. Будем использовать матрицу-столбец B с элементами Z, которые представляют собой j,D величины Z для пациента (данного возраста, состояния здоровья и других особенностей) больного болезнью j( j = 1,2,3,...,n ) при лечении в соответствии с диагнозом D. До проведения k-го анализа диагноз D определялся по наиболее вероятной болезни p = max{p,j = 1,2,3,...,n}, с учетом этого, до проведения k j max j го анализа Z = pnewZ. (2.5.8) j j,D j В формуле (2.5.8) использованы вероятности pnew, а не p потому, что j j истинным считается распределение pnew, и именно так распределенных больных до j анализа k лечили неверно - по диагнозу D. Обратим внимание, что в формуле (2.5.8) Z вычислена именно по старому диагнозу D. То есть исходим из того, что до проведения k-го анализа и распределение p и лечение, в общем случае, j неверны. После проведения анализа k диагнозом Dnew будем считать болезнь, у которой вероятность максимальна.
max{pnew( aok ),j =1,2,3,...,n}. (2.5.9) j new Величина Z для дискретного симптома или анализа aok найдется как cok max new Zk = Qk ( aok ) pnew( aok )Z. (2.5.10) j j,Dnew cok min j new Здесь: Zk - значение Z после проведения k-го анализа (после определения k-го ДП);
Z - элементы матрицы B, точнее, столбец B, номер которого j,Dnew соответствует наиболее вероятной болезни - диагнозу Dnew. В формуле (2.5.10) подразумевается, что aok пробегает все свои дискретные значения от минимального aok min до максимального aok max.
Для непрерывных ДП aok max new Zk = (2.5.10а) Q ( aok ) pnew( aok )Z j,Dnewdaok.
k j j aok min new После вычисления Zk по вышеприведенным формулам1 вычислим эффективность проведения анализа k как разность:
new Z( k ) = Zk - Z = f ( k ). (2.5.11) Далее аналогичные вычисления выполняются для всех k анализов, симптомов, данных инструментальных обследований. И, наконец, искомые симптом или анализ или инструментальное обследование x определяется как номер ДП, при котором Zk максимальна.
x = k{max[Zk k =1,2,3,..., y]}. (2.5.12) (Напомним, что номер x получен при лечении по первому принципу2) Анализ x является рекомендуемым. После его выполнения он переходит в число известных анализов i, i mnew, где mnew = m +1.
Вместе с тем, кроме рекомендуемого анализа стоит рассмотреть и остальные анализы k. Как минимум, стоит о них сообщить врачу - выдать результаты расчета - список анализов k в порядке уменьшения Zk с указанием величины Zk.
Напомним, что согласно [25, 26], травматичность анализа входит в величину Z.
В формуле (2.5.10а) p,j = 1,2,3,...,n удобно также представить как вектор P( aok ). Обнулим в этом векторе все координаты, кроме j o максимальной, являющейся диагнозом. Новый вектор назовем PД ( aok ). С учетом этих обозначений формула (2.5.10а) запишется в виде aok max о new Zk = Qk ( aok )B PД ( aok ) Edaok, (2.5.10б) aok min где E - единичный вектор размерностью n. Аналогично перепишется формула (2.5.10). Идеальное лечение по 3-му принципу запишется в виде aok max new Zk = Qk ( aok )Bd P( aok ) Edaok. (2.5.10в) aok min Здесь Bd - диагональная матрица, полученная из матрицы B обнулением недиагональных элементов, т.е. элементов, у которых i j.
Отметим, что алгоритм определения эффекта идеального лечения (по третьему принципу) сложнее, чем алгоритм эффекта от лечения по наиболее вероятному диагнозу. Это видно на примере. Пусть 100 пациентов больны тремя болезнями с распределением:
Номер болезни j = 1 j = 2 j = Число больных 10 50 (По третьему принципу каждый больной лечится от той болезни, которой он болен. По первому принципу все лечатся по диагнозу, в данном случае диагноз D определяется по наиболее вероятной, 2-й, болезни.) После проведения следующего анализа распределение приобрело вид:
Номер болезни j = 1 j = 2 j = Число больных 20 15 Как видно по приведенным таблицам, 10 больных болезнью j=1 ранее лечились неверно. Для определения эффекта диагностики нужно указать (нужно знать) как ранее лечились эти пациенты. В данном примере они могли лечиться от болезни j=2 или j=3. Рационально считать, что они лечились по варианту с наибольшим Z. Т.е. расчет идет по варианту (принципу) наименьшего эффекта, наименьшего Z.
Перейдем к болезни j=2. До искомого уточняющего анализа лечение 35 пациентов от этой болезни было ошибочным. От какой болезни эти пациенты лечатся после уточняющего анализа? На этот вопрос, в общем случае, нет единственного ответа. Чтобы ответ был единственным, нужно опять привлечь дополнительные предположения, например, принцип наименьшего эффекта уточняющего анализа.
Однако, возможны и иные аргументы по выбору не оптимального, а близкого к нему анализа или по выбору не одного, а группы анализов [25, 26].
В работах [25, 26] поставлены и рассмотрены задачи о выявлении неверного анализа (о проверке анализа) и о повторении анализа.
В рамках изложенного выше варианта методики задача о выявлении неверного анализа решается так. Из уже выполненных анализов по очереди исключаются анализы или их группы, и для них выполняется описанная выше процедура поиска наиболее необходимого анализа.
В частном случае, при конкретных подозрениях о возможной ошибочности анализа, последний удаляется из выполненных анализов. По формуле полной вероятности находится его ожидаемая величина.
ai max i= acoi pl = ai q( ai )dai, (2.5.13) ai min где q( ai ) = p q ( ai ). (2.5.14) j j j pl При данном aoi находится pnew по Байесу или другому методу.
j i= aoi pl + aoi i = 1,2,3,...,m,m -1, i pl pnew. (2.5.15) j После этого переобозначаем p = pnew и циклически повторяем вычисления j j pl по формулам (2.5.13) - (2.5.15) до установления aoi и p.
j pl Найденные aoi и p наглядно иллюстрируют причины и необходимость j перепроверки анализа i = pl. Саму же перепроверку осуществляют при рекомендации, основанной на изменении критерия Z. Например, если после исключения подозрительного анализа величина Z (полученная по описанной выше методике) изменилась существенно, стоит перепроверить анализ.
Вопрос о повторении анализа решается аналогично выявлению анализа, который наиболее нужно сделать. Отличие состоит только в следующем.
Вероятность повторного анализа i вычисляется с учетом предыдущих анализов i.
Точнее, сравнение этих величин с проверяемыми величинами анализов и с получавшимися вероятностями болезней.
Для одних обследований вероятности повторных анализов не отличаются от первичных, для других - отличаются. Повторим здесь пример, приведенный в предыдущих публикациях [2.5.1, 2.5.2]. Если в организме есть глисты (или простейшие, или патогенная флора), то при повторных анализах вероятность их обнаружения повышается. Повышается надежность (т.е. вероятность) обнаружения и не обнаружения патологических изменений в биопсии и т.п.
Таким образом, при выяснении, какой следующий анализ сделать, рассматриваются: еще не сделанные анализы и уже сделанные. Для последних выясняется необходимость их повторения как для контроля (для исключения случайных ошибок), так и для повышения надежности.
Возникает естественный вопрос о продолжении или остановке процесса определения следующего анализа. Если число анализов не исчерпано, то разумно сформулировать критерии прекращения процесса поиска анализа x. (Кстати, если число анализов исчерпано, а упомянутые критерии не выполнены, то это заставляет задуматься о полноте набора используемых анализов или болезней).
Для ветеринарии в некоторых случаях критерии могут быть разработаны, исходя из стоимости анализов и прибыли от излечения. Критерии, предлагаемые ниже, не связаны с ценами. В качестве необходимых условий остановки поиска следующего анализа предложим соотношения pnew - p j j, (2.5.16), p p j j Z Z. (2.5.16а).
Неравенство (2.5.16) отражает стабилизацию процесса уточнения диагноза, (2.5.16а) показывает, что эффективность дополнительных анализов стала низкой.
Поскольку Z имеет размерность времени, можно подумать о рациональных значениях Z. Эти значения не стоит выбирать меньше нескольких дней. Другим ограничением минимального значения Z и других критериев является точность вычислений Z,p и других величин.
j Достаточные условия окончания расчетов могут быть получены сравнением со здоровым человеком:
new Z - Z z. (2.5.16б) Z Здесь Z11 - величина Z для здорового человека, т.к. первый индекс 1 матрицы B относится к отсутствию болезней, а второй индекс 1 - к лечению в случае нормального здоровья.
Другое достаточное условие - высокая точность диагностики (1 - max p ) <. (2.5.16в).
j p Ряд критериев может быть получен сравнением с оптимальным лечением по предложенным выше 2-му и, главное, 3-му принципам лечения.
Более жестким и точным является требование выполнить условия (2.5.16) - (2.5.16в) в нескольких, например, трех последовательных расчетах x, причем анализ x, найденный в части этих расчетов, например в двух расчетах, должен быть реализован.
Данная стратегия выбора следующего анализа уменьшает не только число проводимых (выполняемых) анализов, но и сокращает время обследования, время постановки диагноза, что иногда принципиально важно. Приведенный выше алгоритм сводит к минимуму субъективный фактор как при назначении следующего анализа, так и при диагностике.
После небольшой модификации данная методика может быть использована и в других областях медицины, а также в управлении, экономике и др. Например, может быть решена задача оптимального распределения дотаций на лечение.
Дотации могут быть распределены по болезням так, чтобы общая жизнеспособность - количество и качество жизни населения выросли наибольшим образом. При этом для заразных болезней нужно учесть не только влияние лечения на больного, но и следствия заражения окружающих.
Один из вариантов решения состоит в следующем. Варьируемыми параметрами выбрать суммы, отпускаемые на лечение одного больного каждой болезнью. Функцией цели - max Z, где Z увеличение вследствие лечения количества и качества жизни больного и людей, находящихся в контакте с ним. При решении необходимо учесть ограничение на общую сумму финансирования.
Методами нелинейного программирования (параметрической оптимизации) эту задачу можно решить.
2.6 Оценка результатов диагностики 2.6.1 Уровень надежности и неопределенный диагноз Результатом байесовской диагностики каждого пациента являются вероятности каждой болезни (формула 2.4.1). Сумма вероятностей равна единице.
По рассчитанным вероятностям ставится диагноз. Если вероятность 1-й болезни ( p1) не ниже вероятности 2-й болезни ( p2), то диагнозом может считаться 1-я болезнь. (Формально более точное определение дано ниже и включает случай равенства вероятностей, но на практике равенства вероятностей в реальных расчетах не бывает.) pj - вероятность j-й болезни pj, % - 1-я болезнь - 2-я болезнь 94% 85% 51% 6% 49% 15% Диаграмма А Диаграмма В Диаграмма С Рис. 2.6.1. Примеры результатов диагностики трех пациентов Рассмотрим гипотетический случай (пример В на рис. 2.6.1): p1 = 51%, p2 = 49%. Здесь вероятности болезней практически не различимы и делать категорический вывод, по нашему мнению, нельзя. В другом случае (пример А):
p1 = 94%, p2 = 6%, можно более уверенно дать ответ.
Если вероятность одной из болезней не только не ниже вероятностей других болезней, но и превышает установленный заранее луровень надежности диагноза, 90% Уровень надежности то выбор делается в пользу этой болезни. Установим уровень надежности, равный 90%. Для примера А мы получаем диагноз - болезнь 1, для примеров В и С - диагноз неопределенный, то есть программа отказывается сделать выбор в пользу 1-й болезни и требует больше данных. Такой подход к оценке вероятностей позволяет перевести часть неправильно поставленных диагнозов в область неопределенных ответов. Одновременно часть правильных диагнозов также становятся неопределенными (как в примере С). Представляется, что важнее сделать меньше ошибок в диагнозе, чем большему числу пациентов поставить верный диагноз.
2.6.2 Критерий эффективности диагностики Методы, алгоритмы и программы математической диагностики, в частности, диагностики заболеваний тестируются на базах данных, например, на группе (G) больных с точно установленными заболеваниями.
G = {1,2,3,...,k,...,g}.
В известных авторам работах в качестве критерия эффективности диагностики используется процент верных диагнозов. Под верным диагнозом понимается математически (компьютерно) поставленный диагноз, совпадающий с диагнозом, поставленным данному больному медиками.
Вместе с тем, по тем же самым результатам математической диагностики можно более объективно оценить эффективность используемого метода диагностики. Пусть в результате расчета найдены вероятности болезней k -го больного из группы G : Pkj = 1,2,3,...,n, где j - номер болезни, n - число диагностируемых болезней. Считаем, что каждый больной болен только одной болезнью и что применяемый метод диагностики рассчитывает вероятности всех болезней, которые имеются у больных данной группы G.
Например, в группе G имеются больные двумя болезнями (n = 2) j =1 и j = 2. Тогда для k -го больного вычисляются pk1 (т.е. вероятность первой болезни pkj=1) и pk 2 (т.е. вероятность второй болезни pkj=2 );
в иных обозначениях, вычисляется вектор вероятностей болезней pk = ( pk1, pk 2 ) pkj = 1. (Как и ранее, j суммирование по параметру обозначается одним нижним индексом:
j =n k =n =, =.) j =1 j k =1 k Номер болезни, которой каждый пациент действительно болен, обозначим jtr( k ). Вероятность (расчетная) этой болезни для k -го больного соответственно имеет обозначение p. Критерием эффективности предлагается выбрать jtr( k ) величину CE = pkjtr, (2.6.1) g k где g - число больных в группе G.
Приведем условный пример оценки эффективности двух методов диагностики. Эти методы обозначим как M1 и M2, а применение этих методов к больным группы (базы) G как M ( G ). То есть M ( G ) - это расчет вектора вероятностей болезней для каждого из пациентов группы G. Пусть G состоит из двух больных k = 1 и k = 2, которые на самом деле больны болезнью j =1, т.е.
jtr =1. {1,2 | jtr = 1}. Пусть также M1( G ), т.е. применение первого метода G = диагностики для группы больных G, привело к следующим результатам:
для больного k =1: pkj = p11 = 0,49;
pkj = p12 = 0,51;
для больного k =2: pkj = p21 = 0,99;
pkj = p22 = 0,01.
Очевидно, что расчетным диагнозом считаем болезнь, вероятность которой не меньше, чем у других болезней. Если таких болезней - диагнозов не одна, то среди них диагноз определяется случайным образом.
В приведенном выше расчете метод M1 диагностировал у больного 1 болезнь j=2, поскольку расчетная вероятность 2-ой болезни больше, чем 1-ой: p12 = 0,51 > p11 = 0,49. Этот диагноз неверен, т.к. в действительности больной страдает болезнью 1: jtr(1) = 1. У больного 2 вероятность 1-й болезни выше, чем вероятность 2-й: p21 = 0,99 > p22 = 0,01, т.е. расчетом диагностируется 1-я болезнь. Это верно, т.к. принято jtr( 2 ) =1.
При обычном подходе эффективность диагностики 50%: у одного больного правильный диагноз, у второго - неправильный. Критерий CE по формуле (2.6.1) CE( М1 ) = ( 0,49 + 0,99 ) = 0,74, или 74%.
Примем теперь, что по методу M2( G ):
для больного k =1: pkj = p11 = 0,01;
pkj = p12 = 0,99;
для больного k =2: pkj = p21 = 0,99;
pkj = p22 = 0,01.
Метод M2, так же как метод M1, неверно диагностировал больного 1 и верно больного 2. При обычном подходе эффективность диагностики 50% - такая же, как у M1. Критерий CE по формуле (2.6.1) CE( М2 ) = ( 0,01+ 0,99 ) = 0,5, или 50%.
Для удобства рассматриваемые вероятности болезней выражены в процентах и сведены в таблицу.
Таблица 2. Вероятность болезней, % Обычная k больной k =1 больной k = оценка CE j (болезнь) диагностики 1 2 1 медицинский диагноз (jtr) 100* ( jtr ) 0 100* ( jtr ) 0 1 49 ( jtr ) 51 99* ( jtr ) 1 0,74 0, M1( G ) 1 ( jtr ) 99 99* ( jtr ) 1 0,50 0, M2( G ) * - отмечены вероятности болезни, считающейся диагнозом ( p >50%);
обозначение ( jtr ) - напоминает, что больной на самом деле болен этой болезнью.
Сравнивая эффективность методов M1 и M2, видим, что CE(M2) существенно меньше, чем CE(M1). Разберемся почему. Оба метода неверно ставят диагноз больному 1. Первый метод вероятность правильной болезни указывает 49%.
Это неверно, но до правильного диагноза не хватает чуть более 1%. M вероятность правильной болезни определил как 1%, что очень далеко от действительности. Т.е. M2 хуже, чем M1. CE учитывает разницу в диагностике:
CE(M1) > CE(M2). Обычный подход указанной разницы не чувствует.
Для полноты анализа можно конкретизировать CE. Так, кроме общего CE можно вычислить CE для каждой болезни отдельно. Поясним это. В рассмотренном примере группа G состоит из больных одной болезнью. Но группа может состоять и из больных разными болезнями G G, где j =1,2,3,...,n;
j G - подгруппа из больных одной болезнью. Gj ={1,2,3,...,k,...,g }, G = G, j j j j g = g. Для каждой подгруппы можно вычислить CE, который будет j j j характеризовать эффективность метода при диагностике одной болезни.
Собственно, в приведенном примере рассматривался CE диагностики одной болезни j=1.
Аналогично можно выделить подгруппу, имеющую определенный набор симптомов, и вычислить CE для этой подгруппы. Из последней подгруппы можно выделить ее часть, относящуюся к одной болезни, и вычислить CE для этой части.
2.6.3 Влияние отдельного ДП на диагноз Интересно проанализировать, как отдельные ДП или их группы влияют на диагноз. Говоря нестрого, диагноз - это наиболее вероятная болезнь, и ставится диагноз сравнением вероятностей рассматриваемых болезней. Расчетные вероятности болезней зависят от всех ДП, и весьма интересно выяснить, как на расчетную вероятность каждой болезни повлияло наличие каждого диагностического признака, какой вклад в повышение или уменьшение вероятности болезни внес анализируемый ДП.
Pages: | 1 | 2 | 3 | Книги, научные публикации