Книги, научные публикации Pages:     | 1 | 2 | 3 |

М.Л. ЖМУДЯК, А.Н. ПОВАЛИХИН, А.В. СТРЕБУКОВ, А.В. ГАЙНЕР, А.Л. ЖМУДЯК, Г.Г. УСТИНОВ ДИАГНОСТИКА ЗАБОЛЕВАНИЙ МЕТОДАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ Издательство АлтГТУ БАРНАУЛ 2006 УДК 519.23/.25 ...

-- [ Страница 2 ] --

Оценку влияния ДП на вероятность можно провести множеством способов.

Приведем один из способов оценки, согласно которому кроме вероятности болезни p вычисляется pij-. pij- - вероятность болезни, рассчитанная при отсутствии i -го j ДП, влияние которого анализируется. Комбинации p и pij- могут быть базой для j многих оценок влияния ДП. Например, отношение p j m Eij = (2.6.2) pij характеризует роль i -го ДП среди m других признаков в величине p - j величине вероятности j -й болезни.

Можно рассчитать вероятность j -й болезни, используя только тот i -й ДП, влияние которого анализируется. (Т.е. использован только один ДП!) Найденная таким расчетом вероятность, которую обозначим pij, характеризует роль i -го ДП (в вычисленной вероятности болезни) отдельно, вне влияния других ДП.

Соотнесем pij со средней вероятностью остальных болезней, определенной по тому же (по анализируемому) ДП:

pij Eij = для k j. (2.6.3) n- pij n -1k = Для двух болезней оценка (2.6.3) роли отдельного ДП вырождается в отношение i t p1 1q1( aoi ) t t Ei1 = = при p1( aoi ) p2( aoi ), (2.6.4а) i t p2 2q2( aoi ) i t p2 2q2( aoi ) t t Ei2 = = при p1( aoi ) < p2( aoi ). (2.6.4б) i t p1 1q1( aoi ) Еще более простой оценкой является отношение вероятностей или плотностей вероятностей ДП при двух рассматриваемых болезнях:

i t p1 q1( aoi ) t t Ei1 = = при q1( aoi ) q2( aoi ), (2.6.5а) i t p2 q2( aoi ) i t p2 q2( aoi ) t t Ei2 = = при q1( aoi ) < q2( aoi ). (2.6.5б) i t p1 q1( aoi ) Последняя оценка реализована в диагностической компьютерной программе, разработанной авторами. (Хотя оценка (2.6.2) более представительна.) Примеры оценки по соотношениям (2.6.5a,b) приведены в разделе 4.2 и в приложении 2, в рубрике степень влияния анализа. Для каждой болезни указываются только те величины Eij, которые больше единицы. Это довольно удобно для анализа причин проведенной диагностики, поскольку, так сказать, аргументы в пользу конкурирующих болезней удалены из информации о данной болезни и размещены в информации о болезнях - конкурентах.

2.7 Модельные болезни и исследование на них теоретических вопросов Создать, придумать искусственные, модельные болезни авторы предлагают [115, 120], как минимум, с тремя целями. Первая - выяснить влияние на диагностику различных факторов, так сказать, в чистом виде и в различных вариантах. Имеется в виду, что реально наблюдаемые факторы: набор (соотношение) в базе данных больных различными болезнями, собранные для реальных больных и болезней анализы и другие диагностические признаки и т.п. - содержат естественные шум и конкретность, что затрудняет и ограничивает анализ.

Вторая цель - получить тестовые примеры для проверки эффективности различных методов диагностики. Модельные тестовые примеры в отличие от реальных данных не имеют ограничений на объём данных, т.е. можно смоделировать любое число больных, и не содержат ошибок диагностики и ошибок сбора данных. Третья цель - выяснить ряд теоретических вопросов, поскольку характер факторов, ДП и число и вид модельных болезней при моделировании последних можно выбрать так, чтобы прояснить возникающие при диагностике вопросы. Например, на модельных болезнях можно выяснить принципы объединения непрерывных и дискретных ДП в многомерный ДП и эффективность диагностики с помощью многомерных ДП.

При этом необходимо обратить внимание на то, как смоделировать независимые и зависимые диагностические признаки, чтобы исследовать проблемы учета взаимозависимости признаков при диагностике.

Среди вопросов, которые можно прояснить на моделях, - вопрос о том, начиная с какого количества данных (объема базы данных) объединение диагностических признаков в многомерные имеет преимущество перед использованием одномерных диагностических признаков как независимых.

Планируется выяснить, какие именно диагностические признаки рациональнее объединять в многомерный ДП и т.д.

Учитывая это и другие перечисленные выше цели, были предложены модели болезней. Одна из самых простых моделей - однопризнаковая, т.е. такая, при которой состояние пациентов при всех болезнях характеризуется одним диагностическим признаком.

Будем рассматривать однопризнаковые болезни. Диагностические признаки считаем функционально связанными со временем, отсчитываемым от начала заболевания. Модель болезни задаем зависимостью математического ожидания диагностического признака от времени. Под независимым понимаем диагностический признак, значение которого (при заданных математическом ожидании и распределении) находится как случайная величина. В качестве модели нулевого уровня сложности можно предложить модель одной болезни с независимым диагностическим признаком, математическое ожидание которого постоянно или изменяется линейно. Такая модель интересна только для контроля правильности реализации.

Модель следующего (первого) уровня сложности - это модель с двумя болезнями. Значение (единственного) диагностического признака при каждой болезни постоянно и индивидуально для данной болезни, т.е. значения диагностического признака при болезнях - разные. Протекание таких болезней (зависимость математического ожидания величины диагностического признака от времени) изображено на рисунке 2.7.1 линиями. По оси абсцисс - оси времени - могут быть отложены дни от начала заболевания.

Болезнь 1 можно для удобства называть большое значение диагностического признака, или большая температура, а болезнь 2 - маленькое значение диагностического признака, или маленькая температура.

Для конкретного пациента, t (дни) страдающего болезнью 1, величину Рис. 2.7. диагностического признака можно находить по известному (изображенному на рисунке линией 1) математическому величина признака ожиданию диагностического признака и какому-либо, например, нормальному распределению. Таким образом, значение диагностического признака определяется в первый день заболевания. Согласно принятой модели постоянного диагностического признака, в остальные дни заболевания значение диагностического признака у этого пациента такое же, как в первый день. Величина диагностического признака для конкретного пациента в рассматриваемом варианте модельной болезни изображена на рис. 2.7.1 пунктиром.

Определение значения диагностического признака для пациента, страдающего второй болезнью, отличается только использованием другой величины математического ожидания диагностического признака. (За исключением случаев специального исследования разных распределений для болезней.) В рассмотренных болезнях - болезнях постоянного диагностического признака - диагностические признаки являются зависимыми. Это следует из предсказуемости значений диагностических признаков: зная величину диагностического признака в один из дней, можно предсказать величину диагностического признака в любой день.

Модели постоянных диагностических признаков предложены, в основном, для выяснения эффективности усреднения диагностических признаков по сравнению с использованием их как независимых.

Следующий по сложности случай, - когда при одной из болезней диагностический признак линейно изменяется, а при другой - постоянен. Такой случай, точнее, изменение математического ожидания диагностического признака в функции времени (дней с начала заболевания), изображен на рис. 2.7. 2.

Первую из изображенных на рис. 2.7.2 болезней можно называть лизменяющийся диагностический признак (пациент болен изменяющимся диагностическим признаком), вторую - постоянный диагностический признак.

Величины переменного t (дни) Рис. 2.7. диагностического признака для величина признака конкретного пациента находятся так. В первый день болезни значение диагностического признака получается случайным образом при выбранных распределении и математическом ожидании диагностического признака в первый день. Это математическое ожидание изображено на рисунке как ордината в первый день. Значения диагностического признака в остальные дни получим как ординаты линии, проходящей через ординату первого дня и параллельной изображенной на рисунке 2.7.2 линии математических ожиданий величины диагностического признака. Полученное указанным образом изменение величины диагностического признака для конкретного пациента изображено на рис. 2.7.2 пунктиром.

Пересечение (линий математического ожидания) диагностических признаков сделано специально для исследований допустимости усреднения величин диагностических признаков. Ожидается, что у больного изменяющимся диагностическим признаком (болезнь 1) мы совершим диагностическую ошибку, если будем брать пары диагностических признаков, равноудаленных от места пересечения линий диагностических признаков (пунктирной линии и линии математического ожидания болезни 2), усреднять значения диагностических признаков в этих парах и использовать усредненные значения при диагностике.

Ошибка ожидается потому, что усредненные значения переменного диагностического признака будут в точности равны диагностическому признаку при второй болезни - болезни постоянный диагностический признак.

Заметим, что величины диагностических признаков у пациента в два любых дня - достаточная информация для диагностики заболевания: если величины диагностических признаков разные, - болезнь переменный ДП, если величины одинаковые, - болезнь постоянный ДП.

До того, как у пациента определены две величины диагностического признака, диагностические признаки являются независимыми. То есть по значению диагностического признака в один из дней нельзя найти значение диагностического признака в другой день, поскольку неясно, какой болезнью пациент болен. Вместе с тем, при каждой болезни диагностические признаки зависимы: если известна болезнь (известна линия математического ожидания диагностического признака), то по одному значению диагностического признака можно предсказать его значения в любой день.

Планируется провести исследования диагностики на однопризнаковых моделях, а затем перейти к двухпризнаковым моделям. На последних, в числе прочего, планируется исследовать случай, когда диагностические признаки по отдельности свидетельствуют о разных болезнях.

Глава 3 База данных, вероятности и плотности вероятностей диагностических признаков 3.1 Характеристика статистических данных 3.1.1 Относительная частота механической и паренхиматозной желтух Были приблизительно оценены доли больных механической и паренхиматозной желтухами в общем количестве больных этими желтухами.

Имеется в виду общее количество поступивших в больницу больных паренхиматозной и механической желтухами. Оценка проведена по данным терапевтического отделения краевого гепатологического центра (больница №5).

Принято, что доля больных: паренхиматозной желтухой 1 = 0,7;

механической желтухой 2 = 0,3.

3.1.2 Диагностические признаки Методом случайной выборки были взяты 613 историй болезней обычных больных с точно установленными диагнозами (механическая или паренхиматозная желтуха) и выписаны диагностические признаки с указанием дней их определения.

Напомним, что под диагностическими признаками понимаются симптомы заболевания, клинические анализы, данные инструментальных обследований пациента;

как и ранее, в тексте употребляется сокращение ДП - диагностический признак. Всего использовалось девятнадцать диагностических признаков, в которые были включены пол и возраст пациента:

1) пол пациента;

2) возраст пациента;

3) боль;

4) кожный зуд;

5) расширение холедоха;

6) расширение внутрипеченочных ходов;

7) увеличение печени;

8) увеличение селезенки;

9) зеленый цвет печени;

10) маркеры вирусных гепатитов;

11) обтурация желчных путей (наличие опухоли, желчных камней, стриктур и т.д.);

12) наличие эффекта от предыдущего лечения;

13) билирубин непрямой (неконъюгированный);

14) билирубин прямой (конъюгированный);

15) ферменты АСАТ (аспартатаминотрансфераза);

16) ферменты АЛАТ (аланинаминотрансфераза);

17) щелочная фосфатаза;

18) сулемовая проба;

19) альбумин.

Данные выписывались в динамике, то есть симптомы, клинические анализы и данные обследований брались не только в день поступления пациента в больницу, но и в другие дни: с 1-го дня (день поступления пациента в больницу) по 50-й день (максимальный период лечения больных).

Заметим, что база данных - реальная, ДП каждого пациента определены не в каждый день болезни. То есть это результаты обычных обследований, далеких от идеальности. Отсутствие анализа для любого признака в один из дней говорит лишь о том, что анализ в этот день не был проведен. Например, некоторые анализы не сделаны, так как были сделаны недавно, а другие анализы не сделаны из-за отсутствия реактивов и т.п. Разработанные нами алгоритм и методика диагностики функционируют и в том случае, когда ДП определены не в каждый день, и когда определены не все ДП.

Все истории болезней были подняты из архива больницы №5 (больница РТП г. Барнаула;

данные выписывались под руководством одного из авторов - профессора Г.Г. Устинова).

Ниже приведена история болезни одного из пациентов. Это обычный больной с типичными диагностическими признаками, на основании которых рассчитывается диагноз (рассчитываются вероятности болезней и ставится диагноз).

№ истории болезни: ФИО: П.А.Ю.

Возраст: Дата поступления: 12.01. День выписки: 1.02. Начало болезни: Начало лечения: Комментарий: наркомания, на 20-й - состояние удовлетворительное УЗИ проводилось в следующие дни: Маркеры в 8-й день: +B Признак/день 1 4 5 8 14 15 Боль + Кожный зуд - Расширение холедоха - Увеличение печени + - Увеличение селезенки - Маркеры + Билирубин непрямой 26.00 28.00 22.00 18. Билирубин прямой 48.00 16.00 18.00 6. Ферменты АСАТ 2.00 1.00 1.10 0. Ферменты АЛАТ 5.50 2.20 2.30 0. Дадим краткий комментарий приведенным данным.

Больной П. поступил в терапевтическое отделение краевого гепатологического центра (больница №5) 12 января 2001 года. Желтуха появилась за 2 дня до поступления. В день поступления больной отмечал боли в правом подреберье (знак л+ - ДП положительный). Во время обследования врач определил увеличение печени. При лабораторном исследовании (данные анализов поступили на 4-й день) отмечено повышение содержания в крови билирубина за счет прямой фракции, значительное увеличение активности ферментов АЛAT и ACAT. На пятый день произведено ультразвуковое исследование. Установлено, что холедох не расширен, печень и селезенка не увеличены. Проведение УЗИ в динамике показало сокращение печени до нормы. Это не противоречит результатам проведенных ранее исследований, а указывает на положительную динамику течения заболевания под воздействием лечения.

У больного обнаружен HBS-антиген-маркер вирусного гепатита В. Из используемых при компьютерной диагностике ДП в представленных данных содержатся 11 диагностических признаков.

Следует отметить, что в истории болезни имеются и другие диагностические признаки, такие, например, как внутривенное употребление наркотиков, некоторые данные УЗИ, показатели анализов крови.

С накоплением статистики планируется ввести в диагностику все имеющиеся данные, что уточнит конечный результат - диагноз.

Выписанные данные 613 больных ниже используются для статистических характеристик ДП. Для диагностики используются только 564 истории болезни.

Дело в том, у остальных 49 больных в истории болезни приведено недостаточно ДП для постановки диагноза. У этих больных диагноз был поставлен не только по ДП, но и по другим данным, например, по результатам операции или вскрытия. Поэтому такие больные из базы для контроля диагностики исключены, но оставлены в базе данных для построения гистограмм.

3.2 Дискретные и непрерывные диагностические признаки, построение гистограмм 3.2.1 Дискретные и непрерывные диагностические признаки Признаки разделяются на два класса: дискретные и непрерывные.

Дискретные признаки (боль, кожный зуд, увеличение печени, потеря веса, пол и т.д.) принимают одно из четко определенных значений. В рамках диагностируемых состояний - одно из двух значений: наличие патогенного признака или его отсутствие, норма или не норма. Например, наличие или отсутствие боли, печень нормальная или увеличенная, наблюдалась или нет потеря веса. Состоянию нет (отсутствие) ставилось в соответствие число 0, состоянию да (наличие) - число 1. (Для признака пол: 0 - мужской пол, 1 - женский пол.) Медицинские данные иногда позволяют разделять дискретные признаки на 3 и более категории. Например, боль: сильная, слабая, отсутствует. Цвет печени:

розовый, коричневый, фиолетовый, зеленый. Размеры печени: уменьшена, не увеличена, увеличена на 1 см, увеличена на 2 см и т.п. Однако анализ многих историй болезней пациентов показал, что даже при двух взаимоисключающих категориях возможны различные оценки одного и тоже состояния разными врачами.

Например, врач-интерн записывает, что печень не увеличена, а заведующий отделением - напротив - печень увеличена. Так как увеличение возможных состояний дискретных признаков может привести к увеличению ошибок (в силу субъективности обследования лечащим врачом), пока принято, что дискретный признак может иметь только два значения. При этом (в ущерб детальности) повышается надежность исходных данных.

Непрерывный признак (ферменты АЛАТ, ферменты АСАТ, билирубин прямой, билирубин непрямой, щелочная фосфатаза, сулемовая проба, альбумин, возраст) характеризуется вещественным числом в определенном интервале: от минимального до максимального значений признака. Анализ величин непрерывных признаков врачом связан с медицинскими интервалами - нормами для каждого признака (кроме возраста). Каждое значение признака любого пациента, чаще всего, характеризуется так: норма, выше нормы, ниже нормы. Иногда используются дополнительные категории: много выше нормы, много ниже нормы и т.п.

паренхиматозная желтуха 0, 0, механическая желтуха 0, 0, 0, 0, + 0, - + 0, - "Ц" = "+" = печень не увеличена печень Рис. 3.2.1 Распределения ДП лувеличение печени Входящие в формулу Байеса вероятностные характеристики признаков рассчитываются после построения соответствующих гистограмм признаков для каждой болезни. Для дискретных признаков каждый интервал гистограммы - одно из возможных состояний признака. Первый интервал дискретного признака - отсутствие патологического признака, второй интервал - его наличие.

После построения гистограммы вычисляется вероятность попадания нового данного в каждый интервал. Таким образом, для каждого конкретного больного находятся вероятности ДП (положительного или отрицательного состояния) для каждой болезни. Именно эти вероятности используются в расчетах по формуле Байеса (2.4.1).

3.2.2 Особенности построения гистограмм непрерывных диагностических признаков относительная частота Математически формула Байеса позволяет использовать и вероятности и плотности вероятностей одновременно. Для использования вероятностей можно дискретизировать непрерывные признаки. То есть, разделить признак на ограниченное число интервалов (например, по медицинскому принципу: норма, ниже нормы, выше нормы) и поставить в соответствие каждому интервалу вычисляемую вероятность (а не плотность). Дискретизация связана с потерей информации, поэтому лучше использовать не вероятности непрерывно распределенных признаков, а их плотности вероятностей. Вероятностные характеристики признаков зависят от выбранных длин интервалов гистограмм, поэтому ниже изложены методики определения указанных интервалов. Для построения гистограммы с равными интервалами находятся минимально и максимально возможные значения признака. Полученная разность - размах гистограммы делится на определенное количество равных интервалов. На основании статистической базы данных рассчитывается количество пациентов, попадающих в каждый интервал (интервал значений каждого признака).

Существуют различные рекомендации по определению количества интервалов. Число интервалов является функцией объема выборки, по которой строится гистограмма. Другим условием, ограничивающим количество интервалов, является требование к минимальной высоте столбца гистограммы на каждом интервале (к минимальному числу попаданий в интервал).

В настоящей работе количество интервалов ограничено следующими условиями:

1. Количество интервалов должно быть максимально возможным, тем самым достигается наибольшая точность, приближенность к истинному распределению;

2. Высота интервала, в который попало значение признака, для которого вычисляется плотность, должна быть не меньше определенной заданной величины (при этом достигается приемлемая надежность распределений);

3. Высота каждого интервала должна быть не меньше определенной заданной величины (минимальная высота гистограммы);

4. Унимодальность гистограммы - приближение гистограммы к распределению с одним экстремумом;

5. Количество интервалов непрерывного признака должно быть не меньше трех.

Сначала количество интервалов берется максимально возможным. Если при таких интервалах указанные условия не выполняются, то интервалы укрупняются, их количество уменьшается на 1, гистограмма рассчитывается заново. Это повторяется до соблюдения условий.

Требование унимодальности объясняется тем, что анализ распределений признаков не проводится и даже не предполагается. Приводимая методика диагностики изначально разрабатывалась как универсальная, применимая для диагностики любых болезней с любыми наборами признаков. Аналитический разбор всех признаков не представляется возможным, поэтому распределения признаков принимают наиболее простую форму с одной модой. Таким образом, исключается ошибка построения неистинного мультимодального распределения, особенно в условиях малой выборки. Недостатком такого подхода является то, что при принудительном унимодальном распределении гистограмма становится более грубой, менее точно повторяющей функцию плотности распределения.

Минимально возможное количество интервалов гистограммы - два интервала.

При этом варианте автоматически достигается условие унимодальности. Но одновременно теряется прогностическая ценность распределения.

n n 90 100 x x 1 2 3 Рис. 3.2.2, 3.2.3 Примеры разбиения на интервалы гистограмм непрерывных ДП На рис. 3.2.2 гистограмма состоит из 3-х интервалов, однако условие унимодальности не сохраняется. Поэтому интервалы укрупняются, их количество уменьшается до двух (рис. 3.2.3). Если для крайних значений признака (интервалы и 3-й для рис. 3.2.2, интервалы 1 и 2-й для рис. 3.2.3) вероятности изменяются не значительно, то для средних значений вероятность изменяется от 3/20 до 1/2 и становится неотличимой от других значений. Чтобы оградить метод от подобных ошибок, когда количество интервалов уменьшается до 2, разработан следующий алгоритм. Количество интервалов принудительно увеличивается до 3, при этом интервалы гистограммы приводятся в соответствие с медицинскими интервалами признака. Обычно, это интервалы: норма (средние нормальные значения признака для человека), ниже нормы, выше нормы (рис. 3.2.4).

n x нн н вн Рис. 3.2.4 Пример построения гистограммы с медицинскими интервалами Медицинские интервалы не являются равными, но при таком разбиении признак имеет большую прогностическую ценность для врача. Предположительно и в представляемой методике диагностики качество деления на медицинские (экспертные) нормы будет лучшим, чем для двухинтервальной гистограммы.

Очевидно, что чем больше интервалов в гистограмме, тем больше она повторяет функцию плотности распределения. Однако, условие унимодальности, выполняемое безусловно, может намного сократить число интервалов и ухудшить точность вычисления плотностей. На рис. 3.2.5 условие унимодальности не выполняется полностью.

ni n x 1 2 3 4 5 6 7 8 9 10 11 12 Рис. 3.2.5 Пример построения гистограммы непрерывного ДП Причиной не унимодальности распределения является, прежде всего, нерепрезентативность выборки на пограничных значениях признака (интервалы 11, 12, 13), а не истинная бимодальность. В этом случае, укрупнение интервалов приведет только к ухудшению точности вычисления плотностей для интервалов 2 - 10, хотя для интервалов 1, 11, 12, 13 укрупнение интервалов может дать совершенно иные результаты, в отличие от имеющейся гистограммы. На основании этих данных сделано следующее предположение. Если значение признака попало в интервал, свыше высоты которого выполняется условие унимодальности (интервалы 2Ц10), а ниже нет, то вычисляемая плотность вероятности соответствует истинной.

Считается, что унимодальность относительно данного значения признака выполняется. В противном случае (значение попало в интервал 1, 11, 12, 13) интервалы необходимо укрупнять.

После того, как гистограмма построена, можно приближенно вычислить плотность вероятностей для каждого конкретного значения признака. Это отношение высоты относительных частот к длине соответствующих интервалов.

Причем в пределах одного интервала эта величина неизменна (рис. 3.2.6).

ni n x1 x2 x3 x 1 2 Рис. 3.2.6 Пример построения гистограммы непрерывного ДП Гистограмма очень грубо отражает ход графика функции плотности распределения, поэтому рассчитанные плотности для значений х1, х2, х3 из интервалы 1 будут равными. Хотя в действительности, как мы видим из рисунка, они могут отличаются в разы. Поэтому построение общей для всех значений признака гистограммы не удовлетворяет необходимой точности вычисления плотностей. Это же соображение не позволяет дискретизировать признаки. В пределах одной категории дискретизированной гистограммы истинные вероятности в середине и на концах интервала могут сильно отличаться.

Из рисунка 3.2.7 видно, что плотность вычисляется достаточно достоверно для значений признака, лежащих в центрах интервалов. Исходя из этого, разработан алгоритм, когда для каждого значения признака, для которого необходимо вычислить плотность, строится собственная отличная гистограмма. При этом, значение попадает в центр одного из интервалов. Гистограмма строится как бы вокруг значения признака (рис. 3.2.7).

ni n x1 x2 x3 x 1 2 3 ni n x1 x2 x3 x 1 2 3 Рис. 3.2.7а, 3.2.7б Примеры построения гистограммы непрерывного ДП На рис. 3.2.7а гистограмма построена вокруг значения x1, на рис. 3.2.7б вокруг значения x3. Таким образом, плотность вероятностей для значений признака, попадающих в центр интервала, вычисляется более точно. Недостатком такого подхода является увеличение времени расчета диагноза.

Предложенные в настоящем разделе алгоритмы обладают очень важным свойством: сформированные по алгоритмам гистограммы не имеют пустых интервалов, т.е. интервалов, в которые не попал ни один больной из базы данных.

(Наличие пустых интервалов губит качество диагностики.) Гистограмма без пустых интервалов получается увеличением длины интервалов на участках (на краях) гистограммы, где данных мало. Но данное увеличение интервалов не распространяется на области богатой статистики (в основном, в центре гистограммы), где интервалы, примерно, соответствуют задаче отражения истинного распределения.

3.3 Построение искусственных распределений Часто для построения распределений недостаточно статистических данных.

Эта проблема, в ряде случаев, решается введением данных из врачебного опыта (раздел 2.1.3).

Определенный у пациента диагностический признак используется в диагностике только тогда, когда для этого признака имеются достоверные гистограммы при каждой из диагностируемых болезней. Гистограмма же достоверна, если для ее построения (для вычисления плотности вероятностей) имеется не менее определенного количества данных, то есть числа больных каждой болезнью, у которых был определен именно этот признак (например, сделаны анализы билирубин прямой). Иначе говоря, объем выборки должен быть не меньше заданной величины. В противном случае согласно алгоритму признак в диагностике не участвует, так как вычисленная по малой выборке плотность не является достоверной.

Такая ситуация может иметь место и для некоторых ДП, представляющих большую ценность для диагностики. Игнорирование таких признаков ухудшает диагностику, а в отдельных случаях приводит к неверным результатам.

В рамках статистической базы это относится к признакам: зеленый цвет печени, маркеры, обтурация желчных путей, отсутствие эффекта лечения от паренхиматозной желтухи.

Рассмотрим гистограммы признака зеленый цвет печени.

n n 3 0 21 x x - + - + а б Рис. 3.3.1 Гистограммы дискретного ДП зеленый цвет печени:

а) паренхиматозная желтуха;

б) механическая желтуха.

На каждом столбце гистограммы написано число больных На рис. 3.3.1а гистограмма признака зеленый цвет печени для паренхиматозной желтухи, на рис. 3.3.1б - для механической желтухи. По гистограмме видно, что положительное значение признака зеленый цвет печени не встречается у больных паренхиматозной желтухой. Напротив, при механической желтухе ДП зеленый цвет печени наблюдается часто.

Нулевое количество больных механической желтухой с ДП зеленый цвет печени - с позиций теории вероятностей мало похоже на реальность и, скорее, говорит о малой выборке. Диагностика по формуле Байеса с использованием этого распределения приведет к нулевому числителю и соответственно нулевой вероятности одной из болезней, что также мало реально. Вопрос нулевых вероятностей поднимался с самого начала исследований. Было принято решение: не допускать нулевых данных в распределении (не допускать нулевых столбцов диаграмм). Реализация этого принципа для непрерывно распределенных ДП изложена в предыдущем разделе. Для дискретных ДП вместо нулевого значения указывается какое-либо очень малое число больных.

Ввиду перечисленных обстоятельств, были применены выработанные принципы: вместо нулевого значения указать малое число больных и использовать медицинские знания для дополнения статистики. Согласно многолетним врачебным наблюдениям одного из авторов - профессора Г.Г. Устинова, примерно, у одного из ста больных паренхиматозной желтухой бывает зеленый цвет печени. Это больные с холестатическим вариантом течения паренхиматозной желтухи. На основании этого врачебного опыта сформировано более реальное распределение, изображенное гистограммой рисунка 3.3.2, которая (гистограмма) отличается от гистограммы, изображенной на рис. 3.3.1а.

n 100 x - + Рис. 3.3.2 Гистограмма ДП зеленый цвет печени для паренхиматозной желтухи, построенная с учетом медицинских рекомендаций Для настоящей методики применение искусственных распределений, построенных с учетом мнения специалиста, позволило достичь лучшей диагностики, чем применение эмпирических гистограмм, полученных на основе малой выборки. Так и должно было случиться: имеющихся данных для паренхиматозной желтухи было недостаточно, следовательно, не было оснований использовать важный диагностический признак. Искусственное распределение позволило этот признак использовать, что и повысило качество диагностики.

Заметим, что важность признака для дифференциальной диагностики - это его уникальность - близость к нулю вероятности одного из значений ДП [89].

Коррекция распределений проводилась только для тех признаков, которые являются крайне информативными в диагностике и часто оказываются решающими для диагноза.

Другие, не столь диагностически ценные признаки, без нулевых вероятностей, с малой выборкой для построения гистограмм, предпочтительнее игнорировать.

Достоверность искусственных распределений так же небезупречна, как и гистограмм с малой выборкой. Однако использование искусственных распределений позволяет свести к минимуму грубые ошибки. В приведенном примере вероятность зеленого цвета печени у больных паренхиматозной желтухой действительно не нулевая, в отличие от вероятностей эмпирического распределения, и, соответственно, сохраняется возможность постановки диагноза паренхиматозная желтуха у больного с зеленым цветом печени.

Не составляет труда построить искусственные распределения для дискретных признаков (на основании экспертных оценок). Но и для непрерывных признаков возможно построение искусственных гистограмм, например, в пределах медицинских интервалов: норма, ниже нормы, выше нормы.

3.4 Построение многомерных распределений Целесообразность использования многомерных распределений изложена в разделе 2.2. В условиях реальной статистической базы удавалось построить многомерные признаки, включающие 2, 3, изредка 4 и 5 признаков.

Построение многомерного распределения рассмотрим на примере построения двумерного ДП АЛАТ-АСАТ.

1. Независимо друг от друга строятся гистограммы анализов АЛАТ и АСАТ по приведенным выше правилам построения одномерных распределений.

2. а) Определяется тот интервал гистограммы для АЛАТ, к которому относится значение АЛАТ пациента N.

б) Так же находится интервал для АСАТ.

3. Далее определяются все пациенты, значения признаков которых попадают в найденные интервалы.

4. Проверяется условие: число таких пациентов (высота интервала) должно быть не меньше определенной заданной величины (по крайней мере, не быть нулевым):

а) если условие не выполняется, тогда количество интервалов гистограмм для АЛАТ и АСАТ уменьшается, гистограммы строятся заново и происходит возврат к пункту 2;

б) если условие выполняется, тогда рассчитывается вероятность (плотность вероятности) двумерного признака.

Для иллюстрации приведем одномерные гистограммы признаков АЛАТ и АСАТ пациента N.

Интервалы 1 2 3 4 5 6 7 8 Рис. 3.4.1 Гистограмма ДП ферменты АСАТ для паренхиматозной желтухи Размер выборки (количество больных паренхиматозной желтухой, у которых есть анализ АСАТ) - 248. Признак пациента N попал во 2-й интервал. Высота интервала (число пациентов, у которых признаки попадают в этот же интервал) - 28.

Длина интервала 0.52. Плотность вероятности 0.22.

Интервалы 1 2 3 4 5 6 7 8 9 10 Рис. 3.4.2 Гистограмма ДП ферменты АЛАТ для паренхиматозной желтухи Выборка 257. Признак пациента попал во 2-й интервал. Высота интервала 4.

Длина интервала 0.62. Плотность вероятности 0.025.

Интервалы 1 2 3 4 5 6 7 8 9 Рис. 3.4.3 Гистограмма ДП ферменты АСАТ для механической желтухи Выборка 160. Признак пациента попал в 4-й интервал. Высота интервала 21.

Длина интервала 0.32. Плотность вероятности 0.41.

Интервалы Рис. 3.4.4 Гистограмма ДП ферменты АЛАТ для механической желтухи Выборка 159. Признак пациента попал во 2-й интервал. Высота интервала 87.

Длина интервала 1.22. Плотность вероятности 0.45.

Ниже приведены гистограммы двумерного ДП АЛАТ-АСАТ.

Р Р6 Интервалы Интервалы Р Р по АСАТ по АЛАТ Р Р Р Рис. 3.4.5 Гистограмма двумерного ДП АСАТ-АЛАТ для паренхиматозной желтухи Размер выборки (количество больных паренхиматозной желтухой, у которых есть анализы и АЛАТ и АСАТ) - 248. Признаки пациента N попали во 2-й интервал по АСАТ и во 2-й интервал по АЛАТ. Высота интервала 3. Длина интервала 0. по АСАТ и 1.0 по АЛАТ. Плотность вероятности 0.015.

Интервалы 6 по АЛАТ Интервалы по АСАТ Рис. 3.4.6 Гистограмма двумерного ДП АСАТ-АЛАТ для механической желтухи Выборка 159. Признаки пациента N попали в 4-й интервал по АСАТ и во 2-й интервал по АЛАТ. Высота интервала 9. Длина интервала 0.32 по АСАТ и 1.22 по АЛАТ. Плотность вероятности 0.144.

Гистограммы рассчитываются отдельно для всех признаков (включая многомерные) каждого пациента при каждой из болезней.

Для построения двумерной гистограммы для паренхиматозной желтухи использовалось 7 интервалов для АСАТ и 7 интервалов для АЛАТ. Только при таком делении размаха признаков данный пациент попадает в интервал с минимальной высотой (не менее определенной величины, согласно правилу 4).

Только при таком разбиении мы считаем двумерное распределение представительным и отражающим реальность.

Для одномерных гистограмм признаков АСАТ и АЛАТ количество интервалов - 9 и 11 соответственно.

Таким образом, гистограммы признаков АЛАТ и АСАТ, не объединенных в двумерный признак, могут быть отличны от одномерных сечений гистограммы тех же признаков, объединенных в двумерный признак. Как правило, количество интервалов в гистограммах многомерного признака меньше, чем количество интервалов гистограмм одномерных признаков. Отметим, что для построения Р Р Р Р Р Р Р Р Р Р надежного n-мерного распределения требуется большее количество данных, в n- порядков превышающее количество данных при построении надежного одномерного распределения. Рассчитанные вероятности (плотности вероятностей) многомерных признаков получаются менее точными, чем вероятности одномерных.

Погрешности, возникающие при расчетах, снижают эффект от использования многомерных распределений.

При расчете вероятностей заболеваний используются данные обычных обследований больных, т.е. не полные комплексы признаков и анализов, определенных не в каждый день болезни. Часто возникает ситуация, когда можно построить отдельные гистограммы двух признаков, но статистическая база данных не позволяет построить двумерную гистограмму этих же признаков. Это ограничивает возможность использования многомерных распределений. На данный момент база, собранная из 613 пациентов, позволяет строить многомерные распределения из 2-3 признаков, в редких случаях, из 4-5 признаков.

Неполная, ограниченная база данных приводит к тому, что для построения одномерных гистограмм каждого из двух признаков имеется значительно больше данных, чем для построения двумерной гистограммы тех же признаков. То есть снижается точность вычисления вероятностей двумерного ДП.

3.5 Особенности работы со статистической базой данных В собранной базе данных для каждого ДП (анализа) указан день, в который ДП определен (день, когда взят анализ). Дни, в которые определены ДП, должны отсчитываться от дня начала заболевания. К сожалению, этот день по истории болезни, в основном, не удается установить, и за день начала заболевания принимается день поступления в больницу. Каждый признак может быть определен (анализ может быть сделан) один или несколько раз, а может быть не сделан вообще в течение всей болезни.

Отсутствие признака (анализа) в один из дней говорит лишь о том, что он в этот день не определялся. Предложенная методика работоспособна и при отсутствии ДП в некоторые дни и, практически, при любой имеющейся в наличии информации.

Но, предполагается, что каждый дополнительный признак, любая новая информация уточняют конечный результат - диагноз.

Несмотря на солидный объем собранных данных, остро стоит проблема нехватки или отсутствия статистики для диагностики, для построения распределений. Учет динамики с помощью формулы Байеса требует построения распределения i-го признака для j-й болезни в каждый из дней заболевания. Но, практически, из-за малого числа анализов приходилось объединять признаки за несколько (2 - 5) дней. При этом определяемое данное может усредняться, а может принимать ближайшее значение к указанному дню.

Здесь очень полезно использовать распространяемость признаков. Дело в том, что часть ДП в некоторый период не меняется и, определив ДП, можно использовать его не только в день определения, но и в некоторые другие дни. Так, маркеры, появившись, не меняют свое значение до смерти. Обтурацию желчных путей, расширение холедоха и расширение внутрипеченочных ходов можно распространить на ближайшие пару дней до и после дня определения, а чаще - до операции. Зеленый цвет печени наблюдается как минимум 2 - 3 дня до и после определения. Также можно распространить и многие другие дискретные признаки.

Но признаки боль, зуд, лувеличение печени могут меняться ежедневно, поэтому они не распространяются.

Предположить состояние признаков боль, зуд можно и по отсутствию данных. Обычно лечащий врач, записывая историю болезни, регистрирует жалобы больного. Если больной не жалуется на боль или зуд, врач эти данные не записывает. Очевидно, что отсутствие данных - это синоним отсутствия боли и зуда. В диагностирующей программе можно учесть подобные особенности медицинских данных и увеличить размер выборки.

Хорошим, годным для диагностики, считалось распределение, для которого имелось не менее определенного количества данных статистики. В ином случае существует два варианта.

1) Не использовать при диагностике это распределение и сам признак.

2) Использовать искусственное распределение, построенное не по данным статистики, а в результате опроса эксперта - врача. На основании мнения специалиста, можно создать не очень точные, но весьма полезные распределения признаков (см. раздел 3.3 Искусственные распределения).

Другой вопрос, который возникает в связи с нехваткой данных: что делать с признаком, значение которого попало в такую малонаселенную область статистики, где, согласно гистограмме, вероятность или плотность вероятности равна нулю. Использование нулей в формуле Байеса может привести к абсолютно неверной диагностике. Вероятность болезни, для которой имеет место такое распределение, была бы также равна нулю. Даже, несмотря на то, что другие признаки могли говорить ЗА эту болезнь. Изложенное показывает, что плотность вероятности любого признака не должна быть нулевой. Это должно быть какое-то малое число. Про конкретный выбор малого числа можно сказать, что он (выбор) субъективен, слабо влияет на результат, может быть осуществлен экспериментально. В настоящей работе, чтобы избежать проблем с интервалами гистограммы, в которых количество больных нулевое, используются алгоритмы раздела 3.2.2. Без этих алгоритмов для выбора обсуждаемых малых чисел рекомендуется следующее.

Во-первых, должны быть проанализированы распределения признака при разных болезнях. Для одной болезни может отмечаться отсутствие приближенных к значению признака данных, тогда как для другой таких данных может быть достаточно. В этом случае значение признака более характерно для второй болезни, чем для первой. Это отражает реальное состояние в природе. Тогда плотность вероятности первой болезни устанавливается в зависимости от соседнего ненулевого значения плотности. Если данных статистики недостаточно для обеих болезней, то делается вывод, что значение признака не характерно ни для одной из болезней, такого значения признака в природе не бывает, и признак в диагностике не участвует.

Предусмотрен еще один подход к обработке дискретных признаков. Это переход от рассмотрения признака во множестве дней к одному признаку, для которого динамика не учитывается. Например, переход от признака боль в разные дни к признаку была ли боль. То есть рассматриваются те пациенты, у которых за время болезни хотя бы единожды регистрировалась боль, и вычисляется доля таких пациентов среди всех пациентов. Данный подход уменьшает погрешности распределения, оно становится менее зависимым от лабораторных ошибок, ошибок осмотра пациента (но, конечно, динамика теряется).

3.6 Исследование взаимозависимости диагностических признаков 3.6.1 Независимые и зависимые диагностические признаки в формуле Байеса При диагностических расчетах по формуле Байеса распространено грубое приближение: ДП болезни считаются независимыми, хотя в общем случае в едином организме независимость признаков исключена. Независимые ДП это, видимо, слабо зависимые признаки. Не исключена зависимость каждого из этих признаков от какого-либо ДП или зависимость третьего признака от совокупности указанных двух.

Два признака можно считать независимыми, если их линейная корреляция (оцениваемая коэффициентом Пирсона) близка к нулю или подтверждается гипотеза (хи-квадрат) о независимости признаков.

Оценить взаимозависимость всего набора признаков не представляется возможным из-за ограниченности статистической базы. В рамках имеющихся данных по механической и паренхиматозной желтухам допустим учет взаимозависимостей трех, редко четырех признаков. Причем для различных видов желтухи (диагностируемых состояний) будут различны степени зависимости одних и тех же диагностических признаков.

Далее рассчитывается взаимозависимость различных признаков в первый день болезни без учета динамики болезней. (То есть рассматриваются признаки АЛАТ в 1-й день, АСАТ в 1-й день, боль в 1-й день, Е Остальные дни не рассматриваются). Были проанализированы все пары признаков для обеих болезней с помощью метода (хи-квадрат) и определения корреляции. Полученные результаты сведены в таблицы взаимозависимостей признаков.

Таблица 3. Результаты анализа методом независимости пар ДП при паренхиматозной желтухе 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 # + + + - + ? + + ? + + + + ? + + + + 2 + # + + + + ? + ? ? + + + + ? + ? + + 3 + + # - + + ? + + ? + + + + ? + ? - + 4 + + - # + - ? + ? ? - - + + ? + ? - ?

5 - + + + # + ? + + ? + + + + ? + + + + 6 + + + - + # ? + ? ? + + + + ? + ? + ?

7 ? ? ? ? ? ? # ? ? ? ? ? ? ? ? ? ? ? ?

8 + + + + + + ? # + ? + + + + ? + ? + - 9 + ? + ? + ? ? + # ? - - + - ? ? ? + ?

10 ? ? ? ? ? ? ? ? ? # ? ? ? ? ? ? ? ? ?

11 + + + - + + ? + - ? # - - + ? - + + + 12 + + + - + + ? + - ? - # + + ? - + + + 13 + + + + + + ? + + ? - + # - ? + - + + 14 + + + + + + ? + - ? + + - # ? + + + + 15 ? ? ? ? ? ? ? ? ? ? ? ? ? ? # ? ? ? ?

16 + + + + + + ? + ? ? - - + + ? # + + ?

17 + ? ? ? + ? ? ? ? ? + + - + ? + # + ?

18 + + - - + + ? + + ? + + + + ? + + # + 19 + + + ? + ? ? - ? ? + + + + ? ? ? + # Таблица 3. Результаты анализа методом независимости пар ДП при механической желтухе 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 # + + + + + + ? - ? + + + + + + + + ?

2 + # + + - + + ? ? ? + - + + - - ? + ?

3 + + # - + + + ? - ? + + + + + + + + ?

4 + + - # + + + ? - ? + - + + + + + + ?

5 + - + + # + - - + ? - - + + + + + - ?

6 + + + + + # + ? ? ? + + + - + + + + ?

7 + + + + - + # ? ? ? + + - + ? + + + ?

8 ? ? ? ? - ? ? # ? ? ? ? ? ? ? ? ? ? ?

9 - ? - - + ? ? ? # ? + + + + ? ? ? + ?

10 ? ? ? ? ? ? ? ? ? # ? ? ? ? ? ? ? ? ?

11 + + + + - + + ? + ? # - - + + + + + ?

12 + - + - - + + ? + ? - # - - + + + + ?

13 + + + + + + - ? + ? - - # - + + + + ?

14 + + + + + - + ? + ? + - - # + + + + ?

15 + - + + + + ? ? ? ? + + + + # + ? + ?

16 + - + + + + + ? ? ? + + + + + # + - ?

17 + ? + + + + + ? ? ? + + + + ? + # + ?

18 + + + + - + + ? + ? + + + + + - + # ?

Номера строк и столбцов соответствуют нумерации ДП в разделе 3.1. л+ означает, что два признака независимы, - означает, что признаки зависимы, знак л? говорит о том, что характер зависимости определить не удалось.

Корреляция двух признаков позволяет количественно определить степень зависимости.

Таблица. 3. Корреляции ДП при паренхиматозной желтухе Таблица. 3. Корреляции ДП при механической желтухе Вычисление корреляции возможно уже при наличии трех значений ДП, но надежность выводов, основанных на малой выборке, недостаточна. Статистически значимые, надежные корреляции ( p <0,05) отмечены жирным шрифтом. Все ДП распределены по нормальному закону.

Для примера анализа полученных данных отметим, что при паренхиматозной желтухе наиболее коррелируют следующие пары ДП: 11 - 12 (билирубин непрямой и прямой, r =0,64), 13 - 14 (ферменты АЛАТ и АСАТ, r =0,55), 13 - 17 (ферменты АЛАТ и альбумин, r =0,86), 17 - 18 (альбумин и возраст, r =0,79) и др.

3.6.2 Экспертная оценка зависимости признаков Хи-квадрат и корреляция являются статистическими методами оценки взаимозависимостей и представляют собой феноменологическую меру. Для установления причинно-следственной связи между переменными необходимо использовать другие методы.

Экспертная оценка взаимозависимости признаков с учетом причинной связи между ними и патофизиологии была сделана одним из авторов - д. м. н., профессором Г.Г. Устиновым.

Из сравнения полученных тремя методами (хи-квадрат, корреляция, экспертная оценка) таблиц взаимозависимостей признаков видно, что мнение эксперта часто не подтверждает статистические результаты. Исходя из вышеописанных проблем определения взаимозависимостей признаков, более достоверными считаются выводы эксперта. Однако применение лишь экспертных оценок, без учета реально собранной базы данных, может приводить к неадекватным, противоречивым результатам. Поэтому достоверными считаются такие зависимости признаков, которые получены из всех источников и не противоречат друг другу.

3.6.3 Наборы (ядра) независимых признаков Метод (хи-квадрат) и экспертные заключения не позволяют количественно оценить зависимости признаков. Возможна лишь дифференциация пары признаков либо как независимых, либо как зависимых.

Далее, в качестве первого приближения и ввиду недостаточной надежности определения степени взаимозависимости диагностических признаков разделим признаки на абсолютно независимые и абсолютно зависимые. В реальности же, зависимости не настолько категоричны, это показывает корреляция признаков.

По таблицам взаимозависимостей признаков можно для каждой болезни выделить наборы признаков, в которых все признаки будут между собой независимыми.

Так, по таблице 3.1 можно найти максимум 7 взаимонезависимых признаков (независимых при паренхиматозной желтухе). Например, независим в совокупности набор из признаков: 2, 5, 6, 8, 14, 16, 18. Это ДП: кожный зуд, увеличение печени, увеличение селезенки, маркеры, ферменты АЛАТ, сулемовая проба, возраст. В данном наборе все ДП между собой взаимонезависимы. Из таблицы 3.2 находится набор признаков, также состоящий из 7 взаимонезависимых признаков (независимых при механической желтухе). Например, независимы ДП: 1, 4, 7, 11, 14, 17, 18. Это диагностические признаки: боль, расширение внутренних печеночных ходов, зеленый цвет печени, билирубин непрямой, ферменты АЛАТ, альбумин, возраст.

Определим каждый такой набор признаков как лядро взаимонезависимых признаков. Очевидно, что в формулу Байеса для независимых признаков должны входить только ядра. Все остальные признаки, не входящие в состав ядра (и соответственно в формулу Байеса), считаются абсолютно зависимыми признаками от ядра. При этом, как уже указывалось, реально таблицы не определяют абсолютно все ядра признаков, а сами признаки внутри ядра не являются абсолютно взаимонезависимыми. Таким образом, возможно существование ядер признаков, которые не могут быть получены из таблиц, но, зависимость которых более близка к определению лабсолютно независимые. Такие ядра не всегда могут быть получены с помощью статистических методов.

Из таблиц взаимозависимостей выделяется множество ядер независимых признаков. Причем для каждой болезни существует собственное множество ядер.

По имеющейся статистике выделены ядра - величиной от двух (пара независимых) до семи (максимальное количество взаимонезависимых) признаков. (При количестве ДП в ядре больше двух существует много вариантов ядер, имеющих одинаковое число ДП, но разные наборы признаков.) У данного подхода имеется существенный недостаток. После определения наилучшего ядра, предполагается, что оно будет использоваться при диагностике каждого пациента. То есть требуется, чтобы набор признаков больного соответствовал признакам ядра. На практике не всегда возможно проведение всех требуемых клинических анализов, биохимических тестов и т.д. Поэтому реальные данные истории болезни часто не удовлетворяют этому требованию. База тестирования, с которой проводились эксперименты для выявления наилучших ядер, тоже имеет не полные наборы данных. В расчете вероятности болезни конкретного больного из базы тестирования участвуют только те признаки, которые были в наличии у этого больного. Набор реальных признаков пациента редко совпадает с ядром.

Использование неполного ядра реальных данных больного нередко становилось причиной ошибок диагностики, в то же время учет других признаков больного, не включенных в ядро, позволял, напротив, получить верный диагноз.

Таким образом, в качестве набора признаков, по которым производится диагностика, следует использовать ядра, выделенные не из всех ДП, а из ДП конкретного больного. Соответственно и база тестирования должна состоять из больных с таким же набором ДП.

Глава 4 Учет динамики заболеваний при диагностике 4.1 Методика учета динамики и взаимозависимость диагностических признаков Согласно изложенной в разделах 2.4.1, 2.4.2 методике в отличие от известных работ для расчетов вероятностей болезней больного по формуле Байеса используются не только диагностические признаки в день поступления пациента больницу, но и в другие дни. Если признак (симптом или анализ) у больного определяется многократно, то для диагностики используются все его значения.

Таким образом, учитывается, что распределения признаков при заболевании и признаки пациента меняются в течение болезни, зависят от времени - от числа дней, прошедших с начала заболевания.

дни 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Рис. 4.1.1 График диагностического признака (анализа) билирубин непрямой пациента N в динамике На рис. 4.1.1 видно, как изменяется билирубин одного из пациентов со временем. Анализы определялись 7 раз: в 1, 2, 5, 6, 12, 19 и 23-й дни. В остальные дни анализы неизвестны. (Принципиальное отличие авторской методики диагностики состоит в том, что не требуется направлять больного на недостающий для работы программы анализ. Программа работоспособна и при отсутствии части ДП, диагноз ставится по той информации, которая имеется в наличии.) Согласно предложенной методике полагается, что билирубин в 1-й день - это один диагностический признак, билирубин во 2-й день - это другой диагностический мкмоль /л признак, билирубин в 5-й день - также новый признак и т.д. Все симптомы и анализы выписывались в динамике за 50 дней, следовательно, каждый симптом или анализ теоретически может дать до 50 различных диагностических признаков. Учет динамики позволяет использовать вместо 19 исходных признаков - гораздо больше - до 950 диагностических признаков (50 дней на 19 симптомов). Такой скачок в увеличении данных, по которым рассчитывается диагноз, конечно, теоретический, предельный;

реальное увеличение числа используемых ДП меньше, у нас при диагностике желтух число исходных данных повысилось раз в пять, что (как показано в следующих главах) привело к ощутимому преимуществу в диагностике.

Из предложенной методики учета динамики заболеваний практически реализованы первое и второе приближения. (В такой терминологии известные методики, не учитывающие динамику, считаем нулевым приближением.) Первое приближение рассматривает каждое последующее (в другой день) определение одного и того же ДП как определение нового независимого ДП. То есть один и тот же ДП, определенный в два разных дня, понимается как два абсолютно разных и независимых признака.

Вместе с тем, очевидно, что определенные в соседние дни величины одного и того же признака должны (за исключением особых случаев) сильно коррелировать между собой. (В приведенном примере должны коррелировать ДП в 1 и во 2-й дни, в 5 и в 6-й дни, в 21 и в 22-й дни и т.д.). Естественно, что два анализа, два определения в соседние (близкие) дни одного и того же признака взаимозависимы.

Но чем больше проходит дней между двумя анализами, тем меньшая связь между ними наблюдается. Это обусловлено возрастающим влиянием на ДП разных факторов (лечения, развития болезни и др.) в интервале между анализами.

Высказанные соображения иллюстрируются данными двух следующих рисунков.

1. 0. 0. 0. 0. дни 0. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Рис. 4.1.2 График корреляции признаков АЛАТ в n-й день от АЛАТ в 1-й день при паренхиматозной желтухе Корреляция д. признака АЛАТ "от первого дня" 1. 0. 0. 0. 0. дни 0. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Рис. 4.1.3 График корреляции признаков АЛАТ в n -й день от АЛАТ в 1-й день при механической желтухе На графике 4.1.2 показано, как меняется корреляция признаков (анализов) ферменты АЛАТ во все дни от признака АЛАТ в 1-й день при паренхиматозной желтухе. ДП АЛАТ во 2-й день сильно зависим от анализа АЛАТ в 1-й день, коэффициент корреляции Уr Ф равен 0,78. Зависимость АЛАТ в 3-й день от АЛАТ в 1-й день уже не столь явная: r =0,56. Начиная с 4-го дня зависимость - слабая, r <0,4.

При механической желтухе зависимости признаков несколько иные - график 4.1.3. Корреляция признаков АЛАТ во 2-й и АЛАТ в 1-й день при механической желтухе менее выражена, чем при паренхиматозной, r =0,48.

Зависимость АЛАТ в 1-й день и АЛАТ в 3-й день практически отсутствует, r =0,2. Но на 5-й день корреляция вновь сильна: признаки АЛАТ в 1-й день и АЛАТ в 5-й день сильно зависимы, r =0,83. Однако, в среднем, и при механической желтухе с увеличением интервала корреляция ослабевает.

При диагностике, включая расчеты вероятностей болезней по формуле Байеса, следует учитывать взаимозависимость всех признаков, в том числе и взаимозависимость одноименных (одних и тех же) симптомов или клинических анализов, определенных в соседние дни. Учет взаимозависимости ДП позволяет при диагностике правильно использовать данные о их динамике (данные многократных определений ДП). Более того, учет взаимозависимости ДП является ключом решения проблемы использования многократно определяемых (или повторно определяемых), а также дублирующих диагностических признаков. Под дублирующими ДП понимаются сильно зависимые признаки, в том числе такие, которые являются, скорее, контрольными. Модель предельного случая дублирующих ДП - измерение температуры иным термометром. Покажем важность проблемы использования многократно определяемых признаков на примере. Пусть какой-либо диагностический признак изменяется медленно: его изменение заметно лишь по прошествии дней. Если такой признак измерять (в какой-либо день) каждую минуту, то следующее измерение будет зависеть от предыдущего и даже повторять, дублировать его. Такие повторные измерения не добавят существенно новой информации. В то же время, в силу особенностей формулы Байеса и при принятом использовании диагностических признаков как независимых, многократно (повторно) определенные диагностические признаки повлияют на диагностику.

Диагностика даже может из правильной стать неверной. (Если ДП влияет в сторону неверного диагноза, но это влияние компенсируется другими ДП, то многократное повторное определение данного признака приведет к изменению диагноза на неверный.) Эта проблема более подробно рассмотрена в следующем параграфе.

4.2 Диагностика при многократном определении признака Нередко симптомы, результаты анализов и инструментальных методов исследования больного противоречивы: среди них существуют признаки, которые оспаривают диагноз. Рассмотрим набор симптомов, клинических анализов и данных инструментальных обследований пациентки N.

Признак/день 1 4 Боль + Кожный зуд - Расширение холедоха - Увеличение печени - Увеличение селезенки - Зеленый цвет печени - Билирубин непрямой 38.00 30.00 14. Билирубин прямой 94.00 50.00 27. Ферменты АСАТ 1.10 0.80 0. Ферменты АЛАТ 2.10 2.80 2. Сулемовая проба 2.00 1.90 1. Возраст 74. Пол Ж Здесь л+ - ДП положительный, - - ДП отрицательный.

Пациентка болела механической желтухой и от нее была вылечена. Программа диагностики на основании вышеприведенных реальных данных пациентки (только тех, что имеются в наличии) поставила компьютерный диагноз механическая желтуха.

Вероятность механической желтухи, рассчитанная по формуле Байеса, по диагностическим признакам первого дня обследования составила 0,95;

по ДП первого и четвертого дней - 0,96, по ДП всех дней (первого, четвертого и седьмого) - 0,94. (В данном случае включение в исходные данные динамики ДП не привело к повышению точности диагностики. Это не противоречит выводу о повышении правильности диагностики с учетом динамики. Вывод подтвержден в среднем, а у конкретного больного не проявился, скорее всего, из-за сравнительно более подробного обследования в первый день).

Чтобы яснее понять ларгументы методики и программы при постановке диагноза проводятся оценки влияния каждого ДП на постановку диагноза, так сказать, ларгументы в пользу болезни. Оценки влияния отдельных ДП на вероятность каждой болезни проводились по методике, изложенной в разделе 2.6.3;

осуществлялась оценка (диагностика) только по одному ДП без участия остальных признаков.

Рассчитанные лоценки влияния ДП показали, что диагноз механическая желтуха поставлен в значительной мере из-за возраста больной, оценочная степень влияния - 14 раз. Большой вклад в диагностику внесла информация о ДП ферменты АЛАТ, ферменты АСАТ, билирубин и др.

Перейдем к ДП, свидетельствующим против правильного диагноза (против механической желтухи). Из таких ДП самым сильным для данной пациентки является отсутствие признака расширение холедоха. Положительное значение признака встречается в 15 раз чаще у больных механической желтухой, чем у больных паренхиматозной. Отрицательное - в 6 раз чаще при паренхиматозной желтухе. У приведенной больной этот ДП - отрицательный - холедох не расширен, что говорит не в пользу диагноза. Оценка степени влияния этого ДП против диагноза - 6 раз.

Признак расширение холедоха определялся один раз, в 1-й день. В данном разделе исследуется влияние многократного определения ДП на диагноз. Для этого исследования полезно рассмотреть искусственное увеличение числа наблюдений ДП расширение холедоха. Будем считать, что холедох не расширен и в последующие дни. Эти искусственные данные вполне возможны: холедох не был расширен в день поступления в больницу, и на фоне лечения отсутствие расширения могло сохраниться. Если использовать эту информацию в программе, то компьютерный диагноз на третий день болезни будет следующим: механическая желтуха с вероятностью 0,89. То есть, если дополнительно использовать отрицательное значение ДП расширение холедоха во 2 и 3-й дни, диагноз изменится на неопределенный. Если же учитывать значение признака и в последующие дни, то на 10-й день диагноз из неопределенного станет неверным.

При искусственном распространении отрицательного значения ДП расширение холедоха на 11, 12-й день и т.д., вероятность верного диагноза будет приближаться к нулю, неправильного - к единице. Данный пример иллюстрирует, что неизменный ДП нужно использовать один раз.

Очевидно, что чем больше проведено измерений одного признака в течение всей болезни, тем сильнее он (если его измерения рассматривать как совокупность разных и независимых признаков) влияет на результат диагностики.

Рассмотрим повторные измерения признака, который мало меняется или даже не изменяется определенное время. Например (точнее, в гипотетическом нереальном примере), тест на АЛАТ можно проводить несколько раз через каждые минут. Результат будет практически неизменен, и повторное измерение признака новой информации для диагностики не даст. В этой ситуации нельзя каждое измерение воспринимать как новый признак, так как исследуемые новые измерения признака сильно (абсолютно) зависимы от предыдущих измерений.

Согласно предлагаемой методике при сильной взаимозависимости ДП, в том числе при сильной зависимости повторно определенных величин одноименного ДП от первично определенной величины, необходимо учитывать эту взаимозависимость (условную вероятность или степень зависимости одного относительно другого). При недостатке данных (когда корреляцию и условную вероятность нельзя достоверно определить) стоит воспользоваться предложенным вторым приближением, состоящим в усреднении близких по времени результатов определения ДП.

Усредняются величины ДП, что представляется предпочтительным по сравнению с усреднением плотностей вероятностей ДП. (Предпочтительность усреднения величин ДП особенно наглядна в случае, когда два ДП находятся по разные стороны от математического ожидания: первично определенный ДП больше, а повторно определенный меньше математического ожидания.) Заметим, что в силу погрешностей измерений, первично и повторно определенные значения признака не будут абсолютно равными, и усреднение повысит достоверность величины ДП.

(О применении аналогичного усреднения для построения распределений при отсутствии достаточной статистической базы говорилось выше, в разделе 3.5.) Другой путь учета динамики (использования многократных измерений ДП) состоит в построении многомерного распределения из многократно определенных признаков. При этом в диагностике вместо комплекса одномерных повторных признаков используется один многомерный признак. Так как значения повторных признаков близки, то в получившейся многомерной таблице все пациенты будут распределены вблизи диагонали.

Для каждой болезни и для каждого признака можно определить характерные интервалы дней, в течение которых анализы неизменны. Например, признак маркеры для обеих болезней неизменен длительное время с момента его появления. Повторные измерения признака в острый период болезни абсолютно зависимы между собой, не дают новой диагностической информации, поэтому маркеры усредняются в один признак из всех 10 рассматриваемых дней. К аналогичным признакам можно отнести возраст и пол. Для других признаков более сложно определить характерные интервалы постоянства значений признаков. По крайней мере, можно усреднить признаки за наименьший характерный интервал дней из двух болезней.

Возникает задача по определению характерных для каждой болезни и каждого признака интервалов дней, в течение которых величина признака не меняется, постоянна. (Повторим, что представлять многократные измерения признака как один признак рационально тогда, когда результаты многократных измерений признака сильно взаимозависимы.) Существуют признаки (дискретные), для которых определение таких интервалов не вызывает затруднений. Определить эти интервалы может медик - эксперт. Для других ДП указанные интервалы могут быть определены с использованием корреляционной матрицы каждого признака за все дней.

Таблица 4. Корреляционная матрица признака билирубин прямой за 10 дней.

Значения коэффициента корреляции для некоторых соседних дней не значимы, что является результатом малого количества данных, на основании которых выполнен анализ. Матрица показывает слабую взаимозависимость 1 и 2-го дней. Сильно зависимы дни: 2-4-5, 3-4-5-6-7-8-9, 4-8-9, 5-7-9, 6-8-9, 7-8-9, 8-9, 9-10.

Можно выделить следующие характерные интервалы дней признака: 1, 2, 3-4-5-6-7, 8-9-10.

В дальнейшем, если необходимо поставить диагноз пациенту, которому сделаны анализы билирубина в 1, 3, 6, 7-й дни, то для расчетов берется значение признака 1-й день и усредненное значение за 3, 6, 7-й дни.

Такой подход требует специального рассмотрения динамики всех признаков для каждой болезни.

В условиях ограниченной неполной статистики следует усреднять близкие по времени (повторные) значения признака: сильно зависимые признаки усредняются, слабо зависимые считаются независимыми. Проведенные исследования и анализ зависимости ДП позволили приближенно сформулировать следующие рекомендации по использованию при диагностике (механической и паренхиматозной желтух) многократно определяемых признаков: значения ДП (анализов) первых двух дней усредняются в 1-й диагностический признак, анализы за следующие 3 дня усредняются во 2-й признак, за следующие 5 дней усредняются в 3-й признак. Таким образом, вместо 10 независимых ДП получаем 3 признака.

Предлагаемое усреднение привело к уточнению диагностики, по сравнению с диагностикой без усреднения повторных измерений признаков (глава 5).

4.3 Влияние лечения на динамику заболевания Предложенная методика диагностики тестируется на механической и паренхиматозной желтухах, течение которых кардинально отличны.

Соответствующим образом отличается и лечение. Лечение паренхиматозной желтухи - терапевтическое, медикаментозное. За время лечения (от 10 дней до месяцев) состояние больного, в основном, нормализуется, то есть большинство диагностических признаков постепенно приближаются к норме. Если полагать, что лечение паренхиматозной желтухи примерно одинаково для всех больных, то можно говорить о динамике заболевания при лечении. Больному обычно назначают медицинские процедуры уже в день поступления, поэтому учесть динамику болезни до начала лечения в настоящей работе не удалось - не было нужных данных. Хотя предпринималась попытка приближенно оценить начало паренхиматозной желтухи по имеющейся информации. Затем без уточнения действительного дня начала заболевания было достигнуто почти стопроцентное совпадение компьютерного и врачебного диагнозов. После этого попытки откорректировать начало заболеваний, приближая его к реальному, были отложены.

Как правило, своевременно предпринятое лечение паренхиматозной желтухи постепенно приводит к улучшению состояния больного и нормализации лабораторных показателей.

Лечение механической желтухи, в большинстве случаев, хирургическое.

Операцию необходимо проводить в первые 5 - 7 дней с момента поступления. В течение этого времени проводится предоперационная подготовка. Однако, как уже указывалось, большинство больных поступают в хирургическое отделение поздно - на 10 - 30-й день болезни. Все это время больному проводится лечение, однако улучшение состояния и лабораторных показателей не происходит. Таким образом, динамика двух заболеваний различна, и её учет должен приводить к повышению точности диагностики.

После операции признаки механической желтухи резко снижаются, что не характерно для естественной динамики болезни при медикаментозном лечении.

День операции индивидуален для каждого больного, он зависит как от наличия достоверных показаний о необходимости операции, так и от состояния больного. А значит, говорить об общей естественной динамике собственно болезни после операции нельзя и в рамках решаемой задачи диагностики нет необходимости.

Приведенные выше обстоятельства указывают, что проводимая в настоящей работе диагностика - это диагностика болезней на фоне лечения и до операции у больных механической желтухой. Следовательно, нельзя использовать для диагностики анализы и другие ДП пациента после операции. Эти данные не должны влиять ни на диагностику, ни на статистические распределения. Вследствие обоснованного выше игнорирования послеоперационных распределений признаков затруднена дифференциальная диагностика других больных, которым не выполнялись операции, то есть больных паренхиматозной желтухой, ДП которых (после 10 дней пребывания в больнице) не с чем сравнивать. В среднем, эксперименты по диагностике пациентов проводились с учетом данных 10 дней от начала лечения. После десятого дня большинству больных механической желтухой были сделаны операции. Как показали эксперименты, диагностика с учетом динамики по 10 дням оказалась лучшей диагностикой по всем дням.

Очевидно, что диагноз должен быть известен как можно раньше и, конечно, до операции. После операции компьютерный диагноз не нужен.

Приведенные выводы о динамике болезни с учетом лечения верны для пациентов, которые лечатся от той болезни, которой они действительно больны. Их динамика, примерно, одинакова в пределах одной группы. Но что происходит, когда больного механической желтухой ошибочно принимают за больного паренхиматозной желтухой? Или больного паренхиматозной желтухой за пациента с механической желтухой. Лечение таких больных отлично от лечения группы, к которой они принадлежат, и результаты лечения также иные.

Случаи неверных диагностики и соответственно лечения, к сожалению, вполне регулярны, и безрезультатное лечение одной из болезней не зря введено в исходные данные (раздел 3.1) как диагностический признак № 12 наличие эффекта от предыдущего лечения, который свидетельствует о другом типе желтухи (в основном, отсутствие эффекта от лечения паренхиматозной желтухи указывает на механическую желтуху).

Изложенные ситуации показывают проблемы диагностики больных, которым не проводилось лечение, и больных, которым проводилось лечение от другой болезни. Для решения этих проблем вместо двух диагностируемых состояний (механическая и паренхиматозная желтуха) следовало бы ввести базу данных с четырьмя группами больных: пациент болен и лечится от механической желтухи, пациент болен и лечится от паренхиматозной желтухи, пациент болен механической желтухой и лечится от паренхиматозной желтухи, пациент болен паренхиматозной желтухой и лечится от механической желтухи. После этого появилась бы возможность более тонкой диагностики: более надежно диагностировались бы больные, которым проводится неверное лечение.

Однако, проблема еще обширнее. Обсуждаемых больных не все время лечат неправильно, на какой-то день после начала лечения пациентам ставят верный диагноз. Следовательно, меняется лечение, и пациент уже не характеризуется одним из 4-х введенных состояний. Он, строго говоря, относится к новой группе. Также к иным, отдельным группам относятся пациенты, лечение которых начиналось не со дня поступления в больницу, а раньше (самолечение, лечение не в специализированной клинике) или позже этого дня.

Например, группа пациентов, лечение которых началось в день поступления в больницу, отлична от группы пациентов, интенсивное лечение которых началось на 5-й день после поступления (скажем, после праздничных дней). У первой группы на 5-й день анализы уже изменились в сторону нормы, а у второй группы их отличие от нормы не уменьшилось. Соответственно, распределения признаков обеих групп на 5-й и последующие дни будут отличны, несмотря на то, что обе группы могут относиться к одному диагностическому состоянию и проходят аналогичное лечение.

Заметим, что количество дней, прошедших между началом болезни и поступлением в больницу, сильно отличается для разных пациентов. На это влияет, в частности, удаленность от больницы, другие факторы. Например, житель города при первых признаках желтухи обращается в больницу и проходит лечение, когда болезнь не запущена. В то же время, сельский житель может болеть продолжительное время, и в день поступления в специализированную больницу анализы такого больного будут сильно отличаться от нормы. Очевидно, что правильнее отсчитывать динамику от дня начала заболевания, а не от дня поступления в больницу. Желательно также учесть день начала лечения и индивидуальные особенности протекания стадий болезни для каждого больного.

Методика учета индивидуальных начала лечения и течения болезни прорабатывалась авторами [91]. Но пока при практической диагностике были использованы только следующие простые допущения:

1. Днем начала заболевания и начала лечения условно считается день поступления в больницу.

2. Больные с ошибочными диагнозами не выделяются в отдельные группы, т.е.

распределения ДП включают некоторое количество больных с лечением, отличным от лечения большинства больных.

Глава 5 Результаты диагностики с применением различных методических приемов 5.1 Применение уровня надежности и коэффициента эффективности для оценки качества диагностики Расчет погрешности определения вероятности болезней [99] пока не реализован, поэтому результаты диагностики оцениваются согласно разделу 2.6:

кроме процента верных диагнозов используются предложенный коэффициент эффективности диагностики (CE ) и уровень надежности диагноза. (Наиболее вероятная болезнь считается диагнозом не всегда, а тогда, когда вероятность этой болезни еще и выше заданного уровня надежности. В качестве уровня надежности принята вероятность болезни 90%.) Использование уровня надежности диагноза позволяет перевести часть недостаточно надежных (неправильных и правильных) диагнозов в разряд неопределенных.

Ниже приведен пример результатов диагностики 563 больных с использованием уровня надежности.

Таблица 5. Сравнение диагностики пациентов при разных уровнях надежности Правильных Неправильн. Неопредел.

Принятый уровень диагнозов диагнозов диагнозов надежности пац. % пац. % пац. % 1. 50% (без неопределенных) 543 96,5 20 3,5 0 2. 90% (с неопределенными) 525 93 11 2 27 В первой графе приведена диагностика больных с принятым уровнем диагностической надежности - 50%. То есть для двух болезней фактически уровень надежности не используется и диагнозом считается та болезнь, вероятность которой выше вероятности другой болезни (а значит больше 50%). В данном случае неопределенных диагнозов нет. Во второй графе принят уровень надежности - 90%.

Здесь появляются неопределенные диагнозы.

При установке уровня надежности 90%, количество правильных диагнозов уменьшилось на 18 (на 3,2% от числа всех больных), количество неправильных диагнозов уменьшилось на 9 (1,6%), и появились 27 неопределенных диагнозов (5%).

Несмотря на то, что часть правильных диагнозов стали неопределенными, мы считаем этот подход оправданным: важнее сделать меньше ошибок в диагнозе, чем большему числу пациентов поставить верный диагноз.

Возникает вопрос о выборе уровня диагностической надежности диагноза.

Чем выше этот уровень, тем меньше правильных и, одновременно, неправильных диагнозов. Можно установить такой высокий уровень надежности, что все неправильные диагнозы исчезнут, перейдут в область неопределенных диагнозов.

При этом количество правильных диагнозов уменьшиться настолько, что такая диагностика перестанет удовлетворять врача. Вполне возможен случай появления нового больного, которому будет поставлен неверный диагноз при любом уровне надежности.

Кроме того, установка уровня надежности зависит от количества данных, используемых в диагностике: чем больше данных, тем, в принципе, большей должна быть полученная расчетом разница вероятностей правильного и неправильного диагнозов, следовательно, тем более высокий уровень надежности можно установить.

Таблица 5. Влияние количества диагностирующих данных (признаков) на вероятности болезней Вероятность действительной болезни пациента, Пациент с использованием данных нескольких дней, % 1-й день 1, 2-й дни 1, 2, 3-й дни 1,2,3,4-й дни 1 99,99486 99,99956 99,99987 99, 2 99,97545 99,96377 99,99816 99, 3 89,54650 99,91049 99,99890 99, 4 67,75748 19,76993 62,11264 36, 5 15,72451 6,39987 2,97724 0, В таблице 5.2 показано как изменяются вероятности истинных болезней пяти пациентов. (Истинные здесь - те болезни, которыми пациент действительно болен и от которых его лечат.) В первом столбце (в начале строк) - номера пациентов, в заголовках следующих столбцов указано число дней, в которые взяты диагностические признаки, использованные при диагностике каждого пациента.

Больные диагностируются на основании набора признаков взятых сначала за 1-й день, потом за 1 и 2-й дни, за 1, 2, 3-й дни, и за 1, 2, 3,4-й дни. У большинства пациентов вероятности истинных болезней приближаются либо к 1 (№1, №2, №3), либо к 0 (№5). Таким образом, увеличение массива данных, по которым ставится диагноз, приводит к увеличению числа правильных и неправильных диагнозов при постоянном уровне надежности. Практически, это означает сложность использования постоянного уровня надежности для неодинаковых наборов данных.

Сложность заключается в адекватном сравнении результатов диагностики.

Таблица 5. Влияние уровня надежности на диагностику пациентов, вероятности болезней которых содержатся в табл. 5. Уровень Количество поставленных диагнозов надежности 1-й день 1-2-й дни 1-3-й дни диагноза Прав. Неправ. Прав. Неправ. Прав. Неправ.

90% 2 0 3 1 3 95% 2 0 3 0 3 97% 2 0 3 0 3 50% 4 1 3 2 4 Для данных пациентов и для диагностики за 1-й день наиболее подходящим уровнем диагностической надежности, когда программа реже всего ошибается, является 90%. Уровень надежности 95% - лучший при диагностике за 1 - 2-й дни, 97% - за 1 - 3-й дни. С увеличением количества данных, по которым ставится диагноз, уровень надежности диагноза должен повышаться. В работе далее не исследуется более подробно вопрос выбора уровня диагностической надежности.

Он принимается равным 90% для диагностики всех пациентов. На наш взгляд, это, примерно, тот уровень, при котором врач может доверять компьютерному диагнозу.

Введение неопределенных диагнозов возвращает нас к проблеме сравнения и оценки качества диагностики различными методами и приемами (или при разных условиях). Например: в каком из расчетов таблиц 5.1 и 5.2 качество диагностики выше, где больше процент верных или меньше процент неверных диагнозов? В таблицах приведены одни и те же расчеты. Просто в таблице 5.2 взят разный уровень надежности.

С целью сравнения качества диагностик в разделе 2.6 был введен коэффициент эффективности диагностики (CE ). Определено понятие CE диагностики одного пациента - это расчетная вероятность действительной болезни данного пациента, т.е. той болезни, которой он действительно болен. Общий CE (всех пациентов) - это среднеарифметическое CE каждого пациента. Данный показатель одновременно учитывает и правильные, и неправильные, и неопределенные диагнозы. CE является универсальной характеристикой качества диагностики, не зависящей от уровня надежности и размера выборки диагностируемых пациентов. CE диагностики в таблице 5.1 равен 0,9601 (для обоих расчетов он одинаков).

5.2 Серия экспериментов при различных приемах формирований распределений Для проведения экспериментов выбраны непрерывные ДП билирубин прямой, билирубин непрямой, ферменты АСАТ, ферменты АЛАТ, щелочная фостафаза, лальбумин, возраст. Так как только на построение распределений непрерывных признаков влияют описанные в разделах 3.2 и 3. правила. Величины признаков взяты для диагностики один раз - в ближайший день от начала болезни. Результаты экспериментов приведены в таблице 5.4. В этой таблице использованы следующие понятия.

1. Высота интервала - число больных, у которых значение признака попадает в данный интервал. Высота интервала, точнее, минимальная высота интервала задается для формирования гистограммы;

последняя формируется так, что число больных в интервале, в который попал ДП диагностируемого больного, не менее заданной минимальной высоты интервала.

2. Высота каждого интервала формируется по логическим условиям да/лнет. Если да, то высота каждого интервала (не только того, в который попало значение признака) будет не меньше, чем в п. 1. В ином случае возможно построение гистограммы, в которой имеются интервалы с любой высотой, даже с нулевой.

3. Унимодальность гистограммы. Гистограмма может быть не унимодальной (значение нет), полностью унимодальной для всех интервалов (значение да), унимодальной только для интервалов с высотой большей, чем вычисляемая высота (значение да, относительно).

4. Центр интервала. При значении да гистограмма формируется так, что значение анализа является центром интервала. При нет гистограмма формируется без центрирования интервала вокруг значения ДП.

CE - коэффициент эффективности. Это основной показатель, по которому оценивается рациональность выбора того или иного метода построения гистограмм.

Как видно по таблице, высота интервала (1-я переменная) должна быть не больше 1. Только при такой величине достигается максимальной количество правильных диагнозов - 471 и коэффициент эффективности - 0,914 (1-й эксперимент из экспериментов 1 - 4).

Далее при высоте интервала 1 определяется, необходимо ли условие, когда высота каждого интервала должна быть не меньше найденной минимальной (переменная №2). Это выясняется из сравнения 1 и 6-го экспериментов. Результаты очень похожи, но неприменение этого условия все же предпочтительнее (CE 1-го эксперимента = 0,9141, CE 6-го эксперимента = 0,9120). Видимо, соблюдение условия ненулевого значения каждого интервала чуть-чуть ухудшает представительность главного интервала, того интервала, в который попал ДП диагностируемого больного.

В экспериментах 1, 7, 8 определяется необходимость условия унимодальности (3-я переменная). В 1-м расчете унимодальность не выполняется, в 7-м расчете унимодальность - полная, в 8-м - относительная. Лучшим вариантом (CE = 0,9146) оказался 8-й эксперимент: т.е. предпочтителен предложенный прием такого разбиения на интервалы, что соблюдается унимодальность интервалов с высотой большей, чем высота интервала, в который попал ДП диагностируемого больного.

В 9-м расчете показано, что признак, для которого рассчитывается распределение, должен располагаться в центре интервала (CE = 0,9194). В 10 и 11-м расчетах еще раз проверяется условие унимодальности.

Некоторые варианты построения распределений демонстрируются в приложении 2, где приведены примеры определения вероятностей и плотностей вероятностей ДП одного из пациентов.

Таким образом, экспериментальным путем подобраны следующие условия построения гистограмм:

1. Высота интервала = 1.

2. Высота каждого интервала гистограммы, кроме интервала, указанного в предыдущем пункте, может быть любой.

3. Должна соблюдаться унимодальность гистограммы для всех интервалов, высота интервала в которых больше, чем в интервале, указанном в пункте 1.

4. Интервал следует формировать так, что признак, плотность распределения которого рассчитывается, должен попадать в центр интервала.

Таблица 5. Численные эксперименты по формированию распределений Поставленных диагнозов № Правила формирования распределений CE Правиль Непра- Неопред экс.

-ных вильных еленных 1. Высота интервала - 2. Высота каждого интервала - нет 1. 471 14 79 0. 3. Унимодальность гистограммы - нет 4. Симптом - центр интервала - нет 1. Высота интервала - 2. Высота каждого интервала - нет 2 467 14 83 0. 3. Унимодальность гистограммы - нет 4. Симптом - центр интервала - нет 1. Высота интервала - 2. Высота каждого интервала - нет 3 468 13 83 0. 3. Унимодальность гистограммы - нет 4. Симптом - центр интервала - нет 1. Высота интервала - 2. Высота каждого интервала - нет 4 463 17 84 0. 3. Унимодальность гистограммы - нет 4. Симптом - центр интервала - нет 1. Высота интервала - 2. Высота каждого интервала - нет 5 446 12 106 0. 3. Унимодальность гистограммы - нет 4. Симптом - центр интервала - нет 1. Высота интервала - 2. Высота каждого интервала - да 6 471 15 78 0. 3. Унимодальность гистограммы - нет 4. Симптом - центр интервала - нет Продолжение таблицы 5. Поставленных диагнозов № Правила формирования распределений Правиль Непра- Неопред CE экс.

-ных вильных еленных 1. Высота интервала - 2. Высота каждого интервала - нет 7 3. Унимодальность гистограммы - да, 469 16 79 0. полная 4. Симптом - центр интервала - нет 1. Высота интервала - 2. Высота каждого интервала - нет 8 3. Унимодальность гистограммы - да, 476 16 72 0. относит.

4. Симптом - центр интервала - нет 1. Высота интервала - 2. Высота каждого интервала - нет 9 3. Унимодальность гистограммы - да, 485 14 65 0. относит.

4. Симптом - центр интервала - да 1. Высота интервала - 2. Высота каждого интервала - нет 10 3. Унимодальность гистограммы - да, 477 15 72 0, полная 4. Симптом - центр интервала - да 1. Высота интервала - 2. Высота каждого интервала - нет 11 475 15 74 0, 3. Унимодальность гистограммы - нет 4. Симптом - центр интервала - да 5.3 Серия экспериментов при различных приемах формирования базы данных Для проведения экспериментов использовались все ДП. Для диагностики признаки взяты один раз - в ближайший день от начала болезни. Гистограммы ДП сформированы по правилам, определенным в предыдущем параграфе. Результаты экспериментов приведены в таблице 5.5. Поясним содержащиеся в таблице краткие названия.

Укрупнения дней - это количество дней, за которое усредняются признаки с целью получения более репрезентативной выборки при построении гистограмм. Для примера приведены ДП одного из пациентов Таблица 5. Данные пациента N Дни, когда у пациента были определены диагностические признаки Признаки 1 2 4 5 8 11 15 20 кожный зуд + + + - - - АЛАТ 2.0 1.8 2.0 1.4 1.0 0.6 0.4 0.2 0. Пусть необходимо выбрать данные по АЛАТ за 6-й день для гистограммы.

Если нужно укрупнить 5 дней, тогда берутся анализы около заданного дня - 4, 5, 6, 7, 8-й дни (всего 5 дней, но только в трех из пяти дней имеются данные), далее берется среднее. Результат - (2,0+1,4+1,0)/3 = 1,47.

Если нужно укрупнить 3 дня, тогда берутся анализы за 5, 6, 7-й дни (всего дня, и только в 6-й день имеется анализ). Результат - (1,4)/1 = 1,4.

Вырожденный случай - когда нужно укрупнить 1 день, тогда берутся анализы только за 6-й день. Так как анализ не проводился, то данные этого пациента именно в 6-й день в гистограмму не войдут.

То есть, чем больше дней укрупняются для выборки, тем больше данных получаем для гистограммы. Но одновременно с этим сильнее сглаживаются истинные значения признаков. Необходимо определить предел укрупнения дней, когда диагностика начнет ухудшаться.

Распространение признаков - учитывается постоянность некоторых дискретных признаков в течение определенного времени. По медицинским данным следующие признаки желтухи не меняются за характерные периоды времени (табл. 5.6).

Таблица 5. Интервалы дней, за время которых признаки не успевают измениться Дней Наименование признака после до определения определения Расширение холедоха 3 до операции Расширение внутренних печеночных ходов 3 до операции Зеленый цвет печени от поступления до операции Маркеры от поступления до выписки Инородное тело от поступления до операции Таким образом, зная анализ маркеры в 8-й день, можно считать известными маркеры в любой из дней от начала до конца болезни (и далее). Это позволяет собрать более представительную выборку по маркерам в любой день.

Искусственные распределения - построение искусственных распределений на основании опыта врача. Искусственные распределения используются при отсутствии данных для вычисления надежного истинного распределения (см. раздел 3.3).

Численные эксперименты по определению целесообразности лукрупнения дней и распространения признаков приведены в таблице 5.7. Согласно результатам этих методических экспериментов необходимо укрупнять данные максимум за 5 дней. Коэффициент эффективности такой диагностики CE = 0, (3-й эксперимент). Другие эксперименты (1, 2, 4, 5) показывают по оценке CE худшие результаты.

Опираясь на эту информацию, был проведен 6-й эксперимент, демонстрирующий влияние эффекта распространяемости признаков. Количество правильных диагнозов увеличилось на 5 (по сравнению с 3-м экспериментом).

Неправильных уменьшилось на 1, CE = 0,9512.

Следующий шаг - применение медицинских интервалов (7-й расчет).

Фактически используются статистические распределения, полученные не из статистики (ввиду ее ограниченности), а из опыта эксперта (но не знаний эксперта).

Получены следующие результаты. Правильных - 524. CE = 0,9626.

По результатам расчетов выработаны следующие правила построения распределений:

1. Укрупнение дней - оптимально 5 дней.

2. Использование распространения признаков.

3. Использование искусственных распределений.

По этим правилам получена наилучшая диагностика 564 пациентов:

правильных диагнозов поставлено 524, неправильных - 8, неопределенных - 32, CE = 0,9626.

Таблица 5. Численные эксперименты по формированию базы данных Количество поставленных № диагнозов Правила формирования распределений CE эксп.

Правиль- Непра- Неопре ных вильных деленных 1. 1. Укрупнение дней - 2. Распространения симптомов - нет 494 12 58 0, 3. Искусственные распределения - нет 2. 1. Укрупнение дней - 2. Распространения симптомов - нет 501 11 52 0, 3. Искусственные распределения - нет 3. 1. Укрупнение дней - 2. Распространения симптомов - нет 513 10 41 0, 3. Искусственные распределения - нет 4. 1. Укрупнение дней - 2. Распространения симптомов - нет 512 11 41 0, 3. Искусственные распределения - нет 5. 1. Укрупнение дней - 2. Распространения симптомов - нет 513 12 39 0, 3. Искусственные распределения - нет 6. 1. Укрупнение дней - 2. Распространения симптомов - да 518 9 37 0, 3. Искусственные распределения - нет 7. 1. Укрупнение дней - 2. Распространения симптомов - да 524 8 32 0, 3. Искусственные распределения - да Диагностика проведена на базе 564 тестовых больных.

5.4 Серия экспериментов с использованием многомерных распределений В таблице 5.8 приведены результаты диагностики всех пациентов на основе двух признаков АЛАТ и АСАТ. Признаки выбраны не случайно. Это одни из наиболее взаимозависимых признаков. Их зависимость подтверждена различными статистическими методами и врачом.

Таблица 5. Результаты численных экспериментов по объединению признаков АЛАТ и АСАТ в двумерный признак Связи между признаками для Количество поставленных диагнозов CE каждой болезни всего правильн. неправил. неопредел 1. Механическая желтуха - два одномерных признака, 402 311 21 70 0, паренхиматозная желтуха - два одномерных признака 2. Механическая - двумерный, 402 191 13 198 0, паренхиматозная - двумерный 3. Механическая Цдва одномерных, 402 214 16 72 0, паренхиматозная - двумерный 4. Механическая - двумерный, 402 290 20 92 0, паренхиматозная - два одномерных В таблице приведены результаты 4-х диагностических тестов. Два признака могут быть взаимозависимы по-разному для каждой болезни. Для паренхиматозной желтухи признаки могут быть сильно зависимы, здесь объединение признаков в двумерный признак может дать определенный эффект, а для механической желтухи зависимость может оказаться слабой, незначимой. В последнем случае двумерный признак может не привести к улучшению диагностики, вследствие ограниченности статистики: погрешности, возникающие при построении двумерного распределения, могут оказаться сильнее преимущества при учете взаимозависимости.

Поэтому предусмотрено построение многомерных признаков, в которых соответствующая взаимозависимость автоматически учитывается для каждого диагностического состояния в отдельности. Таким образом, рассматриваются варианта связей между признаками для обеих болезней.

Результаты экспериментов, на наш взгляд, неоднозначны. С одной стороны, если судить по CE и по правильным диагнозам, эффект от объединения АЛАТ и АСАТ - отрицательный. Так, при использовании признаков как одномерных и независимых (см. графу 1), количество правильно поставленных диагнозов - (CE = 0,86), а при объединении признаков в один двумерный признак при обеих болезнях (см. графу 2) количество правильных диагнозов - 191 (CE = 0,80). Выше сказано о факторах, которые могли привести к такому выводу. С другой стороны, количество неправильных диагнозов явно уменьшилось: 1-я графа - 21 диагноз, 2-я графа - 13 диагнозов. По нашему мнению, уменьшение количества неправильно поставленных диагнозов важнее, чем увеличение правильных диагнозов. Именно поэтому мы считаем результаты экспериментов неоднозначными. Диагностика на других вариантах связей (3 и 4-я графа) заняла промежуточное положение.

Таблица 5. Результаты численных экспериментов по объединению признаков билирубин прямой и непрямой в двумерный признак Связи между признаками для каждой Количество поставленных диагнозов CE болезни всего правильн неправил. неопред.

1. Механическая - два одномерных, 393 20 4 369 0, паренхиматозная - два одномерных 2. Механическая - двумерный, 393 40 2 351 0, паренхиматозная - двумерный 3. Механическая - два одномерных, 393 84 9 300 0, паренхиматозная - двумерный 4. Механическая - двумерный, 393 41 4 348 0, паренхиматозная - два одномерных Два признака - билирубин прямой и непрямой - также являются сильно взаимозависимыми (по статистическим и медицинским данным). В этом случае объединение признаков в двумерный признак для паренхиматозной желтухи (графа 3) дает небольшое диагностическое преимущество, если судить по CE и количеству правильных диагнозов. Количество неправильных диагнозов, как видно по таблице, уменьшается, когда используется объединение билирубинов при каждой из болезней (графа 2).

Возникает мысль, что нельзя сделать однозначного вывода о том, что всегда нужно объединять признаки или всегда нужно не объединять признаки. Для одного набора признаков (пары) построение многомерного распределения не оправдывается, для другого набора - объединение полезно, если сравнивать по числу правильных, неправильных диагнозов или CE. Далее, решение об объединении признаков в многомерный признак основывается на сравнении коэффициентов эффективности.

Предложенную методику можно детализировать. В частности, можно рассмотреть 2 признака, у которых при высоких значениях каждого признака объединение в пару рационально (повышает CE ), а при низких значениях - нет (снижает CE ) и т. п.

Врачи рассматривают значения признаков билирубин прямой и билирубин непрямой в пределах трех категорий: значения в норме, высокие (выше нормы), очень высокие (много выше нормы). Для двумерного признака билирубин прямой - билирубин непрямой образовывается девять комбинаций таких категорий.

Ниже приведена таблица результатов диагностики с учетом того, что признаки разбиты на категории - медицинские интервалы.

Таблица 5. Результаты численных экспериментов по объединению признаков билирубин прямой и непрямой в двумерный признак.

Поставленных диагнозов Категории Категории Связи между для для признаками для CE билирубина билирубина каждой болезни непрямого прямого 1 2 3 4 5 6 7 Н Н 16 5 0 11 0, 1. Механическая Н ВН 6 1 0 5 0, желтуха - два одномерных Н МВН 7 2 1 4 0, признака, ВН Н 15 0 0 15 0, ВН ВН 36 0 0 36 0, паренхиматозная ВН МВН 158 62 11 85 0, желтуха - МВН Н 0 0 0 0 два одномерных МВН ВН 4 0 0 4 0, признака МВН МВН 153 19 2 132 0, Н Н 16 5 0 11 0, Н ВН 5 1 0 4 0, 2. Механическая Н МВН 7 2 1 4 0, желтуха - двумерный, ВН Н 15 0 0 15 0, ВН ВН 36 0 0 36 0, паренхиматозная ВН МВН 158 45 8 105 0, желтуха - двумерный МВН Н 0 0 0 0 МВН ВН 4 0 0 4 0, МВН МВН 152 33 3 116 0, ных Всего льных Правиль еленных Неправи Неопред Продолжение таблицы 5. 1 2 3 4 5 6 7 Н Н 16 5 0 11 0, Н ВН 5 1 0 4 0, 3. Механическая Н МВН 7 3 2 3 0, желтуха - два ВН Н 15 0 0 15 0, одномерных, ВН ВН 36 0 0 36 0, ВН МВН 158 8 3 147 0, паренхиматозная МВН Н 0 0 0 0 желтуха - двумерный МВН ВН 4 0 2 2 0, МВН МВН 153 36 3 114 0, Н Н 16 5 0 11 0, Н ВН 5 1 0 4 0, 4. Механическая Н МВН 7 2 1 4 0, желтуха - двумерный, ВН Н 15 0 0 15 0, ВН ВН 36 2 0 34 0, паренхиматозная ВН МВН 158 87 16 55 0, желтуха - два МВН Н 0 0 0 0 одномерных МВН ВН 4 0 0 4 0, МВН МВН 152 36 2 114 0, Н - норма (для значений признака, не превышающих норму);

ВН - выше нормы (для значений, превышающих норму);

МВН - много выше нормы (для значений, намного превышающих норму) Основным критерием для выбора способа объединения ДП являлся коэффициент эффективности. То есть выбирался тот способ объединения, при котором CE является наибольшим.

Таблица 5. Выбор объединения ДП в зависимости от категории признаков Категории ДП для механической и для паренхиматозной желтухи Выбор в пользу объединения двух ДП в CE Категории для Категории для двумерный признак билирубина билирубина непрямого прямого Н Н 0,647 Механич. - 1-мерные, паренхим. - 2-мерный Н ВН 0,751 Механич. - 2-мерный, паренхим. - 1-мерные Н МВН 0,679 Механич. - 1-мерные, паренхим. - 2-мерный ВН Н 0,581 Механич. - 2-мерный, паренхим. - 1-мерные ВН ВН 0,621 Механич. - 2-мерный, паренхим. - 1-мерные ВН МВН 0,734 Механич. - 2-мерный, паренхим. - 1-мерные МВН Н МВН ВН 0,546 Механич. - 2-мерный, паренхим. - 1-мерные МВН МВН 0,684 Механич. - 2-мерный, паренхим. - 2-мерный В таблице для каждой категории ДП найден наилучший способ их объединения. Теперь для этих признаков вопрос объединения или не объединения решается для каждого больного индивидуально, в зависимости от величины признаков, от попадания их в ту или иную категорию. Например, у пациента ДП оказались в категориях: норма - для непрямого и выше нормы - для прямого билирубина. Тогда лучшим вариантом объединения признаков будет: двумерный признак - для механической желтухи и два одномерных признака - для паренхиматозной желтухи. Так же детально рассматривалось объединение всех пар признаков.

При этом проблемой являлся (и остался) выбор признаков для объединения в один многомерный признак. Дело в том, что признак можно объединить в пару не только с одним признаком, но и с несколькими другими признаками. Выше мы объединяли наиболее зависимые признаки, чтобы в наибольшей мере избавиться от погрешностей, возникающих при рассмотрении зависимых признаков как независимых. Возможны и другие подходы к выбору пар признаков для объединения. Например, можно выбрать те пары, у которых CE диагностики - наибольший (максимум CE ).

Для диагностики реально использовалось 19 ДП, рассматриваемых в течение 10 дней (то есть теоретически до 190 признаков). Возникает вопрос, с каким из других признаков объединить в пару данный признак? Один из подходов к выбору пар состоял в том, что каждый признак использовался один раз, поскольку повторное использование признака не дает существенно новой диагностической информации. То есть каждый признак входил только в одну пару. Формирование пар, исходя из изложенного подхода и принципа максимума CE, рассмотрим на примере диагностики по четырем признакам.

Таблица 5. Коэффициент эффективности диагностики для всех пар, составленных из 4-х ДП Признак Признак CE при рассмотрении признаков Эффект N M как одномерных объединенных в от (независимых) двумерный объединения 1 2 0.7 0.8 0. 1 3 0.8 0.7 -0. 1 4 0.6 0.9 0. 2 3 0.6 0.7 0. 2 4 0.7 0.9 0. 3 4 0.8 0.9 0. Обозначения: N и M - номера признаков.

По этим данным можно рекомендовать объединения признаков: 1 - 2, 1 - 4, 2 - 3, 2 - 4, 3 - 4. Объединение признаков 1 - 3 нецелесообразно, так как эффект от объединения - отрицателен.

Продолжим выбор пар признаков для диагностики, ограничиваясь вариантом, когда каждый признак участвует в диагностике только один раз. По данным таблицы 5.12, для диагностики перспективны следующие 3 варианта наборов признаков и их пар:

1) 1 - 2, 3 - 4;

2) 1 - 4, 2 - 3;

3) 2 - 4, 1 - 3.

Далее необходимо выбрать один из вариантов объединения. Например, по следующему алгоритму. Пары признаков (табл. 5.12) сортируются по эффекту от объединения. Результаты, полученные после сортировки, приведены в таблице 5.13.

Таблица 5. Коэффициент эффективности диагностики для всех пар из четырех признаков, после сортировки CE при рассмотрении признаков Эффект от Признак Признак как одномерных объединенных объединения N M (независимых) в двумерный 1 4 0.6 0.9 0. 2 4 0.7 0.9 0. 1 2 0.7 0.8 0. 2 3 0.6 0.7 0. 3 4 0.8 0.9 0. На основании этих данных (приведенных в таблице 4 результатов сортировки) в пару объединяем признаки, показавшие максимальный эффект от объединения.

Это пара 1 - 4. Далее находим другие пары (вниз по таблице 5.13), признаки которых не включены в уже составленные пары. Таким образом, составляем лучший набор признаков: 1 - 4, 2 - 3. (Этот набор одинаков для всех пациентов, у которых имеются эти признаки. Для тех пациентов, у которых отсутствует хотя бы один из рассмотренных 4-х признаков, набор будет иной.) Именно так, как это описано в рассмотренном примере, выбирались двумерные признаки для диагностики механической и паренхиматозной желтух.

Для каждого больного, опираясь на его собственный набор анализов, симптомов и данных инструментальных обследований, создавались двумерные признаки. Другие признаки пациента, не вошедшие в состав двумерных, входили в формулу Байеса как одномерные, независимые признаки. Причем, как уже замечено, объединение признаков может основываться на сравнении CE общего для признаков, или на детализированном сравнении CE, в зависимости от величин анализов пациента и попадания анализов в ту или иную категорию. Оба варианта были проверены в экспериментальных расчетах. При этом получены следующие результаты диагностики.

Таблица 5. Результаты численных экспериментов по объединению всех признаков в двумерные признаки Объединения пар признаков, в зависи- Процент поставленных диагнозов мости от общего или детального рассмотрения эффекта объединения. Правильных Неправильн. Неопредел.

1. Диагностика до применения 93,8 2,1 4, двумерных признаков 2. Использование общего CE 92,4 2,3 5, 3. Использование детального CE 94,9 1.2 3, Диагностика выполнена 564 больным.

Введение двумерных распределений без тонкого рассмотрения признаков привело к ухудшению результатов диагностики.

После объединения части признаков в двумерные количество правильных диагнозов выросло с 93,8% до 94,9%, то есть на 1,1%. На наш взгляд, уточнение диагностики не столь существенно, чтобы стоило вводить учет парных зависимостей в повседневную диагностику.

Выше уже обсуждались причины скромного эффекта использования многомерных распределений и высказывалось предположение, что эффект проявится после увеличения базы данных.

5.5 Серия экспериментов с учетом динамики заболеваний В этом разделе изложены результаты методических численных экспериментов. Для построения гистограмм и формирования базы данных используются рекомендации, определенные в предыдущих параграфах, т.е.

признаки из базы данных обрабатываются согласно выработанным рекомендациям.

У диагностируемого пациента используются все ДП, которые не обрабатываются умышленно, чтобы методически разделить эффекты разных стадий учета динамики.

В настоящем разделе исследованы приемы учета динамики, названные в разделе 2. первым приближением, согласно которому для диагностики используются все ДП, включая все повторно определенные ДП, и повторно (многократно) определенные ДП (за исключением неизменных) считаются отдельными, независимыми признаками. (То есть никакого усреднения многократно определенных ДП у диагностируемого пациента не производится, это делается во втором приближении).

Таблица 5. Численные эксперименты по учету динамики заболеваний Дни, в порядке их Всего Процент поставленных диагнозов.

использования диагно- CE Правильных Неправильн. Неопределен.

для диагностики зов 1 409 82.9 2.7 14.4 0. 2 504 87.7 2.4 9.9 0. 3 550 89.1 2.6 8.4 0. 4 556 90.8 1.9 7.2 0. 5 563 92.2 1.9 5.9 0. 6 563 92.2 2.1 5.7 0. 7 563 92.9 2.3 4.8 0. 8 563 93.6 2.1 4.3 0. 9 563 93.8 1.9 4.3 0. 10 563 93.8 2.1 4.1 0. 11 563 93.4 2.1 4.4 0. 12 563 93.6 2.1 4.3 0. 13 563 93.4 2.1 4.4 0. 14 563 93.6 2.3 4.1 0. 15 563 93.8 2.3 3.9 0. 20 564 93.4 2.1 4.4 0. 30 564 93.4 2.1 4.4 0. 50 564 93.4 2.1 4.4 0. В первой графе приведены результаты диагностики 409 больных, у которых имеются диагностические признаки в 1-й день (день поступления в больницу), во 2 й графе - результаты диагностики 504 больных, у которых имеются признаки в или 2-й день (в том числе больных, у которых есть ДП в оба дня). В 10-й графе - итоги диагностики 563 больных, у которых имеются анализы в любой (хотя бы один) из первых 10 дней, и т.д.

По таблице 5.15 видно, что, добавляя новую информацию, поступающую во 2 й день, 3-й день и т.д., мы получаем уточнение диагноза для всех пациентов и диагностируем других больных, у которых начинают появляться анализы. Точность диагностики увеличивается с каждым днем (судя по правильным диагнозам и CE).

Сравнивая диагностику по 1-му дню и 9-му дню, можно сказать, что процент правильных диагнозов увеличился на 11%, неправильных уменьшился на 0,8%. CE увеличился на 0.049. Эффективность диагностики улучшается вплоть до 9-го дня, после которого незначительно снижается. Снижение результатов диагностики объясняется нехарактерным, не естественным для больных механической желтухой течением болезни после 9 - 10 дня, когда у многих пациентов сделаны операции.

Нельзя сравнивать данные больных механической желтухой после 10 дня, так как у одного больного анализы значительно отличаются от нормы (у него еще не было операции), а у другого - уже ближе к норме (уже была операция). В дальнейших исследовательских расчетах информация, поступающая после 10 дня лечения больного, в диагностике не участвует (правильнее было бы, ограничится не 10-ым днем, а днем операции).

Сравнение результатов диагностики, приведенных в таблице 5.15, не вполне корректно. Ни у одного из пациентов нет ДП, определенных в каждый день течения болезни. Только для таких больных мы можем адекватно проследить влияние динамики болезней на диагностику - на то, как дополнительные анализы в каждый новый день улучшают или ухудшают результаты. Чтобы проследить, как влияет на результаты учет каждого нового диагностического дня, проведены эксперименты, по которым построены следующие таблица 5.16 и график на рис. 5.5.1.

Таблица 5. Численные эксперименты по учету динамики заболеваний Количество Процент поставленных диагнозов.

Всего дней, диагно- CE используемых правильных неправильн. неопределен.

зов для диагностики 1 564 84.5 2.3 13.1 0. 2 564 91.8 2.1 6.0 0. 3 564 93.1 1.6 5.3 0. 4 564 93.8 2.0 4.2 0. 5 564 93.1 2.0 4.9 0. По этой таблице построен следующий график.

1. 0. 0. 0. 0. 0. 0. 0. CE 0.901 0. 0. доля правильных диагнозов 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. доля неопределенных диагнозов 0.10 0. 0. 0. 0. доля неверных диагнозов 0. 0. 0. 0.014 0. 1 2 3 4 Рис. 5.5.1 График изменения результатов диагностики в зависимости от количества дней, используемых при диагностике Первым диагностическим днем считается день, когда у пациента впервые появились анализы (он не всегда совпадает с днем поступления пациента в больницу). Во втором эксперименте (2-я графа и 2-ой день на графике) были взяты данные пациентов, имеющих анализы в любые два дня, даже, если между ними есть еще дни, в которые анализы не были определены. В третьем эксперименте (3-я графа) диагностировались пациенты, имеющие анализы в любые три дня и т.д.

Расчет на 5-й день - лучший, в этом расчете для диагностики используется больше всего дней (и соответственно диагностических признаков). Неправильных диагнозов по пяти диагностическим дням поставлено меньше всего, а коэффициент эффективности - самый высокий. Результаты, приведенные на рис. 5.1, подтверждают вывод о том, что для улучшения диагностики следует учитывать динамику заболеваний.

В 1-й день лишь у 409 больных определены некоторые анализы и симптомы, получены результаты инструментальных обследований. Добавляя новую информацию, поступающую во 2-й день, 3-й день и т.д. мы получаем уточнение диагноза для всех пациентов и диагностируем других больных, у которых начинаются появляться анализы.

Учет динамики заболеваний - прием, впервые используемый в диагностических программах. Полагая, что признак в 1-й день и признак во 2-й день - два совершенно разных признака, стало возможным использовать поступающую к врачу информацию о динамике болезни. Несмотря на приближенность использованной в настоящем разделе методики учета динамики (использовано первое приближение, не учтено, что признаки в соседние дни сильно взаимозависимы) точность диагностики намного увеличивается.

5.6 Результаты байесовской диагностики с учетом динамики заболеваний Все основные результаты диагностики с использованием различных методических приемов сведены в сравнительную таблицу 5.17. В таблице представлены численные эксперименты предыдущих разделов и результаты диагностики с учетом динамики одномерных ДП по выработанным рекомендациям, в соответствии с которыми сильнозависимые многократно определенные значения ДП усредняются (в главе 4, в разделе 4.1, такой подход условно назван вторым приближением).

Таблица 5. Результаты основных численных экспериментов Результаты диагностики Процент поставленных диагнозов Правил. Неправ. Неопред.

1. По исходной базе данных без учета динамики 86 2 заболеваний 2. По ладаптированной базе данных, 93,5 2 4, учитывается динамика болезней 3. С применением двумерных распределений, 95 1 учитывается динамика 4. С усреднением многократно измеренных 97 1 признаков, учитывается динамика Как видно из таблицы, усреднение признаков, определенных в близкие дни (в близкие интервалы времени) (графа 4), дает больший эффект, чем учет двумерных зависимостей (графа 3). Данные таблицы также демонстрируют преимущество диагностики с использованием динамики болезней.

В 4-й графе таблицы отражен высокий уровень диагностики - 97% правильных диагнозов, 1% неправильных диагнозов, 2% - неопределенных диагнозов. Эти результаты позволяют говорить о том, что созданная методика диагностики реализует поставленные в настоящем исследовании цели.

Глава 6 Сравнение результатов дифференциальных диагностик методами Байеса, дискриминантного анализа, классификационных деревьев и нейронных сетей Кроме вышеизложенной диагностики на базе формулы Байеса по тем же самым исходным данным выполнялась диагностика еще тремя методами классификации и прогноза: дискриминантный анализ, классификационные деревья, нейронные сети.

Диагностика первыми двумя методами была проведена по программе Statistica, а методом нейронных сетей с помощью программы NeuroPro (Neuro Pro 0.25, автор Царегородцев Е.А., Красноярский центр нейросетевых исследований). В отличие от авторской программы диагностики, указанные программы требуют для расчетов полные наборы признаков для каждого больного.

При неполных наборах методы дискриминантного анализа и деревьев классификации обязывают заменить пропуски средними значениями для каждого ДП.

При диагностике методами дискриминантного анализа, классификационных деревьев и нейронных сетей были использованы оригинальные методические наработки, которые обеспечили эффективность диагностики по методу Байеса: учет динамики заболеваний путем использования диагностических признаков и их распределений в разные дни болезни, объединение распределений в близкие дни болезней, включение в ДП пола и возраста пациентов и др.

Таким образом, приводится не чистое сравнение авторской методики диагностики с другими методами. Чистое сравнение невозможно, т.к. эти три метода не работают с прямой базой данных, полученной по реальному обследованию больных. Они функционируют и показывают достойные результаты только с нашими оригинальными наработками.

Результаты сравнения перечисленных выше трех методов и нашей методики приведены в таблице 6.1. Для получения результатов использовались две процедуры оценки точности диагностики: кросс-проверка на тестовой выборке и проверка на полной выборке. Полная проверка производилась на всех больных, включенных в статистику. Для кросс-проверки из базы данных были извлечены случайным образом 20% тестовых больных. Обучение проходило на оставшихся 80%. Эта проверка более значима, ее результаты более близки к реальным.

Таблица 6. Результаты диагностики на полной выборке и кросс-проверке Метод диагностики и Процент поставленных диагнозов процедура тестирования правильных неправильных неопределенных 1а. Дискриминантный анализ 92 8 2а. Деревья классификации 93 7 3а. Формула Байеса 96 1 4а. Нейронные сети 97 3 1б. Дискриминантный анализ 94,5 5,5 2б. Деревья классификации 95 5 3б. Формула Байеса 97 1 4б. Нейронные сети 100 0 Пункт ла - кросс-проверка на тестовой выборке, б - проверка на полной выборке.

На полной выборке лучшие - нейронные сети (п. 4б - 100%). Этот результат несколько отдален от практики, так как диагностируемый пациент не исключен из базы данных (статистика фактически знает, чем болен каждый диагностируемый больной). Как только появляются новые, не входящие в базу обучения, больные (п. 4а) диагностика не столь безошибочна - 97%. Дискриминантный анализ и деревья классификации диагностируют с близкой точностью (п. 1а, 2а) 92% - 93%, (п. 1б, 2б) 94,5-95% и проигрывают по качеству диагностики другим тестируемым методам. Метод Байеса занимает промежуточное положение по проценту правильно поставленных диагнозов (96%), если же сравнивать по неправильно поставленным диагнозам, то метод Байеса - лучший (1% против 3% у нейронных сетей). Байес (см. п. 3а) у 3% пациентов лотказался ставить диагноз (3% неопределенных диагнозов), и количество неправильных диагнозов составило 1%. Высокая оценка метода Байеса представляется нам верной: лучше в ряде случаев отказаться от постановки диагноза, чем поставить неверный диагноз. Именно в этом смысле метод Байеса оказался несколько лучше нейронных сетей. В сведенных в таблицу 6.1 расчетах по всем методам использовалась динамика заболеваний. Без учета динамики диагностика ухудшается, что иллюстрируется таблицей 6.2, в которой приведены расчеты только по ДП одного дня болезни - дня поступления пациента в больницу.

Таблица 6. Для диагностики данные взяты один раз - в день поступления пациента в больницу Метод диагностики и процедура Процент поставленных диагнозов оценки точности Правильных неправильных неопределенных 1а. Дискриминантный анализ 91 9 2а. Деревья классификации 90,5 9,5 3а. Формула Байеса 85,5 2 12, 4а. Нейронные сети 90 5,5 4, 1б. Дискриминантный анализ 92 8 2б. Деревья классификации 91,5 8,5 3б. Формула Байеса 88 2 4б. Нейронные сети 100 0 Хотя по полной выборке нейронные сети - безошибочны, по кросс-проверке диагностика почти всех методик на уровне 90%. (Против 97% при учете динамики.) Лучший - дискриминантный анализ (91% правильных).

Метод Байеса отстает (85% правильных), но по неправильным диагнозам он опять лучший (2% против 9% у дискриминантного анализа и 5,5% у нейронных сетей). Учет динамики по разному повышает точность диагностики каждым методом. У дискриминантного анализа и деревьев классификации (при кросс проверке) рост числа правильных диагнозов не выше 2,5%. А у метода Байеса и нейронных сетей этот рост соответственно 10,5% и 7%. Так, без динамики метод Байеса и нейронные сети по числу правильных диагнозов хуже дискриминантного анализа и деревьев классификации, а при учете динамики метод Байеса и нейронные сети - значительно лучше остальных методов.

Положительное влияние учета динамики на диагностику сравнимо с различием между эффективностью разных методов. По проценту правильных диагнозов методы при кросс-проверке отличаются не более чем на 5,5 %, а средний рост правильных диагнозов из-за учета динамики - 5,25 %.

Заключение После того как были отлажены приемы работы с данными все тестируемые и предложенные методы показали хорошее или отличное качество диагностики. Это не слишком ожидаемый результат тем более, что даже лучшие из использованных методов не содержат гарантии постановки правильного диагноза. В чем же причина успеха методов? Представляется, что успешность математической диагностики основана на том, что в диагностических признаках содержится избыточная информация. Многократные указания на верный диагноз перекрывают не только расплывчивость другой части информации, но и ошибки диагностики. Не исключено, что успешность врачебной диагностики имеет аналогичную составляющую - избыточность исходной информации.

Основной результат настоящего исследования - новые предложения и выводы, среди которых отметим следующие.

Поставлена задача создания методов диагностики, сочетающих математический (статистический) и медицинский подходы. В качестве таких методов предложено дополнение статистики, основанное на понимании клинического течения заболевания, патологических изменений при нем и других медицинских знаниях, и задание условных вероятностей одних диагностических признаков (ДП) относительно других [104]4.

Показано, что переход к многомерным распределениям является естественным путем учета взаимозависимости ДП [95, 96, 99, 101, 110], предполагается, что повышение качества диагностики за счет использования многомерных ДП начинается тогда, когда количество статистических данных превысит определенный порог [112, 114].

Для решения теоретических вопросов диагностики математическими методами и тестирования разрабатываемых методов предложены имитационные модели болезней с возможностью моделировать динамику и взаимозависимость ДП, выбирать их число и др. [115, 120].

Здесь и далее в тексте заключения даны ссылки на авторские публикации, в которых сделаны приведенные выводы.

Введенный критерий эффективности диагностики вероятностными методами единообразно оценивает качество диагностики одного больного и группы больных и объективно отражает эффективность диагностики [111].

Поставлена и математически решена задача оптимальной последовательности обследования пациента, иными словами, нахождения диагностического признака, наиболее необходимого для дальнейшего уточнения диагноза и др. [102, 135].

Предложенная диагностика методом наибольшего правдоподобия [90 - 93, 95, 97, 99, 100, 101, 110] приводит к хорошим результатам [94, 98]. Разработанный алгоритм позволяет найти вероятность быстрее и надежнее, чем классические методы [101, 110].

Высказано предположение, что диагностика методом искусственных нейронных сетей может быть усилена использованием вероятностных методов [142, 143].

Создана методика диагностики с учетом многократно определенных диагностических признаков, в частности, методика диагностики с учетом динамики заболеваний [103 и др.]. Методика реализована в виде универсальной компьютерной программы, которая используется для диагностики механической и паренхиматозной желтух;

точность диагностики 97% правильных, 1% неправильных и 2% неопределенных диагнозов.

Литература 1. Представление и использование знаний / под ред. Х. Уэно, М. Исудзука. - М.: Мир, 1989. - 220 с.

2. Элти Дж. Экспертные системы: концепции и примеры / Дж. Элти, М. Кумба. - М.: Финансы и статистика, 1987. - 191 с.

3. Таунсенд К. Проектирование и программная реализация экспертных систем на ЭВМ / К. Таунсенд, Д. Фохт. - М.: Финансы и статистика, 1990.

4. Уотермен Д. Руководство по экспертным системам: пер. с англ. / Д. Уотермен. - М.: Мир, 1989. - 388 с.: ил.

5. An expert system for the diagnosis of epilepsy: results of a clinical trial / S. V. Thomas, J. R. Kurup, А. Kuruvilla etc. // Natl Med J India. - 2001. - Sep-Oct;

14(5).

- P. 274-276.

6. Экспертная система прогнозирования течения рака предстательной железы как результат базы данных канцер-регистра [Электронный ресурс] / О. В. Леонов, Д. И. Демин, Г. П. Букин и др. - Электронные данные. - Режим доступа:

7. Экспертные системы [Электронный ресурс]. - Электронные данные. - Режим доступа: 8. Экспертная система [Электронный ресурс]. - Электронные данные. - Режим доступа:

9. Диагностика коматозных состояний [Электронный ресурс]. - Электронные данные. - Режим доступа: 10. Экспертная система Vertigo [Электронный ресурс]. - Электронные данные. - Режим доступа: 11. Expert systems. Computers as sages by Howard Rheingold [Электронный ресурс]. - Электронные данные. - Режим доступа:

12. Экспертные системы медицинской диагностики. Достоинства и опыт реализации, обоснование экономической эффективности [Электронный ресурс]. - Электронные данные. - Режим доступа:

13. Boris. V. Maryanchik. Proceedings of the 1-st International Workshop of Central and Easten Europe on Multy-Agent System CEEMASТ99 / The Multy-agent System "Arrow" for the Development of Personal Sequential Diagnostics Systems in Medicine and Engineering. - 1999. - St.Peterburg, Russia. - Р. 337-339.

14. Экспертная диагностическая система Вест-синдром [Электронный ресурс]. - Электронные данные. - Режим доступа: 15. Нефротренажер Гематурия на основе компьютерной экспертной системы в оболочке Arrow для диагностики нефропатий, протекающих с синдромом гематурии у детей [Электронный ресурс]. - Электронные данные. - Режим доступа:

16. Место информационных технологий в практике здравоохранения [Электронный ресурс]. - Электронные данные. - Режим доступа: tech.com.ua/articles 17. Проверим алгеброй болезньЕ Новейшие компьютерные технологии на службе диагностики [Электронный ресурс]. - Электронные данные. - Режим доступа: 18. Программа Прогноз развития мозгового инсульта [Электронный ресурс]. - Электронные данные. - Режим доступа: medic/misc/files /insult.zip 19. Follicular Neoplasms of the Thyroid: Decision Tree Approach Using Morphologic and Morphometric Parameters / V. Deshpande, K. Kapila, S.K. Siva and K. Verma // Acta Cytol. - 1997. - V. 41. - P. 369 - 376.

20. Пупышева Т.Л. Использование ассоциативных правил для решения задач цитологической диагностики фолликулярных новообразований щитовидной железы [Электронный ресурс] / Т.Л. Пупышева, А.В. Демин. - Электронные данные. - Режим доступа: 21. Использование продукционных правил для дифференциальной диагностики болезни Шегрена / О.И. Щербаченко и др. // Прикладные информационные аспекты медицины. - 2000. - Т.3, №2.

22. Savasere A. An Efficient Algorithm for Mining Association Rules in Large Databases / A. Savasere, E. Omiecinski, S. Navathe // In Proc. 21st IntТl Conf. Very Large Data Bases / Morgan Kaufmann.- San Francisco, 1995.

23. Дифференциальная диагностика желтух [Электронный ресурс]. - Электронные данные. - Режим доступа:

24. Мингалеев А.А. Компьютерная система диагностики болезней внутренних органов [Электронный ресурс] / А.А. Мингалеев. - Электронные данные. - Режим доступа: 25. Жмудяк М.Л. К вопросу об использовании функциональных моделей в диагностике и лечении / М.Л. Жмудяк // Региональные проблемы информатизации:

труды Республиканской науч.-техн. конф. - Барнаул, 1995. - С.25-26.

26. Жмудяк М.Л. К использованию функциональных моделей в диагностике и лечении / М.Л. Жмудяк;

АлтГТУ. - Барнаул, 1995. - 28с.- Библиогр. - Рус. ЦДеп. в ВИНИТИ 05.04.95, №949-В95.

27. Айвазян С.А. Основы моделирования и первичная обработка данных / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин. - М.: Финансы и статистика, 1983.

28. Андерсон Т. Введение в многомерный статистический анализ / Т. Андерсон. - М.: Физматгиз, 1963. - 500с.

29. Бейли Н. Статистические методы в биологии /пер. с англ.;

под ред.

В. В. Налимова. - М.: Иностр. лит, 1962.

30. Бейли Н. Математика в биологии и медицине / Н. Бейли. - М.: Мир, 1970. - Гл. 11.

31. Биологическая и медицинская кибернетика: справочник / Минцер О. П.;

отв.

ред. Журавлев Ю.И. - Киев: Наукова думка, 1986. - 375 с.

32. Беллман Р. Математические методы в медицине / Р. Беллман. - М.: Мир, 1987. - 200 с.

33. Благуш П.П. Факторный анализ с обобщениями / П.П. Благуш. - М.:

Финансы и статистика, 1989. - 246 с.

34. Боровиков В.П. Statistica. Статистический анализ и обработка данных в среде Windows / В.П. Боровиков, И.П. Боровиков. - М.: Информационно- издательский дом Филин, 1997. - 608 с.

35. Медицинская информационная система / Н.М. Амосов, Н.Г. Зайцев, А.А. Мельников и др. - Киев: Наукова думка, 1971.

36. Вальд А. Статистические решающие функции / А. Вальд //Позиционные игры / под ред. Н.Н.Воробьева и Н.Н. Врублевской. - М.: Наука, 1967. - С. 300-522.

37. Ван дер Варден. Математическая статистика: пер. с нем. / Ван дер Варден. - М., 1960.

38. Волынский Ю.Д. О месте многомерной статистики в клинико физиологических исследованиях / Ю.Д. Волынский, А.И. Курочкина // Кардиология. - 1980. - Т.20, №5. - С. 88-91.

39. Генкин А.А. Интеллектуальные медицинские системы, алгоритмически формирующие знания //Стратегическое использование информационных систем:

материалы междунар. семинара / под ред. Р. Д. Галиерса, Б.Я. Советова. - СПб., 1992. - С. 64-66.

40. Генкин А.А. Парные коэффициенты корреляции клинико-лабораторных признаков: артефакты и трудности интерпретации / А.А. Генкин //Клиническая лабораторная диагностика - 1993. - №6. - С.71-73.

41. Горбань А.Н. Обучение нейронных сетей / А.Н. Горбань. Ц- М.: СП ПараГраф, 1991. - 300с.

42. Гублер Е.В. Информатика в медицине / Е.В. Гублер. - М.: Финансы и статистика, 1991.

43. Гублер Е.В. Вычислительные методы распознавания патологических процессов / Е.В. Гублер. - Л., 1970.

44. Гублер Е.В. Применение непараметрических критериев статистики в медико биологических исследованиях / Е.В. Гублер, А.А. Генкин. ЦЛ., 1973.

45. Дюран Б. Кластерный анализ: пер. с англ. / Б. Дюран. - М.: Статистика, 1977. - 128с.

46. Математические модели и оптические реализации многослойных и полиномиальных нейронных сетей / Н.Н. Евтихиев и др. - М., 1994. - 32 с. - (Препринт/МИФИ, 004-94).

47. Иберле К. Факторный анализ / К.Иберле. - М.: Статистика, 1980. - 398 с.

48. Кендалл М. Многомерный статистический анализ и временные ряды / М.

Кендалл, А. Стьюарт;

Pages:     | 1 | 2 | 3 |    Книги, научные публикации