С. М. Гусакова 1, А. С. Комаров 2, В. В. Устинов 3, В. Ю. Федорович 4 Вдоклад

Вид материалаДоклад

Содержание


Список литературы
Подобный материал:
УДК 001:4:510.64:162.3

ПРИМЕНЕНИЕ ДСМ-МЕТОДА К РЕШЕНИЮ ЗАДАЧ ПОЧЕРКОВЕДЧЕСКОЙ ЭКСПЕРТИЗЫ*

С.М. Гусакова1, А.С. Комаров2, В.В. Устинов3, В.Ю.Федорович4

В докладе излагаются идеи применения ДСМ-метода для решения идентификационных и диагностических задач почерковедческой экспертизы. Описывается язык представления данных и структура созданной базы данных.

Почерковедческая экспертиза, активно использующаяся в криминалистике, призвана помочь следствию установить исполнителя рукописного текста или некоторые его характеристики (такие, например, как пол, возраст и др.). Соответственно задачи экспертизы делят на идентификационные (установление исполнителя) и диагностические (установление личных характеристик исполнителя и условий выполнения рукописи) [Черенков, 1995].

Среди диагностических задач выделяется задача определения психофизиологических характеристик человека по особенностям его почерка [Орлова, 2006]. В дипломной работе слушателя Московского университета МВД Смирнова А.А. «Возможность установления темперамента исполнителя рукописей по общим признакам почерка» был проведен эксперимент, установивший наличие некоторой связи между особенностями почерка и темпераментом писавшего (почерк характеризовался общими признаками, темперамент характеризовался с помощью психологического теста).

Во всех случаях от эксперта требуется трудоемкая предварительная обработка рукописного текста, выделение признаков почерка и затем анализ. Причем эксперт пользуется одной из многих существующих методик. Для объективизации экспертных исследований применяются различные статистические и вероятностные методы, которые требуют наличия представительной выборки.

В докладе излагаются идеи применения ДСМ-метода для решения различных задач почерковедческой экспертизы и описывается структура созданной для программной реализации базы данных (БД).

ДСМ-метод автоматического порождения гипотез для баз фактов (БФ) с неполной информацией является логико-комбинаторным средством анализа структурированных данных и порождения гипотез о причинно-следственных зависимостях неявно содержащихся в БФ. Гипотезы о возможных причинах изучаемых эффектов являются средствами для прогнозирования этих эффектов [Финн, 1991].

ДСМ-метод реализует формализованные эвристики анализа данных в базах фактов. Эти эвристики являются правдоподобными рассуждениями, которые осуществляют синтез познавательных процедур – эмпирической индукции – порождения из БФ, содержащей позитивные (+) и негативные (-) примеры гипотез о (+) и (-) причинах изучаемого эффекта; аналогии – предсказания наличия (отсутствия) этого эффекта в случаях неопределенности посредством гипотез о (+ ) и (-) причинах и абдукции – объяснения начального состояния БФ посредством (+) и (-) гипотез для: либо принятия гипотез на достаточном основании, либо расширения БФ, либо констатации «практической расходимости» процесса предсказания.

Таким образом, ДСМ-метод реализует важный принцип – «сходство объектов определяет сходство эффектов и их повторяемость». Это отличает ДСМ-метод от статистических методов и делает его инструментом формализованного качественного анализа данных.

Для того, чтобы ДСМ-метод мог быть успешно применен, предметная область и задачи, решаемые в ней, должны удовлетворять определенным условиям – в плохо формализованной предметной области данные должны иметь структуру, позволяющую определить операцию сходства. Причем применение ДСМ-метода опирается на содержательный подход при построении представления данных и операции существенного сходства, а не просто операции, удовлетворяющей некоторым математическим условиям [Гусакова и др., 1987]. Наличие положительных (+) и отрицательных (-) примеров в базе фактов, а также эксплицитное присутствие в ней эмпирических зависимостей между причинами и эффектами ими вызываемыми, завершает список условий применимости ДСМ-метода. Задача в предметной области, удовлетворяющая перечисленным условиям, называется ДСМ-задачей.

Все перечисленные выше задачи почерковедческой экспертизы являются ДСМ-задачами, т. к. область плохо формализована, данные хорошо структурированы (почерк описывается большим количеством общих и частных признаков), что позволяет определить операцию сходства. Во всех задачах имеются положительные и отрицательные примеры. В данных эксплицитно присутствуют эмпирические зависимости между особенностями почерка и характеристиками писавшего (на признании этого факта основывается решение диагностической задачи почерковедческой экспертизы).

Следует отметить, что в терминологии принятой в ДСМ-методе, результат операции сходства объектов называют причиной проявления соответствующих эффектов (свойств). Конечно, набор характерных для данного исполнителя рукописи признаков почерка нельзя назвать причиной (в буквальном смысле этого слова) того, что исполнитель является женщиной или обладает темпераментом флегматика. Скорее наоборот, особенности исполнителя как человека вызывают особенности его почерка, поэтому этот набор будем называть «условной причиной».

Принадлежность задачи к классу ДСМ-задач является необходимым, но не достаточным условием возможности решения этой задачи с помощью ДСМ-метода. Анализ перечисленных задач почерковедческой экспертизы показал, что хотя все они являются ДСМ-задачами, но требуют для своего решения различных подходов. ДСМ-метод в целом - это набор методов и стратегий правдоподобных рассуждений и для его успешного применения необходимо использовать метод и стратегию, адекватные решаемой задаче. Первый шаг на пути к решению с помощью ДСМ-метода поставленной задачи – создание модели предметной области, т. е. разработка языка представления данных, включающая выделение объектов, описание их структуры и запись в соответствующем языке, описание эффектов (свойств), определение операции существенного сходства на объектах и отношения вложения, а также формулировка аксиом предметной области. Причем модель предметной области определяется не только самой этой областью, но и решаемой в ней задачей, т.к. от задачи зависит и представление данных и операция сходства. После построения модели формируется база фактов, которая содержит сведения об объектах и их свойствах, или иными словами содержит факты о том, какими свойствами каждый объект базы обладает, а какими нет (положительные и отрицательные примеры). Кроме того в БФ содержатся объекты свойства которых неизвестны.

Для решения всех перечисленных выше задач почерковедческой экспертизы объектом является рукописный текст, принадлежащий тому или иному исполнителю. Структура этого объекта определяется особенностями почерка, выражающимися в общих и частных признаках, т.е. признаках, относящихся ко всему почерку в целом и к исполнению отдельных букв. Поэтому была разработана единая база данных (БД), позволяющая вводить, корректировать и хранить объекты для всех задач.

В БД помимо текстов, которые получили название «документ» хранятся различные методики, а также варианты написания букв. С их помощью новые тексты вводятся в БД в соответствующем формализованном представлении.

Объект БД типа «документ» состоит из множества общих признаков с соответствующими значениями и множества наиболее частотных вариантов написания букв, характерных для этого документа, а также из ряда второстепенных характеристик, как-то: сведения об его авторе, виде документа, дате написания и т.п. Объекты этого типа вводятся в БД оператором на основе сделанных разработок документов. Информация об объектах данного типа хранится в пяти таблицах БД. Таблица Documents содержит общие сведения о документе, как-то: вид документа, дата выполнения, условия выполнения, автор и объем. В таблицах DocTypes и DocConditions перечислены все возможные виды документа и условия выполнения. В таблицах DocCF (CF от Common Features – общие признаки) и DocWoL (WoL от Way of Letter – образ буквы) перечислены для каждого документа значения общих признаков и варианты написания букв с указанием частоты их встречаемости, выделенные в документе экспертом.

В БД имеются две таблицы, хранящие информацию об авторах. Таблица Persons содержит сведения о фамилии, имени, отчестве, поле, годе рождения и психологическом типе автора. В таблице PsyTypes перечислены все возможные психологические типы человека.

Объект БД типа «методика» состоит из набора параметров (различных видов значимостей, используемые в существующих методиках) и множества подмножеств вариантов написаний для каждой буквы, где для каждого вошедшего варианта написания указаны значения всех параметров в данной методике. Объекты этого типа вводятся в БД оператором на основе разработанных методик. Информация об объектах типа «методика» хранится в двух таблицах БД. Таблица Methods содержит общие сведения о методике, как-то: имя и краткое описание. В таблице Weights перечислены параметры, используемые при оценке значимости вариантов написания букв, для каждой методики.

Объект БД типа «буква» представляет собой множество всех вариантов написаний данной буквы, где каждый вариант написания разделен на определенное количество частей (элементов и связей), каждая из которых описана с помощью частных признаков почерка. Варианты написания букв автоматически добавляются в БД при введении нового документа или методики, а объекты типа «буква» строятся путем простой группировки соответствующих вариантов написания.

Термин ‘буква’ в рамках данной БД имеет двоякое понимание, с одной стороны это рукописный/печатный символ, а с другой совокупность частных признаков. Для простоты понимания текста будем называть ‘букву’ во втором значении ‘вариантом написания буквы’, т.к. этот термин лучше отражает природу объекта. Информация об объектах данного типа хранится в четырех таблицах БД. Таблица Letters содержит сведения о букве: соответствующий символ и количество элементов, на которые он делится. В таблице WaysOfWriting хранятся описания абстрактных вариантов написания, построенные на основе информации об их элементах. Таблица WaysOfLetter содержит варианты написания букв, так абстрактный вариант написания присваивается конкретной букве. В таблице WolWeight хранятся значения параметров методик для каждого варианта написания буквы.

Информация об объектах типа «элемент буквы» хранится в четырех таблицах БД. В таблице PsyTypes перечислены все возможные типы элементов буквы. Таблица PartF содержит подмножества множества частных признаков. В таблице Parts хранятся описания этих подмножеств. Таблица WowPart содержит варианты написания элементов буквы, так абстрактный вариант написания присваивается конкретному элементу буквы с указанием его типа.

Информация об объектах типа «признак» хранится в двух таблицах БД. Таблица Features содержит сведения о признаках, как-то: название, тип, в каких частях буквы встречается (только для частных признаков). В таблице FValues перечислены все возможные значения для каждого признака.

Для описания объектов всех типов в данной модели используются одни и те же признаки почерка, что позволяет некоторым образом формализовать предметную область. Такой язык представления делает описания объектов универсальными, позволяя применять к одним и тем же документам разнообразные методики без изменения структуры их описания. Так же предусмотрена возможность пополнения языка представления новыми признаками, что придает модели определенную гибкость.

Аксиомы предметной области отражают представления экспертов о ней и методах решения задач в ней. Эти представления могут быть сформулированы экспертом устно или могут быть извлечены из научных трудов.

В данном случае выбираются следующие аксиомы.

Почерк взрослого человека имеет особенности, выражаемые как общими, так и частными признаками и в целом сохраняет их на протяжении длительного времени.

Индивидуальные характеристики человека (такие как пол, возраст и др.) и его психологические особенности накладывают отпечаток на особенности его почерка.

Внешнее сходство почерков связано с единой психофизиологической основой их формирования, в том числе с обучением по единой методике, единым нормам прописи и т.д.

Набор задач почерковедческой экспертизы хорошо демонстрирует зависимость элементов модели одной и той же предметной области от содержания задачи.

Анализ этих задач показывает, что выделенные в криминалистике виды – диагностические и идентификационные задачи концептуально различаются и с точки зрения ДСМ-метода и требуют применения различных методов сходства. Как отмечалось выше, из группы диагностических задач выделяется задача определения психофизиологических характеристик человека по особенностям его почерка. Таким образом, мы будем рассматривать три класса задач.

В задачах всех трех классов объекты – это образцы почерка, представленные в виде наборов общих и частных признаков. Состав и значение признаков зависит от выбранной экспертом методики, однако, даже при использовании одной и той же методики для задач разного класса реально используемые признаки могут отличаться с учетом различных определений операции содержательного сходства.

Свойства объектов различны в различных классах. В классе диагностических задач свойствами объекта являются те характеристики, которые мы хотим определить по почерку – пол, возраст, уровень образования и т.п. Эти свойства могут комбинироваться. Для задач идентификационного класса свойство – это сам исполнитель рукописного текста. В задаче определения темперамента свойства имеют сложную структуру, они описываются набором ответов на психологический тест.

Рассмотрим подход к решению каждого класса задач подробнее.

Для решения диагностических задач операция сходства должна выявлять признаки почерка, повторяющиеся у людей с общим диагностическим свойством (одного пола, одной возрастной группы и т. п.), но учитываться должны только общие признаки и частные признаки, характеризующие особенности выполнения общих элементов букв, а не конкретные особенности написания отдельных букв, т.к. эти последние признаки характеризуют индивидуальные особенности почерка, в то время как диагностические задачи являются обобщающими. Результат такой операции может быть признан «условной причиной» проявления диагностического свойства только в случае, если такой же набор признаков не встречается ни в одном из объектов с другим диагностическим свойством ( такой объект является (-)-примером для исследуемого свойства). Таким образом, для решения диагностических задач должен применяться прямой метод сходства с запретом на контрпримеры [Финн, 1991].

Задача идентификации требует применения модифицированного ДСМ-метода [Гусакова, 2002].

Действительно, при решении этой задачи эксперт имеет дело с рукописными текстами, как правило, небольшого размера, выполненными одним и тем же лицом. В каждом из этих текстов характерные особенности почерка встречаются не в полном объеме и только все вместе они дают достаточно точное представление о почерке данного лица. Поэтому операция сходства для этой задачи определяется как аналог операции объединения, а при описании объекта наряду с общими признаками особое внимание уделяется описанию частных признаков исполнения каждого элемента каждой буквы. (Ср. с задачей датировки берестяных грамот с помощью ДСМ-метода [Гусакова, 2004]).

Для задачи определения темперамента по почерку на первом этапе будет проводиться эксперимент в постановке, предложенной в дипломе А.А. Смирнова, т.е. рассматриваться четыре типа темперамента (сангвиники, холерики, меланхолики и флегматики), отнесение к тому или иному типу - по результатам психологического теста. Эти типы представляют в этой постановке множество свойств объектов. Представление объекта – образца почерка только через общие признаки. В такой постановке задача практически не отличается от других задач диагностического класса. В дальнейшем предполагается углубление постановки. Должен быть усложнен сам тест. Ответы на его вопросы должны быть не бинарные (да, нет) как это есть сейчас, а четырех типов – да, нет, скорее (или чаще) да, чем нет и скорее (или чаще) нет, чем да. Психологические типы должны формироваться по наборам вариантов ответов, в этом случае список их будет существенно богаче. В действительности чистые виды темпераментов встречаются редко. (Ср. [Климова и др., 1999]). Список признаков должен быть расширен.

В такой постановке задача определения темперамента по почерку представляет наиболее широкие возможности для использования ДСМ_метода. В этой задаче хорошо структурированы как данные, характеризующие почерк, так и психологические характеристики, поэтому здесь может быть использован как прямой, так и обратный метод сходства [Гусакова и др., 2000].

В заключение можно сказать, что применение ДСМ-метода в решении задач почерковедческой экспертизы позволит не только помочь эксперту в принятии решения и его обосновании, но и откорректировать методики и быть может создать новые.

Список литературы

[Гусакова и др., 1987] Гусакова С.М., Финн В.К. Сходство и правдоподобный вывод // Известия АН СССР.- Сер. Техническая кибернетика. -1987.- № 5.

[Гусакова и др., 2000] Гусакова С.М., Финн В.К. Об одной модели электорального поведения. // VII Национальная конференция с международным участием “Искусственный интеллект-2000”, Переславль-Залесский, Октябрь 24-27, 2000, Труды конференции, Т.1, ВИНИТИ, 2000.

[Гусакова, 2002] Гусакова С.М. ДСМ-метод, основанный на новом виде сходства . //6-я международная конференция НТИ-2002, «Информационное общество. Информационные ресурсы и технологии. Телекоммуникации», Труды конференции,- ВИНИТИ, 2002.

[Гусакова, 2004] Гусакова С.М. Подход к решению задач атрибуции исторических источников с помощью ДСМ-метода . // Новости искусственного интеллекта.- 2004.- №3

[Климова и др., 1999] Климова С.Г., Михеенкова М.А., Панкратов Д.В. ДСМ-метод как метод выявления детерминант социального поведения. // НТИ. Сер.2 – 1999.- №12.

[Орлова, 2006] Орлова В.Ф. Судебно-почерковедческая диагностика: учеб, пособие для студентов вузов / М.: ЮНИТИ-ДАНА, Закон и право, 2006.

[Финн, 1991] Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ //Итоги науки и техники. Сер. Информатика.- 1991.- Т. 15.

[Черенков, 1995] Черенков А.М. Возможности определения особенностей характера человека по признакам почерка // Экспертная практика. М., 1995. Выпуск 37.

1*Работа выполняется при поддержке программы фундаментальных исследований Президиума РАН «Автоматическое порождение гипотез и анализ данных посредством Решателей задач интеллектуальных систем» на 2006 г.

 125190 А-190 Москва, ул. Усиевича, д.20, ВИНИТИ РАН smg@viniti.ru

2 125993 ГСП-3 Москва, Миусская пл., д.6, РГГУ, erdraug@inbox.ru

3 117437, г. Москва, ул. Академика Волгина, д.12., МУ МВД России

4 117437, г. Москва, ул. Академика Волгина, д.12., МУ МВД России fevur@rambler.ru