Научно-исследовательская работа студентов: Материалы юбилейной 60-й научной студенческой конференции. Петрозаводск: Изд-во ПетрГУ, 2008. 325 с. Isbn 978-5-8021-0880-2

Вид материалаНаучно-исследовательская работа

Содержание


Секция «Математическое моделирование систем управления»
Моделирование эпидемического процесса
Технология организации доступа
Применение компьютерных технологий
Применение статистических методов
Анализ областей видимости петроглифов
Подобный материал:
1   ...   18   19   20   21   22   23   24   25   ...   68
^

Секция «Математическое моделирование систем управления»


НЕКОТОРЫЕ АСПЕКТЫ СОЗДАНИЯ
ЛИНГВИСТИЧЕСКИХ БАЗ ДАННЫХ

Некрасов М.
Научный руководитель — доктор тех. наук, проф. Рогов А. А.
Работа выполнена в рамках проекта, поддержанного грантом РГНФ
№ 05-04-12418в (руководитель А. А. Рогов)

Целью данной работы являлось описание разработки и организации работы с лингвистическими базами данных. Под лингвистическими базами данных в рамках данной работы понимаются грамматический словарь и синтаксическая база данных. Основой структуры любого грамматического словаря являются грамматические параметры слов. Для эффективности работы грамматические параметры у нас хранятся при помощи структуры дерева. Важнейшей частью системы работы со словарем является база данных. Пополнение словаря производится при помощи грамматического разбора новых текстов или конвертации информации из словарей других проектов. Большинство текстов для обработки бралось из журналов, редактором которых был Ф. М. Достоевский («Эпоха» и «Время»). Грамматический разбор текстов проводится филологами при помощи программы «СМАЛТ».

Первоосновой базы данных словаря стала грамматическая база данных, созданная ранее в проекте СМАЛТ (статистические методы анализа литературных текстов). Кроме того, для пополнения словаря использовалась информация из словарей других проектов: «Конкардансы Даля» и ПК «Атрибуция». Типичные проблемы, с которыми мы сталкивались при конвертациях: несоответствие наборов грамматических параметров и различия в используемых структурах хранения данных. Для предоставления информации из словаря был создан web-сайт, благодаря которому можно получить удаленный доступ к материалам словаря. Его адрес в Интернете: ссылка скрыта. Также создана локальная версия этого ресурса, предназначенная прежде всего для специалистов, имеющих проблемы с доступом в Интернет. Она распространяется на CD-диске. Главным преимуществом локального ресурса относительно web-сайта будет более гибкая работа со словарем: возможность редактирования словаря каждым специалистом в зависимости от его направления работы.

Одним из основных направлений развития системы СМАЛТ будет ее универсализация. Каждый пользователь должен получить возможность использовать свой собственный набор параметров для проведения любого разбора, какой он пожелает. В данный момент начинается работа по синтаксическому разбору текстов XIX в. Для этого филологами была сформулирована новая синтаксическая разметка, а программистами разработана новая программа по синтаксическому разбору. Она позволяет проводить синтаксический разбор как самих предложений, так и их отдельных частей.


^ МОДЕЛИРОВАНИЕ ЭПИДЕМИЧЕСКОГО ПРОЦЕССА
ПРИ ПОМОЩИ КЛЕТОЧНОГО АВТОМАТА

Зятева О.
Научный руководитель — канд. физ.-мат. наук, доц. Семенова Е. Е.

В последнее время появилось много публикаций, посвященных клеточным автоматам, которые используются для описания процессов различной природы: распространение слухов, движение толпы, газовая динамика и др. Клеточные автоматы являются базовыми моделями новой активно развивающейся науки — синергетики. Они представляют собой дискретное пространство, в котором происходит эволюция,
и включают правила, определяющие ее развитие. Целью данной работы является построение клеточного автомата для процесса распространения эпидемии на ограниченной территории.

Дискретное пространство разработанного клеточного автомата — это прямоугольная таблица, как набор клеток, каждая из которых может находиться в одном из следующих состояний: здоровая (восприимчивая к заболеванию), инфицированная и приобретшая иммунитет. Перечислим условия протекания процесса:

• изолированность территории (например, школа);

    • отсутствие миграции;

    • источник инфекции появился извне.

Для моделирования эпидемического процесса были предложены следующие правила: заражения и выздоровления. Заражение здоровой клетки происходит в том случае, если количество инфицированных соседей более четырех (считаем, что каждая клетка имеет восемь соседей). Инкубационный период составляет один день, поэтому заражение произойдет уже на следующий день. Продолжительность болезни
(количество дней) зависит от тяжести заболевания, поэтому по истечении данного периода происходит полное выздоровление с приобретением иммунитета.

Реализация клеточного автомата была выполнена в среде EXCEL. Таблица включает следующие листы: лист, содержащий входные данные (начальное состояние процесса); лист, содержащий правила развития эпидемии; лист с диаграммами, отображающими динамику числа клеток разного типа (состояния). Организовано пошаговое моделирование процесса (шаг соответствует одному дню) с использованием макросов Visual Basiс.

Предполагается, что результаты моделирования могут быть использованы при принятии решения о разработке мероприятий для предотвращения развития эпидемии.

^ ТЕХНОЛОГИЯ ОРГАНИЗАЦИИ ДОСТУПА
К ЛИНГВИСТИЧЕСКИМ БАЗАМ ДАННЫХ
НА ПРИМЕРЕ ИАС «СМАЛТ»

Седов А.
Научный руководитель — доктор тех. наук, проф. Рогов А. А.
Работа выполнена в рамках проекта, поддержанного грантом РГНФ № 05-04-12418в (руководитель А. А. Рогов)

Корпус — это информационно-справочная система, основанная на собрании текстов на некотором языке в электронной форме. Создание корпусов в первую очередь предназначено для обеспечения научных исследований лексики и грамматики языка, а также тонких, но непрерывных процессов языковых изменений, происходящих в языке. Причем интерес представляет не только изменение языка на сравнительно небольшом периоде, но и трансформация его между столетиями. Еще одной задачей при создании корпуса можно назвать предоставление всевозможных справок, относящихся к определенным областям (лексика, грамматика). Благодаря современным компьютерным технологиям возможно упростить и многократно ускорить обработку больших объ-
емов литературы. Также упрощается при этом процедура проверки
и поиска определенных слов.

СМАЛТ — система математического анализа литературных текстов выделяется из множества других корпусов тем, что имеет возможность работы с текстами, используя символы юникода, и в частности работает с текстами XIX в. Данная система предоставляет несколько способов доступа к накопленным знаниям. Первый — доступ через Интернет, второй — при помощи установки на локальный компьютер версии программы. Более рациональным является создание общего хранилища текстов, поскольку это позволит концентрировать огромный объем данных в одном месте и исследователям будет упрощен поиск и доступ к материалам исследований других ученых. На основании данных из хранилища различные исследователи могут как делать собственные выводы, так и находить или опровергать догадки. Зачастую исследователю необходим собственный набор признаков и текстов для проведения исследований. Возвращаться к ручной работе не имеет смысла,
а использовать результаты других исследований порой не имеет смысла, поскольку набор признаков может существенно отличаться. Создание нового собственного корпуса (ПО для работы) будет задачей сложной и трудоемкой, что не может позволить себе рядовой исследователь. Поэтому важной задачей представляется создание программного обеспечения, которое помогало бы на основании уже созданных корпусов, на основе многолетнего опыта разработки среды создавать собственные корпуса и опубликовывать их в Интернете.

^ ПРИМЕНЕНИЕ КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ
ПРИ ИЗУЧЕНИИ ПЕТРОГЛИФОВ КАРЕЛИИ

Рогова К., Быстров М.
Научный руководитель — доктор тех. наук, проф. Рогов А. А.
Работа выполнена в рамках проекта, поддержанного грантом РГНФ № 08-01-1211в (руководитель Н. В. Лобанова)

При создании любой коллекции электронных изображений возникает три задачи: приведение графических документов к единому стандарту, удобному для формирования базы данных; формирование базы графических документов; разработка комплекса программ по поиску в электронной коллекции документов. Данная работа посвящена способам решения трех вышеперечисленных задач на примере создания коллекции электронных изображений петроглифов Карелии, реализованных в информационно-поисковой системе «PIRS». Эта система, обеспечив наглядность и доступность исторического материала, позволяет, наряду с традиционными, применять математические методы и компьютерные технологии при исследовании петроглифов.

Информационно-поисковая система «PIRS» состоит из четырех блоков: базы данных петроглифов, модуля подготовки изображений для базы данных, модуля онлайнового доступа и модуля локального доступа к базе данных. Модули онлайнового, локального доступов к базе данных предназначены для поиска изображений по различным критериям. На вход подается исследуемое изображение, а на выходе должны появиться изображения из базы данных, наиболее похожие на исходное. Определенную сложность поиска создают фактическое отсутствие некоторых частей изображения и частая невозможность определить, где верх, а где низ изображения. При этом требование, что при поиске необходимо только совпадение контура изображения, позволяет упростить поиск, и изображение петроглифа можно рассматривать как бинарное. В зависимости от выбранных параметров поиска будет найдено одно или несколько изображений. Для поиска используются сеть адаптивного резонанса и структурный метод поиска. В настоящее время заканчивается разработка двухуровневого метода поиска.

Разработанные информационные методы анализа петроглифов и полученные с их помощью результаты позволяют использовать их при анализе петроглифов других регионов России и во всем мире. В настоящее время ведутся разработки по присоединению в систему «PIRS» информации о петроглифах Северной Фенноскандии, в первую очередь петроглифах Мурманской области (Канозеро) и Норвегии (Альта).

^ ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ
ДЛЯ ОПРЕДЕЛЕНИЯ СКЛОННОСТИ ПОДРОСТКОВ
К УПОТРЕБЛЕНИЮ НАРКОТИЧЕСКИХ СРЕДСТВ

Кириличева А.
Научный руководитель — канд. тех. наук, доц. Шабалина И. М.

Для определения склонности подростков к употреблению алкоголя, наркотиков и курению специалистами используется анкетирование и дальнейший анализ результатов анкетирования. Задача состоит в разработке алгоритмов, основанных на статистических методах построения диагностических правил, позволяющих с максимальной надежностью определить степень склонности подростка к употреблению указанных веществ. На базе этих алгоритмов необходимо создать систему поддержки принятия решения (СППР).

В исследовании использовались результаты анкетирования 208 человек по анкетам, содержащим 192 вопроса. Анкетирование проводилось кафедрой психиатрии ПетрГУ (заведующий кафедрой М. М. Буркин) среди учащихся старших классов. Для этих подростков эксперт определял степень их склонности к употреблению наркотических веществ. Подростки с известной экспертной оценкой склонности составляют обучающую выборку.

Особенностью исходных данных являются: номинальные (неколичественные) значения признаков и большое количество признаков при относительно малом количестве объектов обучающей выборки.

Для работы с номинальными признаками удобно их представление
в дихотомическом виде.

Для сокращения количества признаков использовались результаты проверки взаимосвязи признаков и влияния каждого признака на склонность к употреблению наркотических средств. Выявлено 18 информативных признаков.

При построении диагностических правил применялись следующие методы: методы построения линейных разделяющих функций, частотный метод (основан на вычислении частотных характеристик обучающей выборки), метод, позволяющий поставить обобщенный диагноз. Частотный и обобщенный методы показали лучшие результаты при распознавании склонности к употреблению наркотических средств
(до 82 % правильно поставленных диагнозов).

В результате проделанной работы были выявлены наиболее информативные признаки, предложены методы построения диагностических правил для определения склонности подростков к употреблению наркотических средств, разработана СППР, в которой реализованы вышеуказанные методы.

^ АНАЛИЗ ОБЛАСТЕЙ ВИДИМОСТИ ПЕТРОГЛИФОВ

Кириков П.
Научный руководитель — доктор тех. наук, проф. Рогов А. А.
Работа выполнена в рамках проекта, поддержанного грантом РГНФ № 08-01-1211в (руководитель Н. В. Лобанова)

Петроглифы Карелии — ценнейший памятник первобытной эпохи, получивший мировую известность. Путем изучения областей видимости наскальных рисунков можно отвечать на вопрос о целевой аудитории автора, распознав изображение петроглифа, делать выводы о символическом значении данного образа для древних людей, что поможет лучше понять особенности быта и образа жизни.

Видимость объекта характеризуется степенью видимости и дальностью видимости, то есть расстоянием, с которого наблюдаемый объект становится различимым глазом. Видимость объекта зависит от его яркостного контраста, освещенности, угла зрения, наличия в воздухе частичек пыли, мельчайших капелек и кристалликов воды, которые рассеивают свет и уменьшают дальность видимости, а также от остроты зрения наблюдателя. Для петроглифов определяющим видимость параметром становиться угол наблюдения, зависящий от размеров петроглифа и расстояния до него.

Для анализа видимости создан сканер топографических карт и модуль к информационно-аналитической системе «PIRS».

Сканер топографических карт позволяет, используя оцифрованную версию карты, ввести данные о высотах в отмеченных точках, производит расчет высот вдоль линий топографической карты и аппроксимацию высот по всей карте. Результатом работы сканера является файл карты, содержащий матрицу высот и координаты расположения наскальных рисунков.

Модуль анализа видимости, используя файл карты, созданный сканером, предоставляет пользователю интерфейс по работе с картой, позволяя передвигаться по ней и изменять масштаб изображения. При выборе петроглифа модуль, используя данные о топографии местности, параметры роста наблюдателя и минимального угла зрения, производит анализ области видимости наскального рисунка. Область наглядно отображается на карте местности. Полученные данные могут быть использованы для исторического анализа петроглифов. Данные о площади видимости наскальных рисунков могут косвенно указывать на размер племени древних людей.