Система семантического разбора для естественно-языковых текстов

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



Описаны алгоритмы системы анализа текста и разработана структура системы построения семантического разбора для естественно-языковых текстов.

Во время работы дипломного проекта разработан законченный продукт, подходящий для применения его в качестве анализатора текстов, предоставляющий на выходе семантическую сеть.

На сегодня создание системы семантического разбора естественно-языковых текстов является одной из самых актуальных задач в компьютерной лингвистике, решение которой позволило бы достичь высокого уровня формализации языковых структур в разнообразных прикладных целях: от создания систем автоматического распознавания речи до поисковых систем в Интернет.

Однако создание подобных систем для русского языка упирается в большое количество сложностей, связанных с недостаточно разработанной теоретической базой, в общем, и прикладном языкознании. Дело в том, что структуры человеческого языка отличаются разнообразием и часто высоким уровнем сложности, предусмотреть который чрезвычайно тяжело. В связи с этим, в настоящее время, предлагается структура семантического разбора естественно-языковых текстов работающего с простыми синтаксическими структурами. Создания системы, работающей с текстом на русском языке любой сложности, представляется на настоящем этапе невозможным.

В данной работе рассматривались так же вопросы охраны труда, связанные с тем, что операторы ЭВМ, операторы по подготовке данных, программисты по прежнему подвергаются воздействию физически опасных и вредных производственных факторов. Таких, как повышенный уровень шумов, повышенная температура внешней среды, отсутствие или недостаток естественного света, недостаточная освещенность рабочей зоны, электрический ток, статическое электричество и др. Определялись пути решения этих проблем, чтобы обеспечить безопасные условия труда для работников.

Особое внимание уделяется пожарной безопасности, так как пожары сопряжены с опасностью для человеческой жизни и большими материальными потерями. Немаловажным аспектом являются требования к оборудованию. Такие требование как поддержка чистоты ЭВМ от накопления пыли и грязи, выяснены стандарты монитора и требования к настройкам яркости, контраста и других параметров, изложенных в данном разделе.

Так же проведены расчеты отпускной цены программного продукта, которая составит 16083,34 грн. И сделаны выводы, что данная система семантического разбора естественно-языковых текстов в конечном итоге представляет собой на данном этапе исследовательскую работу. Но библиотеки данной системы можно использовать в коммерческих целях, они имеют широкую сферу применения, от перевода текстов на различные естественные языки, применения в поисковых системах, лингвистики, так и для представления знаний.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1._SyTech - разработка программного обеспечения: аналитические системы, электронный документооборот, корпоративные системы, информационные порталы //

2._TextAnalyst 2.0 - персональная система автоматического анализа текста //

3._Сулейманов Д.Ш., Аюпов М. Семантический анализ естественно-языковых текстов в вопросно-ответном режиме, 2003.

._Андрусенко Т.Б. Лингвистические структуры в компьютерных учебных средах. - Киев: Наукова Думка, 1994. - 160 с.

. Бухараев Р.Г., Сулейманов Д.Ш. Семантический анализ в вопросно-ответных системах. - Казань: Казан, 1990. - 124 с.

._Автоматическая Обработка Текста //

7._Википедия: Нина Николаевна Леонтьева - русский лингвист , специалист по структурной и прикладной лингвистике (ПЛ), преподаватель //

._Википедия: Сyc - проект по созданию объёмной онтологической знаний //

._Тематический анализ для естественно-языковых текстов //

._Википедия: SNePS - система представлния знаний //

._Леонтьева Н.Н. Система французско-русского автоматического перевода (ФРАП): лингвистические решения, состав, реализация. Проблемы создания системы автоматического перевода: Сб. научн. трудов МГПИИЯ им. М. Тореза. - М., 1987. - С. 6 - 25.

._Кудряшова И.М. О семантическом словаре в системе ФРАП: Сб. научн. трудов. - М.: МГПИИЯ им. М. Тореза, 1986. - 8 с.

._Леонтьева Н.Н. ПОЛИТекст: информационный анализ политических текстов: Сб. НТИ. - 1995.

. Леонтьева Н.Н, Кагиров И.А. Автоматический синтаксический анализ русских текстов, - Санкт-Петербург, 2003.

._Ножова И. Морфологическая и синтаксическая обработка текста (модели и программы): Диссертация. - 2003.

._Сокирко А. Морфологические модули //

._Сокирко А. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ), Диссертация. - 2003

._Бессмертный И.А. Искусственный интеллект: Учебное пособие. - СПб., 2010.

._Каригов И.А., Леонтьева Н.Н. Модуль синтаксического анализа для литературного русского языка. - СПб: Спирант, 2008.