Система семантического разбора для естественно-языковых текстов
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
Описаны алгоритмы системы анализа текста и разработана структура системы построения семантического разбора для естественно-языковых текстов.
Во время работы дипломного проекта разработан законченный продукт, подходящий для применения его в качестве анализатора текстов, предоставляющий на выходе семантическую сеть.
На сегодня создание системы семантического разбора естественно-языковых текстов является одной из самых актуальных задач в компьютерной лингвистике, решение которой позволило бы достичь высокого уровня формализации языковых структур в разнообразных прикладных целях: от создания систем автоматического распознавания речи до поисковых систем в Интернет.
Однако создание подобных систем для русского языка упирается в большое количество сложностей, связанных с недостаточно разработанной теоретической базой, в общем, и прикладном языкознании. Дело в том, что структуры человеческого языка отличаются разнообразием и часто высоким уровнем сложности, предусмотреть который чрезвычайно тяжело. В связи с этим, в настоящее время, предлагается структура семантического разбора естественно-языковых текстов работающего с простыми синтаксическими структурами. Создания системы, работающей с текстом на русском языке любой сложности, представляется на настоящем этапе невозможным.
В данной работе рассматривались так же вопросы охраны труда, связанные с тем, что операторы ЭВМ, операторы по подготовке данных, программисты по прежнему подвергаются воздействию физически опасных и вредных производственных факторов. Таких, как повышенный уровень шумов, повышенная температура внешней среды, отсутствие или недостаток естественного света, недостаточная освещенность рабочей зоны, электрический ток, статическое электричество и др. Определялись пути решения этих проблем, чтобы обеспечить безопасные условия труда для работников.
Особое внимание уделяется пожарной безопасности, так как пожары сопряжены с опасностью для человеческой жизни и большими материальными потерями. Немаловажным аспектом являются требования к оборудованию. Такие требование как поддержка чистоты ЭВМ от накопления пыли и грязи, выяснены стандарты монитора и требования к настройкам яркости, контраста и других параметров, изложенных в данном разделе.
Так же проведены расчеты отпускной цены программного продукта, которая составит 16083,34 грн. И сделаны выводы, что данная система семантического разбора естественно-языковых текстов в конечном итоге представляет собой на данном этапе исследовательскую работу. Но библиотеки данной системы можно использовать в коммерческих целях, они имеют широкую сферу применения, от перевода текстов на различные естественные языки, применения в поисковых системах, лингвистики, так и для представления знаний.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1._SyTech - разработка программного обеспечения: аналитические системы, электронный документооборот, корпоративные системы, информационные порталы //
2._TextAnalyst 2.0 - персональная система автоматического анализа текста //
3._Сулейманов Д.Ш., Аюпов М. Семантический анализ естественно-языковых текстов в вопросно-ответном режиме, 2003.
._Андрусенко Т.Б. Лингвистические структуры в компьютерных учебных средах. - Киев: Наукова Думка, 1994. - 160 с.
. Бухараев Р.Г., Сулейманов Д.Ш. Семантический анализ в вопросно-ответных системах. - Казань: Казан, 1990. - 124 с.
._Автоматическая Обработка Текста //
7._Википедия: Нина Николаевна Леонтьева - русский лингвист , специалист по структурной и прикладной лингвистике (ПЛ), преподаватель //
._Википедия: Сyc - проект по созданию объёмной онтологической знаний //
._Тематический анализ для естественно-языковых текстов //
._Википедия: SNePS - система представлния знаний //
._Леонтьева Н.Н. Система французско-русского автоматического перевода (ФРАП): лингвистические решения, состав, реализация. Проблемы создания системы автоматического перевода: Сб. научн. трудов МГПИИЯ им. М. Тореза. - М., 1987. - С. 6 - 25.
._Кудряшова И.М. О семантическом словаре в системе ФРАП: Сб. научн. трудов. - М.: МГПИИЯ им. М. Тореза, 1986. - 8 с.
._Леонтьева Н.Н. ПОЛИТекст: информационный анализ политических текстов: Сб. НТИ. - 1995.
. Леонтьева Н.Н, Кагиров И.А. Автоматический синтаксический анализ русских текстов, - Санкт-Петербург, 2003.
._Ножова И. Морфологическая и синтаксическая обработка текста (модели и программы): Диссертация. - 2003.
._Сокирко А. Морфологические модули //
._Сокирко А. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ), Диссертация. - 2003
._Бессмертный И.А. Искусственный интеллект: Учебное пособие. - СПб., 2010.
._Каригов И.А., Леонтьева Н.Н. Модуль синтаксического анализа для литературного русского языка. - СПб: Спирант, 2008.