Известно, что читателя в библиотеке всё больше интересует доступ непосредственно к документу, а в самом документе то, что отвечает на его конкретный запрос

Вид материалаДокументы

Содержание


Соблюдение Закона об авторских правах РФ при использовании интеллектуально-справочной информационной системы.
Подобный материал:
Модестов С.Ю.

к.п.н., профессор, зав. кафедрой Санкт-Петербургского государственного университета сервиса и экономики

modestov-s@mail.ru

Дементьева Т.Б.

заслуженный работник культуры, доцент Санкт-Петербургского государственного университета сервиса и экономики

Фадеев П.Э.

генеральный директор ОДО "Интелпарт", Минск


ТЕХНОЛОГИЯ ОСМЫСЛЕННОЙ ОБРАБОТКИ ИНФОРМАЦИИ И ЕЕ ПРИМЕНЕНИЕ В ОБРАЗОВАНИИ


Известно, что читателя в библиотеке всё больше интересует доступ непосредственно к документу, а в самом документе — то, что отвечает на его конкретный запрос. То есть читателю, строго говоря, не нужны издания — ему нужны мысли, знания, решения, которые содержатся в текстах. Однако на подобную обработку информации, структурирование текстов у библиотеки чаще всего не хватает ни кадров, ни времени. Почему? Многие замечали, что с течением времени «концентрация мыслей» на килограмм бумаги или килобайт текста существенно падает, а количество источников растёт.

Казалось бы, с развитием компьютерных технологий, появлением Интернета качество информационного поиска должно было возрасти. Однако бóльшая часть работы с информацией и знаниями выполняется так же, как она выполнялась жрецами во времена египетских фараонов. Старший жрец посылает юного помощника в хранилище рукописей за необходимыми свитками, изучает содержимое и при необходимости конспектирует. За многие тысячелетия процедура работы со знаниями осталась почти без изменений, только сейчас «на посылках» у ищущего информацию — Интернет. Работа непосредственно с содержанием, со смыслом информационного источника ведётся так же, как во «времена египетские». Поисковые системы Интернета не способны заменить «ручной интеллектуальный труд», работу со смыслом материала. В оптике есть телескоп, а в информатике есть поисковые системы, Интернет. И те, и другие позволяют обозревать необозримые без них просторы, макромир. Однако в оптике есть ещё и микроскоп, который позволяет увидеть микромира. Хорошо бы, чтобы в информатике был свой «микроскоп»…

Нужен был следующий шаг — система, которая «понимает» смысл текста. И такая система была создана. Это разработка «Интеллектуальный партнёр» минских учёных из компании «Интелпарт». Главное достоинство данной системы — способность «понимать» запрос пользователя на живом языке. Система способна находить в файлах фрагменты, содержащие ответ на поставленный вопрос. Поиск ответов ведётся не по формальному совпадению символов (как, например, в Яндексе, Рамблере или Google), а по содержанию запроса: система способна находить аллегории, сравнения, прецеденты.

Работы фактически были начаты в 1989 году. Сначала компания занималась управлением коллективами; когда накопились большие картотеки по управлению, потребовалось мгновенно осуществлять навигацию в этих текстах. И к 1998 г. появилась первая версия осмысленного поисковика. Любопытно, что первая версия была в некотором смысле побочным, сервисным продуктом – она работала только внутри систем управления персоналом. Но постепенно выяснилось, что эта программа может жить самостоятельно, и в начале 2000-х гг. появилось ПО «Интеллектуальный партнер» компании «Интеллектуальный партнер».

Компания «Интелпарт» первая сконструировала «микроскоп для знаний»1, но существуют и другие разработки, ориентированные на работу со смыслом текста. Интересна разработка «Document Explorer» корпорации «Майкрософт» для MSDN. Хорошая программа, но выстраивать все необходимые смысловые связи она не умеет, это приходится делать экспертам. Хлопотно, дорого, субъективно, не оперативно.

Программу осмысленного поиска планирует создать один из лидеров Российского IT-рынка компания «ABBYY». В её разработку уже вложены 500 человеко-лет труда, и планируется вложить ещё столько же. Это не может не внушать уважение и позволяет сделать вывод, что в обозримое время появится интересный продукт2.

Без сомнения, хорош проект МГУ по созданию поисковой системы «NIGMA». Опираясь на алгоритмы кластеризации, она автоматически выявляет наиболее часто употребляемые смысловые связи (но не все). Эта система в ряде случаев действительно существенно облегчает поиск источников информации. Если разработчикам удастся успешно освоить ещё 340 тысяч долларов, выделенных «на научные исследования в области создания новых алгоритмов для интернет-поисковых систем»3, то они могут смело переходить к созданию персонализированных систем, позволяющих не только находить требуемые источники информации, но и работать с ними.

Технология осмысленного поиска информации особенно интересна в образовательном процессе. Одна из основных проблем современного образования - информационная перегрузка учащихся. Скачиваются рефераты, пишутся на заказ дипломы… На самом деле, учащиеся перегружены ненужной информацией, «мусором». По каждому запросу поисковая машина выдаёт сотни тысяч ссылок, десятки и сотни источников по каждой теме. Скажем, по запросу «нематериальная мотивация персонала» Яндекс выдаёт 271 000 ссылок, по запросу «окислительно-восстановительные реакции» — 124 000 ссылок. Понятно, что просмотреть эти массивы невозможно физически. Предлагаемая система не отменяет интеллектуальный труд: она проводит своего рода «обогащение информационной руды», и учащийся работает гораздо эффективнее, не тратя время на выуживании драгоценных крупиц нужных знаний.

С помощью такой системы, имея возможность получить доступ к любому фрагменту текста с учётом его смысла, педагогам также значительно легче вести научную, педагогическую и методическую работу. Значительно упрощается процесс подготовки материалов к занятиям, кейсов заданий для учащихся, учебных пособий, в том числе компендиумов, хрестоматий, сборников.

Как устроена система «Интеллектуальный партнер»? Концепция работы программы опирается на понятие «элементарного смысла». Под элементарным смыслом слова понимается система его связей и отношений с другими словами.

Когда программа «читает тексты», то работает лингвистический процессор на основе грамматического кода профессора В.А.Карпова, модуля русской морфологии, созданного рабочей группой AOT.RU, которую возглавляет к.ф.н. А.В. Сокирко, и авторских механизмов взаимодействия модулей элементарного смысла. Процесс чтения состоит из трех основных этапов:

1. Предложения текста разбирает грамматический процессор, определяя, где в предложении подлежащее, сказуемое, дополнение и т.д.

2. Далее, разобранное предложение обрабатывает синтаксический процессор, определяя, структуру ролей в предложении: где в предложении субъект, где объект, где акция и т.д. В результате имеем ролевую структуру предложения.

3. Семантический процессор на основе ролевой структуры формирует модули смыслов и увязывает их между собой. Получаем структуру предложения в виде взаимодействия смысловых модулей.

Таким образом, в результате чтения исходный текст начинает существовать как бы в двух взаимосвязанных плоскостях. Первая – это собственно сам исходный текст так, как он написан. Вторая – это тот же текст, но представленный (переписанный) в виде взаимосвязи смыслов слов в предложениях.

При работе с программой:

1. Задавая программе слово или предложение, мы попадаем в определенную точку информационного пространства, окруженную присущими этой точке смыслами.

2. Затем в зависимости от того, что требуется (выбор того или иного смысла), мы переходим к следующему смыслу, но уже в контексте предыдущего.

3. Выстроив требуемую цепочку смыслов, мы выходим в определенное место исходного текста, которое содержит интересующий нас смысл.

Поскольку контекст каждого последующего смысла учитывает предыдущий, то возникает эффект, когда на необходимые знания, расположенные в некой информационной сфере (в геометрическом смысле), мы можем выходить, начиная с любой точки на поверхности такой условной информационной сферы.

Возможности использования интеллектуально-справочной информационной системы в учебном процессе достаточно широки. Студенты могут использовать данную систему при подготовке к семинарским и практическим занятиям, написании рефератов, контрольных, курсовых, дипломных работ, самообразовании, самостоятельном изучении новых курсов, подготовке к экзаменам, зачетам. Преподаватели могут использовать данную систему при подготовке к лекционным и семинарским занятиям, составлении учебных программ, учебно-методических пособий, научно-исследовательской и научно-методической работе.

Преимущества интеллектуально-справочной информационной системы в учебном процессе:

1. Студенты более качественно и предметно работают с материалами курса.

2. При работе с подборкой цитат по запросу, студенты осуществляют аналитико-синтетическую деятельность, что способствует формированию научного стиля мышления.

3. Студенты не только приобретают новые знания, но и получают инструмент для постоянного использования их в своей реальной практике.

4. Интеллектуально-справочную систему можно создать по любому курсу (необходимо лишь скомплектовать базы знаний по нужным темам, а сам поисковик – остается неизменен).

5. Дополнительно появляется возможность непрерывного информационного сопровождения студентов (например, заочников) после завершения учебного курса.

6. Поскольку система создает подборки прецедентов по различным запросам, это существенно упрощает написание курсовых, контрольных и других работ – существенно снижается скачивание работ из Интернета.

7. Система является отличным помощником для профессорско-преподавательского состава при подготовке к занятиям, при ведении научной работы.

Соблюдение Закона об авторских правах РФ при использовании интеллектуально-справочной информационной системы.

Каждая интеллектуально-справочная информационная система содержит в себе базу знаний, представленную научными, научно-публицистическими, художественными произведениями отечественных и зарубежных авторов, газетных и журнальных статей, тезисов конференций. Список литературы каждой базы знаний прилагается.

В интеллектуально-справочной информационной системе тексты, то есть базы знаний существуют в виде подборки смысловых цитат. Это осуществляется за счет обработки баз знаний специальной программой-перфоратором, встроенной в интеллектуально-справочную информационную систему. После этого база из сплошного состояния превращается в «дырявое», и является согласно ст. 11 - подборкой цитат. Согласно ст. 19 п. 1 цитирование разрешается без выплаты авторского вознаграждения.

Цитаты из закона РФ об авторском праве (в ред. Федерального закона от 19.07.95 N 110-ФЗ):

«Статья 11. Авторское право составителей сборников и других составных произведений

1. Автору сборника и других составных произведений (составителю) принадлежит авторское право на осуществленные им подбор или расположение материалов, представляющие результат творческого труда (составительство). Составитель пользуется авторским правом при условии соблюдения им прав авторов каждого из произведений, включенных в составное произведение. Авторы произведений, включенных в составное произведение, вправе использовать свои произведения независимо от составного произведения, если иное не предусмотрено авторским договором. Авторское право составителя не препятствует другим лицам осуществлять самостоятельный подбор или расположение тех же материалов для создания своих составных произведений.

Статья 19. Использование произведения без согласия автора и без выплаты авторского вознаграждения. Допускается без согласия автора и без выплаты авторского вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и источника заимствования:

1) цитирование в оригинале и в переводе в научных, исследовательских, полемических, критических и информационных целях из правомерно обнародованных произведений в объеме, оправданном целью цитирования, включая воспроизведение отрывков из газетных и журнальных статей в форме обзоров печати;

2) использование правомерно обнародованных произведений и отрывков из них в качестве иллюстраций в изданиях, в радио- и телепередачах, звуко- и видеозаписях учебного характера в объеме, оправданном поставленной целью; 3) воспроизведение в газетах, передача в эфир или сообщение по кабелю для всеобщего сведения правомерно опубликованных в газетах или журналах статей по текущим экономическим, политическим, социальным и религиозным вопросам или переданных в эфир произведений такого же характера в случаях, когда такие воспроизведение, передача в эфир или сообщение по кабелю не были специально запрещены автором;

4) воспроизведение в газетах, передача в эфир или сообщение по кабелю для всеобщего сведения публично произнесенных политических речей, обращений, докладов и других аналогичных произведений в объеме, оправданном информационной целью. При этом за автором сохраняется право на опубликование таких произведений в сборниках;

5) воспроизведение или сообщение для всеобщего сведения в обзорах текущих событий средствами фотографии, путем передачи в эфир или сообщения для всеобщего сведения по кабелю произведений, которые становятся увиденными или услышанными в ходе таких событий, в объеме, оправданном информационной целью. При этом за автором сохраняется право на опубликование таких произведений в сборниках;

6) воспроизведение правомерно обнародованных произведений без извлечения прибыли рельефно-точечным шрифтом или другими специальными способами для слепых, кроме произведений, специально созданных для таких способов воспроизведения».

Чем выше квалификация специалиста, тем четче и в большей степени он работает с информационными источниками, прецедентами, примерами, тем четче, лучше, результативней он использует реальные информационные источники. Задача системы не в том, чтобы чему-то обучить. Ее задача – помочь быстро воспользоваться имеющимися знаниями, которые слоями хранятся в памяти, и сопоставить их с некими новыми знаниями, с другими мнениями, точками зрения, подходами. Эффект пользования системой достигается не за счет того или иного источника, а за счет их совместной и практически одновременной работы с ними – это главное. Для того чтобы что-то найти в Интернете, нужно заранее знать, что ты хочешь найти. По сути, нужно знать заранее, что требуется. При поиске в Интернете информация находится по ключевым словам, в системе она лежит и используется по ключевым смыслам. На один запрос любой Интернет-поисковик выдает несколько десятков тысяч ответов, просмотреть которые в разумное время просто невозможно – тем более найти искомое. При этом для работы с системой время не требуется. Она как раз и позволяет существенно экономить время при информационном поиске. Эта система – принципиально новый подход к работе с информацией, она не оперирует ключевыми словами, как это делают все обычные программы, а оперирует смыслами – связками между слов, поэтому немного не похожа на обычные программы и обладает своей спецификой. Для некоторых понятий – например, «время», «деньги», «система» и т. п. очень долго строится дерево смыслов. Дело в том, что перечисленные понятия обладают очень широким смыслом, поэтому их используют везде, отсюда и огромные деревья смыслов. По замечанию одного из испытателей, после ввода некоторых слов - «человек», «машина», получается «целое море ерунды». Система хоть и интеллектуальная, но машина, и в ее понимании «человек» - это не сотрудник, а целый мир (более 3 000 смыслов имеет «человек»). Более того, даже «сотрудник» (более 1912 смыслов) – достаточно широкое понятие и его следует уточнить словом «конфликт». Далее можно перейти к дереву понятия «конфликт» (888 смыслов) и, может быть, опять уточнить.

В таких случаях можно пойти длинным путем, перейти в режим «Запрос» и, записав свою проблему в полном виде, искать по ключевым словам (в этих режимах такая возможность присутствует). На начальных этапах работы с системой следует избегать режимов «эксперт» и «аналитик». С устойчивыми словосочетаниями (вроде «нехватка времени») иногда возникает ситуация, когда слова и их смысл совпадают, в этих случаях возникает видимость работы по ключевым словам. Но с обычным поисковиком по ключевым словам удобно работать, когда точно знаешь, что именно надо найти. Такой режим тоже предусмотрен. Знания имеют свойство устаревать. Система не создает новых знаний, она просто более качественно ищет в предоставленных ей текстах. Если регулярно не обновлять базы знаний, то постепенно качество поиска будет снижаться, поскольку система будет предоставлять пользователю все более устаревшие знания.

Российская специфика определяет необходимость опережающего, можно даже сказать превентивного получения новых знаний. С учётом советских традиций обучения, оказывается целесообразным применять постоянно «настраивающуюся» схему обучения. Именно такие возможности открывает технология осмысленной обработки информации.

Современная работа учреждения высшего профессионального образования – сложное переплетение обучения и воспитания, формирование профессиональных качеств и мировоззрения через обучение. Все понимают, что поддержание современного вуза «на уровне» – это каждодневная работа руководства по различным направлениям. Высшее образование – это не просто сумма знаний, это компетентность выпускника в различных видах деятельности.

Для студентов образование – это, прежде всего, большие объемы знаний, которые осваиваются серьезным постоянным трудом. Учащиеся не только усваивают знания, но и получают целостное образование. Выпускников, получивших высшее образование, всегда отличает глубина мышления. Нагрузка по обеспечению высокой компетентности учащихся целиком лежит на руководстве, педагогах и сотрудниках библиотек университета. От них требуется быть глубоко образованными в своей предметной области; постоянно поддерживать квалификацию ППС, быть в курсе современного состояния наук; осуществлять индивидуальный подход к учащимся; поддерживать методическую квалификацию, расширять арсенал педагогических технологий.

Такого рода работа со знаниями требует специализированного программного обеспечения, поскольку ясно: обеспечение образовательного процесса необходимыми знаниями «вручную» становится все сложнее.

Отдельно следует остановиться на применении данной системы в образовательном процессе. Внедрение системы приносит положительные результаты в трех основных областях образовательного процесса.

Работа студентов.

Главная проблема современного образования – информационная перегрузка учащихся. На самом деле, учащиеся перегружены ненужной, «мусорной» информацией. Запрос любому поисковику в Интернете – сотни тысяч ссылок, литературы по каждой теме – десятки и сотни источников. Порой нагрузка по подготовке «выдержек», хрестоматий, компендиумов ложится на преподавателей и сотрудников библиотек, отнимая время от основной работы. Предлагаемая система не отменяет интеллектуальный труд, а усиливает его: она проводит своего рода «обогащение информационной руды», и учащийся работает гораздо эффективнее, экономя время на выуживании драгоценных крупиц нужных знаний.

Вот виды работ учащихся, где система «Интеллектуальный партнер» себя прекрасно зарекомендовала: самостоятельная подготовка к текущим занятиям, работа с источниками, литературные обзоры, подготовка творческих работ, реферирование текстов, проектная деятельность, написание курсовых, дипломных работ, самостоятельные исследования.

Работа профессорско-преподавательского состава.

Та же проблема решается и на уровне педагогов: вести научную, педагогическую и методическую работу гораздо легче, если имеешь практически мгновенный доступ к любому фрагменту текста с учетом его смысла.

Виды работ педагогов: подготовка текущих материалов к занятиям, повышение и поддержание своей квалификации, ведение собственных картотек, информационная работа, создание кейсов заданий для учащихся (задания разной сложности, всех основных типов – от ролевых игр и дебатов до подборок ситуационных задач), научно-исследовательская деятельность, подготовка учебных пособий для учащихся, в том числе компендиумов, хрестоматий, сборников.

Отдельно следует отметить выдачу студентам не только готовых подборок материалов, компендиумов, созданных системой, но и установку на их персональных компьютерах непосредственно системы «Интеллектуальный партнер». Это сделает возможным постоянное пополнение их личных баз знаний и оперативную работу по любому гуманитарному предмету.

Особенно удобна такая форма работы в случае дистанционного, второго высшего образования и прочих подобных форм. Студент-заочник будет гарантированно снабжаться достаточно большим массивом литературы по учебным дисциплинам; при этом такое снабжение имеет крайне низкую себестоимость (в пределе – пересылка файла по электронной почте).

Работа руководства университета.

Помимо общего повышения результативности образовательной деятельности, есть два других аспекта – реализация концепции «воспитывающего обучения» и повышение точности контроля педагогического процесса.

«Воспитывающее обучение». В его основе – простая схема: нравственное, эстетическое и этическое воспитание осуществляются на лучших образцах человеческой мысли – научной, духовной, художественной. Главная проблема – подбор необходимого массива примеров и создание своего рода «информационного пространства» - легко разрешима. Педагоги создают свои, авторские базы знаний по любому аспекту или теме. С этими базами – а не с готовыми источниками – работают учащиеся, обмениваются материалами, ведут свои проекты, исследовательскую деятельность, обсуждают результаты. Мы готовы оказать методическое содействие в реализации такого рода проектов.

Контроль работы педагогического процесса также делается проще и понятнее. Достаточно регулярно оценивать базы знаний педагогов и учащихся по ряду признаков: количество источников; их качество, содержание; регулярность обращения; частота обновления; запросы учащихся; работа со сборниками цитат.

Это позволяет ненавязчиво контролировать содержание образования в основных его точках.

1 Александров С., Фадеев П. Многоконтекстная автоматическая обработка больших объёмов информации. Принципы, методы, исходные алгоритмы // elpart Минск: Интеллектуальный Партнёр, cop. 2001–2008. - .com/index_cip.htm.

2 Гостев А. Бесплатные числа // Секрет фирмы. - 2007. - № 14(197). - С. 53.

3Nigma.ru - М.: МГУ им. Ломоносова, Stanford University, cop. 2005–2009. - .ru/index.php?action=click_menu&menu_element=news.