Работа с электронным текстом: поисковые технологии

В предыдущих выпусках мы уже говорили о том, что работа с электронным текстом в работе учителя-словесника будет успешной лишь в том случае, если в ней будет учитываться специфическая природа электронного текста. Когда же электронный носитель информации пред­почтительнее, чем привычный “бумажный”? Приведём пример.

Изучаем “хрестоматийную” тему «Мотив оди­ночества в лирике Лермонтова» (Дай руку мне, склонись к груди поэта)») Как ветер, волен и Один… («Люблю я цепи синих гор…») Беззаботен и Один… («Желанье») Белеет парус ОдинОкой… («Парус») И всё, что чувствует, он чувствует Один! («Он был рождён для счастья, для надежд…») Никто моим словам не внемлет… я Один… («Никто моим словам не внемлет… я один…»)

Заметим, что при поиске можно было исключить слова, не являющиеся однокоренными, если в поисковой строке набрать не просто “один”, а “один” — с пробелом перед словом. Заметим также, что проведённый эксперимент совсем “чистым” назвать нельзя: мы не искали буквосочетание “одн”, встречающееся, например, в слове “одна” (ср. “Одна и грустна на утёсе горючем // Прекрасная пальма растёт”).

Проанализируем результаты. Во-первых, мы можем быть абсолютно уверены, что не пропустили ни одного упоминания слова, связанного с темой одиночества в текстах поэта. Во-вторых, мы получили большой корпус текстов для анализа. В-третьих, такой путь даёт огромный выигрыш во времени: если не проводить эту работу полностью, выписывая сперва все встречающиеся упоминания, а сразу же отсекать неподходящие варианты, то при некотором навыке пользования такой вид работы может быть осуществлён примерно за час. Хочется обратить внимание, что мотив одиночества в лирике Лермонтова — один из центральных, следовательно, и корпус текстов значителен по объёму. Если же мы будем искать, к примеру, упоминания берёзы или клёна в лирике Есенина, то в результате получим материал значительно меньший по объёму и, следовательно, затратим на работу куда меньше времени.

Таким образом можно осуществлять поиск не только по элементам мотива в тексте, но и по буквальным Упоминаниям предмета или Имени героя. Например нужно вспомнить, когда впервые в «Преступлении и нака­зании» (