Научный журнал
Вид материала | Документы |
- Научный журнал "Вопросы филологии" Оргкомитет: Сопредседатели, 47.73kb.
- Научный журнал «Вопросы филологии» Оргкомитет: Сопредседатели, 53.54kb.
- «Агентство гуманитарных технологий», 75.45kb.
- Образование и общество: Научный, информационно-аналитический журнал. 2009, №1. С. 29-34, 186.43kb.
- Источник: Культура народов Причерноморья. Научный журнал. №36. Симферополь, 2002., 160.13kb.
- В. О. Бернацкий д-р филос наук, профессор, 3289.12kb.
- Статья опубликована в Вестнике Российского Государственного Торгово-Экономического, 259.77kb.
- Ежемесячный аналитический журнал, 26.94kb.
- Шмелева Т. В. Речевой жанр. Возможности описания и использования в преподавании языка, 230.32kb.
- Международный научный журнал "рхд" Всероссийская конференция "динамические системы,, 36.92kb.
УДК 81′33
ИНТЕЛЛЕКТУАЛЬНОЕ РАЗВИТИЕ ЛИНГВИСТИЧЕСКОГО АВТОМАТА2*
Р.Г. Пиотровский
В статье рассматривается вопрос об использовании в лингвистическом автомате (ЛА) искусственных нейронных сетей (ИНС) обратного распространения, позволяющих моделировать такие синергетические свойства ЛА, как самоорганизация, саморазвитие и самообучение. Утверждается, что условием реального введения в архитектуру ЛА указанных сетей является переход от экспериментального использования нейро-сетевой вычислительной техники к ее массовому применению с традиционным компьютерным парком.
Вводные замечания
Считается, что отсутствие заметных успехов на пути создания «интеллектуальных» систем автоматической переработки текста (АПТ) объясняется в основном недостатком наших знаний о глубинных механизмах речемыслительной деятельности (РМД) и их синергетике, а отсюда отсутствием ясного понимания того, что можно, а чего нельзя требовать от ЛА, перерабатывающего устный или письменный текст. Поэтому задача статьи состоит не столько в том, чтобы описать современные возможности ЛА, сколько в том, чтобы очертить круг вопросов, связанных с «интеллектуализацией» систем АПТ. К последним относятся принципы алгоритмизации основных лингвистических задач – задач, последовательное решение которых могло бы помочь в ослаблении эпистемологических и технологических барьеров, стоящих на пути продуктивного моделирования РМД человека и создания сильных компьютерных аналогов его интеллекта в целом. Здесь можно выделить два направления, в рамках которых в последние пять-десять лет работали сотни ученых разных специальностей по обоим берегам Атлантического и Тихого океанов.
Первое направление известно как создание компьютерных систем искусственного интеллекта (ИИ). Второе – условно обозначим как проектирование и разработку адаптивно-интеллектуальных компьютерных систем. Оба направления «завязаны» на синергетику систем АПТ.
-
Системы искусственного интеллекта
Усилия этого направления сконцентрированы на автоматизации отдельных интеллектуальных действий человека при планировании поведения, целесообразного с точки зрения определенной логической задачи. Примером таких задач могут служить задачи, возникающие в ходе игры в шашки, нарды, отчасти шахматы, при построении систем машинного доказательства теорем, сенсорных роботов. Существуют лингвисты-алгоритмизаторы и программисты, которые, осознанно или подсознательно опираясь на номотетические убеждения Лейбница, Рассела и раннего Витгенштейна, пытаются развивать интеллектуальные функции ЛА, исходя из давно преодоленного наукой убеждения о том, что язык есть сложное математическое исчисление. В центре внимания представителей этого направления находятся вопросы хранения знаний, построение экспертных систем и систем поиска информации, чернового перевода иноязычных текстов.
Однако критический анализ построения и функционирования таких ИИ-систем показывает, что они не обнаруживают признаки полновесной интеллектуальности. И шахматные роботы, и системы распознавания образов, и электронные композиторы и даже системы доказательств теорем, не говоря уже о системах машинного перевода, не обладают пока настоящим творческим интеллектом (Intellectus, Vernunft по Канту). Эти системы находятся в лучшем случае на формально-логическом уровне рассудка (ratio – у схоластов, Verstand – у Канта), в пределах которого ни сама «интеллектуальная» система, ни заложенные в ней понятия и цели не способны к самостоятельной адаптации, к таким изменениям условий общения и внешней среды, которые заранее не предусмотрены алгоритмизатором.
Если говорить о возможностях моделирования синтактики, семантики и прагматики текста, то их слабость нагляднее всего обнаруживается в построении и функционировании простейших диалоговых систем, имитирующих свободную недирективную беседу системы и человека. Функционируя на основе бихевиористской схемы «стимул – реакция», эти системы моделируют лишь контактоустанавливающие функции речевого общения (3.1.1). Благодаря искусно подобранным и заранее введенным в систему репликам-шаблонам, здесь создается иллюзия недирективного коммуникативного воздействия, производимого ЛА на живого собеседника. Эта иллюзия бывает настолько сильной, что находятся наивные математики, утверждающие, что такие диалоговые системы, выполняя тест Тьюринга, демонстрируют первый этап интеллектуального понимания текста компьютером. Существуют также психиатры и психологи, поверившие в то, что программа типа «ЭЛИЗЫ» или более сложный автомат типа «ПАРРИ», который имитировал ответы больного с параноидным синдромом, смогут стать базой для автоматизированной психиатрии.
Методологические и социальные последствия этих иллюзий могли оказаться настолько серьезными, что Дж. Вейценбаум – автор «ЭЛИЗЫ» – выступил с подробным разъяснением инженерно-лингвистической технологии своей программы, предостерегая читателя против мистификации машинного «разума» и вульгаризаторского упрощения человеческого сознания и интеллекта.
Однако, несмотря на ограниченность полученных экспериментальных и теоретических результатов для развития «интеллектуальности» АПТ, в ходе работ по созданию ИИ-систем были выработаны следующие начальные условия и соответствующие им понятия, на которые нужно ориентироваться в работе по интеллектуализации систем АПТ:
- Проблемное пространство задач, т. е. множество символьных структур (состояний) и набор операторов в этом пространстве. Входы и выходы операторов суть состояния. Некоторые из них могут быть определены только для части состояний. Последовательность операторов образует путь во множестве состояний.
- Постановка задачи, предусматривающей задание наборов начальных и конечных (целевых) состояний и множества фазовых ограничений на переходы (траектории) из одного состояния в другое.
- Целевые состояния (решения задачи) заключаются в том, чтобы найти в пространстве состояний оптимальные траектории, которые, начинаясь с некоторого исходного состояния, проходят маршрутами, которые удовлетворяют ограничения, накладывающиеся на задачу, и заканчиваются в одном из целевых состояний.
Например, проблемное пространство для игры в шашки включает:
- начальное состояние в виде исходного положения фигур;
- процедуры, т. е. разрешенные ходы;
- целевое состояние, т. е. полное истребление или блокирование фигур противника.
На этих принципах построены задачи, использующие другие исчисленческие задачи, например, доказательства теорем или игры, такие как нарды. Эти принципы используются в рассмотренных выше «интеллектуальных» системах АПТ. Так, работа диалоговых систем типа «ЭЛИЗА» подчинена одной цели – поддержание беседы, пусть даже откровенно эхолалического характера. Экспертные системы, а также системы аннотирования и индексирования текста упорно выдают с помощью заранее заготовленных шаблонов-фреймов только ту заложенную в их базах знаний информацию, которая соответствует (не всегда содержательно) запросам потребителя или заранее заданной структуре фрейма.
- Перспективы создания адаптивно-интеллектуального блока ЛА
Использование только что описанной начальной алгоритмической детерминанты не может рассматриваться в качестве универсального инструмента для построения адаптивно-интеллектуальных компьютерных систем, предназначенных, в частности, для решения сложных речемыслительных задач типа высококачественного машинного перевода. Успех решения этих задач зависит от учета кибернетическим устройством меняющихся условий внешней среды. В случае с МП традиционная переработка текста должна сочетаться с непрерывным слежением со стороны ЛА за изменениями не только в формальной организации текста, но и за развитием его семантики и прагматики. Рассмотрим схему этого поисково-исследовательского подхода, характерного для поведения человека, на примере открытия и завоевания Америки.
- Начальное состояние. На рубеже XV–ХVI вв. в Европе отсутствовало сколько-нибудь ясное представление не только о географическом положении и очертаниях, но даже и о самом существовании Америки. Большинство географов и мореходов считало, что восточные берега Южной, Центральной и Северной Америки, а также лежащие возле них острова являются вожделенными восточно-азиатскими землями Катай (Китай), Сипанго (Япония), Малая Индия (Индокитай).
- Процедуры. Набора процедур, пригодных для освоения вновь открытых земель, заранее заготовлено не было. Эти процедуры создавались в зависимости от возникающих обстоятельств и поступления новой информации. Так, рассказы индейцев о сказочном Эльдорадо стимулировали сухопутные походы Кортеса, де Бальбоа, Писарро. Эти походы уже не были связаны с мечтой Х. Колумба об открытии западного пути в Восточную и Юго-Восточную Азию. Зато путешествие Ф. Магеллана, открывшего южные ворота в Тихий океан и проложившего через него путь к берегам Азии, а также экспедиции С. Кабота, искавшего северо-западный проход, представляли созданные на ходу процедуры, с помощью которых эти мореплаватели пытались реализовать первоначальный замысел Колумба. Усилия голландских, французских, ирландских, английских, немецких переселенцев, колонизовавших в ХVII–ХVIII вв. Северную Америку, представляли собой новые процедуры, никак не связанные по своему происхождению и целям ни с открытием западного пути в Азию, ни с поисками сказочного Эльдорадо. Поэтому процесс освоения Америки нельзя представить как путь в заранее установленном проблемном пространстве освоения Нового Света. Весь процесс осуществлялся в виде параллельно-последовательной реализации совершенно различных процедур. Если говорить о моделировании этого процесса, то его удобнее представить как частично упорядоченную цепь событий, объединенных причинно-следственными связями.
- Целевое состояние. Колонизаторы не располагали изначальным набором целевых состояний для освоения Нового Света. Их цели, пути и приемы исследования формировались в процессе колонизации Америки.
Наблюдения над разными формами порождения и восприятия речи, начиная с бытовых диалогов и кончая написанием и чтением художественных или научных сочинений, говорят о том, что все эти формы речевой деятельности не могут быть представлены как простой поиск в пространстве задач. Скорее всего, каждый вид этой деятельности представляет собой исследовательско-поисковый процесс только что рассмотренного типа с нечеткими постоянно меняющимися целями и процедурами. Именно поэтому современная инженерная лингвистика представляет порождение и распознавание текста в качестве процесса, в котором детерминированное планирование и организация хомскианского типа действуют лишь на коротких участках текста, а между достаточно удаленными друг от друга лингвистическими единицами обнаруживаются лишь стохастические связи.
Выбор целей и соответствующих им процедур в ходе порождения приема сообщения должен регулироваться некоторым синергетическим механизмом, который условно именуется коммуникативно-прагматическим оператором (КПО). Исследование эндогенных расстройств РМД подтверждает предположение о том, что его управляющая роль реализуется в трех основных функциях.
Во-первых, КПО определяет и регулирует переход с одного уровня порождения (восприятия) сообщения на другой.
Во-вторых, он выбирает из тезауруса и лингвистической компетенции именно те лексико-грамматические средства, которые необходимы для построения, распознавания или переработки сообщения, а затем формирует из них такой текст, который должен быть адекватен замыслу отправителя или пониманию этого замысла у получателя сообщения, а также отраженному в нем факту объективной действительности.
В-третьих, КПО проверяет адекватность порождаемого или воспринимаемого текста семантико-прагматическому замыслу. Эта проверка реализуется путем постоянного сравнения смысла формируемого или распознаваемого сообщения с той информацией об отражаемом им факте внешнего мира, которая уже содержится в пресуппозиции отправителя или приемника или поступает в их сознание одновременно с информацией через другие органы чувств или телесные сигналы.
Из сказанного следует, что «интеллектуальные» системы переработки текста должны в идеале функционировать так, как работают сложные системы в информационно-энергетическом пространстве. Это значит, что ЛА должны строиться не только в виде полифункциональных программ АПТ, способных осуществлять различные изолированные операции (грубый лексико-грамматический МП, автоматическое индексирование, аннотирование текста и т. д.). Эти автоматы должны уметь с помощью аналога КПО сопоставлять результаты указанных операций, оценивать их адекватность замыслу отправителя и ожиданию получателя информации, учитывать изменение внешних условий человеко-машинного общения.
Таким образом, основной задачей при построении «интеллектуального» автомата становится создание такого машинного аналога КПО, который мог бы управлять поведением системы в меняющейся обстановке. Это значит, что машинный КПО должен уметь самостоятельно перестраивать в ЛА структуру целей и динамически менять путь переработки текста в пространстве лингвистических задач. Перестройка структуры целей предусматривает изменение приоритетов. Цели, считающиеся недостижимыми, откладываются. Например, если автомату в ходе анализа данного фрагмента недостает семантико-синтаксических ресурсов, он должен ограничиться его пословно-пооборотным переводом. Отложенные цели не забываются, а откладываются в «оппортунистической» памяти и при необходимости могут актуализироваться. Например, после семантико-синтаксического перевода оставшейся части предложения или абзаца ЛА может вернуться к анализу первого примитивно переведенного фрагмента.
Наблюдения над решением лингвистических задач у здоровых людей и испытуемых с эндогенными расстройствами РМД показали, что основными свойствами РМД, необходимыми для организации нормального коммуникативного процесса, являются:
- способность говорящего сопоставить данные пресуппозиции с информацией, извлекаемой из тезауруса, и, соответственно, сопоставление принятого сообщения с пресуппозицией у адресата;
- адаптивность обоих участников коммуникативного процесса к изменениям во внешней среде и самой коммуникации;
- умение перестраивать целеполагания относительно этих изменений.
Среди других компонентов сознания человека такие способности являются пока наименее доступными с точки зрения их моделирования.
-
Лингвистический автомат и искусственные нейронные сети
Наши знания о комплексной организации и функционировании мышления человека пока очень ограничены [1, с. 82–132]. Биологическим субстратом РМД человека является нейронная сеть, содержащая около 1011 вычислительных элементов, которые участвуют примерно в 1015 связях. Эти последние являются теми путями, по которым передаются (чаще всего напрямую) электрохимические сигналы от одного нейрона (н.) к другим нейронам.
Что касается нейрона, то общая схема его построения известна. Он может быть представлен в виде комплекса следующих частей (рис. 1):
- тела н. или сомы (1), в которой накапливается электрохимические заряды, поступающие от других н.;
- дендритов – ветвящихся отростков на входе в н., через которые в сому поступают заряды из разных участков нейронной сети;
- аксона (3) – длинного нервного волокна, исполняющего роль канала, выводящего из нейрона накопленный электрохимический заряд;
- коллатералий (4) – ветвлений аксона;
- синапсов (Si) – пластинок (бляшек), с помощью которых коллатерали крепятся к окончаниям дендритов данного или других нейронов.

Рис. 1. Схема нейрона
Аксон, коллатерали, синапсы и дендриты образуют пути передачи информации от одного нейрона к другим. Вместе с тем каждый нейрон может быть замкнут с помощью этого пути на себя. Таким образом в сети образуются нейронные кольца, см. рис. 1, блок (2). Системы колец путем циркуляции электрохимического потенциала по каждому кольцу обеспечивают хранение, точнее – запоминание информации, в мозгу человека [4, с. 3233]. Можно предположить, что сложная система нейронных колец и их ансамблей является той биофизической основой, на которой располагается и функционирует знаковая система языка [12, с. 259302].
Нейроны могут, с одной, стороны, образовывать электрический потенциал покоя. С другой – импульсы, приходящие через синапсы и дендриты, могут изменять электрический потенциал нейрона, возбуждая его. Как только потенциал достигнет заданного для данного нейрона порога, нейрон выдает новый электрический импульс, распространяющийся по аксону и коллатералям к синапсам других нейронов.
При передаче и переработке информации в нейронной сети важные функции выполняют синапсы, которые могут как возбуждать, так и тормозить другие нейроны. Возбуждение или торможение каждого нейрона-приемника определяется соотношением порога его возбуждения с суммой принятых им возбуждающих и тормозящих сигналов:
![]() | (1) |
где x – некоторый входной сигнал;
w – сила его возбуждающего (положительного [+]) или тормозящего (отрицательного [–]) воздействия на принимающий нейрон.
Суммы (1), достигшие порога нейрона-приемника, преобразуются активационной функцией F в выходные сигналы Y. Если указанная сумма не достигает порога нейрона-приемника, сигнал Y не вырабатывается. Кроме того, процесс активации зависит от того, на какие дендриты нейрона-приемника поступили возбуждающие и тормозящие сигналы.
Если говорить о смысловой информации, содержащейся в речевых сигналах, то пока мало что известно о том, как записываются эти электрохимические сигналы относительно нейронных колец и их ансамблей. Также неясно, как происходит ее сравнение с уже имеющимися в мозгу сведениям и как реализуется нейрофизиологическое суммирование и преобразование этих сведений на электрохимическом уровне, не говоря уже о семантическом и прагматическом его сопоставлении с уже записанной в сети информацией. Еще меньше надежных ориентиров для построения компьютерных копий отдельных частей нейрона и компонентов нейронных ансамблей. Поэтому информатикам, программистам и психолингвистам приходится выходить за пределы современных биологических знаний. При этом мозг, его блоки, в том числе и КПО, становятся научными метафорами [18], а их компьютерные аналоги имеют целью лишь смоделировать (точнее – сымитировать) определенные функции нашего сознания.
Несмотря на лакунарный характер сведений о механизмах высшей нервной деятельности человека, ее исследования показали, что речь идет о системе, обладающей мощными синергетическими средствами самоорганизации, самообучения и приспособления к условиям окружающей среды. Именно поэтому бионика, изучающая структуры и жизнедеятельность организмов с точки зрения использования открываемых ею свойств и закономерностей для решения инженерных задач, уже на начальном этапе своего развития стремилась создать функциональные модели нейронных сетей, на которых можно было бы изучать синергетические функции сознания человека. Такой интерес совпал по времени с появлением вычислительной техники, которая обещала стать достаточно сильным исследовательским инструментом для бионических исследований.
Все эти обстоятельства определили появление с конца 40-х и в течение 50-х гг. прошлого века сначала теоретических исследований, а затем и инженерных проб в построении искусственных нейронных сетей (ИНС). К сожалению, созданные пионерами нейрокибернетики У. Маккаллоком [3], М. Минским [5], Ф. Розенблаттом [10], Б. Уидроу [20, с. 78–123] и их соавторами ИНС оказались неспособными решать даже несложные интеллектуальные задачи, в том числе и лингвистические. Поэтому интерес к разработке ИНС к 70-м гг. угас, чтобы вновь возродиться только к середине 80-х гг. в связи с появлением многослойных ИНС (13, с. 52–57). Исходные положения по создания этих ИНС и перспективах их использования были изложены в основополагающей книге П. Черчланд и Т. Сейновского [16], а затем развивались в статьях, опубликовнных в выходящем с конца 80-х гг. под редакцией Сейновского журнале «Neural Computation».
ИНС представляют собой устройства параллельных вычислений, состоящие из множества взаимодействующих моделей нейронов, представляющих собой простые процессоры. Каждый нейрон избирательно имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает также избирательно другим нейронам-процессорам. Будучи соединенными в достаточно большую сеть с управляемым взаимодействием, эти локально простые процессоры вместе способны решать сложные задачи [2, с. 13; 6, с. 8–11; 7, с. 6–61; 9; 11]. В идеале ИНС ориентированы на использование специального аппаратного обеспечения – нейрокомпьютеров. Это обеспечивает комплексные параллельные вычисления на связанных между собой многокомпонентных нейронных объединениях (так называемых слоях) и дает возможность быстро решать достаточно трудоемкие задачи. ИНС могут функционировать и на традиционном программном обеспечении, реализуемом на обычных совместимых компьютерах. Однако вычисления здесь производятся последовательно, что сильно сокращает быстродействие системы и делает ее использование для решения традиционных задач переработки текстов малоэффективной.
Как уже было сказано, однослойные ИНС, построенные в 40-50-х гг. пионерами нейрокибернетики, оказались неспособными к самообучению и решению более или менее сложных «интеллектуальных» задач. Позднее оказалось, что обучение можно реализовать на многослойных ИНС, включающих минимум два взаимодействующих слоя нейронов [13, с. 34–50].
Различают два типа многослойных ИНС. У сетей первого типа, называемых сетями без обратных связей, или ИНС прямого распространения, нет памяти, их выход полностью определяется текущими входами и значениями весов, ср. выражение (1). Сети второго типа, имеющие соединения от выходов к входам (рис. 2), называются сетями с обратными связями (ИНСОС). В этих сетях предыдущие значения выходов возвращаются на входы. Поэтому выход в ИНСОС определяется как текущим входом, так и предыдущими стимулами, след от которых удерживается в их памяти. Это дает системе возможность пос

Рис. 2. Многослойная ИНС с обратными связями [13, с. 55; ср. 8, с. 32 и сл.]
ледовательно накапливать и обобщать предыдущие правильные решения.
Способность ИНСОС обобщать предыдущие положительные прецеденты на новые ситуации и извлекать существенные свойства из поступающей информации выступает в качестве функционального аналога кратковременной человеческой памяти. Она является обязательным условием для решения «интеллектуальных» задач, которые предусматривают необходимость менять целеполагания, а также стратегию и тактику решения этих задач, в том числе когнитивных [6, с. 8–11] (и даже музыкальных [19, с. 213234]), в зависимости от изменений в той внешней среде, в которой функционирует данная ИНСОС. Одновременно способность ИНС к запоминанию информации, получаемой из внешнего мира, дает возможность организовать самообучение системы.
Перспективы применения ИНСОС в инженерной лингвистике заманчивы. Однако использование ИНС носит здесь поисковый характер, ограниченный построением экспериментальных систем преобразования письменного текста в устную речь и наоборот [15, с. 276 –288; 17, с. 303–306], а также попытками применить ИНС для морфолого-синтаксического разбора текста [14, с. 172–179]. Что же касается лингвистических автоматов, то включение в их архитектуру ИНСОС в качестве интегральных синергетических модулей станет реальным только тогда, когда нейросетевая техника, вооруженная необходимым программным обеспечением, станет наряду с традиционными «он-лайн» ЭВМ массовым инструментом для решения вычислительных задач.
Библиографический список
- Барский, А.Б. Нейронные сети: распознавание, управление. Принятие решений / А.Б. Барский. – М. : Финансы и статистика, 2004. – 176 с.
- Калан, Р. Основные концепции нейронных сетей : пер. с англ. / Р. Калан. – М. : Вильямс, 2001.
- Маккаллок, У.С. Логическое исчисление идей, относящихся к нервной деятельности. Автоматы : пер. с англ. / У.С. Маккалок, У. Питтс. – М. : Изд-во иностранной литературы, 1956.
- Механизмы памяти. Руководство по физиологии / сост. И.П. Ашмарин, Ю.С. Бородин, П.В. Бундзен [и др.] ; отв. ред. Г.А. Вартанян. – Л. : Наука, 1987.
- Минский, М.Л. Персептроны : пер. с англ. / М.Л. Минский, С. Пейперт. – М. : Мир, 1971.
- Плешко, В.В. TopSOM: визуализация информационных массивов с применением самоорганизующихся тематических карт / В.В. Плешко, А.Е. Ермаков, Г.В. Липинский // Информационные технологии. – 2001. – № 8.
- Поляков, В.Н. ПроектWordNet и его влияние на технологии компьютерной и когнитивной лингвистики / В.Н. Поляков // Труды казанской школы по компьютерной и когнитивной лингвистике TEL2002. – Казань : Отечество, 2002.
- Радченко, А.И. Моделирование основных механизмов мозга / А.И. Радченко. – Л. : Наука ; ЛО, 1968.
- Редько, В.Г. Эволюция, нейронные сети, интеллект: модели и концепции эволюционной кибернетики / В.Г. Редько. – М. : КомКнига, 2006.
- Розенблатт, Ф. Принципы нейродинамики : пер. с англ. / Ф. Розенблатт. – М. : Мир, 1962.
- Рутковская, Д. Нейронные сети, генетические алгоритмы и нечеткие системы : рус. пер. / Д. Рутковская, М. Пилиньский, Л. Рутковский. – М. : Горячая линия – Телеком, 2006. – 452 с.
- Скрэгг, Г. Семантическая сеть как модель памяти : пер. с англ. / Г. Скрэгг // Зарубежная лингвистика : «Новое в лингвистике», «Новое в зарубежной лингвистике». – М. : Прогресс, 1999.
- Уоссермен, Ф. Нейрокомпьютерная техника. Теория и практика : пер. с англ. / Ф. Уоссермен. – М. : Мир, 1992.
- Шуклин, Д.Е. Структура семантической нейронной сети, реализующей морфологический и синтаксический разбор текста / Д.Е. Шуклин // Кибернетика и системный анализ. – Київ : Iнститут кiбернетики НАН України, 2001. – № 5.
- Amrouche, A. On the Use of the Nonparametric Regression in Neural Network Based Approach Applied to Arabic Speech Recognition / А. Amrouche, J.M. Rouvaen // SPECOM’2004 Proceedings. 9th International Conference SPEECH and COMPUTER. 2022 September 2004. St.-Petersburg, RUSSIA. Organizer : St.Petersburg Institute for Informatics and Automation of the Russian Academy of Sciences. Speech Informatics Group. –St.-Petersburg : «Anatolya» Publishers, 2004.
- Churchland, P.S. The Computational Brain / P.S. Churchland, T.J. Sejnowski. – Cambridge, MA : The MIT Press. Bradford Books, 1992.
- Fishel, M. Modeling the temporal structure of newsreaders’ speech on neural networks for Estonian text-to-speech synthesis / М. Fishel, М. Mihkla // SPECOM’2006 Proceedings. XI International Conference SPEECH and COMPUTER. 25–29 June 2006. St.-Petersburg, RUSSIA. Organizer: St.Petersburg Institute for Informatics and Automation of the Russian Academy of Sciences. Speech Informatics Group. –St.-Petersburg : «Anatolya» Publishers, 2006.
- Smolensky, P. On the Proper Treatment of Connectionism / Р. Smolensky // The Behavioral and Brain Sciences. – Vol. 11. – № 1.
- Stoffer, Th. Mentale Repräsentation musikalischer Strukturen / Th. Stoffer // Zeitschrift fűr Semiotik. Bd. 18. – H. 2.
- Widrow, B. Reliable, trainable network for computing and control / В. Widrow B., J.B. Angell // Airospace Engineering. – 1962. – Vol. 21. – № 2.
УДК 81’1
ПРИНЦИПЫ СИСТЕМАТИЗАЦИИ НАУЧНЫХ ТЕРМИНОВ
Т.Н. Сергеева
Автор статьи, опираясь на признаки терминов, выводит принципы их систематизации. Будучи инструментом, при помощи которого создаются научные теории, законы, позиции, тезисы, термины и терминологии как их системы являются значительной составной частью науки и техники. Терминология может быть изображена в разных аспектах (синхронном и диахронном), может быть систематизирована по разным исходным положениям.
Понятие «Терминология» образовалось от слова «термин» и греч. «logos» – слово, учение. Оно являет собой совокупность слов и словосочетаний, использующихся в лингвистике для формулировки особых понятий и для наименования характерных объектов определенной научной сферы. Терминология (терминологическая система) любого научного раздела основывается на понятийных взаимоотношениях профессиональных знаний, сформулированных языковыми средствами. В теоретическом терминоведении рассматриваются проблемы «метаязыка», «метадиалекта» науки и шкалы сформированности качества термина. Эти вопросы рассматривают такие языковеды, как Р.Г. Пиотровский, О.С. Ахманова, А.В. Суперанская, Н.В. Подольская, Н.В. Васильева, Н.А. Слюсарева и др. Терминология является составной частью метаязыка; особая сложность для ее изучения состоит в том, что язык-объект и метаязык являются абсолютно идентичными в плане выражения, по виду являются одним и тем же языком.
Терминология каждой научной сферы – это не просто список терминов, а семиотическая система, то есть отображение установленной системы понятий, воссоздающей определенную научную идеологию. Появление терминологии потенциально лишь тогда, когда наука достигает довольно высокого уровня развития, то есть термин рождается тогда, когда это понятие до такой степени сформировалось, что за ним можно закрепить абсолютно установленное научное выражение. Недаром основным средством отграничения термина от обычного слова является проверка на дефинитивность, то есть ответ на вопрос, поддается ли термин строгой научной дефиниции. Термином может называться произвольное слово, которому дано ясное определение, устанавливающее называемое понятие и строго ограничивающее понятийную область, обеспечивая обособленность от других смыслов омонимичного слова общей лексики. Искусственно созданное слово также может стать термином. «Граница между терминологической и общеупотребительной лексикой нестабильна и имеет не исторический, а, скорее, функциональный характер, и постоянно происходит как процесс превращения терминов в общеупотребительные слова вследствие проникновения научных и технических объектов в наш быт, так и использование бытовой лексики для создания и развития терминологий, когда на основе представлений формируются понятия» [2, с. 5].
Глубинный признак терминов дает возможность разграничить их с другими единицами языка и разделить все многообразие терминов. Обозначение терминами общих представлений является данным глубинным признаком терминов. Так как имеется несколько видов общих представлений, то могут быть выявлены и различные виды терминов.
Во-первых, можно выделить самые распространенные понятия материи и ее определений, названия которых совпадают с названиями категорий («материя», «движение», «пространство», «время» и другие). Исходя из этого термины, обозначающие категории, являются видом терминов категорий.
Во-вторых, на любой стадии формирования человеческого познания, в любой период наблюдается некоторое число общенаучных и общетехнических представлений, которые применимы к любой науке или отрасли техники («анализ», «задача», «цель»). Сюда же можно включить общие понятия методологических наук – философии, кибернетики, информатики и других; часть понятий данных наук может употребляться, как и общенаучные представления, в других областях знания (например, «информация», «часть»).
Можно отметить, что общенаучные и межотраслевые понятия представляют собой данные понятия не только из-за того, что они употребляются в определенных научных областях, а по причине обладания общим содержанием, благодаря которому и возможно их применение в различных областях. Как образец возьмем общенаучное понятие «расчет», межотраслевые понятия «математический расчет», «статистический расчет» и конкретно-научные понятия «прочностной расчет», «расчет сечения провода», «тепловой расчет».
К вышесказанному добавим, что в любой научной сфере имеются характерные представления различного уровня обобщенности, начиная с самых больших – классов – до минимальных – видов, а также представлений, воссоздающих аспекты анализа данных классов. Настоящие понятия имеют следующие названия: видовые и аспектные. Например, «речь» – видовое понятие относительно понятий «авторская речь», «косвенная речь», «отрывистая речь», «деловая речь», которые, в свою очередь, являются аспектными понятиями.
Данные разновидности понятий олицетворяются в языке в типах терминов. Здесь мы наблюдаем такую же картину, как и с понятиями, и выделяем термины категорий, общенаучные и общетехнические термины, межотраслевые термины, специальные термины (примеры были приведены при перечислении типов понятий).
Типологию можно назвать основным положением систематизации. Данная в этой статье типология терминов (деление терминов по наиболее существенным их признакам) является именно терминологической систематизацией терминов. Базой всех дальнейших систематизаций являются разнообразные отдельные признаки терминов – содержательные, формальные, функциональные, внутри- и внеязыковые.
Главной систематизацией терминов по содержанию является членение на термины наблюдения и теоретические термины. Данная систематизация употребляется в основном в философии. Под терминами наблюдения понимаются группы действительных объектов, а под теоретическими терминами – отвлеченные представления, находящиеся, как правило, в зависимости от установленной теории, концепции. Настоящего членения достаточно для решения терминологических вопросов философии или философии науки, но для решения философских проблем терминоведения требуется создать более детальную систематизацию, т. к. уровень отвлеченности представлений, называемых теоретическими терминами, неодинаков: от философских категорий до общенаучных и специальных научных понятий.
Следующей систематизацией терминов по содержанию является распределение их по научным сферам. Список данных сфер примерно таков: наука, техника, производство, экономический базис, надстройка. Базируясь на данной социологической модели, можно перечислить рубрики, входящие в систематизацию терминов по сфере знания.
В научной области можно выделить группу научных терминов, которая разделяется на такое количество классов, сколько существует наук на конкретной стадии научно-технического прогресса. В произвольном классе физических, химических и прочих терминов можно отметить столько терминосистем, сколько имеется разнообразных самостоятельных теорий дескрипции физических, химических и других объектов и закономерностей. Если говорить об отличиях в научно-технической и общественно-политической терминологии, то политические науки, по единой точке зрения экспертов, принадлежат к общественным наукам, и, таким образом, политические термины вливаются в массу общественных терминов. Все данные термины означают научные представления в той же степени, что и научно-технические термины. Отличие содержится в том, что первые означают понятия общественных наук, а вторые – понятия естественных и технических наук. Вследствие этого, пытаясь достигнуть точности, рационально говорить о терминах общественных, естественных и технических наук и о технических терминах и терминологиях, а не о научно-технической и общественно-политической терминологии. Тем не менее, термины общественных наук располагают определенным количеством характерных признаков, которые противопоставляют их терминам естественных и технических наук. Перечислим данные признаки:
- зависимость терминов общественных наук от конкретной теории. При детальном анализе термины естественных и технических наук также зависят от теории, которая определяется мировоззрением, но эта зависимость может быть сглажена. В терминах социальных наук она входит в их содержательную структуру;
- оригинальное осуществление признака системности. Наряду со слаженными терминосистемами, воссоздающими завершенные теории (философское понимание культуры, экономика феодального строя), существуют такие сферы знания, для которых не существует системы понятий и терминосистемы (в частности, нанотехнологии, дизайн и другие);
- существование терминов с неопределенными пределами означаемых ими представлений, к примеру, терминов, означающих понятия общественного характера (субъект, идеал);
- более масштабное развитие синонимии и многозначности, чем в терминосистемах естественных и технических наук;
- введение оценочного фактора в семантику терминов.
Технические термины функционируют в сфере производства и техники. Так называются единицы языка, означающие машины, механизмы, инструменты, операции. Технические термины отличаются от научных терминов меньшей подчиненностью концепциям употребляющих их людей, несмотря на то, что подобная подчиненность и имеется. В последнее время технические термины зачастую вкрадываются и в собственно научные публикации.
В области экономического базиса и производственных связей существуют, с одной стороны, термины языка дескрипции (в языках политической экономии, конкретной экономии) и, с другой стороны, термины языка обслуживания экономики.
Сфера надстройки представляет собой административно-политическую область (оборона, юстиция, внешние сношения и другие) и социально-культурную область (здравоохранение, наука, культура, образование и другие).
Наиболее детальной систематизацией терминов является систематизация по объекту называния внутри определенных областей знания.
Третья, содержательная систематизация терминов – по логической категории понятия, обозначаемого термином. Отличаются термины предметов (метр), процессов (деление); признаков, свойств (морозоустойчивость); величин и их единиц (ватт).
Языковедческие систематизации терминов сформированы на признаках терминов как слов или словосочетаний конкретного языка.
Наличие несоответствия между планом выражения и планом содержания, которое является основанием для существования в естественном языке как синонимии, так и полисемии, является причиной существования в терминологических системах, с одной стороны, дублетов, триблетов и тому подобных, другими словами двух, трех и более терминов, на деле сопоставляемых с одним и тем же референтом, с другой – многозначности терминов, когда один и тот же термин имеет несколько научных определений. В этом проявляется двойственность не только термина, но и слова. «Словарь лингвистических терминов» О.С. Ахмановой приводит 23 синонима к термину «фразеологическая единица», зафиксированных в научном использовании русских лингвистов к 60-м гг. XX в., 6 синонимов к термину «предложение» и т. д. Многозначность терминов, в частности, «речь» (три значения), «форма» (пять значений), «фраза» (четыре значения), показанная тем же словарем, наглядно отображает не столько присутствие разнообразных понятий, наименованных одним термином, сколько различные подходы, различные аспекты исследования одного и того же языкового объекта [1].
Если рассматривать лингвистические термины с точки зрения их внутреннего содержания, то они разделяются на мотивированные, где очевидна семантическая и структурная соразмерность составляющих его морфем с морфемами определенного языка (частотный словарь, словоформа), и немотивированные, к числу которых, кроме заимствований, причисляют также кальки, являющиеся, в частности, ядром русской грамматической терминологии. Данные термины, являясь точным переводом соответствующих греческих и латинских терминов, стали абсолютно немотивированными (иерархия, семиотика).
На генетическом уровне в составе русской языковедческой терминологии можно выделить термины исконно русские (буква, ударение), заимствования (ауслаут, пиджин, сандхи, анаколуор) и построенные на основах греко-латинских терминоэлементов (микросоциолингвистика, инессив, зооним, интонема).
По составу распознают однословные (монолексемные) термины (синтаксис, корпус, тег) и термины-словосочетания (полилексемные) (знаковая система, искусственный интеллект, параллельный корпус). От терминов-словосочетаний нужно дифференцировать сложение терминов – соединение двух и более независимых терминов, например: монофтонгизация восходящего дифтонга, прототипические свойства подлежащего, компонентный анализ лексического значения слова. Способы формирования однословных терминов в языковедческой терминологии делятся на: семантический – терминологизация общеупотребительного слова, часто с метафорическим переносом, например, поле, гнездо (слов), дерево (зависимостей); сюда же можно отнести перенос терминов из других наук с абсолютным или частичным их переосмыслением; словообразовательный: суффиксация (вариантность, вариативность, контекстуализация), префиксация (подтекст, наддиалект), основосложение (звукотип, лексикостатистика, языкознание). Важную роль в формировании терминов играют греко-латинские элементы, комбинационные способности которых практически не имеют границ. Разные направленности отдают предпочтение разным способам создания терминов.
С точки зрения принадлежности терминов к частям речи различают термины-существительные, прилагательные, глаголы, наречия. В частности, среди языковедческих терминов есть существительные (деривация, псевдография), прилагательные (корональный, билатеральный). Среди терминов музыковедения фигурируют термины-наречия (высоко, пиано). По показаниям подсчетов, терминов – названий объектов в процентном отношении намного больше, чем терминов – названий признаков. Да и обозначения признаков в терминах часто выступают в опредмеченном виде.
Систематизация терминов по авторству воспроизводит социологический подход к терминам. В этом плане можно назвать коллективные и индивидуальные термины. Например, термин «робот» был создан Станиславом Лемом, термин «фонология» создал Иван Александрович Бодуэн де Куртенэ.
Учитывая применение в различных областях, различают универсальные (для нескольких аналогичных областей), уникальные (для одной области) и концептуально-авторские термины. Например, языковедческие термины могут означать явления, свойственные всем языкам (стилистика), для одного или нескольких языков (апостроф) или только для одного подхода (значимость термина – Ф. де Соссюр).
Существенная роль терминов в процессе научного познания объективной реальности определяет возможность создать их науковедческие систематизации. Таким образом, различаются термины, предназначающиеся для закрепления знания, термины, употребляемые как инструмент постижения, и термины обучения. В частности, термином – инструментом постижения можно назвать изначально введенный Дж. Паркинсоном термин «дрожательный паралич», позднее замещенный в русском языке термином «болезнь Паркинсона». Термины обучения употребляются в начальной школе из-за их простоты и понятности (чтение), потом их замещают научными терминами – способами закрепления знания (литература).
Для любого периода характерна историко-лексикологическая систематизация терминов, в которой можно встретить термины-архаизмы, термины-неологизмы. Большее количество неологизмов наблюдается в складывающихся терминосистемах. Архаизмы свойствены тем терминосистемам, корни которых уходят в прошлое, и в связи с развитием науки и устареванием отдельных научных точек зрения. Но так как термины сохраняются в языке как его лексические единицы, они могут восстановиться в составе новых терминосистем или в новом смысле при переформировании терминосистемы.
Ввиду того, что термины реализовывают прикладную функцию как инструменты постижения и как способы закрепления научного или технического знания, они проходят процесс унификации и фиксируются в той или иной конфигурации в качестве рекомендованных или стандартизованных. По этому принципу основывается систематизация терминов по нормативности – ненормативности, в состав которой входят термины, находящиеся в процессе стандартизации (стандартизируемые), уже прошедшие стандартизацию (стандартизированные), отвергаемые в процессе стандартизации (недопустимые); находящиеся в процессе упорядочения (рекомендуемые), подвергшиеся упорядочению (рекомендованные), параллельно допустимые, отвергнутые в процессе упорядочения. Здесь необходимо упомянуть, что в области науки и техники существуют термины, нормативность которых является непременной. Приведем такой пример: медицинские термины нормализованы интернационально, так как это может обеспечить взаимопонимание врачей, говорящих на разных языках, но занимающихся одним делом.
Также, вследствие анализа частоты употребления терминов в текстах, может быть использована систематизация, выделяющая высокочастотные и низкочастотные термины. Информацию о частотности терминов можно позаимствовать из частотных терминологических словарей, которые в большом количестве опубликованы в нашей стране.
Этот список систематизаций терминов дает возможность сделать следующий вывод: настолько разностороннее явление, как термин, входит в самые разные систематизации – по логическому, лингвистическому, науковедческому и другим воззрениям. Данные систематизации в своей совокупности дают характеристику роли и места терминов в научной, экономической, политической, управленческой и других сферах функционирования современного общества.
Библиографический список
- Ахманова, О.С. Словарь лингвистических терминов / О.С. Ахманова. – 2-е изд. – М. : Советская энциклопедия, 1969. – 607 с.
- Гринев, С.В. К истории отечественного терминоведения / С.В. Гринев, В.М. Лейчик // Научно-техническая информация. – 1999. – Серия 1. – № 7.
- Суперанская, А.В. Общая терминология. Терминологическая деятельность / А.В. Суперанская, Н.В. Подольская, Н.В. Васильева. – М. : УРСС, 2005.
ЖУРНАЛИСТИКА |