В.З. Демьянков
(Отсканированная монография)
Демьянков В.З. Специальные теории интерпретации в вычислительной лингвистике. – М.: Изд-во Моск. ун-та, 1988. – 87 с.
ИНТЕРПРЕТАЦИЯ ЧЕЛОВЕЧЕСКАЯ И ИНТЕРПРЕТАЦИЯ МАШИННАЯ
1.1. Анатомия понятия "интерпретация"
1.2. Процедура интерпретирования
1.5. Воплощение результатов интерпретации
1.6. Опорные пункты и инструменты интерпретации
1.7. Субъект интерпретации: личностные аспекты
ИНТЕРПРЕТИРУЩИЙ ПОДХОД К ОШИБКАМ ПРОДУЦИРОВАНИЯ
2.2. Совершенство интерпретации
2.3. Непонятность, непонятливость и непонятость
СПЕЦИАЛЬНЬЕ ТЕОРИИ ИНТЕРПРЕТАЦИИ В ОБЩЕМ ЯЗЫКОЗНАНИИ
3.1. Генеративные модели в 1970-1980-х гг.
3.2. Формальные модели негенеративного типа
3.3. Неформальные модели общения
3.4. Неформальные теории языковой репрезентации
ПРИЛОЖЕНИЕ СПЕЦИАЛЬНЫХ ТЕОРИЙ В ВЫЧИСЛИТЕЛЬНОЙ ЛИНГВИСТИКЕ
4.1. Интерпретация как постановка и решение задачи
4.2. Строение системы интерпретации
4.5. Интерпретирующий компонент
4.6. Системы первого и второго уровней
СОДЕРЖАНИЕ (в том виде, в каком оно приведено в конце бумажной версии 1988 г.)
УДК 410.417.801
Демьянков В.З. Специальные теории интерпретации в вычислительной лингвистике. – М.: Изд-во Моск. ун-та, 1988. – 87 с.
Учебно-практическое пособие посвящено современному состоянию разработок интерпретаторов естественных и искусственных языков, в наибольшей степени использующих достижения общего языкознания и психолингвистики. Дается сопоставительный анализ интерпретации текста человеком и ЭВМ и делается обзор современных лингвистических концепций моделирования интерпретации. Сформулированные общие выводы специальных теорий интерпретации прилагаются к построению системы, интерпретирующей наименования количественных экономических показателей в виде процедур их вычисления и поиска хранимых данных. Показывается, что естественно-языковая формулировка содержит в себе (в скрытом виде) указание на алгоритм поиска ответа на запрос в виде указанного наименования.
Книга адресована студентам старших курсов и аспирантам, специализирующимся в прикладном и математическом языкознании, а также всем разработчикам систем, отвечающих на запросы, сформулированные на естественном языке.
-3-Понятие интерпретации, лежавшее в самих истоках филологии, в 1970-1980 гг. вновь оказалось в центре внимания общелингвистической теории. Тогда под новым углом был поставлен вопрос о сущности и процедурах истолкования и понимания текстов в рамках моделей вычислительной лингвистики. Если раньше языковедов интересовали больше чисто структурные свойства языка, то теперь человеческий фактор в речи выдвинулся на первый план. Действительно, нельзя представить себе адекватную модель понимания и продуцирования текстов на естественных и искусственных человеческих языках без учета того, как человек, во всей своей индивидуальной неповторимости, воспринимает речь. То, что на первых шагах вычислительной лингвистики можно было – временно – вынести за скобки, оставив на рассмотрение в будущем (а именно, индивидуальность каждого носителя языка и неповторимость сиюминутных ситуаций восприятия речи), теперь, во второй половине 1980-х гг. становится весьма актуальной задачей.
В данной работе, продолжающей линию предшествующих публикаций автора {Note 1}, интерпретация анализируется как один из видов деятельности. Этот взгляд излагается в первой главе. Во второй главе аналогичным образом трактуется понятие ошибки продуцирования и понимания речи: объяснить эти явления можно, опираясь именно на такую деятельностную концепцию человековедения, которая за общими закономерностями видит и пытается истолковать индивидуальность.
{Note 1. [Демьянков 1978], [Демьянков 1985].}
Понятие интерпретации настолько проникло во все сферы филологии 1980-х гг., что можно говорить о единстве филологического исследования на качественно новом уровне: даже рассматривая модели в вычислительной лингвистике, приходится сегодня оперировать понятиями не только теоретического языкознания,
-4- но и теоретического литературоведения. Таким образом, как это ни покажется на первый взгляд парадоксальным, воссоединение этих дисциплин и хорошее фоновое знание их во всей совокупности необходимы не только для практического истолкования текстов человеком-текстологом, но и для решения задач вычислительной лингвистики.Однако эта тенденция к воссоединению дисциплин сопровождается в общем языкознании многообразием теорий. Действительно, признав право каждого человека – носителя языка – на неповторимость, исследователи языка и за собой оставляют право на глобальную теорию. Это привело к огромному количеству общих теорий на лингвистическом небосклоне, и каждую из них с большим или меньшим правом можно назвать специальной теорией интерпретации, – им и посвящена третья глава.
Наконец, в четвертой главе – в качестве иллюстрации к предшествующему изложению – описывается один из возможных специальных формальных аппаратов, имеющих непосредственный выход в практику построения информационных систем интерпретирующего класса, т.е. принимающих на входе запрос на естественном языке и выполняющих предписываемые (этим выражением) действия.
Самое чтение поэта есть уже творчество. Поэты пишут не для зеркал и не для стоячих вод.
(Иннокентий Анненский. Книга отражений.)
В последние годы в языкознании сложились предпосылки для создания общей, специальных и прикладных теорий интерпретации. Общая теория должна определять принципы интерпретирования речи и общения людей, а также взаимосвязь понятий класса "интерпретация" (понимание, недопонимание, ошибка продуцирования и интерпретации и т.п.). Специальные теории должны тогда воплощать общие положения в виде конкретного понятийного и формального аппарата – таковы многие современные грамматические концепции, относимые к "интерпретационному направлению" в языкознании последних лет. Прикладная теория интерпретации должна решать принципиальные проблемы специальных теорий в рамках систем, обрабатывающих и создающих тексты как на естественных, так и на искусственных языках, в частности, на языках программирования.
Разработка прикладных теорий интерпретации осуществляется в настоящее время при двойной направленности. Первая связана с учетом возможностей и внутренней техники работы современных ЭВМ; при создании лингвистической теории эти факторы учитываются и осмысляются как объективные ограничения на формальный аппарат теории. Вторая направленность связана с усовершенствованием ЭВМ.
Современные ЭВМ обладают "интерпретирующим режимом работы", когда одновременно с прочтением выражения (текста программы, заданной на некотором языке программирования, например, на языке АЛГОЛ, ФОРТРАН, ПЛ/1, ПАСКАЛЬ) выполняются действия, предписываемые этим текстом. Однако этот режим связан, как правило, с большими затратами ресурсов ЭВМ: иногда даже вся оперативная память ЭВМ оказывается полностью
-6- занятой "пониманием" текста программы, так что в ней не остается места для осуществления самих предписываемых действий. Вместо интерпретирующего режима поэтому чаще пока что используется другой режим компиляции программ (формирования внутреннего, "машинного" представления алгоритма), называемый трансляцией. Тогда текст программы сначала переводят на язык машинных операций (попутно возможна и оптимизация получаемого алгоритма), "приспосабливают" его к текущему состоянию данной ЭВМ, – и только после этого оттранслированная программа начинает выполняться. Итак, при первой направленности, говоря о той или иной специальной теории интерпретации, учитывают реальные возможности интерпретирующего режима и реальные возможности ЭВМ; эта направленность может быть охарактеризована как использование идей информатики в языковедческой теории ("от ЭВМ – к человеку"). Вторая же направленность противоположна первой: "от человека – к ЭВМ". А именно, речь идет о том, чтобы усовершенствовать структуру ЭВМ, разработав прикладные теории интерпретации, о том, чтобы внедрить результаты общелингвистических и психолингвистических исследований в конструирование ЭВМ нового поколения. В своем комплексе эти две направленности образуют проблему моделирования интерпретационных процессов на ЭВМ. Оба направления можно охарактеризовать как тенденцию к гуманизации информатики, к введению в информатику понятий, все больше приближающих машинную интерпретацию к реальности человеческой мыслительной деятельности.Ниже мы попытаемся сопоставить элементы интерпретации (текста, речи) человеком и ЭВМ. Забегая вперед, отметив, что большинство этих элементов в сегодняшней информатике учитывается только косвенно: человеческий фактор в ней фактически игнорируется. А это означает, что у прикладной теории интерпретации огромное поло деятельности.
-7-{Note 1. Литература по данному вопросу обширна, часть ее содержится в нашей работе: [Демьянков 1985а, с.374-455].}
"Интерпретация" – термин далеко не однозначный. Генеральный водораздел его значений проходит между "интерпретацией-объектом" (например, текст перевода, критическая статья по поводу художественного произведения, "реагирующие реплики" слушателя) и "интерпретацией-процессом", не всегда воплощенным в виде воспринимаемых объектов. Понятие интерпретации можно анализировать – "анатомировать", если угодно, – тем же способом, что и виды деятельности вообще. В частности, есть процедура интерпретирования как таковая, субъекты и объекты интерпретации, цели, результаты и инструменты ее. Есть и материал интерпретации – психика конкретной личности, далеко не во всех отношениях отождествимая с психикой другого интерпретатора, – точно так же, как и различные экземпляры одной и той же модели ЭВМ, установленные в различных научно-исследовательских учреждениях и используемые людьми разной квалификации, представляют собой очень разный материал.
Обладает интерпретация и своими презумпциями. Так, при вей всегда имеет место презумпция интерпретируемости рассматриваемого текста как выполненного в рамках конкретной и (по предположению воспринимающей стороны) известной системы знаков, на известном языке. То же верно и для ЭВМ: столкнувшись с неправильно сформулированным фрагментом текста программы, компилятор (в частности, интерпретатор) сигнализирует об обнаружении ошибки и одновременно либо останавливает свою работу, либо (в зависимости от устройства и от серьезности ошибки) продолжает работу при презумпции интерпретируемости текста, но лишь после исправления ошибки человеком. Не напоминает ли это, в зародыше, реакцию слушающего, чувствующего свое недопонимание и спешащего остановить собеседника?
-8-Итак, можно сказать, что каждый шаг интерпретации и его промежуточный результат обладают обратной связью с процессом интерпретаций. На каждом таком шаге проверяется, верна ли презумпция интерпретируемости данного целого объекта, еще не полностью воспринятого, данного субъекту только частично.
Частный результат этой проверки заключается в констатации интерпретируемости или неинтерпретируемости текста при наличном ресурсе интерпретатора. И в то время как машина, по-видимому, всегда предполагает свое совершенное владение языком (программирования) – даже там, где программист поступил в соответствии с правилами данного языка, но не учел несовершенства используемого на этой машине варианта компилятора, – для человека-интерпретатора свойственно часто ставить под вопрос именно свою компетентность. Это несомненно так, когда интерпретируют сообщение на плохо усвоенном языке. И даже когда для интерпретатора данный язык родной, то, в зависимости от степени авторитетности речи, далеко не всегда торопятся оценить непонятное как ошибку говорящего: чем авторитетнее речь или автор ее, тем более свойственно интерпретатору брать ответственность за непонимание на себя. По ходу восприятия большого текста таких эпизодов недоинтерпретируемости может быть огромное количество.
Из одних эпизодов интерпретатор выходит, обогатившись новыми знаниями (недопоняв, он включает в свой багаж новые сведения об употребимости старых или новых языковых средств), из других – с легким скепсисом, из третьих – в полной подавленности или растерянности, – все это зависит от личностных свойств интерпретатора не в меньшей степени, чем от общих свойств человеческой интерпретации как таковой. Однако в обычном случае после того, как исчерпан объект восприятия, муки интерпретации проходят.
Подобно тому, как муки слова при создании литературного произведения не запоминаются автору во всех своих подробностях, в виде последовательности всех пережитых мысленных эпизодов творения и исправления, – так и муки интерпретации, если они вообще доступны данному человеку (ведь доскональность и совестливость в интерпретировании очень варьируются), могут осознаваться скорее в виде отдельных эпизодов непонимания, привязанных к той или иной детали интерпретируемого текста, чем к элементарным процедурам распознавания (скажем, к подробностям поиска
-9- во внутреннем словаре, извлечения оттуда всех возможностей отождествления с неопознанным объектом из текста). Соответственно, стираются в памяти все следы этих мук.Перейдем теперь к каждому из названных элементов интерпретации более подробно.
Пользуясь средствами формальной логики и теории алгоритмов, можно построить такой формальный аппарат, который протоколировал бы весь ход интерпретации. В отличие от самой-процедуры – развертывания интерпретации во времени, – такое "структурное" представление только весьма приблизительно отражало бы суть процесса, – скорее промежуточные результаты, не больше. В частности, оно отражало бы: а) передвижение фокуса внимания реципиента по тексту и последовательное выделение одного за другим квантов интерпретации – мельчайших единиц, отождествимых с хранимыми единицами внутреннего инвентаря интерпретатора; б) этапы работы внутренних модулей интерпретатора – состояние его оперативной и долговременной памяти, а также вид операций, выполняемых над ними (скажем, пополнение или стирание хранимой информации); в) изменения, происходившие с воспринимаемым контекстом (как языковым, так и внеязыковым) по ходу интерпретирования. Впрочем, ни в одной из реализованных на ЭВМ моделей понимания даже эти виды протокола не представлены в полном объеме.
Более содержательным и охватывающим одновременно каждый из трех названных видов протокола представляется набор следующих "измерений": а) процесс интерпретирования как смена видов операций, таких, как конструирование, реконструкция и заполнение пропусков (восполнение пропущенных деталей образа), – это "утончение" образа; б) репрезентация – отражение образа внутри "мира интерпретатора", взаимодействующее как с когницией (что приводит к группировке элементов получаемого образа таким способом, который может отличаться от упорядочения элементов воспринимаемого текста), так и с метаинтерпретационной оценкой (типа констатации отличий между текстом, его репрезентацией и когницией); в) операции, оценивающие воспринимаемый текст как стоящий в ряду других текстов, в интертекстуальной
-10- парадигме (примеры оценок: цитирование, оригинальность, влияние других текстов). И начиная именно с этого переплетения подпроцедур, мы попадаем в сферу, практически отсутствующую в рамках компиляторов ЭВМ.В структурном представлении хода интерпретации отсутствует динамический дух, перипетии столкновения разных линий восприятия текста, внутренних миров автора и адресата, то состояние, когда мы вот-вот ухватим то неуловимое, что мы видим в жизни через призму данного текста. С этой точки зрения очень важно следующее положение: каждый шаг в этом процессе обладает статусом гипотезы, а не истины в последней инстанции. На каждом этапе мы выдвигаем гипотезы о том, каков смысл целого текста (еще не полностью, возможно, прошедшего перед нашим внутренним взором), но исходим при этом из того, в частности, что уже было нами переработано в этом же тексте. Когда говорят о гипотетической интерпретации куска текста, который предстоит "увидеть" реципиенту, употребляют термины "ожидание", "экспектация", "предвосхищение". Таким образом, гипотезы обращены на прошлое, настоящее и будущее данной речи. Даже интерпретация полностью услышанной речи – всего лишь более или менее правдоподобная гипотеза, предпочтительная на фоне остальных предположений, сама дающая основания для дальнейших актов понимания. Основания для ожиданий, – более или менее веские, но не обязательно осознаваемые интерпретатором, – по ходу внутренней борьбы идей подтверждаются или опровергаются.
Объекты ожиданий очень разнообразны. Речь, которую нам только предстоит воспринять, далеко не исчерпывает всего многообразия; иначе при чтении человек преследовал бы единственную цель – предугадать, какие олова, а не какие мысли последуют далее; а это в действительности скорее исключение, чем обыденность.
К объектам ожидания относятся еще и предполагаемые намерения автора речи, его знания (мнения), скрытые за речами: мы приписываем другим мнения, основываясь, отчасти, и на собственных своих интерпретациях того, что мы услышали от этого автора или о нем. Даже оценка информированности собеседника корректируется, также будучи ожиданием.
Степень соответствия намерений автора его речам тоже является одним из важнейших объектов гипотез (в частности, и ожиданий). Пусть далеко не всегда намерения подаются явно: речь зачастую мстит
-11- двуличному говорящему – отсюда "фрейдовы оговорки", запутанность изложения, расхождения между интонацией и типом речевого акта. Чуткому интерпретатору виднее, чем автору, разрыв между истинными (не всегда осознанными) и напускными, "подаваемыми" намерениями. А сверхчуткий интерпретатор, предающий цензуре свои же речи, никогда не сможет солгать, осознавая это.В общем случае имеем три группы сущностей, к которым привязаны гипотезы: 1) объекты последующей интерпретации (сама речь); 2) внутренние миры автора (когда интерпретатор полагает, что автор абсолютно искренен, таких миров один; обычно же их столько, сколько "эшелонов намерений", – когда за одним намерением скрыто другое, за тем – третье и т.д., – мы предполагаем у говорящего); 3) внутренний мир интерпретатора, в том виде, в каком, как думает его носитель, он представляется автору речи, – это дважды преломленное представление интерпретатора о себе самом. Итак, коротко, – вот три главных объекта гипотез: речь (плюс ее контекст), автор и интерпретатор.
Обоснованность ожиданий коренится в названных трех видах объектов. Предполагая связность речи, а при этом видя нарушения связности в той или иной части текста, мы можем винить в этой сам текст как физически несовершенный материал, подающий связный мир говорящего для нашего связного мира, но можем также сетовать на путаницу в голове говорящего, или, наконец, описывать все на собственную свою неискушенность.
Что же происходит, когда ожидания не подтвердились? Уже услышанное или прочитанное переинтерпретируется, – либо же реципиент отказывается понимать весь текст, "выходит из игры". Второй путь зачастую представлен локально: из своего восприятия мы стираем только небольшую часть трудного текста; на ее месте не всегда не остается никаких следов этой хирургической операции: "рана непонимания" иногда долго мучает интерпретатора. Обычные же случаи – скорее между двумя полюсами: между полюсом оптимизма при обновлении гипотез и полюсом пессимизма, отказа понять. В разной степени драматичными бывают тогда и результаты переинтерпретации. Однако всегда главными объектами переинтерпретации бывают именно ожидания; переинтерпретация – это частный случай интерпретации.
-12-Степень целенаправленности, контроля над тем, насколько интерпретация как процесс соответствует поставленной цели, – это переменная величина, зависящая от очень многих факторов, из которых личностные – характер, воля и способности – играют далеко не последнюю роль. Интерпретация (в отличие от машинной трансляции) управляет своим ходом: промежуточные результаты могут менять и промежуточные, и глобальные пали. Тот случай, когда сказанное интерпретируется с минимальным вкладом знаний и установок реципиента, – всего лишь один из конечного числа возможных. Между тем, в рамках компиляторов ЭВМ зафиксировано только считанное число таких возможностей.
Целенаправленность интерпретации связана и с автором, и с адресатом. Первое – когда интерпретатор предполагает целенаправленность авторской речи и в граничном случае полностью полагается на автора, просто следя за ним; это – интерпретация с минимальным привнесением собственных планов, максимально альтруистичная, самозабвенная. В полной море вряд ли на нее способен даже человек, лишенный самолюбия и тщеславия. А интерпретатор-машина – сама самозабвенность; все, что от этого идеала отклоняется, отвергается в качестве компилятора ЭВМ, – но зато и было бы ближе к человеческому восприятию. Другой полярный случай – интерпретация, идущая только от интерпретатора: последний ничего не ждет от автора, а только использует речь его как сырье – зачастую лишь отрывки из этой речи, поскольку понять текст как целое – уже значит приписать целенаправленность автору. Например, ближе к этому полюсу рассерженный или раздраженный читатель, каждым своим шагом пытающийся доказать, что автор трактуемых слов сплошь и рядом противоречит себе, а тем самым и собственным целям.
В наиболее широком смысле цель интерпретации – в установлении гармонии или поддержании уже сложившихся гармоничных отношений – между внутренними мирами реципиента и автора речи. Интерпретация-объект, получаемая при этом, представляет собой что-то вроде промежуточного звена, соединяющего эти два внутренних мира в данный момент. Гармоничность же предполагает целостность и примирение воспринимаемых противоречий в чужих
-13- речах, вписанное в чужой внутренний мир. Именно поэтому можно сказать: "Понять – значит простить"; в данном случае: проинтерпретировать – значит (пусть на миг) простить огрехи выражения, выявив за ними истинные намерения и приняв чужой мир как один из возможных, имеющих полное право на существование, хотя, возможно, и менее приоритетных по сравнению с внутренним миром самого интерпретатора.Эти объекты совпадают с объектами ожиданий (см. выше); это: а) внешние чувственно воспринимаемые стимулы, относительно которых имеется презумпция интерпретируемости, т.е. знаковости, – речь реально воспринятая и/или ожидаемая; б) внутренний мир автора, гипотетически моделируемый и постоянно пересматриваемый реципиентом по ходу речи и по ее контексту; в) внутренний мир интерпретатора, также в постоянном движении, поскольку каждый значимый шаг интерпретации речи так или иначе связан с переструктурированием собственного мира, с добавлениями и исправлениями в нем.
Когда выражение становится объектом интерпретации, реконструируется его "предыстория" – путь, которым оно было построено, – а также связь между внутренним миром автора и текущим состоянием внутреннего мира интерпретатора. Глубина интерпретации – степень проникновения в сущность объекта ее – также тождественна глубине такой реконструкции. Для человека глубина интерпретации весьма непостоянна от эпизода к эпизоду, от личности к личности; для ЭВМ эта глубина равна нулю: задача машины – исполнять, а не докапываться до истоков данного текста программы. Между тем изобретение средств "углубления" интерпретации ЭВМ позволило бы отличить серьезное и существенное от малозначимого в тексте программ, возможно, даже сделало бы компьютер восприимчивым к остроумию программиста, находящего неожиданные алгоритмические решения. Пока что талант программиста может оценить только другой программист, как минимум, владеющий тем же языком; машине же недостаточно знать этот язык, для того чтобы глубоко интерпретировать текст.
-14-Условно такие результаты можно подразделить на воспринимаемые (видимые, слышимые и т.п.)- типа ответных действий и невоспринимаемые непосредственно – типа умозаключений, достройки внутреннего мира и т.п. Однако и те, и другие не были бы интерпретацией-объектом, если бы их не объединяла общая черта – духовность. Простую реакцию, скажем, редактора, исправляющего изъяны рукописи в результате своей оценочной интерпретации ее, – нельзя было бы назвать интерпретацией, если бы она была лишена духовности.
Из глубины веков преследует филологов вопрос о том, что предшествует чему: значение речи определяет интерпретацию ее – или же интерпретация представляет собой создание значения высказывания? Первый взгляд коренится в том представлении, согласно которому значения создают особое царство, со своими законами и иерархиями. – аналогично отношениям между предметами реального мира (ср. платоновы идеи). Определенную поддержку этому взгляду дает лексикографическая практика: значение лексемам в словаре приписывают таким образом, чтобы очертить по возможности наиболее широкий спектр вкладов данной лексемы в значение целого предложения в произвольном контексте. Другой же подход состоит в том, чтобы считать предложение или текст, или вообще любую речевую единицу (даже словоформу) не обладающими значением до того, как они были сконструированы по ходу речи; словарное значение, при таком подходе, – это значение данной лексемы в данном словаре, взятом как своеобразный текст.
Нам представляется разумным следующее решение этой проблемы. Часть речевых единиц обладает "хранимым" значением (эти единицы соотнесены со словарными), а для остальных значение – результат интерпретации в тексте. Для первых тогда интерпретация в тексте опирается на лексическое значение, адаптированное данным интерпретатором (во всей его личностной неповторимости) к тексту. В словарь заносятся обычно те единицы, хранимое значение которых не тождественно внутренней форме (т.е. сумме значений составляющих единиц в рамках конкретной конструкции). Вот почему значительно реже, чем отдельные слова,
-15- в словарь попадают синтаксически более сложные выражения: их интерпретация чаще совпадает с внутренней формой. Только если синтаксически сложное выражение интерпретируется идиоматическим образом, не как сумма смыслов частей этого целого, – лексикографы предполагают, что имеют дело с единицей словаря: это случай идиом типа "набить руку", когда неразумно приписывать лексеме "рука" в качестве лексического значения (реализованного ровно в одном контексте) еще и что-нибудь вроде "навык".Кроме того, значение лексемы в словаре – не то же, что интерпретация этой единицы в конкретной речи конкретным же индивидом и в конкретных обстоятельствах (то, что в средневековой логике называли суппозицией). Вряд ли есть четкая верхняя граница единиц, обладающих "постоянными суппозициями", т.е. лексическими значениями; ведь идиоматичным может быть не только словосочетание, но и целое предложение (например, "Любовь зла – полюбишь и козла"), и целый текст. Идиоматичными можно назвать многие хрестоматийные тексты: их обязаны знать – по установлениям данного социума – все, кто может называться носителем культуры. Это, например, огромное количество расхожих цитат из таких произведений, как "Горе от ума" А.С.Грибоедова, "Евгений Онегин" и многие произведения А.С.Пушкина – для представителей нашей культуры; начальная, "открывающая" сура Корана – для мусульманского социума и т.п.
Так же как не все, для кого идиоматичен религиозный текст, бывают верующими, – так и не все, цитирующие хрестоматийный текст, придерживаются буквального его смысла; например, цитату "В мои года не должно сметь свое суждение иметь" мы часто употребляем иронически, не вкладывая в нее свой действительный отказ от мнения. Это еще раз подтверждает то положение, что владение текстовой идиоматикой есть элемент культуры, не выводимый по правилам конструктивной семантики, в которой значение целого складывается из значения частей по предписаниям конструкции соположения этих частей.
Хрестоматийные тексты обладают закрепленным значением уже до акта цитирования, а потому в той же степени идиоматичны (и соответственно, имеют лексическое значение, скажем, в "Словарях крылатых слов"), что и идиомы-словосочетания более скромных размеров. Это, конечно, не исключает окказионального переистолкования этих текстов, более
-16- близкого к буквальному, в конкретных обстоятельствах. Например, последнее происходит, когда в тексте не подозревают хрестоматийности, – и этот случай совершенно аналогичен тому, когда слово истолковывают по его внутренней форме, не подозревая устоявшегося лексического значения за ним (олово "прилагательное", понятое как то, что может быть приложено, а не как наименование определенной части речи). Незнание идиоматики – обычная причина наивных интерпретаций.Итак, при нашем соотнесении понятий "интерпретация" и "значение" разграничиваются конкретизируемые и хранимые значения, а сходство словарей у различных носителей их не обязательно связывать с общим для всех, кто говорит на данном языке, царством значений. Это "царство" – метафора, не отражающая реальности.
В общем случае мы полагаем, что в результате интерпретации каждое выражение приобретает речевое значение (суппозицию), которое, в рамках внеречевого контекста обстоятельств интерпретации и общения, дополняет, сужает или модифицирует уже сложившийся внутренний мир интерпретатора. Речевое значение, кроме прочего, выполняет и функцию гармонизации того, что в рамках конкретного текста было оказано вплоть до текущего высказывания. Иначе говоря, каждый промежуточный результат восприятия речи в той степени может быть назван ее успешной интерпретацией, в какой он гармоничен на фоне получающейся внутренней картины реципиента: когда этот результат сопоставляют с целями интерпретатора, можно говорить о степени предпочтительности; сравнивая его с исходным объектом – с самим текстом, – используют оценочные термины типа "объективность" и "адекватность"; когда же результат этот рассматривают сам по себе, как предмет, обладающий самоценностью, – речь идет о завершенности.
Все те же оценки возможны и при машинной интерпретации, которая ("по мнению ЭВМ") только успешна, только гармонична, только объективна и только адекватна и завершенна: иначе – по мысли конструкторов компилятора – работа с ЭВМ станет невозможной. Такой подход заранее сужает возможности интерпретатора: обнаружив в дальнейшем свою ошибку, вместо того, чтобы вернуться на исходные позиции и пересмотреть свои действия заново, он будет, если угодно, "упорствовать", стоять на своем, что далеко не всегда безобидно.
-17-И те и другие используются при интерпретировании речи. Различаются: 1) свойства данной конкретной речи и контекста (речевого и внеречевого) – вехи, опираясь на которые мы продвигаемся по тексту; 2) наши "духовные инструменты". К последним относятся: а) то в нас, что заложено до конкретного акта интерпретирования; б) то, что привносится по ходу этого акта, когда наш багаж знаний пополняется сведениями из данного текста; в) эти же сведения, но логически обработанные в опоре на уже имеющийся запас знаний и обладающие статусом качественно новых знаний; г) наши стратегии, конструируемые нами и подвергаемые пересмотру в процессе восприятия текста.
Среди духовных инструментов, таким образом, мы выделили четыре разновидности. Последняя из них – стратегии интерпретации – представляет собой динамический потенциал, организующий реальный ход интерпретирования, – в отличие от статичного набора знаний. Стратегии вообще упорядочивают события, контролируемые человеком. Стратегии же интерпретирования соединяют цель человека со средствами, когда перерабатывается речь, а одновременно сами являются средствами. Таким образом, стратегия интерпретирования – инструмент, использующий другие инструменты. Те стратегии, которые являются инструментом для воплощения других, называются интерпретационными тактиками.
Все эти разновидности инструментов имеются и в распоряжении интерпретатора ЭВМ. Однако, как правило, стратегии (или то, что им соответствует в машинном воплощении) не образуют альтернатив: в каждый данный момент ЭВМ должна выбрать ровно один путь без колебаний, без раздумий на пересечении дорог. Зато все эти сомнения и раздумия выпадают на долю самого программиста. С приходом качественно новой техники можно будет усовершенствовать и эту сторону, переложив на плечи ЭВМ по крайней мере часть тяжести стратегического или хотя бы только тактического замысла.
-18-С понятием "интерпретация" мы вступаем в область настолько индивидуальных свойств, что реальной становится опасность чрезмерного обобщения. При теоретизировании и при постановке психолингвистического эксперимента с последующим истолкованием результатов важно сохранить равновесие между генерализацией и индивидуализацией, между общим и частным в описании языка я речи. Например, когда считают, что понимая, мы шаг за шагом переходим от поверхностной структуры к репрезентации смысла, – частный случай сложной процедуры выдается за общий, перекодировка приравнивается пониманию. Между тем этот перекодировочный путь выбирается реальными интерпретаторами только тогда, когда мы ничего не ждем от сообщений собеседника, т.е. когда полагаем, что ничто в них не может изменить нашего внутреннего мира. Или, скажем, когда переносный смысл считают результатом дополнительных интерпретационных шагов, начинающихся только с того момента, когда получено буквальное значение высказывания, – имеет место все то же чрезмерное упрощение. Наш тезис состоит в следующем: в отличие от ЭВМ, точнее, ее теперешнего поколения, человеку присущи не только индивидуальные наборы знаний и их иерархизация, не только свои собственные способы усвоения или отклонения чужой информация и логического вывода новых знаний, – но и свои иерархии предпочтительности для стратегий, процедур и намерений в интерпретировании. Одна из сторон субъективности интерпретации – межличностность, другая – интенциональность.
Имеем два вида межличностности: связи типа "автор – интерпретатор" и "интерпретатор – интерпретатор". Так, реципиент оперирует тем набором допустимых истолкований, который ему навязывает автор речи; это первый вид связи. Проявление второго вида связей мы видим в том единообразии, с каким различные индивиды интерпретируют одни и те же высказывания. Чем объяснимо такое единообразие? Во-первых, тем, что интерпретируются одни и те же физические объекты – физический облик речи – на фоне единого материального мира. Возможность понимать друг друга гарантируется единством материального мира.
-19-Во-вторых, объяснимо единообразие интерпретации и единообразием (хотя и не тождеством) в устройстве и механизмах действия духовных инструментов.
Можно предположить, что стратегии интерпретации как один из видов духовных инструментов составляют универсальную базу людей: все обладают каждой из этих стратегий (общий репертуар которых еще предстоит выявить в результате психолингвистических исследований), но иерархии предпочтения над такой базой варьируются от человека к человеку, от одного типа личности к другому, от одного эпизода понимания к другому, от социума к социуму и т.д.
Специфически межличностным видом выбора стратегии является альтернатива: а) в большей или меньшей степени стремиться встать на точку зрения собеседника, "эмпатизировать" ему, посмотреть на вещи его глазами, либо б) сознательно или неосознанно достичь отстраненного взгляда, не совпасть по перспективе рассмотрения с автором речи. Таким образом, межличностность может проявиться в большей или меньшей степени эмпатии интерпретатора.
Интенциональность как другая сторона субъективности интерпретации двунаправленна: она распознается в речах и действиях, а одновременно в качестве намерений реципиента регулирует ход интерпретации. Намерения, скрытые или, наоборот, поданные в речи явно, наиболее часто считаются основной мишенью интерпретации которая способна проникнуть даже по ту сторону неудачно высказываний, тогда извлекаются "объективные намерения говорящего" (а скорее то, что кажется более или менее объективным). Когда такие намерения ясны и без дальнейших слов, благосклонный интерпретатор готов простить огрехи речи и отвлечься от буквального значения сказанного. Мы часто склонны судить о локальных намерениях автора не только по его речам, но и опираясь на предшествующий опыт общения с автором, когда – проницательно или наивно – устанавливаем, насколько тот придерживается канонов соотнесения своих намерений с тем, что принято говорить в конкретных обстоятельствах. Выбирая (в подсознании) стратегии интерпретации, мы руководствуемся тем, насколько легко извлекаются истинные мотивы речи и насколько прозрачна фальшь ее: такие стратегии, позволяющие приписать тексту иерархию (эшелоны)
-20- намерений, можно было бы назвать "контрнамерениями", а реакцию между стратегиями этого типа и намерениями автора (в гипотезе интерпретатора) можно метафорически представить как взаимодействие кислоты и щелочи, нейтрализующих друг друга.Не все мы и не всегда проницательны; иногда, например, воспринимая комплимент как иронию или оскорбление – вопреки замыслу говорящего, – мы теряемся в догадках, как и насколько канонично следует прореагировать на отступление от норм общения. Оценка намерений составляет поэтому и драматическое ядро взаимодействия людей, будучи одним из кардинальных видов интерпретации, квалифицирующей высказывания как тип речевого акта в опоре на весь спектр действий. Именно рассмотрением драматургии общения и занимается теория речевых актов, бурно развивающаяся особенно в последние годы; ее можно определить как исследование принципов и свойств интерпретации речевых и внеречевых намерений, основанной на интерпретации речи.
Установление явных и скрытых намерений как раз и отличает интерпретацию от остальных видов обращения со знаками. В частности, именно поэтому неудачно сводить понимание (несомненно интерпретирующую деятельность) к перекодировке поверхностных структур в семантические. Ведь перекодировка предполагает не только неизменность кода – репертуара знаков (что уже неверно для наиболее обычного языка: естественный язык постоянно меняется), но и несущественность намерений автора для восприятия речи. Перекодировка – один из сверхчастных типов интерпретации, при восприятии речи чрезвычайно редко представленный в чистом виде.
Обе стороны интенциональности – намерения автора и интерпретатора – тесно связаны между собой, но связь эта весьма индивидуальна. Имеем два полюса на непрерывной шкале, характеризующей типы интерпретаторов. На одном полюсе те, кто в данном конкретном эпизоде (не обязательно всегда) пытаются выявить намерения автора как бы "через замочную скважину", не спугнув автора, не навязав ему своих личных взглядов; такой осторожный и лабильный интерпретатор послушно вносит все требуемые поправки в свою текущую систему мнений. На другом же полюсе – те, кто абсолютно на каждом шагу внутренне протестуют против навязываемой системы мнений, зачастую – пусть даже только мысленно (особенно если воспринимается текст,
-21- автора которого нет рядом) – одергивая говорящего или злорадно констатируя его коммуникативные промахи. Ибо именно промахом можно назвать несоответствие намерений получаемому эффекту. Особенно трагично такое положение, когда столь сверхкритично интерпретируем мы свою же речь: не успев что-либо сказать, мы уже зачеркиваем свои мысли. Итак, на одном полюсе те, кто легко принимают как законные все намерения автора, а на другом – те, кто речь воспринимает отстраненно и критично.Тем самым круг замыкается: интенциональность и межличностность обладает общей природой. Да и об эмпатии можно говорить не только как о принятии точки зрения говорящего, взгляде на вещи чужими глазами (это – когнитивная эмпатия, о которой говорилось выше), но и как о готовности узаконить ("легитимизировать", как стало принято говорить в работах по анализу дискурса) реальные и потенциальные намерения чужой речи. Первый тип – принятие презумпций, второй – принятие намерений. Первый связан больше с запасом знаний, второй – со стратегиями интерпретирования.
Как и многие другие параметры интерпретации, в ЭВМ использована только одна из бесчисленных закрепленных позиций на шкале личностности. В зависимости от того, чего мы в конечном итоге ожидаем от машин, можно представить и дальнейшую судьбу их. Если мы хотим "очеловечить" ЭВМ (в той мере, насколько это технически возможно), – нужно привнести большую вариативность межличностности и интенциональности. Если же мы обрекаем ЭВМ на безличностность, то дополнительные технические проблемы снимаются, но зато человек, использующий ЭВМ, должен быть все время начеку, для того чтобы гарантировать себя от нежелательных последствий прямолинейной логики машины, слепо выполняющей заведомо неразумные (с человеческой точки зрения) и порой даже античеловечные задания.
В проблеме интерпретации языковедение смыкается с теоретическим литературоведением: недаром интерпретирующее направление охватило в последние годы обе эти филологические дисциплины, позволив им как бы заново обрести общий язык понятий. Дальнейшее развитие теорий интерпретации будет тесно
-22- связано с философскими проблемами научного исследования, а также с этикой технического прогресса.Лингвистика последних двадцати с лишним лет была усердной ученицей точных наук. Теперь же наступило время, когда общелингвистическая теория может сделать важный позитивный вклад в технику и в точные науки. Для моделирования интерпретации и ее усовершенствования при разработке ЭВМ новых поколений недостаточно простой фантазии в сочетании с профессиональной технической подготовкой. Игнорировать филологические теории интерпретации при моделировании понимания и восприятия речи (как на естественных, так и на искусственных языках) – значит обрекать себя на дилетантизм, на околонаучность. Сегодня это положение представляется гораздо более очевидным, чем некоторое время назад: так сказывается сегодняшняя тенденция к гуманизации технических наук.
Будущее интерпретации в рамках усовершенствованных ЭВМ можно видеть в углублении творческого начала, о котором говорится в эпиграфе к данной главе. Можно с уверенностью сказать, что чтение текстов, предназначенных для ЭВМ, будет не менее интересным, чем чтение поэтических текстов.
Другое практическое приложение развиваемых в настоящее время идей интерпретирующего подхода можно видеть в усовершенствовании человеческой техники понимания чужих и своих собственных речей. Сколько грамотных носителей языка действительно глубоко понимают других людей? Судя по тому, как широко распространены недоразумения от недопонимания простых хроникальных заметок в прессе, здесь еще огромное поле деятельности для практиков-интерпретационистов. Обучение правильным методам и приемам восприятия речи как на иностранном, так и на родном языке – одна из важнейших задач филологической науки в наше время. Недооценка культуртрегерской миссии интерпретации на практике, как и недооценка самого понятия интерпретации в нашей науке, можно надеяться, останется в прошлом.
-23-Человеку свойственно ошибаться.
(Сенека Старший. Контроверсии.)
Понятие "ошибка" не относится к "простым" фактам, не зависящим от теоретических взглядов человека, оценивающего речь. Это понятие всегда тесно связано с метаязыковым рассмотрением своей и чужой речевой деятельности. Вне какой-либо теории лежит близкое, но иное понятие – "странность выражения". Ошибка же – нарушение языковых или иных правил, норм, конвенций и т.п., а последние формулируемы только в рамках теорий (пусть даже и не строго научных). Не случайно поэтому, что изменение теоретического климата в языкознании последних 20 лет оказалось на путях определения этого понятия с новых позиций. Именно в этом аспекте мы и попытаемся ниже выявить статус ошибки как оценочного элемента метаязыка. Наиболее продуктивным для решения этой задачи представляется нам интерпретирующий подход, развиваемый особенно широко в последние годы. Кратко остановимся сначала на сущности этого подхода.
В последнее двадцатилетие предметом особенно пристального внимания стали взаимоотношения между продуцированием речи и ее пониманием. Вопрос ставился так: каковы те принципы, соблюдение которых гарантирует и правильное построение, и правильное понимание текста? В начале этого периода (середина 1960-х – середина 1970-х гг.) предполагалось, что если мы сможем определить принципы получения правильного выражения на данном языке, то тем самым сможем объяснить, почему эта речь понятна носителям данного языка: такое объяснение связывалось с доказательством или опровержением гипотезы о наличии деривации, в результате которой появилось оцениваемое выражение; а при конечном наборе правил (строящих все допустимые
-24- деривации и только их) такое доказательство конечно и конструктивно выводимо.Однако, начиная с середины 1970-х гг., все более сомнительным стало предположение о конечности набора правил, участвующих в построении и интерпретации языковых выражений. Действительно, воспринимая речь, мы можем пополнять свой багаж знаний, в том числе и языковых. Например, мы можем узнавать значения новых слов, объяснения которых сплошь и рядом встречаются в реальных текстах, ср.: "Дикообраз – такое животное, которое похоже на ежа, но только иглы у него длиннее". Подобные пояснения при дальнейшем прочтении того же текста могут быть учтены, когда необходимо получить всяческие логические следствия. Итак, набор знаний, мнений, презумпций и т.п. в конце чтения не совпадает с исходным набором. Отсюда – один шаг до принятия тезиса о потенциальной бесконечности знаний (как языковых, так и энциклопедических), используемых при построении и понимании речи.
При таком уточнении нельзя определить ошибочность как несоблюдение (нарушение) правил, как неучет того или иного элемента из конечного запаса знаний. Ведь о правомочности использования или нарушения правил можно говорить, только если вполне определен набор этих правил. Это и подобные соображения привели, в конечном итоге, к "интерпретирующему" подходу к объяснению фактов языка и речи, когда о деривации предложения говорят как об одном из основных видов интерпретации, а именно, как о синтаксической интерпретации предложения. Само же интерпретирование представляется как процесс, протекающий параллельно восприятию выражения (принцип "слева направо"), и представляет собой выдвижение гипотез, сопровождаемое верификацией их при дальнейшем восприятии речи и соответствующим расширением базы знаний интерпретатора. Тогда оценка выражения как ошибочного есть результат интерпретации этого выражения и опирается не только на чисто синтаксические свойства, но также на семантику и прагматику. Термин "ошибка" является элементом метаязыка, наряду со словами типа "истина" и "ложь". Этот метаязык представляет собой "язык интерпретации", т.е. такую систему, которую используют для языкового воплощения (оформления) интерпретации высказываний. Другие способы воплощения – более или менее реалистичные мысленные
-25- образы, музыка и т.п. – могут и не содержать в качестве своего термина оценки "ошибка".Остановимся сначала на некоторых из используемых в существующей литературе оснований классификации ошибок в речи.
1. Ошибки в речи, сопровождающей другую деятельность, противопоставляются ошибкам в речи, взятой изолированно. Этот параметр следует отчасти скорое к классификации различных методических подходов к ошибкам, чем к классификации собственно ошибок: трудно говорить о речевых "сбоях" без рассмотрения того, что сопровождается речью, вне целей этой речевой деятельности. В качестве примера классификации ошибок, взятой в рамках "сопровождающего" подхода, возьмем анализ ошибок, совершаемых переписчиком текста, осуществленный Д.С.Лихачевым [Лихачев 1983]. Эти бессознательные ошибки переписчика приводят к бессознательным же "...изменениям текста, когда писец переписывает только один экземпляр и не ставит себе целью изменение текста, стремясь только более или менее точно его воспроизвести" [Лихачев 1983, с. 65]. Поэтому переписывание текста состоит из четырех операций: "1) писец прочитывает отрывок оригинала, 2) запоминает его, 3) внутренне диктует самому себе текст, который он запомнил, и 4) воспроизводит текст письмом. Каждая из этих операций может привести к специфическим ошибкам" [Лихачев 1983, с. 65]. Соответственно, различаются: ошибки прочтения, запоминания, внутреннего диктанта и письма – с дальнейшими их подразделениями.
2. Бессознательные (или "спонтанные") ошибки могут быть, кроме того, вслед за М.Бирвишем [M.Bierwisch 1970], разбиты на три группы: а) замена одного олова или морфа на другой; б) нарушение правил сочетаемости слов; в) контаминация. Эта классификация, в ее тщательной проработке, была в свое время выполнена с позиций генеративной грамматики конца 1960-х гг. В ней очень ясно прочерчивается взгляд на ошибки как на нарушение правил. Данное основание можно поэтому охарактеризовать как локализацию причины ошибки в структуре порождающего механизма.
3. Ошибки в речи и в понимании на родном языке противопоставлены ошибкам в речи и понимании на чужом языке.
-26-4. Соотнесение плана выражения с планом содержания приводит к характеристике ошибок как разновидности неадекватности; так, по [A.Gardiner 1932], можно различать: а) малапропизмы (ошибочная форма близка форме правильной, или "целевой", но обладает совершенно иным значением); б) формы, близкий по значению и по звучанию, используются одна вместо другой; в) неправильный выбор грамматической формы; г) выбор не самого точного способа выражения.
5. Соотнесение цели высказывания с процессом речепроизводства. Это основание было использовано классиками теории ошибок Р.Мерингером и К.Майером [Meringer, Mayer 1895]. А именно, различаются: а) интерференция разных элементов замысла высказывания; б) интерференция альтернативных формулировок для одной и той же мысли, имевшейся в интенции говорящего; в) влияние подсознания на продуцирование речи. В некоторых концепциях (З.Фрейд) предполагалось, что первые два типа сводимы к третьему – к влиянию подсознания.
Однако такая редукция не всеми признается законной. В теории Б.Баттеруорта [Butterworth 1981, с.627] (и след.) названные типы ошибок характеризуются, соответственно, так: а) ошибки, заложенные в самом плане (намерении) речи; б) смешение альтернативных планов; в) конкуренция планов. Это же основание – целеполагание – может быть использовано при классификации ошибок и продуцирования, и понимания речи: понимая чужую речь, человек также обладает собственными планами (понимание не менее целенаправленно, чем говорение), и изменения планов, их конкуренция, а также осознание ошибочности планов могут сказаться на ходе истолкования чужих речей.
6. Соотнесение исключительно поверхностных структур целевого и результирующего выражений. Так, Д.Фей [D.Fay 1981, с.717] (и след.) различает четыре класса таких смешений: а) замена целого целым (вместо одного слова или словосочетания в речи появляется другое); б) замена части одного целого на часть другого целого (скажем, конкатенация целевого префикса с ошибочно выбранной основой); в) сочетание первого типа со вторым; г) тот тип, который не может быть квалифицирован как один из первых трех.
Для нас особенный интерес представляют следующие три основания.
7. Степень реальности сигнала в соотнесении с единицами
-27- интерпретации. Случай, когда слышится нечто вполне определенное в то время как говорящий просто колебался, выбирая слово (т.е. адресат воспринял неопределенный звук – "мычание" – как произношение некоторого слова), противопоставлен тому случаю, когда слово или словосочетание, по мнению говорящего, произнесенное четко, было воспринято адресатом как пауза (проинтерпретировано как колебание в выборе слова или как молчание).8. Констатируемость ошибок реципиентом. Ошибки восприятия могут осознаваться или не осознаваться реципиентом [P.Linell 1983, с.179] (и след.), что, в свою очередь, может как приводить к сбою коммуникации (когда на определенном этапе общения реципиент перебивает говорящего, прося того пояснить, что имелось в виду), так и не приводить к сбою [S.Garnes 1975, с .214]. Второй случай может быть представлен следующими разновидностями: а) сбой наступает сразу же при констатации реципиентом ошибки понимания; б) сбой наступает только в результате накопления недоумений, возникающих по ходу выслушивания или прочтения сравнительно длинного отрезка речи. Возможен и тот случай, когда адресат, констатирующий свое недопонимание, тем не менее, вынужден воспринимать речь, не сигнализируя о своем недоумении, – скажем, когда этого не допускает социальный или психологический контекст ("неудобно перебивать уважаемых лиц", а также: как реагировать на непонятные места в выступлении по телевидению?).
9. Глобальные ошибки восприятия противопоставлены локальным, в смысле тех человеческих коллективах, которые затронуты в данном акте недопонимания. Пример первого случая – недопонимание чужого языка как результат плохого или слабого владения им; тогда, по К.Фосслеру [Vossler 1923, с.186], не только нарушается контакт между говорящим на родном языке и его слушающим (для которого этот язык не родной), но и между целым коллективом носителей языка говорящего, с одной стороны, и реципиентом, с другой. Пример второго случая – когда (безотносительно тому, общаются ли люди на родном или чужом языке) нарушается "канал связи" между духовными мирами коммуникантов; например, когда сказанное буквально воспринимают с каким-либо подтекстом или наоборот, когда сказанное в переносном смысле воспринимают буквально. Частным случаем этого последнего подтипа является иллюзия общности презумпций у говорящего и слушающего [W.v.Raffler-Engel 1981, с. 47].
-28-Приведенные выше примеры оснований показывают сложность явления – ошибки продуцирования и понимания речи. Ниже мы попытаемся продемонстрировать интерпретационный подход к этому явлению; как представляется, этот подход позволяет дедуцировать многие из названных оснований классификации ошибок. Предварительно сделаем несколько замечаний относительно понятия интерпретации речи.
Термин "интерпретация", как уже говорилось выше, многозначен. В частности, различаются интерпретация как процесс и как результат. Интерпретация-результат – то, что в большей или меньшей степени совершенно, т.е. приближается к идеалу, которым обладает данный носитель языка.
Очевидно, в зависимости от целей интерпретатора, от "материала", с которым он имеет дело, от морок, с помощью которых кто-либо берется оценивать такую интерпретацию, совершенство будет определено по-разному. Так, можно это совершенство приравнять "степени художественности" или "искусству" истолкователя (как делал В.Дильтей и его последователи); возможно, сюда же добавится и искусство анализа.
Правдоподобие такого взгляда покоится на том, что интерпретирование как искусство (и в этом – его родство с другими видами художественной деятельности) не дано в полной мере такому "художнику понимания" от природы, а скорее развито в результате упражнений (другое дело, что чем лучше эти задатки, тем легче развить их и достичь виртуозности). Умение понимать других – это в такой же степени элемент хорошего воспитания, как и умение держать себя в обществе и правильно выражаться. Необходимость этого искусства связана с тем, что "перцептивные намеки", данные в речи, могут быть весьма туманным, а интерпретатор должен дополнять их в той мере, какая требуется объектом понимания и насколько это допускают интеллектуальные способности интерпретатора.
Неудачи при интерпретировании могут быть, между прочим, следствием не только неразвитости интеллекта, но и результатом психологической атмосферы, например, следствием усталости и рассеянности внимания, ограниченности "поля зрения" в данный момент, неосведомленности (постоянной некомпетентности или временного
-29- упущения) и др. Поскольку же мы интерпретируем речь в той степени глубоко и подробно, какая требуется для решения текущих наших жизненных задач (кстати, чересчур подробная интерпретация – тоже отклонение от нормы), а эти задачи по-разному осознаются, ощущение неудовлетворенности от своей интерпретации может быть и результатом переориентации целей интерпретатора: то, что раньше его удовлетворяло (соответствовало его целям), стало казаться чересчур примитивным или, наоборот, усложненным, "надуманным".Поэтому совершенство интерпретации как и несовершенство ее – понятие многофакторное: 1) когда результат интерпретации соотносят с целями, уместно говорить о гипотетичности и предпочтительности; 2) сравнивая этот результат с объектом интерпретации, имеют дело с объективностью, адекватностью и т.п.; 3) когда же результат интерпретации рассматривается сам по себе, как предмет, обладающий собственной ценностью (но именно в качестве интерпретации, а не отдельного произведения речи или искусства), – имеем дело с завершенностью ее.
В рамках первого направления оценки находится такая характеристика, как связность (несамопротиворечивость) интерпретации. Связная и поэтому правдоподобная интерпретация может, в свою очередь, оцениваться на шкалах возможности (в реальном мире), новаторства, объяснительности, социальной приемлемости и т.д. Находясь только в рамках этого "измерения", истолкователь не может претендовать на полную правоту; он скорее может "проповедовать" свой взгляд на данное произведение, чем доказывать его. Взаимодействует это первое измерение и с промежуточным результатом содержательной интерпретации (оцениваемым в рамках второго измерения – объективности) текста: например, оценивая текст (уже на первых минутах чтения) как научно-фантастический рассказ, мы будем применять к нему иные мерки связности, чем при истолковании реалистической или исторической прозы; предположение (часто выдвигаемое уже в качало интерпретирования) о реальности или нереальности событий, которые нам предстоит узнать из текста, диктуют свои правила дальнейшего чтения целого текста, "ключа" его понимания.
В рамках второго измерения мы сталкиваемся с круговой
-30- зависимостью: соответствие интерпретируемому произведению составляет адекватность интерпретации, однако самоидентичность, целостность произведения определяется только в результате интерпретации, оцениваемой как более или менее адекватная. Под самоидентичностью можно тогда понимать связь между произведением и реальностью ("объективность изображения" – термин такой интерпретации), с одной стороны, и целостностью произведения – с другой. Под адекватностью интерпретации своему объекту можно поэтому понимать степень достоверности в оценке функций интерпретирующего объекта в реальном контексте. Иначе говоря, адекватность интерпретации заключена в правдоподобии значимости, приписываемой интерпретируемому объекту, установленной также в результате интерпретации.Поскольку же интерпретирование связано с устранением неоднозначности и расплывчатости текста, с восполнением пропущенных деталей, – в той степени, какую допускает контекст и которая требуется в конкретных обстоятельствах восприятия текста, – можно сказать, что задача интерпретации состоит в завершении данного текста как объекта интерпретации. Завершенность интерпретации поэтому зависит по меньшей мере от двух переменных величин: а) соответствие текста канонам построения аналогичных произведений; эти каноны меняются от эпохи к эпохе и от культуры к культуре (так, "роман с открытым концом" интерпретаторами может быть доведен до конца только в соответствии с канонами, навязывающими полное истолкование именно романа, а не короткого рассказа); б) возможности и потребности данного интерпретатора как личности в построении завершенных истолкований.
Неудачи в понимании речи объяснимы не только как неуспех интерпретатора. Между автором речи и ее интерпретатором обычно имеется обратная связь особого рода. В частности, понимание в той мере удачно, в какой говорящий сумел сделать свою речь понятной. Поэтому такая обратная связь охватывает: организацию разговора как смены реплик (закрепленную "канонами общения" в данном социуме и нашедшую свое отражение в конвенциях интерпретирования чужой речи), структуру понимания
-31- речи, устранение факторов недопонимания, использование уточняющих языковых средств, способы сигнализирования о своей "кооперированности" в общении (т.е. указания на свое стремление к понятности), "поэтические" стандарты обыденной коммуникации (позволяющие удержать внимание собеседника), форму и регулирование как речевых, так и неречевых действий адресата и многое другое.В наиболее общем случае можно сказать, что говорящий, стремящийся к понятности, использует и языковые, и чисто речевые средства – в частности, привходящее внеязыковое знание, стоящее за реальными высказываниями, а также выбор и упорядочение высказываний как выбор и упорядочение высказываемых мыслей. При этом понятность регулируется не прямым, а косвенным образом. В этом отличие от простой передачи "из рук в руки" каких-либо предметов. Когда некто передает другому яблоко, акт передачи состоится, даже если берущий не догадывается, что ему дали яблоко, или даже если дающий не осознает свои действия как передачу яблока. Не так в случае понятности. Говорящий не просто произносит слова – он предоставляет подходящий контекст или модифицирует прежний контекст для интерпретации своих высказываний, направляя процесс логического вывода, к которому должен прибегнуть адресат. Все это говорящий производит, контролируя свои речевые действия посредством "аутоинтерпретации" (интерпретации своей же речи). Но "передача" речей говорящим еще не предрешает с однозначностью "принятие" этих речей адресатом.
Из сказанного следует, что отсутствие понимания – результат, как минимум, трех причин: 1) непонятность автора (неумелость его обращения с речью; в частности, неадекватность его аутоинтерпретации, с точки зрения остальных носителей языка); 2) непонятливость интерпретатора – временная или постоянная; первый случай – когда, скажем, интерпретируется речь на плохо знакомом языке или о плохо знакомых вещах; второй случай – несоблюдение интерпретатором "норм интерпретирования"; 3) непонятость речи как результат, например, избыточности или недосказанности (соответственно, несоблюденность канонов, регулирующих щедрость или скупость в использовании речевых средств при общении), а также – в общем случае – как результат нестандартности выражений.
К понятию нестандартности можно причислить, кроме того, и следующее: а) описание
-32- редко встречающихся закономерных ситуаций; б) незнакомые слова (иногда употребленные без пояснений); в) сочетания слов, обозначающих нечто неизвестное; г) новые, неординарные события; д) новые смены целенаправленных действий, за которыми скрывается своя мотивировка, подлежащая "вскрытию"; е) небуквальное использование языка и речи (см. подробнее [DeJong, Waltz 1983]).Дополняет эту типологию непонятности, частично перекрываясь с перекрываясь с нею, следующая градация понимания (см. [W.Kühne 1983, с.196] и след.): а) перцептивная ступень (свое непонимание на этой ступени можно выразить словам: "Пожалуйста, громче"; б) ступень языкового значения (непонимание значения языковых, а не чисто речевых единиц); в) актуализированный в контексте языковой смысл (снятие неоднозначностей языкового выражения в результате учета информации о контексте, как речевом, так и внеречевом); г) ступень пропозиции (когда ясно, что сказано, с языковой точки зрения, но не обязательно понятно, зачем это сказано); д) модус высказывания (когда неясен, например, типа речевого акта, тип "иллокуции"); е) узнавание даже того, что сообщено не прямо, т.е. понятость в полном объеме. Все эти ступени связывают воедино три различные стороны понимания: понятность (или непонятность) автора, понятливость (или непонятливость) реципиента, понятость (или непонятость) речи, актуализованные в конкретное время в конкретных обстоятельствах.
В интерпретационной концепции понимание рассматривается как переплетение операций интерпретирующего типа. А именно, полное понимание находится на одном из полюсов) шкалы "успешности" интерпретации, полное непонимание – на другом; остальная часть пространства этой шкалы заполнена промежуточными ступенями. Поэтому констатировать свое понимание или непонимание или неполное непонимание и т.п. – значит дать оценку своим действия.
Однако не всегда субъект может однозначно дать такую оценку. Он может не знать, понял ли он речь собеседника, действительно, адекватно, завершение, правдоподобно и т.д. Такая оценка успеха постоянно сопровождает интерпретацию речи, параллельна этой интерпретации (которая, в свою очередь, протекает параллельно восприятию речи); а оценочная констатация типа "Я не понял" не обязательно прерывает интерпретирование. Можно отметить непонимание или недопонимание, оценить это событие как непонятность (автора), как свою непонятливость
-33- или как непонятность, неудачность текста, – а при этом продолжать интерпретирование поступающих сигналов, не перебивая говорящего (особенно часто такое бывает на публичных выступлениях и при чтении).Неполное непонимание приводит тогда в действие компенсаторный механизм: пробелы в понимании одних частей текста компенсируются интерпретацией других частей; решение одних подзадач понимания используется для заполнения брошей в решении других подзадач. Так, речь на плохо знакомом языке или диалекте мы склонны бываем интерпретировать, опираясь иногда даже не столько на звуки этой чужой речи, сколько на свои ожидания того, что в этой ситуации данный говорящий может пожелать сказать, о чем вообще можно говорить и т.п. Если верно, что установление собственной непонятливости равносильно диссонансу в интерпретировании, то можно оказать, что указанный компенсаторный механизм представляет собой средство для устранения диссонансов понимания, для восстановления и поддержания гармонии.
Как мы пытались показать в другом месте, понимание – не только восприятие физического сигнала – поверхностной структуры языковых выражений, – но и переплетение интерпретирующих операций, связанное с решением следующих задач:
1) соотнесение языковых знаний с воспринимаемой речью (т.е. анализ речи с точки зрения языковой структуры);
2) выдвижение и верификация гипотетических интерпретаций речи параллельно ее развертыванию;
3) "освоение" сказанного – построение "модельного мира" по конкретной последовательности высказываний;
4) реконструкция намерений автора речи;
5) осознание того, насколько внутренний мир интерпретатора отличен от его модельного мира;
6) осознание отношений в рамках модельного и своего внутреннего мира – установление "полей напряжений" в этих мирах;
7) соотнесение модельного мира с запасом знаний о действительности, обычно сопровождаемое модификацией этого запаса;
8) соотнесение получаемой интерпретации (модельного мира) с линией поведения интерпретатора; такое соотнесение (как ответ на вопросы, реакция на приказ и т.п.) можно представить как заполнение "белых пятен" модельного мира;
9) установление и
-34- поддержание определенной "тональности" понимания, гарантирующей целостность, гармоничность понимания в рамках всего контекста общения.Соответственно этому ошибки понимания могут быть также разбиты на девять классов, в зависимости от того, какая задача была решена неправильно или неудовлетворительно. В этой связи уместно провести аналогию с ошибками, возникающими при работе ЭВМ.
Ошибки первого типа могут возникать как в результате слабого знания входного языка, так и в результате неправильно запрограммированной работы компилятора этого языка. Последнее – когда правильные хранимые данные о грамматике накладываются на речевой отрезок неадекватным образом.
Ошибки второго типа выглядят как сбой в построении правдоподобных гипотез, выдвижение совсем не тех предположений об искомой интерпретации, какие мог бы получить реальный носитель языка; частный случай этого – неправильное шкалирование гипотез по вероятности.
К третьему типу относятся как неудачи при построении модельного мира (по вине реципиента, а не говорящего) – "тупиковые ситуации", – так и построение модельного мира, не укладывающегося в схемы для результирующих интерпретаций языковых выражений (предусмотренные компилятором).
Ошибки четвертого типа можно связать как с неясностью истинных намерений автора, так и с полной невозможностью эти намерения выяснить.
Пятый случай, например, может быть представлен как ошибочное отождествление внутреннего мира интерпретатора и получаемого модельного мира (когда реципиент считает, что ему сообщают именно его мнение, между тем как говорящий имел в виду нечто иное).
Расстановка акцентов – внутри модельного и внутреннего) миров – способом, неадекватным самому выражению, относится к шестому типу ошибок понимания.
Неверное изменение запаса знаний, сбои в работе процедур пополнения, сокращения или иной модификации базы знаний (как языковых, так и внеязыковых), – все это можно отнести к седьмому типу.
Неадекватная ответная реакция – симптом сбоя при решении восьмой задачи.
Наконец, отсутствие гармонии между результирующей интерпретацией (в частности, сопровождаемой и неадекватными ответными реакция реципиента) и коммуникативным контекстом – показатель неправильного решения девятой задачи.
Как в случае ЭВМ, так, видимо, и в поведении человека
-35- сбои при решении всех девяти задач объяснимы двояко: а) ошибочной базой знаний, на основе которых решается данная задача; б) ошибочно запрограммированной процедурой использования или модификации соответствующих баз знаний. Разделение процедурной части процессора ЭВМ и запаса знаний, обычно используемое в практике программирования, между прочим, нацелено на то, чтобы достаточно легко и оперативно ликвидировать сбои, оставаясь только в рамках базы знаний, т.е. почти не входя в подробное модифицирование процедурной части или делая это только в крайних случаях. Однако пока что неясно, насколько присуще такое разделение всем типам языковой личности; очень возможен тот случай, что интерпретатор-тугодум обладает базой знаний, чересчур сросшейся с процедурной частью своего "процессора".Отметим здесь же и следующий момент. Как и при всякой оценке, констатация ошибочности предполагает сопоставление: когда мы говорим об ошибке понимания, допущенной человеком A, мы предполагаем обычно, что имеется кто-то – B, – выполняющий или способный выполнить то же операции правильно. В обыденной коммуникации в качестве такого контрольного субъекта B могут выступать как непосредственный адресат речи, так и сам говорящий и сторонний наблюдатель. В зависимости от того, на чью точку зрения мы встанем, мы по-разному квалифицируем и ошибку. Так, Дж.Локк смотрел на общение глазами наблюдателя, стоящего скорее на стороне адресата, когда писал: "...человек говорит невразумительно, если его слова не вызывают в слушателе тех самых идей, которые он обозначает этими словами в своей речи" [Локк 1690, с.403]. Этот взгляд связывает ошибку с неправильным "освоением" сказанного (т.е. с третьим видом в нашем перечислении). Однако с точки зрения говорящего, считающего, что говорит ясно и понятно, тот же случай будет охарактеризован как простая непонятливость адресата.
Итак, квалифицирование типа, к которому относится данная ошибка понимания, связано с точкой зрения, которой придерживается субъект оценки. Не менее субъективна оценка того, насколько полно понимание: имеет ли место полное или неполное понимание, полное или неполное непонимание и т.д. Однако критерии при такой оценке, тем не менее, существуют.
При неполном понимании, по [C.Welsh 1983, с.397],
-36- понимание имеет место, но оно несовершенно в том ином отношении. В наших терминах, неполным можно назвать такое понимание, когда решены все девять задач, но эти решения не вполне удовлетворяют субъекта оценки. Констатация несовершенства понимания, как отмечалось выше, может как приводить, и не приводить к сбою. Однако, констатировать сбой может скорее участник общения, чем сторонний наблюдатель (такой взгляд принят в работе [Milroy 1984, с.15], и нам он представляется разумным: в противном случае речь идет о незамеченном недопонимании, замеченном неполном понимании и т.п.Как неполное непонимание оценивают ситуацию неудачного общения, обладающую элементами понимания; типовой случай этого – когда общаются, не понимая языка друг друга, но соотнося свои и чужие речи с окружающими предметами, знакомыми обоим коммуникантам. Таксономия этих случаев для письменного общения предложена в работе [Collins, Smith 1981], но не дает своей дальнейшей разработки (см. [Ringle, Bruce 1982]).
Если из эпизодов общения искусственно удалить все, что можно квалифицировать как понимание (полное или неполное), оставив только то, что послужило причиной для непонимания (полного или неполного), получим "лакуны" в понимании. Частным случаем являются лингвокультурные лакуны, рассмотренные достаточно подробно в работе [Марковина 1984]. Подчеркнем здесь же, что указанное "удаление" непонятного из текста уже предполагает субъективную констатацию непонятности, а следовательно, "лакуна" – понятие, определимое только относительно конкретного субъекта оценки.
Можно различать, далее, уровни предметного и межсубъектного недопонимания, в смысле работы [R.Burkart 1983, с.61] (и след.). Предметное недопонимание происходит, когда коммуниканты обладают более или менее одинаковым набором знаков, реализованных в данном акте общения. Мы бы даже уточнили эту формулировку так: они актуализировали более или менее одинаковые наборы техник получения (порождения) и интерпретации знаков, взятых в отвлечении от их референции. Это, в частности, тот случай, когда набор употребляемых и понятных слов у коммуникантов одинаков, но различны наборы предметов, предполагаемых в качестве референтов для таких слов. Межсубъектное же недопонимание возникает, когда по-разному интерпретируются одни и те
-37- же речевые действия, т.е. когда имеются расхождения в оценке намерений говорящего. Как представляется, искусственность такого различения связана в первую очередь с тем, что при нем игнорируется субъективность оценки недопонимания. Поэтому вопрос об уточнении соответствующей терминологии остается открытым.Итак, ошибочным действием можно назвать не только неудачное продуцирование речи, но и неудачное ее понимание: понимание и, шире, интерпретация речи – вид целенаправленной деятельности человека. Ошибка понимания может быть объяснена как следствие непонятности автора, непонятливости интерпретатора и непонятости выражений; все три причины следует признать в равной степени реальными и подлежащими лингвистическому исследованию. Динамический подход к понятию ошибки предполагает рассмотрение не только результатов деятельности (к таким результатам относится неправильное выражение), но и сами действия обеих сторон общения.
Да, мы согласны со старинной истиной: человеку свойственно ошибаться. В данной главе мы попытались показать, что верно это же высказывание, взятое с несколько необычным логическим ударением: ошибка – свойство именно человеческое. Машина, сконструированная человеком, не ошибается: если она совершает какие-либо операции, не удовлетворяющие человека, – значит, ошибся тот, кто ее так сконструировал, не предусмотрев всех реальных обстоятельств будущей работы этого механизма. Машины делают только то, к чему их принуждает человек, которому свойственно ошибаться! В отличие от человека, машинам не свойственно раскаяние в этих ошибках, колебания в выборе того или иного решения. Все это ложится на плечи конструктора машины. И чем сложнее ЭВМ, чем ответственнее задачи, стоящие перед нею, – тем больший груз ответственности ложится на плечи человека. Поэтому можно сказать, что проблема усовершенствования интерпретаторов ЭВМ заключается в том, чтобы научить машину соизмерять свои затруднения с мыслимыми последствиями для человека.
-38-Теории – обычно опережение нетерпеливого разума, который хотел бы поскорее расправиться с явлениями, и на их место ставит образы, понятия, а зачастую просто слова.
(И.В.Гёте. Максимы и размышления.)
Предметом предлагаемого критического обзора является состояние теоретического языкознания (как правило, в США) за последние 15 лет {Note 1}. В качестве методической базы мы используем достижения науки о развитии лингвистики и советской теории науки.
{Note 1. Более подробная библиография приводятся в следующих работах автора: [Демьянков 1986а], [Демьянков 1988а].}
Рассмотрение современных лингвистических теорий не является самоцелью: с его помощью выделимы актуальные процессы, обращенные не на прошлое, а на настоящее и будущее, что позволяет четче осознать перспективы дальнейшего углубления лингвистической теории. Актуальность такой постановки проблемы вытекает из объективного исторического хода развития науки, а также из объективных общественных процессов в целом. Разумеется, такая постановка вопроса не тождественна истории языкознания. В данной главе мы сначала сформулируем исходные принципы рассмотрения в интересующем нас аспекте – отношение к смене гамм идей и методов в языкознании, – а затем попытаемся очертить контуры сегодняшней "интерпретирующей лингвистики" как совокупности специальных теорий. Указанные принципы были предложены в работах советских ученых, мы их здесь суммируем.
1. В каждый обозримый период времени выделимы господствующие взгляды на язык – "парадигмы", – одна или несколько,
-39- противоборствующие или, наоборот, поддерживающие друг друга. Понятие "парадигма", вслед за Ю.С.Степановым [Ю.С.Степанов 1985], можно связать со стилем мышления в науке и искусстве: парадигма определяет этап общей научной и художественной деятельности людей в конкретную эпоху, в конкретном обществе, в конкретном ареале.2. Закономерности смены парадигм можно связать с компенсаторным механизмом, преодолевающим одностороннее отношение к концепции. В частности, забегая вперед, можем сказать, что развитие американской лингвистики за последние 10 лет характеризовалось отходом от концепции языка как набора "правил грамматики": на смену "системе правил" постепенно пришел взгляд на язык как на систему принципов (т.е. не предписаний, а констатации) [Burzio 1983, с. 193].
3. На любом этапа, особенно в современном языкознании, можно найти "активно работающих представителей самых различных методических школ и направлений, возникновение которых относится к самым различным хронологическим периодам последнего столетия" [Звегинцев 1973, с.92]. Иначе говоря, конкретная реориентация в науке – выдвижение новой парадигмы – не происходит одномоментно как замена одного господствующего взгляда другим [B.Malmberg 1983, с.6]. Поэтому-то и трудно говорить о каждой новой концепции языка как совершенно оригинальной, не имеющей прецедентов, а о развитии науки о языке – как о постепенном прогрессе, вне конкретной точки зрения, с которой рассматривается конкретный этап ее развития.
4. Соотнесенность теории и эмпирических данных о языках неоднозначна: не обязательно наиболее разработанная теория основана и на наиболее широком материале языков. В частности, генеративная теория прилагалась к описанию различных языков: в рамках ее описано большое количество самых разных языков. Однако обратная связь – влияние эмпирического материала на разработку теории – в 1970-е гг. была гораздо меньшей (хотя к настоящему времени положение начинает меняться). Тем не менее, это не означает, что эмпирические данные на любом этапе развития науки о языке ни в коей мере не оказывают влияния на развитие теории, и что смена теорий объяснима и предсказуема чисто логическим путем.
Эти принципы, на наш взгляд, справедливы по отношению к
-40- ситуации, сложившейся к середине 1980-х гг. в американском теоретическом языкознании. А именно, здесь сосуществует примерно сто различных более или менее общих теорий языка; во всяком случае, число концепций, обладающих самоназванием, больше ста и постоянно растет. Между некоторыми из них заключены неявные союзы: не соглашаясь по одним вопросам, члены этих союзов, тем не менее, не отрицают право на существование других теорий (входящих в союз). Генеративизм, занимавший в 1970-е гг. ключевые позиции, в 1980-е гг. перешел на позиции частной теории, в общих чертах известной многим лингвистам, но с положениями которой часто не соглашаются. Возрождается интерес к структуралистским теориям предгенеративной эпохи, а типологическое исследование стараются совместить с построением формальной модели так, чтобы имело место двухстороннее, а не одностороннее, взаимодействие. Теории, разрабатываемые в последнее время в противовес генеративизму, как правило, ориентируются на моделирование продуцирования и интерпретации речи во всех ее переплетениях с остальными видами человеческой деятельности, а не на описание изолированных отрезков этой речи. Все это определяет общетеоретические тенденции американской лингвистики последних лет.Дополнительно мы хотели бы подчеркнуть и "сверхтенденцию" к интерпретирующей теории языка. Зародилась она в 1950-1960-х гг., но наиболее проявленные формы ее относятся к описываемому периоду. Складывалась эта тенденция как противоборство "антиинтерпретирующего" и "сверхинтерпретирующего" подходов.
"Антиинтерпретирующий" подход состоит в уточнении грамматики и привязанного к ней словаря таким образом, чтобы запретить прямое "порождение" семантически отклоняющихся предложений (предложений с "бытовыми травмами", типа "Зеленые идеи яростно спят", отклоняющихся от обыденных представлений о том, какими могут быть объекты действительности). Для этого использовалось детальное каталогизирование, – а точнее, его проект, – сведений о "нормально-семантической" сочетаемости лексических единиц (английского языка). Этот путь натолкнулся на следующие трудности: а) размытость границ материала для такого лексикографического описания (сочетаемость единиц может выходить за рамки элементарных словосочетаний); б) неясность
-41- разграничительной линии между лексикографией и энциклопедией; в) неясность необходимой степени детальности.Например, следует ли в семантическом представлении предложений типа 'Родственники посетили нас вчера' указывать количество, возраст, привычки этих родственников, – и соответственно, считать, что названное предложение имеет неограниченное число смыслов? Антиинтерпретирующий подход предполагает, что все способы задания семантики предложения в рамках конкретного контекста предшествуют реализации предложения, т.е. исходная семантическая репрезентация каждого предложения гораздо более конкретна, чем поверхностная структура. Грамматика же тогда фактически ничем не отличима от исчисления всех возможных жизненных ситуаций.
"Сверхинтерпретирующий" подход – другая крайность, в которой грамматика представляется как описание всех возможных высказываний, воспринимаемых носителями данного языка, но не обязательно понятных ему или оцениваемых им однозначно. Однако, среди прочего, имеется такой интерпретирующий механизм, который приписывает выражениям различные виды интерпретации. Значение высказывания тогда – не результат абстрактного порождения "семантической репрезентации", уместной или неуместной в конкретном контексте, а результат интерпретации конкретного выражения в конкретном контексте. Иначе говоря, значение – не то, что порождается само по себе, а только характеристика знака в его сиюминутности: значения не образуют "особого царства" и не могут быть даже отвлеченно помыслены отдельно от реального выражения – "экземпляра" знака. Множество видов интерпретации неограниченно и связано с задачами, решение которых доступно человеческому интеллекту. Таким образом, сверхинтерпретирующий подход сверхинтеллектуализирует понимание, но при этом "разгружает" грамматику. Это попытка удалить из описания языка все то, что скорее связано с "бытовыми знаниями", а не с грамматическими конструкциями и лексическими единицами. В частности, удаляются из грамматики выводное знание, аксиомы реального мира, логические аксиомы и алгоритмы решения задач.
Взятые в своих крайностях, эти два подхода грозят либо свести к грамматике абсолютно все (рецилив "универсальной
-42- грамматики"), либо лишить грамматику полностью своего объекта. Ведь и сам язык, и его элементы могут стать предметом интеллекта, а поэтому, – если быть последовательным "сверхинтерпретационистом", – должны быть удалены из грамматики.Преодолеть эти крайности можно, приняв дополнительно к интерпретационной гипотезе следующее положение: как и все остальные виды знания, знание языка ни у конкретного его носителя, ни даже у коллектива никогда не бывает полным; поэтому грамматика не должна рассматриваться как конечное хранилище всех языковых знаний. Используемая в качестве инструмента при продуцировании и интерпретации речи, грамматика может (на время или навсегда) вбирать в себя вспомогательные знания. Те виды знания, которые так и оседают в грамматике, становятся "индивидуальными языковыми знаниями"; те же, от которых можно отвлечься при интерпретации предложений с "бытовыми травмами" являются как бы "приходящими" (и уходящими из поля зрения интерпретатора – когда отпадает необходимость в них), а не языковыми. На вопрос о том, как соотнесены виды знания в рамках грамматики, различные концепции отвечают по-разному.
Перед тем как перейти к рассмотрению различных концепций, подчеркнем, что американская лингвистика 1970-1980-х гг. полностью подчинена национальной американской традиции отношения к науке, сформировавшейся в 1950-х гг., и обладает стереотипами не только институционального поведения, но и теоретического мышления. В ней формулировки должны поддаваться немедленной проверке и формализации чуть ли не в виде алгоритмических процедур (все остальное часто отвергается как несущественное). Переход от неинтерпретирующей конструкции грамматики к интерпретационизму, внешне выглядевший (в конце 1960-х – начале 1970-х гг.) как ожесточенный спор {Note 1} подчинялся всем законам рекламы взглядов того или иного лингвиста-теоретика в рамках этой же традиции. Однако с распространением интерпретирующего подхода к середине 1970-х гг. пришло и более спокойное, терпимое отношение к чужим концепциям; в частности, все больший интерес у американских лингвистов стало вызывать
-43-состояние лингвистической теории за рубежом, особенно в Европе и не случайно: этот подход, как и понятие "интерпретация", лежит в основе европейской филологической традиции. Не случаен, в частности, и интерес к "герменевтическим" подходам. Более того, понятие "интерпретация", все больше проникающее в современные исследования языка и речи, позволяет как бы заново обрести общие точки соприкосновения двум филологическим дисциплинам – общему языкознанию и теоретическому литературоведению.
{Note 1. Об этом см. нашу статью: [Демьянков 1979а].}
Теперь попытаемся вкратце охарактеризовать только наиболее крупные теории в американской лингвистике 1970-1980-х гг. Условно их можно разбить на четыре группы: формальные теории генеративного типа, формальные теории негенеративного типа, неформальные теории общения и неформальные теории языковой репрезентации.
{Note 1. Более подробно описываются эти концепции и соответствующий понятийный и формальный аппарат в нашей работе: [Демьянков 1979].}
3.1.1. Стандартная генеративная модель. В это время она претерпела значительные изменения. Модель "Аспектов" Н.Хомского господствовала примерно до начала 1970-х гг.; она ближе к антиинтерпретационизму, несмотря на наличие "правил семантики интерпретации". Дальнейшая линии развития ее состояла во все большем приближении "глубинного" представления предложения к "поверхностной структуре". Так, сначала [N.Chomsky 1970] был отменен взгляд на отглагольные имена действия (типа: "приход", "получение") как на результат трансформаций: они были признаны исходными единицами словаря. Такое повышение роли лексикона стали называть лексикализмом, в противоположность архаическому – "трансформационалистскому" взгляду (при котором роль трансформаций гораздо больше). Одновременно был подчеркнут параллелизм "главных" частей речи (имя существительное, прилагательное, глагол, наречие), и это отражено в рамках "крышечной нотации" (X'-theory).
Затем, в "теории следов" [Chomsky, Lasnik 1977],
-44- выдвинуто предположение, что при трансформационном передвижении составляющей из одной позиции в предложении в другую на прежнем месте остается "след", сказывающийся на дальнейшей работе трансформаций, правил семантической интерпретации и фильтров (последние запрещают или разрешают в качестве допустимых те или иные конфигурации предложений). Более того, "следы" обладают свойствами анафорических моментов. Поскольку же в дальнейшем развитии (в модели "связывания" [N.Chomsky 1980]) анафору рассматривают не как результат трансформации замены (скажем, когда полная именная составляющая заменяется на местоимение), а как явление уже исходной структуры (правила семантической интерпретации устанавливают, может ли данный элемент быть рассмотрен как анафорический), – появились все предпосылки для бестрансформационного объяснения не только анафоры, но и всевозможных перемещений, и разрывных составляющих.Следующим этапом развития генеративного аппарата является модель "управления и связывания" [Chomsky 1981], вобравшая в себя все названные идеи, а также идею соотнесенности различных видов интерпретации при порождении предложения. Самая после модель "Преград" (Barriers) [N.Chomsky 1986] в наибольшей степени отвечает духу "правил семантической интерпретации".
3.1.2. "Порождающая семантика". Ее основные представители Дж.Лакофф, Дж.МакКоли, П.Постал и др. Основной период ее развитии – начало – середина 1970-х гг. Уже к 1980 г. само название этого направления стало казаться компрометирующим, поскольку бывшие ее представители давно уже отказались, как правило, от этого наиболее воинствующего направления антиинтерпретапионизма. В "порождающей семантике" принимались следующие положения: 1) синтаксические и логические репрезентации имеют одну и ту же формальную природу, а именно, выглядят как деревья НС с пометками категорий; 2) поверхностная структура выводится из логической в результате трансформационной деривации; 3) между лексическими единицами и семантическими предикатами имеется взаимно-однозначное соответствие; фрагмент дерева НС, представленный определенной конфигурацией таких семантических предикатов, может по ходу синтаксической деривации заменяться на целую лексическую единицу (например, "каузировать
-45- прийти" заменяется на единицу "привести"); однако до того, как это произойдет, логическую структуру могут преобразовать чисто синтаксические операции типа "подъема предиката"; 4) среди трансформационных правил выделяются две разновидности: а) локальные правила, которые соотносят две структуры, непосредственно следующие одна за другой в цепи синтаксических преобразований, и б) "глобальные" правила, одобряющие или бракующие целые синтаксические деривации, в зависимости от того, как соотнесены несмежные этапы деривации.Как и "расширенная" стандартная модель, данное направление представляло собой скорее консолидацию теорий, чем однородное течение. В частности, сюда относились ее "филиалы": "перформативный анализ" (представление структуры предложения как сложней конфигурации, главным предикатом которой всегда является перформативный глагол или глагол говорения, мнения и т.п., а субъектом – элемент "Я"), "естественная логика", "теория гештальтов" и др.
3.1.3. "Реалистическая" грамматика Дж.Брезнан. В отличие от стандартной модели, предполагает непосредственный выход в практику психолингвистического исследования и в вычислительную лингвистику. По мнению Брезнан, синтаксический и семантический компоненты моделируют активное автоматическое восприятие (или переработку) речи, используя весьма ограниченную память. Имеется система логического вывода, осуществляющая прагматические процедуры продуцирования и восприятия речи в контексте; эта система использует долговременную память и общий набор знаний. При объяснении сложных конструкций в рамках этой модели следует исходить из того, что легче выяснить что-либо, просто найдя в памяти, чем произведя сложные вычисления; так, чересчур запутанные синтаксические структуры проще считать хранимыми, чем интерпретировать с помощью сложного набора рекурсивных процедур.
Конкретное воплощение этих положений в виде формальной грамматики выглядит так: 1) лексическая репрезентация предложений имеет вид предикатно-аргументной записи; 2) синтаксическая репрезентация связана с лексической посредством набора "грамматических функций" (субъект, прямой объект, косвенный
-46- объект и др.) [J.Bresnan 1980]. Иначе говоря, имеются, по меньшей мере, соотнесенные между собой синтаксические интерпретации у каждого предложения.Дальнейшее уточнение эта концепция получила в рамках "грамматики лексических функций" [J.Bresnan 1982]. В ней принимается, что одна и та же предикатно-аргументная структура может воплощаться в виде различных лексических репрезентаций на основе универсальных принципов соотнесения функций с аргументами. Причем именно правила лексической сочетаемости, а не трансформации или синтаксические правила более абстрактного вида (отвлеченные от конкретных лексем) могут модифицировать исходные соответствия между функциями и аргументами. В частности, активные и пассивные конструкции обладают различными лексическими репрезентациями: нет трансформаций типа пассивизации.
Отличие данной модели от последних вариантов "расширенной стандартной модели" велико, но не принципиально; не случайно, что имеются и компромиссные модели типа [G.M.Horn 1983]. Кроме – того, в обеих концепциях весьма скромно используется аппарат синтаксических трансформаций. Некоторые же подходы – типа "реалистичной грамматики" М.Брейма [M.Brame 1979a] и "функциональной грамматики" М.Кея [M.Kay 1979] – представляют собой такие фрагменты будущей теории, которые одинаково успешно можно включить в рамки и стандартной, и реалистичной модели.
3.1.4. Обобщенная грамматика НС" (Generalized Phrase Structure Grammar – "GPSG") – грамматика без трансформационного компонента – является совместным производством американских и британских лингвистов (Дж.Газдар, Дж.Пуллум, И.Саг и др.). Эта модель скорее распознающего, чем продуцирующего типа. По ходу распознавания выявляемая структура постепенно переводится на язык интенсиональной логики [Gazdar et al. 1985]. Причем учитывается "деривационная история" (последовательность уже проработавших правил распознавания). Для обозначения вспомогательных символов категорий используется аппарат "категориальных грамматик", что позволяет использовать практически неограниченное число грамматических категорий. Вот почему грамматика имеет вид не конечного исчисления (как стандартная модель), а конечного набора схем правил, получающих различное
-47- воплощение при различных же подстановках реальных категорий на место бесконечного набора имен категорий. Иначе говоря, здесь порождаются сами правила, а предложения переводятся на вспомогательный логический язык. Используется здесь и "крышечная нотация" стандартной модели.3.2.1. Грамматика Монтегю {Note 1} занимает особое место среди таких моделей. Р.Монтегю считал свою концепцию антитезой генеративизму, полагая, что занимается не лингвистическим, а формально-логическим исследованием [R.Montague 1974]. Исходная идея: естественные и искусственные языки (логического типа) можно описывать и интерпретировать с помощью приемов рекурсивного определения, используемого в математике (типа: если выражение A и выражение B принадлежат данному языку, то и выражение "A+B" также принадлежит этому языку). То, что можно было бы назвать анализом предложения, соответствует поэтому математическому доказательству принадлежности данного элемента к конструктивно определяемому множеству. Естественно, что, как и в математическом доказательстве, в рамках этой концепции не используется понятие "уровня": действительно, нельзя говорить о данном элементе как принадлежащем некоторому множеству на одном уровне и не принадлежащем ему на другом; это же положение перенесено и на сферу естественного языка.
{Note 1. Более подробное изложение этой деталей и терминологии этой теории содержатся в нашей книге: [Демьянков 1982б].}
В основе анализа предложения лежат следующие гипотезы: а) структура НС предложения соответствует в общих чертах и логической формуле его; б) синтаксические операции сводятся к установлению линейной последовательности элементов.
У этой концепции больше последователей-модификаторов, чем ортодоксов. Модификации же нацелены на следующие моменты: а) распространение синтаксического описания на "трудные" конструкции; б) включение неповествовательных предложений в сферу истинностной семантики; в) уточнение самой процедуры перевода
-48- синтаксической формулы в логическую. "Обобщенная категориальная грамматика" Э.Баха [E.Bach 1983], кроме того, использует еще и аппарат дифференциальных признаков.3.2.2. "Процедурная семантика" – название скорее группы концепций, чем единого направления (представители: Й.Уилкс, Р.Шенк, П.Саппс и др.). Зародившись в рамках вычислительной лингвистики, этот подход подчеркивает связь между значением языковых выражений и операциями конструирования такого значения. А именно [P.Suppes 1980], утверждается: 1) свойства сущностей и их категории представляют собой абстракции процедур; 2) значение (слова, словосочетания и высказывания) – это процедура (или набор процедур), сугубо индивидуальная для каждого человека; 3) успешное общение возможно в силу того, что процедуры, вызываемые одними и теми же языковыми единицами у разных коммуникантов, конгруэнтны, давая, соответственно, конгруэнтные результаты; 4) указанные процедуры аналогичны процедурам, выполняемым ЭВМ, однако последние гораздо менее совершенны (усовершенствование ЭВМ связано поэтому с исследованием таких процедур у человека при его использовании языка); в частности, человеческие процедуры способны модифицироваться в результате общения, обладая обратной связью с процессами восприятия и деятельностью человека, а кроме того, обладая непрерывностью (в противоположность дискретным машинным процедурам).
3.2.3. Где-то посередине между двумя названными концепциями интерпретации в виде логических формул (как в грамматике Монтегю) и в виде операций (как в процедурной семантике) расположена "ситуационная семантика" Дж.Баруайза и Дж.Перри [Barwise, Perry 1983]. В этой концепции значение предложения представляется как отношение между экземплярами высказываний (произнесенных в данный момент, в данном месте, данным индивидом, с данным полем зрения и набором знаний, – ср. понятие дектики у Ю.С.Степанова [Ю.С.Степанов 1985]) и описываемыми ситуациями (в которых, между прочим, присутствует своя дектика). Отсюда вытекают важные логические следствия для формального аппарата; ср., например, Р.Купер [R.Cooper 1983].
-49-Эти подходы направлены на описание и объяснение принципов общения, регулирующих продуцирование и понимание речи. Из них выводятся свойства речи (дискурса). Так реализуется тезис о несводимости речи и языковой деятельности к структуре языка.
3.3.1. Теория речевых актов {Note 1} занимает, пожалуй, центральное место в описываемый период. Основное положение этой теории, зародившейся в рамках лингвистической философии: минимальной единицей человеческой коммуникации является не предложение или высказывание, а "осуществление определенного вида актов, таких как констатация, вопрос, приказание, описание, объяснение, извинение, благодарность, поздравление и т.д." [Searle, Kiefer, Bierwisch 1980, с.VII].
{Note 1. Этой теории посвящен сборник переводов: Новое в зарубежной лингвистике: Вып.17. Теория речевых актов. М.: Прогресс, 1986. Отсылаем читателя за деталями к этой книге.}
Эта установка созвучна тем взглядам, согласно которым следует раздвинуть рамки лингвистического анализа, с тем, чтобы "разгрузить" семантическое описание предложения и текста, удалив из него некоторые компоненты общекоммуникативного порядка, перенеся их в фоновую часть грамматики. Иначе говоря, теория речевых актов – в своем современном виде – представляет тот фон, на котором можно безбоязненно говорить о семантике и прагматике отдельно взятых выражений: все недостающие детали (окажем, сведения о непрямых значениях выражений в контексте общения) должна восполнить эта теория. Впрочем, число очень интересных идей о том, как эта теория должна выглядеть, значительно больше числа конструктивных ее моделей. Недавно появились и предпосылки для перевода этой теории в разряд формальных моделей: так, Дж.Серль и Д.Вандервекен [Searle, Vanderveken 1985] предложили аксиоматизацию теории, вместе с процедурами, определяющими типы речевых актов (интересно, что здесь, применительно к речевым актам, используется тот же математический прием рекурсивного определения, который в грамматике Монтегю позволяет определять принадлежность предложения данному языку).
-50-3.3.2. «Анализ разговора» (синонимы: конверсационный анализ, этнометодологический анализ разговора, феноменолого-социальный анализ речи, этнография речи). Это одно из наиболее представительных направлений, относимых к социолингвистике. В 1970-1980-е гг. это исследование в США связывают с такими именами, как Х.Сакс (погиб в 1976 г.), Э.Гоффман, Э.Щеглофф и др. В центре внимания находится транскрипция живых диалогов во всех тонкостях, проявляющих мотивацию речевых действий, смены реплик, выбор и распределение ролей в разговоре и т.д. Иначе говоря, цель этого точения – теоретическое обоснование путей интерпретации живой речи.
Проблема наглядного представления структуры для реальных предложений и текстов, казалось бы, в 1960-е гг. снятая с повестки дня, в 1970-1980-е гг. вновь выдвинулась на первый план: действительно, с развитием интерпретирующего подхода, необходимо стало развить тот вспомогательный язык, с помощью которого удобно было бы записывать результат синтаксической, семантической, прагматической (в частности, ситуационной) интерпретаций. Аппарат простых деревьев НС, а также логическая запись (даже формальный аппарат интенсиональной логики в грамматике Монтегю) перестали удовлетворять исследователей в силу ограниченности их выразительных возможностей. В этой связи выделяются многочисленные варианты нотаций, из которых здесь мы отметим только несколько.
3.4.1. Тагмемная теория К.Л.Пайка. В 1970-1980-е гг. пережила свой ренессанс. В отличие от ранней концепции 1950-1960-х гг., теперь еще больший упор сделан на описание закономерностей языковой деятельности в рамках поведения человека вообще (ср. интерес к языковой деятельности самой по себе генеративистов, а также к речевой деятельности – в отвлечении от чисто языковых структур – у этнометодологов).
Рассмотрение элементов такого поведения возможно – до некоторой степени условно – в четырех различных, но взаимозависимых перспективах: 1) синтагматика (те "прорези" в целостном поведении, в которые вставлен интересующий исследователя фрагмент речи);
-51-2) парадигматика (классы таких фрагментов); 3) прагматика (ролевые отношения, позволяющие установить релевантность этих фрагментов); 4) концептуально-фоновые отношения (связанность фрагментов в единое целое – "когезия") [K.L.Pike 1982]. Совокупность названных перспектив определяется как особая сущность – "тагмема". Многие понятия современных семантических и прагматических теорий, между прочим, были прямо или видоизмененно перенесены из тагмемной теории (например: "мир дискурса" как набор референтов, конструируемый данной речью; "прорези", связанность – "когезия" – и др.).
Главным же, на наш взгляд, вкладом этой теории является то, что под ее влиянием были предложены и развиваются несколько других влиятельных концепций: так называемая "падежная грамматика", с углублением в "семантику фреймов", и "грамматика ролей и референции".
3.4.2. Падежная грамматика. Это семейство концепций, продолжающих исходную идею Ч.Филлмора [Филлмор 1968]; [Филлмор 1977], "ролевой" семантики предложения (составленной из "ролей", исполняемых референтами имен в прототипической ситуации). Поскольку же не все в предложении можно однозначно соотнести с ролями, в более поздних вариантах падежной грамматики принимается, что семантическая структура предложения состоит из "ядерного" компонента (описывающего референтную ситуацию в ролевых терминах) и неядерного (задающего "угол зрения", или перспективу, в которой рассматривается ситуация). Ср.: "Джон порезал ногу о камень" (где в основном "ролевые" элементы, – за исключением показателя прошедшего времени) и "Джон задумался о смысле существования в невыразимо сложных условиях" (где в основном неядерные моменты).
Ролевая концепция оказалась созвучной когнитивным моделям социальной психологии; это способствовало особенной популярности падежных грамматик в середине – конце 1970-х гг. среди разработчиков "искусственного интеллекта". "Рамочная семантика", или "семантика фреймов" стала в это время одним из ведущих способов формализации. В настоящее время, впрочем, пик интереса к такому способу репрезентации позади.
-52-3.4.3. Реляционная грамматика. Это направление в настоящее время развивается не столь бурно, как в середине 1970-х гг. (см. об этом [А.Е.Кибрик 1982]), и может быть охарактеризовано так: 1) в нем, в отличие от остальных теорий, грамматические отношения (типа: "субъект", "объект" и др.), используемые для описания конкретного языка, и при сопоставлении языков берутся как элементарные, не определяемые через другие (скажем, через конфигурацию дерева НС, как в стандартной генеративной модели, или через соотношения между лексическими функциями, с одной стороны, и синтаксической структурой – с другой, в рамках "реалистических" грамматик); 2) выделяются различные синтаксические (а не семантические) уровни рассмотрения предложения. Впрочем, многое в этой концепции (за исключением отказа от "лексической декомпозиции") напоминает положения "порождающей семантики". В частности, принципы соотнесения различных синтаксических уровней, или "страт" (когда на одном уровне один и тот же элемент предложения может обладать статусом субъекта, а на другом – объекта) сильно напоминает "глобальные правила".
3.4.4. Грамматика ролей и референции (У.Фоли, Р. Ван Валин и др.) зародилась в середине 1970-х гг., а в настоящее время постепенно обрастает все большим весом [Foley, Van_Valin 1984]. Структура предложения складывается здесь из двух частей: а) семантическая ролевая компонента; б) прагматическая компонента. В рамках последней имеется иерархия "превосходства", соответствующая выделенности в речи того или иного элемента предложения (на ее основе можно интерпретировать эти элементы как обладающие определенностью, конкретностью, данностью, фокусировкой и т.п.). Эта прагматическая структура может быть разной для предложений с одним и тем же набором семантических ролей и соответствует коммуникативным свойствам предложений.
Взаимодействие прагматических и семантико-ролевых свойств воплощается в виде двухуровневой реализации предложения: а) семантической "логической структуры", записываемой в терминах предикатов и аргументов, и б) реальной морфосинтаксической формы высказывания.
Понятие "синтаксической деривации", как и деривации вообще (и это типично для всех "союзников" тагмемной теории), отсутствует. Между "логической структурой" и
-53- реальной формой предложения установлены соответствия, помечающие связи актантов при предикате, с одной стороны, с элементами структуры НС, с другой. Эти связи интерпретируются именно как семантические роли. Так, для предложения Сено было погружено на грузовик Биллом элемент сено соответствует такой "роли": "то, что подвергнуто воздействию", – а в то же время, сено является темой при абстрактном предикате быть на.Эта модель очень типична для современных концепций репрезентации. Здесь используется практически весь понятийный инструментарий: абстрактно-логические формулы (абстрактные предикаты, декомпонированные в традициях порождающей семантики), ролевые пометки (как в падежной грамматике), интерпретационный статус логической формулы, стремление учитывать прагматику общения, а также нацеленность на универсальность в описании предложений языка.
Приведенный выше краткий очерк имел целью продемонстрировать те из наиболее популярных в настоящее время интерпретаций систем и понятий, которые можно назвать специальными теориями. Интерпретирующий подход развивается, обладая двойной направленностью: а) на разработку модели грамматического описания, отражающей обратную связь между продуцированием речи и ее пониманием, а также достаточно гибко учитывающей возможности неоднозначного интерпретирования, зачастую глубоко своими корнями связанное с личностными, индивидуальными знаниями, и б) на применение идеи интерпретации к исследованию самого процесса становления и изменения лингвистической теории, т.е. "обращение" лингвистической теории интерпретирующего толка на саму себя.
Здесь большее внимание, впрочем, мы уделили первому направлению; мы пытались показать, как идея интерпретации постепенно из второстепенной превратилась в одну из господствующих линий лингвистического теоретизирования: в частности, прекратили свое существование именно "антиинтерпретирующие" концепции; свое обновление же получили те теории, которые (как тагмемика) позволяют продуктивно оперировать указанным понятием.
Обращение же интерпретирующего подхода на саму лингвистическую теорию состоит в выявлении
-54- мотивов в "институциональном" и в теоретическом мышлении с целью гармонизировать их между собой и получить – в результате синтеза – такую концепцию, которая в наибольшей степени соответствовала бы этим мотивам. Исследование аргументации, используемой в лингвистическом теоретизировании, – один из инструментов такого "обращения" и не исчерпывает его целиком. На повестку дня встает разработка интерпретирующего подхода к лингвистической теории. Этой задаче следует посвятить отдельное исследование, которое, за ограниченностью места в данной книге, мы переносим на будущее.В следующей главе будет описана система интерпретации, на наш взгляд, использующая то наиболее продуктивное, что имеется в описанных выше специальных теориях.
Как, надеемся, станет видно из этого изложения, предложенные и разрабатываемое специальные теории интерпретации действительно, представляют собой "опережение нетерпеливого разума", о котором говорит И.В.Гёте (эпиграф к данной главе). Далеко не все, для объяснения чего задумана теория, в нее можно полностью уложить. Особенно же это относится к специальным теориям, представляющим собой гипотетические интерпретации явлений. Углубить же интерпретации – значит не только уточнить детали формального аппарата (будь то нотационные приемы грамматики Монтегю, генеративной грамматики, теории речевых актов или тагмемики), но и установить противоречия или логичность исходных положений на фоне новых данных о языке и речи.
Да, многое из сегодняшних специальных лингвистических теорий – "образы, понятия, а зачастую просто олова" – согласимся мы с Гёте. И многое в этих теориях, увы, так и остается всего лишь мысленным экспериментом. Однако вычислительная лингвистика, с ее практической направленностью, способна сыграть роль не только потребителя идей теоретического языкознания, но и прилирчивого клиента, а зачастую и поставщика новых идей. Нам хотелось бы, чтобы вот в этом ключе и было воспринято содержание следующей, последней главы.
-55-Меня сразу же поразила огромная рама, занимавшая большую часть комнаты. Заметив это, профессор объяснил мне, что он работает над изготовлением особых механических приборов, предназначенных для открытия отвлеченных истин. ... Тут он подвел меня к раме, по бокам которой рядами стояли все его ученики. ... Поверхность ее состояла из множества деревянных дощечек, каждая величиной с игральную кость – одни побольше, другие поменьше. Все они были сцеплены между собой тонкими проволоками. Дощечки были оклеены кусочками бумаги, и на этих бумажках были написаны все слова языка Бальнибари в различных наклонениях, временах и падежах, но без всякого порядка. ... Машина была устроена таким образом, что после каждого оборота дощечки поворачивались и передвигались, и слова размещались по-новому.
(Джонатан Свифт. Путешествия в некоторые отдаленные страны света Лемюэля Гулливера, сначала хирурга, а потом капитана нескольких кораблей.)
В отличие от описанной в этом отрывке механической системы перебора всевозможных словосочетаний, диалог человека с машиной на естественном языке (ЕЯ) требует построения систем, не просто перерабатывающих поверхностные структуры выражений, но и использующих семантические и прагматические свойства выражений. Эта задача находится в центре внимания дисциплины, называемой "искусственный интеллект" (ИИ) {Note 1}. Решение задач, сформулированных на ЕЯ, состоит в установлении уместного набора и последовательности отдельных действий для перехода от исходной ситуации, заданной на ЕЯ, к заданной же целевой ситуации.
{Note 1. Обзор некоторых проблем искусственного интеллекта содержится в нашей работе [Демьянков 1981а]. Поэтому здесь мы опускаем библиографические отсылки.}
Очевидно, что ИИ может претендовать не более чем на роль "удлинителя" человеческих возможностей, – как и другие
-56- инструменты, изобретенные человеком и призванные увеличить возможности человека, а не заменить его. Иначе говоря, ИИ – не более чем "приставка" к естественному интеллекту: уберите из этого единства человека – и разговор о ИИ станет бессмысленным. Поэтому при построении (системы) ИИ необходимо установить вход и цели системы, а также определить контекст для нее – ту ситуацию, в которой человеку удобно пользоваться системой. Эти требования совершенно аналогичны тем, которые стоят перед разработчиками всех остальных видов "удлинителей".Можно выделить две компоненты ИИ: 1) абстрактный генератор идей – "умный автомат", решающий ту или иную задачу, исходя из описания исходной ситуации и желаемого результата (наиболее типичный случай такой задачи – упражнения в курсах школьной арифметики); язык формулировки задачи в этом случае не обязательно должен быть естественным; 2) генератор идей, "понимающий ЕЯ", задачи для него формулируются на нормальном языке, ограниченном определенной объектной областью, т.е. языке, обычно используемом специалистами соответствующей области знаний в нормальных обстоятельствах общения между собой по поводу работы.
При построении генератора идей на ЕЯ выработалось две тактики. Первая состоит в том, чтобы сначала перевести естественно-языковую формулировку на внутренний язык, после чего задача автоматически решается – находится алгоритм, предписания которого выполняются применительно к конкретным условиям.
Другая же тактика состоит в последовательной переработке естественно-языковой формулировки задачи непосредственно в алгоритм ее решения, т.е. без промежуточного перевода. Это равносильно использованию ЕЯ в качестве внутреннего языка. Очень близок этот подход к замыслу грамматики Монтегю: естественно-языковые выражения – именные составляющие, предложения и т.п. – играют при этом роль сложных логических формул.
Наиболее оправданным нам представляется промежуточный подход, при котором формальный вспомогательный язык вводится только в той степени и только на том этапе, на котором можно установить лингвистически значимые обобщения относительно структуры алгоритмов решения задачи-объекта.
В интерпретирующую концепцию переработки информации на
-57- ЕЯ хорошо вписывается понятие фрейма, или рамки: т.е. структуры данных для представления стереотипной ситуации. Эта рамка ассоциирована с такими видами информации, как экспектации (логические ожидания) и процедуры, к которым следует перейти, если эти экспектации не оправдались.Концепции фрейма, при всем их разнообразии, исходят из следующих положений: 1) разум сказывается в разграничении огромных массивов крайне специализированных знаний, с одной стороны, и весьма небольшого количества механизмов логического вывода, с другой; 2) моделирование разумного поведения достижимо с помощью характеристики типичных объектов и событий, отталкиваясь от которой можно получить описание нетипичных, отклоняющихся от стандарта объектов и событий.
Сложилось два подхода к автоматической обработке сообщена ЕЯ в рамках информационно-поисковых систем. При одном эти сообщения воспринимаются как строки символов, метод обработки которых можно назвать словарным: сообщение разлагают на элементы, каждый из которых отождествляется с тем или иным элементом словаря, а набор ответов на все запросы в их совокупности конечен и фиксирован (граничный случай – когда имеем только две возможности ответа: "Да" и "Нет"). Иногда целое сообщение отождествляется с одной единицей словаря. Другое же направление состоит не в выборе решения из заранее заготовленного "меню", а в автоматическом конструировании его в результате последовательного преобразования запроса в соответствии с формальными процедурами. Именно при втором подходе можно с полным правом говорить о том, что система решает задачу. Вот этот подход мы и попытаемся продемонстрировать в данной главе на примере одного частного класса задач.
Нашим исходным положением является следующее: сложное имя понятия отражает логическую структуру этого понятия, в частности, заключает в себе алгоритм решения задачи. Используя это обстоятельство, мы и пытаемся построить систему интерпретации, преобразующую сложные имена понятий в формулы, представляющие зависимость сложных понятий от простых (базисных).
-58-А именно, с помощью правил интерпретации по выражению на ЕЯ находится, какие более простые понятия составляют запрошенное сложное и как они логически скомпонованы в сложном. Такие правила соотносимы с мыслительными операциями, реально выполняемыми человеком при решении задач.
Система, о которой идет речь, письменные запросы, подаваемые на входе, интерпретирует как алгоритмы ответа на них, а затем выполняет предписания получаемых алгоритмов. Алгоритмы представляют собой арифметические формулы, описывающие способ вычисления числового значения количественного экономического показателя через числовые значения простых показателей, хранимые в базе данных. В частности, если запрошенный показатель является вычислимым через более простые, то арифметическая формула содержит знаки арифметических действий, правильно расставленные арифметические скобки и поисковые образы простых (хранимых) показателей. Если же запрос представляет собой наименование простого показателя, то формула имеет вид поискового образа числового значения этого показателя, т.е. указывает, по какому адресу следует искать готовое число. Выполнение действий, предписываемых получаемым алгоритмом, заключается в том, чтобы заменить поисковые образы хранимых показателей на соответствующие им (содержащиеся в базе данных) числовые значения и в том, чтобы вычислить получаемое таким образом арифметическое выражение.
Внутренняя механика системы такова. Запрос преобразуется анализирующим компонентом в "глубинную структуру", которая потом постепенно интерпретируется как все более сложное арифметическое выражение, содержащее в качестве операндов глубинные структуры все более простыв показателей. Этот перевод осуществляется интерпретирующим компонентом. Выход из этого компонента подается на вход в следующий компонент – "шифровальщик", – определяющий, сообразуясь с входящей в состав системы порождающей грамматикой (а не с набором хранимых глубинных структур), порядковый номер для каждой глубинной структуры, входящей в состав полученного арифметического выражения.
Порядковые номера простых показателей – "номера понятий" в огромном множестве логически осмысленных понятий – как раз и представляют собой поисковые образы соответствующих числовых значений показателей, по ним осуществляется
-59- поиск соответствующих числовых значений в базе данных системы. После того как эти поисковые образы заменятся на числовые значения в арифметической формуле, вычисляющий компонент выдаст результат – числовое значение запрошенного показателя. Имя простого показателя, запрошенного на входе, многие из указанных компонентов оставят без изменений.Отметим следующие особенности системы.
1. Порядок слов – вместо морфологии. Это свойство – специфика для многосложных наименований экономических показателей. При работе анализирующего компонента отождествление единиц запроса с единицами "правил анализа" (перевода в глубинную структуру) происходит без учета окончаний, а только на основе порядка слов и совпадения начала сегментов (словоформ) без флексий с соответствующими словарными единицами, входящими в правила. Это позволяет обойтись без предварительного морфологического анализа в рамках указанной системы и является одной из любопытных особенностей экономического языка. Однако сказанное не исключает необходимости морфологического анализа в подобных системах вообще {Note 1}.
{Note 1. О том, как такая морфологическая интерпретация выглядит, мы уже писали в работе [Демьянков 1982].}
2. Символ сложности. Если глубинная структура соответствует имени сложного показателя, в ней содержится хотя бы один специальный "символ сложности". На каждом этапе интерпретации глубинной структуры происходят, как правило, упрощение хотя бы одного операнда, входящего в промежуточную арифметическую формулу (т.е. та или иная глубинная структура заменяется на некоторую арифметическую формулу, "вкладываемую" в контекст этой заменяемой структуры), а при этом уничтожается хотя бы один символ сложности во всем выражении. Когда символов сложности в интерпретируемом выражении больше нет, – получено выражение, не нуждающееся в дальнейшей интерпретации и содержащее только глубинные структуры хранимых показателей.
3. Вычисляемый номер понятия. Однозначность установлении порядкового номера показателя по глубинной структуре – следствие того, что все показатели полностью, без пробелов, заполняют некоторое логическое пространство, описываемое здесь же порождающей
-60- грамматикой.4. Термовый вид глубинных структур. Глубинные структуры представляют собой выражения определенного "термового" вида – скобочные записи с пометками, соответствующими классам языковых единиц, входящих в состав наименования понятия; эти скобочные записи равносильны представлению структуры по непосредственно составляющим. Это обстоятельство исключает возможность неустранимых ошибок в распознавании и интерпретации наименования, а также делает более эффективной процедуру интерпретации. Именно вследствие сказанного и разумно иметь промежуточный уровень – глубинную структуру – в рамках описываемой системы.
5. Ресинтез формулировки как гарантия достоверности интерпретации. Логическая конструкция системы позволяет предусмотреть для нее, в перспективе дальнейшего исследования, режим акустического распознавания наименований. Надежность. работы системы в таком случае гарантируется дополнительно надстраиваемым компонентом синтеза орфографического представления запрошенного показателя.
В данном разделе мы продемонстрируем специальную теорию со своим формальным аппаратом, ориентированным на анализ словосочетаний, или сочетаний слов, представляющих собой наименования "вычисляемых экономических показателей", или количественных показателей. Пример такого словосочетания: "отношение среднемесячной заработной платы рабочих, выплаченной в начале отчетного года, на фабрике, к соответствующему периоду с начала прошлого года". Интересующая нас интерпретация должна иметь вид арифметического выражения, в которое в качестве операндов входят поисковые образы элементарных экономических показателей, – т.е. таких, числовые значения которых хранятся в данной информационной системе.
В существующих системах ручное индексирование содержательно состоит именно в установлении арифметической формулы вычисления искомого значения показателя. Задача же самой информационной системы, предполагающей это ручное индексирование, сводится только к тому, чтобы заменить поисковые образы
-61- элементарных показателей на их числовые значения и вычислить числовое значение сложного показателя по полученному в результате такой замены арифметическому выражению. В нашей же системе вся задача интерпретации, включая сюда и установление формулы, выполняется автоматически. Наша система анализа позволила бы полностью отказаться от ручного индексирования запросов.В основе этой системы лежит гипотеза о том, что, интерпретируя естественно-языковые выражения, человек руководствуется определенными формализуемыми "правилами интерпретации". С помощью этих правил, например, наименование экономического показателя шаг за шагом переводится в арифметическое выражение (на каждом шаге все более сложное), соответствующее способу вычисления числового значения этого показателя через числовые значения элементарных показателей.
Правила интерпретации аналогичны "постулатам значения" и правилам семантической интерпретации, рассматриваемым в интерпретационистском ответвлении теории трансформационных порождающих грамматик (см. предыдущие главы). Близок этот подход к концепции грамматики Монтегю, где выражения на естественном языке переводятся в логическую форму, по которой устанавливаются их интенсиональные свойства, – например, истинность или ложность высказывания, соответствующего анализируемому выражению, в том или ином "возможном мире".
В данной системе устанавливается числовое значение, соответствующее данному языковому выражению в рамках логического пространства количественных экономических показателей, отражаемых как система выражения, со своими синтагматическими и парадигматическими отношениями. Иначе говоря, интерпретация наименований как проблема языка опирается на внеязыковые знания, на понятийный анализ в рамках нелингвистической дисциплины. Лингвистические средства, таким образом, позволяют под новым углом посмотреть на нелингвистическую дисциплину, в данном случае, – на экономику.
Поскольку описываемая система была задумана как составная часть работающей информационной системы, она отвечает и следующим практическим требованиям.
1. Интерпретации должны подвергаться выражения на том или ином естественном языке, носителями которого являются экономисты.
-62-Это означало обследование всего многообразия экономических "илиолектов", представленных в работе этих специалистов.
2. Система соответствий между поисковыми образами и числовыми значениями элементарных показателей должна обновляться и пополняться при минимальном вмешательстве человека. Система должна с определенной периодичностью предъявлять человеку наименования тех показателей, которые должны быть введены в информационную систему для того, чтобы система могла отвечать на запросы по поводу отсутствующих данных. Так, например, данные о фактическом положении дел на текущий месяц не могут быть введены в базу данных системы раньше, чем в течение или в конце этого месяца.
3. Набор правил интерпретации должен быть организован так, чтобы допускать полное или частичное изменение баз данных без изменений общего алгоритма.
4. Одно правило должно участвовать в интерпретации не одного единственного выражения, а целого класса.
5. Интерпретация должна протекать обязательно за конечное и желательно за минимальное количество шагов. Неправильно сформулированный запрос не должен приводить к бесконечному "зацикливанию" работы системы.
6. Кроме ответа на "единичные" запросы (когда одному предъявленному на входе выражению может быть поставлено в соответствие ровно одно числовое значение), система должна давать ответы на "множественные" запросы. Запрос нарывается множественным, если ответом на него может быть кальке список наименований "единичных" показателей, каждое с соответствующим числовым значением. Пример множественного вопроса: "данные по зарплате на фабрике за текущий месяц"; в ответ на него должны быть выданы плановые и фактические сведения по различным конкретным показателям, принятым на конкретном предприятии. Эти единичные показатели должны быть логически сгруппированы, среди них могут быть как простые (элементарные), так и сложные, вычисляемые с помощью данной же системы.
7. Ответ на запрос должен даваться в удобной для пользователя форме. Так, ответ на элементарный запрос (представляющий показатель с хранимым числовым значением) может представлять собой хранимое в системе число, ответ на сложный запрос (показатель, числовое значение которого вычисляется через числовые
-63- значения элементарных) может быть также дан в виде числа, а может иметь вид экономического документа, – например, вид таблицы, с указанием входов, на пересечении строк и столбцов в которой стоят соответствующие числовые значения; такая форма представляет собой обоснование правильности вычисления искомого показателя и должна автоматически генерироваться при ответе на данный запрос, а не храниться в готовом виде (т.е. она не должна быть заранее заготовленной человеком).Из требований практики вытекают, как минимум, следующие режимы работы системы:
1. Интерпретация наименования единичного экономического показателя в виде арифметического выражения и вычисление числового его значения.
2. Порождение всех необходимых для данного периода времени наименований новых элементарных показателей на естественном языке дм предъявления их человеку, который должен заполнить соответствующие числовые характеристики этих показателей; ввод в систему полученных соответствий.
3. Анализ множественного запроса и порождение всех наименований единичных показателей, составляющих его ответ, с вычислением (когда это необходимо) соответствующих чисел; логическая группировка единичных показателей.
4. Оформление ответа на запрос в виде таблицы (генерация матрицы).
В данной работе мы ограничимся описанием первых двух режимов. Логическая группировка единичных показателей и генерация матриц (на основе интерпретатора) происходят как побочный продукт интерпретации языкового выражения в терминах парадигматических отношений внутри данной системы анализа словосочетания.
В системе выделяются следующие компоненты.
1. База данных (числовые значения элементарных показателей).
2. Грамматика наименований показателей, содержащая синтезирующий и анализирующий разделы, и "шифровальщик".
3. Интерпретирующий компонент, или интерпретатор (переводит естественно-языковое выражение в его интерпретацию – арифметическое выражение, в которое входят в качестве операндов поисковые образы элементарных показателей).
-64-База данных, представляющая собой большое количество соответствий вида "наименование элементарного показателя (в некотором каноническом естественно-языковом виде) – числовое значение этого показателя", чрезвычайно неудобна: она занимала бы огромное место в памяти вследствие громоздкости самого естественно-языкового выражения, да и необходимости в этом нет. Дело в том, что набор элементарных показателей заполняет некоторое логическое пространство мыслимых понятий, которое, в свою очередь, представляет собой определенную комбинацию элементарных единиц. Описание этого логического пространства позволяет вместо естественно-языковой части в базе данных указывать только "номер понятия". И вот каким образом.
Начнем с примера. Показатель "количество рабочих в цехе N 3 в январе 1988 года" как понятие представляет собой комбинацию следующих единиц: "количество" (противопоставляется таким единицам, как "заработная плата", "количество рабочих дней", "количество прогулов" и т.п.), "рабочих" (противопоставляется единицам типа "служащих", "инженерно-технических работников" и т.п.), "в цехе N 3" (противопоставлено единицам типа "в цехе N 1, "в цехе N 2" и т.п.), "в январе" (ср. "в феврале" и т.п.), "1988 года" (ср. "1987 г.", "1989 г.").
Комбинации этих единиц не произвольны: так, нельзя произвольным образом сочетать выражения "количество" и "в цехе"; например, выражение "количество в цехе N 3 рабочих в январе 1988 г." – понятно, но в языке экономистов более маркированно (менее нейтрально), чем приведенное выше словосочетание, выражающее тот же показатель. Выражение "заработная плата, выплаченная январю 1988 года..." и вовсе бессмысленно. Для описания логического пространства в терминах естественно-языковых выражений можно использовать правила сочетания элементарных единиц, отражающие как синтагматические свойства последних (возможности сочетания их в рамках наименования одного и того же показателя и взаимное расположение их внутри такого словосочетания), так и их парадигматические свойства в логическом пространстве экономических понятий.
Вот почему в системе предусмотрено исчисление всех возможных
-65- наименований в каноническом виде. Оно базируется на сравнительно небольшом инвентаре элементарных смысловых единиц (терминальный словарь). Исчисление представляет собой формальную грамматику. Каждое наименование имеет свое структурное описание в терминах категорий этой грамматики, и наоборот, любое выражение, порождаемое этой формальной грамматикой, соответствует вполне определенному показателю из того же логического пространства. Между множеством элементов логического пространства я множеством выражений, порождаемых указанной грамматикой, существует взаимно однозначное соответствие. А если правила грамматики пронумеровать, легко построить алгоритм – его мы будем называть -шифровальщиком", – который множество выражений, порождаемых этой грамматикой, ставит во взаимно однозначное соответствие непрерывной (без пропусков) последовательности натурального ряда. Вот таким образом элементы логического пространства и оказываются пронумерованными без пропусков и без повторений номеров. Как конкретно это выполняется, мы покажем ниже.Итак, база данных в описываемой системе представляет собой набор пар вида "номер показателя в логическом пространстве – числовое значение показателя с этим номером". Такая база данных значительно менее громоздка, чем та, к которой пришлось бы прибегнуть, если отказаться от введения в систему исчисления наименований элементарных показателей. Да и поиск в ней – по числовому, а не по символьному (многобайтовому) ключу – значительно быстрее. Это пример лингвистической оптимизации в рамках информационной системы.
Этот компонент представляет собой порождающую грамматику, генерирующую глубинные структуры, а при необходимости и сами наименования, а также анализирующую наименования, подаваемые в качестве запроса. Имеются два раздела грамматики: анализирующий и синтезирующий. Однако понять устройство первого раздела проще, разобравшись прежде во втором. К формальной грамматике примыкает "шифровальщик".
-66-4.4.1. Синтезирующая грамматика дает формализованное описание парадигматических и синтагматических отношений между элементами структуры наименований и состоит из базового подкомпонента, трансформационного подкомпонента и набора ограничений на структуры.
Вот как выглядит фрагмент базового компонента:
П() ==> П(1. А() В())
П() ==> П(3. § Е2() В() П())
А() ==> А(3. А4() Г()
А4() ==> А4(1. А7())
А7() ==> А7(0. § среднемесячн заработн плат)
Г() ==> Г(0. Г5())
Г5() ==> Г5(2. Г3())
Г3() ==> Г3(0. рабоч)
В() ==> В(1. В5() В4() В7())
В() ==> В(5. В6() В2())
В7() ==> В7(0. В6() В3() В2())
В2() ==> В2(0. год)
В4() ==> В4(0. период)
В5() ==> В5(0. соответствующ)
В6() ==> В6(0. начал)
В3() ==> В3(0. прошл)
Е2() ==> Е2(0. § отношени П к)
Именно с его помощью порождается структура для наименования "Отношение среднемесячной заработной платы, выплаченной рабочим в начале текущего года, к соответствующему периоду начала прошлого года":
П(3. Е2(0. § отношени П к) В(1. В5(0. соответствующ) В4(0. период) В7(0. В6(0. начал) В3(0. прошл) В2(0. год))) П(1. А(3. А4(1. А7(0. § среднемесячн заработн плат)) Г(0. Г5(2. Г3(0. рабоч)))) В(5. В6(0. начал) В2(0. год))))
Символ "П" в этом представлении – имя класса выражений, являющихся полными и правильно построенными глубинными структурами. Кроме этого, в данном примере имеются и другие имена классов: Е2, В, В2, А, Г и т.д. То, что выражение относится к классу с данным именем, отражается в структуре так: само выражение окружало парой круглых скобок, непосредственно перед которыми стоит имя класса, а непосредственно после левой, открывающей круглой скобки после этого имени стоит порядковый
-67- номер данной единицы, среди всех единиц, представляющих данный класс: именно этот номер единица имеет в формальной грамматике. Так, выражение "соответствующ" является представителем класса В6, имеющим номер 0, "период" – номер 0 среди представителей категории В4, выражение "В5 В4 В7" имеет номер 1 среди представителей категории В, выражение "Е2 В П" является представителем номер 3 класса П, и т.д. Порядковый номер отделяется точкой от остальной части внутри пары скобок.У слов русского языка, входящих в элементарные смысловые единицы в таких представлениях, усечены окончания: зачем это сделано, будет ясно из дальнейшего.
Среди представителей категорий, как видим, есть и такие, которые помечены символом "§": если этот символ входит в структуру, значит она соответствует некоторому сложному показателю. В нашем примере – это элементарные смысловые единицы "отношени П к" и "среднемесячн заработн плат" (о значении подчеркнутого символа П будет сказано ниже). Действительно, указание на "отношение" означает, что искомое значение должно вычисляться в результате деления одного числа на другое; "среднемесячная заработная плата" также сигнализирует о неэлементарности показателя.
Как видим, мы используем структуру непосредственно составляющих (НС): в данном примере категория П представлена тремя составляющими – выражением, относимым к категории Е2, выражением категории В и выражением категории П; составляющая категории Е2 дана элементарной смысловой единицей, а составляющие категории В и категории П, в свою очередь, имеют собственные непосредственно составляющие. Выбор представления НС дозволяет использовать скобочную запись (с неограниченным, в принципе, количеством вложений).
Однако, как известно, представление в терминах НС не всегда прямо достижимо: возможны случае когда удобно фрагмент структуры НС считать в реальном естественно-языковом выражении вынесенным за пределы той составляющей, в которую он должен быть включен из логических (парадигматических) соображений. Так, категория Е2 представляет собой класс выражений, начинающихся словом "отношение"; на втором место у таких выражений стоит составляющая класса П, а на третьем – предлог "к".
Однако в приведенном выше примере структурного описания
-68- составляющая класса П, которая должна бы стоять после элемента "отношени", вынесена за пределы самой составляющей Е2, а на ее месте стоит подчеркнутый символ "П". Подчеркивание символа у нас означает, что при переходе от такого представления ("глубинного") к поверхностному необходимо ближайшую составляющую данной категории перенести на место подчеркнутого символа. Сам подчеркнутый символ считается терминальным (т.е. это на символ категории, при котором должны быть рядом указаны представители категории). Только в результате трансформаций (о них – ниже) все составляющие наименования займут свои места, диктуемые грамматикой русского языка.Грамматика синтеза работает так, что на каждом шаге группа символов в представлении, полученном на предыдущем шаге (если эта группа символов идентифицируема как совпадающая с левой частью какого-либо правила из грамматики), заменяется на выражение, стоящее оправа от знака "==>" того же правила. Порождение структурных представлений начинается с замены выражения "П()". Так, для нашего примера деривация происходит следующим образом (каждый новый шаг пишем с новой строки):
П()
П(3. § Е2() В() П())
П(3. § Е2(0. § отношени П к) В() П())
П(3. § Е2(0. § отношени П к) В(1. В5() В4() В7()) П())
П(3. § Е2(0. § отношени П к) В(1. В5(0. соответствующ) В4() В7()) П())
(и т.д., до тех пор, пока не исчезнут все пары круглых скобок, внутри которых ничего нет.)
В результате такого процесса порождения получаются 'глубинные структуры": структурные представления, получаемые в результате работы тех и только тех правил, которые входят в базовый компонент данной грамматики, – т.е. без участия трансформаций.
Если два элемента находятся в парадигматическом отношении (например, если они, встречаясь в одинаковом окружении, представляют различные моменты логического пространства), то они порознь входят в правую часть правил с одинаковой левой частью. Так, парадигматические отношения имеют место между сочетаниями моментов, отвечающих структурному описанию "А(Х1) В(Х2)" и "Е2(Х3) В(Х4) П(Х5)", где Х1, Х2, ... Х5 -
-69- переменные выражений. Для работы шифровальщика и алгоритма порождения глубинных структур удобным является нумеровать, внутри множества правил с одинаковыми левыми частями, различные возможности замены. Так, в приведенном вши фрагменте грамматики имеем для П выборы с номером 1 и 3 ("выборы" с номерами 0, 2 и другие существуют в реальной системе, но, поскольку они не участвуют в порождении иллюстрирующего представления, мы их не ввели в этот фрагмент). Выборы имеют номера, представляющие собой целые числа от 0 и больше.Синтагматические отношения формализуются в рамках данной грамматики как отношения между элементами, входящими в правую часть одного и того же правила, – например, между элементами "среднемесячная", "заработная" и "плата" существуют синтагматические отношения, отраженные правилом для категории А7.
Знак сложности показателя "§" появляется в глубинных структурах также в результате работы базового компонента. Мы исходили из гипотезы, что сложность или элементарность показателя может быть определена по виду структурного описания и связана с тем или иным конкретным выбором у категории. Так, структурное представление, содержащее цепочку "среднемесячн заработн плат", отнесенную к категории А7, характеризует сложный показатель. Аналогичное верно и для цепочек "отношени Пк" и "Е2() В() П()".
Анализ интерпретируемого естественно-языкового выражения проводится в тех же категориях, что и глубинные структуры, получаемые посредством синтезирующей ПГ. Поэтому в правой части правил базового компонента не может быть пустых цепочек: противное привело бы к возможности бесконечного зацикливания в работе правил анализа. Кроме того, в правой части правил могут быть либо только нетерминальные символы (т.е. символы с парой круглых скобок после них), либо только терминальные символы (при ню нет пары круглых скобок, и они представляют собой сегменты слов русского языка или подчеркнутые символы, фиксирующие позицию элемента, вынесенного за пределы данной составляющей). Исключениями из последнего запрета являются символ сложности "§" и символ номера выбора.
Трансформационный компонент, состоящий из набора трансформационных правил, или трансформаций, переводит глубинные структуры в поверхностные. В нашей
-70- системе роль трансформаций, как и в последних вариантах генеративной грамматики (см. выше), ограниченна. Имеем всего два трансформационных правила, преобразующих глубинные структуры с подчеркиванием типа "П" в структурные описания без такого символа: эти правила находят в рамках обрабатываемой структуры ту составляющую, которая отнесена к "подчеркнутой" категории (например, к категории "П", если имеется подчеркнутый символ П), и переносят ее на место подчеркнутого символа. Так, из глубинной структуры, приведенной выше, получим:П(3. Е2(0. § отношени П(1. А(3. А4(1. А7(0. § среднемесячн заработн плат)) Г(0. Г5(2. Г3(0. рабоч)))) В(5. В6(0. начал) В2(0. год))) к) В(1. В5(0. соответствующ) В4(0. период) В7(0. В6(0. начал) В3(0. прошл) В2(0. год))))
В этой структуре, не содержащей более ни одного подчеркнутого символа, – ее называем поверхностной структурой, – порядок элементов соответствует тому, который имеется в естественно-языковой реализации (ср. "отношение среднемесячной заработной платы рабочих в начало года к соответствующему периоду начала прошлого года"). Сами трансформации формулируются следующим образом (здесь, как и всегда, Х1, Х2 и т.д. – переменные выражений, аналогичные переменным контекста в теории порождающих грамматик):
Перенос вправо: Х1 П(Х2 Х3(Х4) Х5 X3 Х6) Х7 ===> X1 П(Х2 Х5 Х3(Х4) Х6) Х7
Перенос влево: Х1 П(Х2 X3 Х4 Х3 (Х5) Х6) Х7 ===> Х1 П(Х2 Х3(Х5) Х4 Х6) Х7
Трансформации работают циклически: они начинают полек структур, которые ими могут быть преобразованы, с наиболее глубоко вложенных составляющих категории "П", затем поднимаются все выше и выше.
Наконец, перейдем к третьему подкомпоненту – к "ограничениям".
Рассмотрим следующую глубинную структуру, получаемую в результате работы представленного выше фрагмента базового компонента:
П(3. § Е2(0. § отношени П к) В(5. Э5(0. начал) В2(0. год)) П(1. А(3. А4(1. А7(0. § среднемесячн заработн плат)) Г(0. Г5(2. Г3(0. рабоч)))) В(5. В6(0. начал) В2(0. год))))
Эта структура может быть переведена трансформациями
-71- в поверхностную, соответствующую наименованию "отношение среднемесячной заработной платы рабочим, выплаченной в начале года, к началу года" (глубинная структура, как и везде у нас, не содержит избыточных элементов, восстановимых более или менее однозначно). С точки зрения интерпретации, такая структура допустима, однако при составлении экономической документации наименований следует отделять такие структуры от нормальных, нетривиальных.Для этого и необходимы "ограничения на глубинную структуру": фильтры, не пропускающие определенные структуры. Фильтр – что-то вроде трансформационного правила особого рода: если структура ми ее составляющая часть удовлетворяет условию работы данного ограничения, то вся она помечается как неправильная, – у нас принят для этой цели символ "?". В частности, среди ограничений на глубинные структуры имеется следующее:
П(Х1 Е2(Х2) В(Х3) П(Х4 В(Х3))) ===> ?П
При таком решении процесс генерации структурных представлений (а он используется при режиме ответа на множественные запросы и при пополнении баз данных) происходит следующим образом. Порожденная глубинная структура подается на вход в блок ограничений; если получается выражение, содержащее в качестве своей части выражение вида "? П" или полностью являющееся им, то происходит переход к порождению следующей глубинной структуры, в противном случае структура подается на вход в трансформационный компонент, на выходе из которого получаем соответствующую поверхностную структуру; после чего переходим к порождению следующей структуры.
В терминах ограничений на глубинные структуры задаются специальные запреты на сочетаемость тех или иных элементов наименования. Кроме ограничений на глубинные структуры, существуют ограничения на поверхностные и промежуточные. Поэтому компонент ограничений, как и в поздних вариантах расширенной стандартной порождающей модели, логически слит с трансформационным компонентом.
Итак, синтезирующая грамматика имеет четыре главных назначения: 1) участие в работе шифровальщика; 2) построение анализирующей грамматики, когда грамматика переводит естественно-языковые выражения в глубинные структуры, перед тем как начнет работать интерпретирующий компонент; 3) участие в
-72- ответе на множественные запросы, когда генерируется класс наименований, логически входящих в ответ на такой запрос, и 4) пополнение базы данных, когда порождается множество наименований элементарных показателей, числовые значения которых должны быть введены в базу данных. О первых двух назначениях будет подробнее сказано ниже, в разделе, посвященном анализирующей грамматике. Здесь остановимся на двух последних.Выражения, порождаемые синтезирующей грамматикой, представляют собой словосочетания с усеченными окончаниями. Это отражает свойство экономического языка, с его длинными словосочетаниями, для понимания которых достаточно обычно бывает только знать порядок слов. Вот почему выражения, подаваемые на вход анализирующей грамматики, у нас перерабатываются правилами, отождествляющими элементы словаря с конкретными словоформами в составе наименований с точностью до окончаний. Шифровальщик, оперирующий категориями синтезирующей грамматики, также во требует, чтобы глубинные структуры отражали морфологические свойства наименований: для шифровальщика важны сведения о том, какая из логических возможностей выбора представителя данной категории реализована в данной структуре.
Разумеется, наша поверхностная структура, "очищенная" от вспомогательных символов (скобок и нетерминальных символов), понятна человеку, хотя и не очень удобна для него, ср.: "отношени среднемесячн заработн плат рабоч начал год к соответствующ период начал прошл год" и "отношение среднемесячной заработной платы, выплаченной рабочим в начале года, к соответствующему периоду начала прошлого года".
Для того чтобы наименования давались в привычном виде, с окончаниями, с предлогами и тому подобными элементами, отнесенными к избыточным при рассмотрении логического пространства, правила синтезирующей грамматики должны быть переформулированы, и к ним должны быть добавлены правила морфологического компонента. Однако это не входит в задачу данной работы.
4.4.2. Анализирующая грамматика. Этот раздел перерабатывает естественно-языковые выражения в их глубинные структуры. Здесь реализуется следующий подход к конструированию анализирующей грамматики. Для правил базового компонента находятся такие "обращения" (т.е. правила, реконструирующие деривацию
-73- выражения), левая часть которых учитывает возможности преобразований, происходивших в результате работы трансформационных правил над глубинными структурами.Поясним сказанное на примере фрагмента анализирующей грамматики, дающей "обращения" для правил приведенной выше синтезирующей грамматики (при учете трансформаций):
1. Х1 выплач- Х2 := X1 Х2
2. Х1 в В(Х2) Х3 := X1 В(Х2) Х3
3. Х1 отчетн- Х2 := X1 Х2
4. X1 на фабрик- Х2 := X1 Х2
5. Х1 с В(Х2) Х3 := Х1 В(Х2) Х3
6. Х1 рабоч- Х2 := X1 Г3(0. рабоч) Х2
7. X1 среднемесячн- заработн- плат- Х2 := X1 А7(0. § среднемесячн заработн плат)
8. X1 год- Х2 := X1 В2(0. год) Х2
9. X1 период- Х2 := X1 В4(0. период) Х2
10. X1 соответствующ- Х2 := X1 В5(0. соответствующ)) Х2
11. X1 начал- Х2 := X1 В6(0. начал) Х2
12. X1 прошл- Х2 := X1 В3(0. прошл) Х2
13. X1 В6(Х2) В3(Х3) В2(Х4) Х5 := X1 В7(0. В6(Х2) В3(Х3) В2(Х4)) Х5
14. X1 В5(Х2) В4(Х3) В7(Х4) Х5 := Х1 В(1. В5(Х2) В4(Х3) В7(Х4)) Х5
15. X1 В6(Х2) В2(Х3) Х4 := X1 В(5. В6(Х2) В2(Х3)) Х4
16. X1 Г3(Х2) Х3 := X1 Г5(2. Г3(Х2)) Х3
17. X1 Г5(Х2) Х3 := X1 Г(0. Г5(Х2)) Х3
18. X1 А7 (Х2) Х3 := X1 А4(1. А7(Х2)) Х3
19. X1 А4(Х2) Г(Х3) Х4 := X1 А(3. А4(Х2) Г(Х3)) Х4
20. X1 А(Х2) В(Х3) Х4 := X1 П(1. А(Х2) В(Х3)) Х4
21. X1 отношени- П(Х2) к В(Х3) Х4 := X1 П(3. § Е2(0. § отношени П к) В(Х3) П(Х2)) Х4
Первые пять правил осуществляют приведение к каноническому виду: в отличие от остальных, в результате работы которых появляется по меньшей мере одна новая пара круглых скобок с нетерминальным символом, правила приведения к каноническому виду обычно удаляют те или иные элементы промежуточной обрабатываемой структуры. Так, по этим правилам (и в результате удаления запятых) выражение "отношение среднемесячной заработной платы, выплаченной рабочим в начале года, на фабрике, к
-74- соответствующему периоду с начала прошлого года" переводится в выражение "отношение среднемесячной заработной платы рабочих в начале года к соответствующему периоду начала прошлого года".Дефис, поставленный в конце основ, свидетельствует о том, на каком месте нужно остановить отождествление этой основы, входящей в левую часть правила, о реальной словоформой из обрабатываемого выражения. Так, по правилу 1 будут удалены словоформы "выплаченный", "выплаченная", "выплаченного" и т.п.
В результате дальнейшего преобразования получается, как видим, глубинная структура, с помощью которой мы иллюстрировали работу синтезирующей грамматики. Легко заметить и связь между правилами этих двух грамматик. Отметим только, что правило 21 – это результат "слияния" правила базового компонента с трансформацией.
4.4.3. Шифровальщик. Задача шифровальщика – определить порядковый номер элементарного показателя (для неэлементарного такая задача бессмысленна) по его глубинной структуре. Работа шифровальщика основана на информации о том, какой номер выбора, в соответствии с синтезирующей грамматикой, имеет место при данном представителе категории в глубинной структуре и сколько выборов имеет каждая из категорий, входящих в данную глубинную структуру. Поскольку иллюстрацию работы шифровальщика удобно провести на совсем небольшом фрагменте грамматики, предположим, что следующие правила составляют базовый компонент:
1.0. П() := П(0. А() Б() В())
1.1. П() := П(1. А() В())
2.0. А() := А(0. а1)
2.1. А() := А(1. а2)
3.0. Б() := Б(0. б1)
3.1. Б() := Б(1. б2)
4.0. В() := В(0. в1)
4.1. В() := В(1. в2)
(здесь вместо конкретных слов русского языка для большей прозрачности алгоритма используются символы а1, а2, ...).
Такая грамматика порождает 12 различных структурных представлений (8 из них – при участии правила 1.0, а 4 –
-75- при участии правила 1.1). Поэтому номера этих структур должны представлять собой числа от 0 до 11.Способов упорядочить такие структуры, вообще говоря, много, достаточно выбрать раз и навсегда один из них, – скажем, такой. Предположим, мы хотим, чтобы все структуры, порождаемые при участии правила 1.0 как "заглавного" (начинающего процесс деривации), имели номер меньше, чем любая структура, порождаемая правилом 1.1; чтобы структуры, в которых категория А представлена элементом а1, имели номер меньше любой другой структуры, у которой в той же позиции имеем выбор а2; аналогичное – для остальных категорий.
Пусть р[К] – количество всех возможных структур, порождаемых данной грамматикой, вида "К(Х)" (К – переменная, принимающая в качестве своих значений нетерминальные символы, Х – переменная выражения, – как и прежде), М[К(Х1. Х2)] – порядковый номер структуры указанного в квадратных скобках вида, относительно других структур категории К; пусть, кроме того, Р[К/Х1] – количество различных структур вида "К(Х2. Х3)" таких, что Х2 < X1 (здесь X1, Х2 – переменные номеров выбора категории К); кроме того, полагаем по определению Р[КØ] = 0.
Вычисление порядкового номера структуры можно представить как процесс получения арифметического выражения, в которое в качество операндов входят указанные функции. Значения этих функций удобно хранить в синтезирующей грамматике или в самом шифровальщике, а сам процесс получения такого арифметического выражения можно представить как интерпретацию глубинной структуры с помощью трех следующих преобразований, составляющих собственно блок "шифровальщика":
1. X1 М[К(Х2. Х3)]Х4 := X1 (Р[К/Х2] + М[Х3]) Х4
2. X1 М[Х2 К(Х3. Х4)] Х5 := Х1(М[К(Х3. Х4)] + р[К] * М[Х2])Х5
3. Х1(Х2 + М[Х3]Х4) Х5 := X1 Х2 Х4 Х5
Здесь "внешние" круглые скобки (внутри них имеются квадратные) представляют собой арифметические скобки, а круглые скобки внутри квадратных – это скобки глубинных структур.
Для нашего примера грамматики имеем:
Р[ПØ] = р[А] * р[Б] * р[В]
Р[П/1] = р[А] * р[Б]
И вообще, если правило, например, имеет вид
К() ===> К(Х1. К1() К2() К3()),
-76- то:Р[К/Х1] = р[К1] * р[К2] * р[К3]
(аналогичное верно для произвольного количества подобных составляющих).
Кроме того, очевидно, что р[К] равно всегда сумме значений функции Р[К/Х] при всех возможных для данной категории К (в рамках данной грамматики) номера выборов X.
Эти преобразования работают в указанном здесь порядке: на каждом новом цикле сначала проверяется, может ли над данным выражением работать правило 1; если может – то работает оно, после чего происходит переход на новый цикл (т.е. опять проверяется, может ли работать правило 1), если не может – то проверяется, может ли работать правило 2; если может – то оно преобразует выражение, и происходит переход на новый цикл (проверяется то же опять-таки для правила 1), если не может – то же устанавливается для правила 3. Если на данном цикле не может работать ни одно из этих правил, – значит, искомое арифметическое выражение получено, и необходимо указанные функции Р и р заменить на их значения, в соответствии со специальной таблицей, – скажем, для нашего примера, в соответствии с такой таблицей:
К Р[К/О] Р[К/1] р[К]
П 0 8 12
А 0 1 2
Б 0 1 2
В 0 1 2
Эта таблица может также быть задана как набор правил типа Р[ПØ] := 8; Р[П/1] := 4; р[П] := 12; Р[А/1] := 1 (и т.д.). В отличие от приведенных выше трех правил шифровальщика, такие специальные правила меняются от грамматики к грамматике.
Продемонстрируем работу шифровальщика. Пусть на вход его подается следующая структура: П(1. А(0. а1) В(1. в1)). Имеем последовательно следующие преобразования:
(вход): М[П(1. А(0. а1) В(1. в1))]
(по 1): (Р[П/1] + М[А(0. а1) В(1. в1])
(по 2): (Р[П/1] + (М[В(1. в1)] + р[В] * М[А(0. а1)]))
(по 1): (Р[П/1] + ((Р[В/1] + М[в1]) + р[В] * М[А(0. а1)]))
(по 1): (Р[П/1] + ((Р(В/1] + М[в1]) + р[В] * (Р[АØ] + [а1])))
-77-(по 3): (Р[П/1] + (Р[В/1] + р[В] * (Р[АØ] + М[а1])))
(по 3): (Р[П/1] + (Р[В/1] + р[В] * Р[АØ]))
Поскольку полученное выражение ни одним из правил 1 – 3 преобразовано быть не может, происходит замена функциональных выражений на соответствующие числа из приведенной выше таблицы; получаем:
(8 + (1 + 2 * 0))
Это выражение равно 9, что определяется автоматически с помощью специального алгоритма, интерпретирующего "нормальные" арифметические выражения (такой алгоритм участвует также и в вычислении числового значения по тому выражению, которое получается в результате интерпретации глубинной структуры сложного показателя как функции от числовых значений элементарных показателей, после того, как глубинные структуры заменены на числовые значения соответствующих элементарных показателей).
Шифровальщик работает только над глубинными структурами, не содержащими символа сложности "§". Поэтому при составлении таблицы значений функций для категорий порождающей грамматики учитываются только те правила, которые не вводят символ сложности.
Итак, видим, что шифровальщик может быть представлен как некоторый вид интерпретатора и нотационно не отличается от других компонентов, состоящих из правил.
Этот компонент переводит заданные на входе словосочетания в арифметические формулы. Для этого словосочетание сначала переводится в арифметическую формулу, в которой операндами являются не числа, а определенные представления элементарных показателей – их глубинные структуры, а затем представления элементарных показателей перешифровываются в "номера понятий", после чего, в результате обращения к базе данных, заменяются на соответствующие числовые значения.
В связи с этим встает следующий вопрос: следует ли интерпретировать наименования, непосредственно исходя из естественно-языкового выражения, – или же удобнее прибегнуть к промежуточному этапу, на котором заданное на входе выражение сначала
-78- переводится в некоторое промежуточное представление, которое потом и подвергается интерпретации?В принципе, законны оба подхода, однако предпочтение должно быть отдано второму, и вот почему. Интерпретация при первом подходе представляет собой перевод естественно-языкового выражения сначала в арифметическое выражение, операндами которого также являются естественно-языковые выражения (наименования менее сложных показателей), затем интерпретации подвергаются эти новые, входящие в состав такого арифметического выражения словосочетания и так далее {Note 1}. На каждом шаге такой интерпретации системе приходилось бы иметь дело с посимвольным установлением тождества между выражениями на естественном языке, входящими в формулировку соответствующего правила интерпретации, и выражениями, составляющими интерпретируемое словосочетание.
{Note 1. Именно так выглядел ранний вариант системы, описанный нами в книге [Демьянков 1978].}
Такое посимвольное отождествление связано с огромным количеством машинных операций, что привело бы к чрезвычайной неэффективности всего алгоритма: ответ на запрос при таком решении может потребовать нереально большого расхода машинного времени (и оперативной памяти). Выход же – в том, чтобы расширить формальную грамматику, исчисляющую наименования элементарных показателей, таким образом, чтобы она же исчисляла еще и глубинные структуры сложных показателей (определенным образом помеченные).
В этом и состоит второе решение. При нем посимвольное отождествление (неизбежное, когда мы имеем дело с выражениями на ЕЯ) происходит только над входным выражением – ровно на одном этапе. Так, если результирующее арифметическое выражение должно содержать 15 операндов-выражений для элементарных показателей, то при первом решении необходимо 15 раз прибегать к помощи алгоритма, переводящего естественно-языковое выражение в его глубинную структуру, а при втором решении – всего лишь один раз, причем обработать гораздо более короткое выражение, чем при первом решении.
Есть и еще один довод в пользу второго решения. Поскольку глубинную структуру сложного показателя можно всегда каким-либо
-79- способом пометить, опираясь на формальное исчисление, так чтобы отличить его от структуры элементарного показателя (в рамках нашей системы структура сложного показателя всегда содержит один или несколько символов сложности "§"), наглядно выделен случай, когда интерпретацию следует остановить: это отсутствие в выражении символов сложности. Если на входе подать наименование элементарного показателя, то при первом решении интерпретатор проработал бы впустую (на выходе имелось бы тогда выражение, не содержащее ни одного знака арифметического действия), перед тем как определить внутреннее представление, а при втором решении избыточный этап обработки отсутствует.Итак, работа интерпретатора происходит в следующей последовательности: структурное представление естественно-языкового выражения, предъявленного на входе (оно получается перед этим в результате работы анализирующей грамматики, см. выше), содержащее хотя бы одни символ сложности, переводится в арифметическую формулу, в которой в качество операндов имеем глубинные структуры элементарных показателей и которая содержит правильно расставленные арифметические скобки и знаки арифметических действий; после этого шифровальщик определяет порядковые номера – "ключи" – элементарных показателей по их глубинным структурам; затем глубинные структуры заменяются на числовые характеристики, хранимые в базе данных и находимые по ключу; после чего, наконец, вычисляются значения полученной арифметической формулы.
Правило интерпретации, при таком подходе, представляет собой преобразование, переводящее выражения определенного вида в арифметическое выражение, окруженное парой арифметических скобок и содержащее правильно расставленные символы арифметических действий.
Теперь приведем примеры правил интерпретации:
(а) Х1[П(3. Е2(0. § Х2) В(1. В5(Х3) В4(Х4) В7(Х5)) П(Х6 В(Х7)))] Х8 := (100 * ([П(Х6 В(Х7)] : [П(Х6 В(3. В7(Х5)))])) Х8
(б) Х1[П(Х2 А(3. А4(1. А7(0. § 13)) Г(Х4)) Х5 В(Х6))] Х7 := Х1(([П(Х2 А(2. А3(0. А5(3. § А11(0. фонд заработн плат) А15(0. преми единовременн поощрени и вознаграждени)) Г(Х4))) Х5 В(Х6))] : [П(Х2 А(3. А4(0. А6(0. А8(0. числ) А9(0. среднесписочн A8)) Г(Х4))) Х5 В(Х6))]) : [Ф(В(Х6))] Х7
-80-Эти правила читаются следующим образом: если интерпретируемое выражение имеет вид такой, какой описывается левой частью (слева от выражения ":=" в правиле), то оно заменяется на выражение, описываемое правой частью правила. В квадратные скобки заключены структурные описания словосочетаний, круглые скобки внутри квадратных все полностью относятся к нотации НС, а круглые скобки вне квадратных представляют собой арифметические скобки. Символы "*", "+", "-", ":" суть знаки арифметических операций. Символы Х1, Х2, Х3 и т.п. представляют те части переводимого выражения, которые алгоритму не нужно "структурировать" (выяснять конкретный вид в терминах грамматики, сопоставлять с терминальным словарем и т.п.). Но та часть преобразуемого выражения, которая отождествляется с данным символом свободной переменной (Х1, Х2, Х3 и т.п.), должна фигурировать вместо того же символа переменной и в результирующем выражении.
Приведенное выше структурное описание наименования отвечает левой части правила (а); имеем:
Х1 и Х8 представлены нулевыми цепочками,
Х2 = отношени П к;
Х3 = 0. соответствующ;
Х4 = 0. период;
Х5 = 0. В6(0. начал) В3(0. прошл ) В2(0. год);
Х6 = 1. А(3. А4(1. А7(0. § среднемесячн заработн плат)) Г(0. Г5(2. Г3(0. рабоч))));
Х7 = 5. В6(0. начал) В2(0. год).
По правилу (а) получаем поэтому из нашего выражения, если его предварительно обнести парой квадратных скобок:
(100 * ([П(1. А(3. А4(1. А7(0. § среднемесячн заработн плат)) Г(0. Г5(2. Г3(0. рабоч)))) В(5. В6(0. начал) В2(0. год)))] : [П(1. А(3. А4(1. А7(0. § среднемесячн заработн плат)) Г(0. Г5(2. Г3(0. рабоч)))) В(3. В7(0. В6(0. начал) В3(0. прошл) В2(0. год))))])).
Выражения в обеих полученных парах квадратных скобок отвечают условию работы правила (б), поэтому правило преобразует оба выражения. Так, после преобразования выражения внутри первой пары квадратных скобок, имеем:
(100 * ((([П(1. А(2. А3(0. А5(3. § А11(0. фонд заработн плат) А15(0. преми единовременн поощрени и вознаграждени)) Г(0. Г5(2. Г3(0. рабоч)))) В(5. В6(0. начал) В2(0. год)))]: [П(1. А(3. А4(0. А6(0. А8(0. числ) А9(0. среднесписочн A8)) Г(0. Г5(2. Г3(0. рабоч))))) В(5. В6(0. начал) В2(0. год)))]): [Ф(В(5. В6(0. начал) В2(0. год)))]):[П(1. А(3. А4(1. А7(0. § среднемесячн заработн плат)) Г(0. Г5(2. Г3(0. рабоч)))) В(3. В7(0. В6(0. начал) В3(0. прошл) В2(0. год))))]))
-81-Дальнейшие преобразования протекают в том же духе, пока в выражении есть символы '§'.
В данном примере видно, что процесс интерпретации внешне выглядит как постепенное нарастание степени вложенности арифметических скобок. Отметим, что нет необходимости в строгом "внешнем" упорядочении правил интерпретации друг относительно друга: то или иное правило интерпретации работает над поданным на его вход выражением, если это выражение отвечает описанию левой части правила; если же данное выражение отвечает условиям одновременно двух или нескольких правил, то безразлично, в какой последовательности эти правила будут работать, результирующее арифметическое выражение, доведенное до структурных представлений элементарных показателей, не изменится, если изменить порядок работы правил интерпретации {Note 1}.
{Note 1. Развернутая демонстрация этого приведена в нашей работе [Демьянков 1978а].}
В последнем из приведенных выше разложений фигурирует выражение "Ф(В(5. В6(0. начал) В2(0. год)))". В описываемой системе оно интерпретируется как количество месяцев, прошедших с начала года до текущего месяца. Такое выражение заменяется на определенное число с помощью правила интерпретации вида "Ф(В(5. В6(0. начал) В2(0. год))) := К", где К – номер текущего месяца (целое число от 0 до 12, меняющееся в базе данных каждый месяц).
Работа системы при интерпретации множественного запроса может быть схематически описана следующим образом. Выражение, подаваемое на входе, – так же, как и любой другой запрос (пользователь системы не обязан даже знать о том, является ли запрос множественным), – подвергается преобразованиям в результате работы анализирующей грамматики. На выходе из этой грамматики получается выражение определенного вида, – назовем его индексом деривации, – которое не может быть представлено как "П(Х)" даже в результате работы всех возможных правил анализа. По этому выражению определяется множество всех наборов правил синтезирующей грамматики, которые способны
-82- дополнить этот индекс так, чтобы получилась глубинная структура вида "П(Х)". Затем синтезирующая грамматика выдает описок глубинных структур и соответствующих им поверхностных. Глубинные структуры подвергаются интерпретации, – так что получаются числовые значения соответствующих показателей; эти числа выдаются в паре с соответствующей поверхностной структурой в качество ответов на запрос. В процедурном отношении работа в режиме ответа на множественный запрос не отличается от интерпретации в остальных режимах.Очерченная выше система анализа и синтеза естественно-языковых выражений допускает различные решения относительно программного обеспечения. Но следует ли правила преобразований (синтезирующей и анализирующей грамматик, правила шифровальщика и другие) в действующей системе воплощать как элементы алгоритма (в оперативной памяти) или можно избежать этой нереальной перегрузки оперативной памяти?
Если правила воплощать как команды или наборы команд, то при огромном количество данных, кроме прочего, затруднится корректировка грамматики. Ведь вполне вероятна необходимость вносить изменения в формулировки каких-либо правил, в тот способ, которым они упорядочены друг относительно друга, и т.п.
Поэтому предпочтительным представляется следующий путь. На каждом шаге работы системы рассматривается не одно, обрабатываемое, выражение, а два: обрабатываемое выражение и выражение-правило. Собственно алгоритм (он-то и воплощается как система программ) представляет собой тогда нечто вроде интерпретатора для правил. Он перерабатывает выражение-объект в соответствии с текущим (очередным) интерпретируемым же правилом. Это тем более реалистично, что, как показано выше, правила можно сформулировать в рамках единообразной нотации для самих различных по содержанию компонентов системы. Тогда, очевидно, с полным правом мы сможем назвать интерпретацией не только анализ, но и синтез языковых выражений.
В связи с этим мы различаем системы двух уровней. Первый уровень является общим для таких алгоритмов и не зависит от специализации задач, решаемых конкретными системами, т.е. от
-83- содержания конкретных наборов правил. Это – уровень интерпретации грамматик. Второй уровень непосредственно связан со спецификой конкретного класса решаемых задач: к таким задачам могут быть отнесены, например, установление структурной формулы химического соединения по его наименованию (и обратно, установление наименования по структурной формуле), вычисление значения того или иного параметра при неформальной постановке задачи, решение шахматных задач и др. К таким задачам относится и наша, решение которой было продемонстрировано в данной главе.Машина, описанная в эпиграфе, могла только перебирать всевозможные сочетания слов. Она обладала только очень упрощенным прообразом нашего базового компонента. Система же, описанная в данной главе, обладает не только более сложным синтаксическим компонентом, порождающим правильные словосочетания русского экономического языка, но и подсистемами интерпретации. Именно добавление последних делает лингвистические автоматы хорошим помощником человека.
Ограничиваясь языковой стороной, мы не стали описывать всевозможные усовершенствования в рамках конкретных программ и наборов данных. Так, когда мы говорили о преобразованиях промежуточных структур и об интерпретации промежуточных формул, мы осознанно отказались от искушения продемонстрировать программистские приемы, способные свести до минимума "просмотры" этих структур с целью выяснить, приложимо ли данное преобразование к данной структуре (скажем, все символы сложности могут быть задублированы за пределами собственно глубинной структуры в виде отдельного поля записи). Программистские приемы нам представляются заслуживающими особенного уважения, вот почему нам показалось легкомысленным попытаться изложить их в облегченном варианте в данной работе.
-84-В результате проведенного анализа мы приходим к выводу о том, что лингвистику в широком смысле слова можно определить как научную дисциплину, исследующую не только структуру языка, но и реально используемые человеком способы интерпретации речи. Конкретными свойствами отдельных видов интерпретации занимаются специальные дисциплины. Так, свойствами логических выражений и тем, как они "читаются", занимается формальная логика, свойствами высказываний, выражающих физические закономерности, – физика; аналогичное верно для математических, экономических, химических и других высказываний. Это не значит, что исследование интерпретаций с точки зрения логической, математической, физической и т.п. реальности полностью исчерпывает соответствующие дисциплины, однако в значительной степени исследование в них связано с уточнениями понятийного аппарата, находящими свое отражение в структуре и способах ("правилах") интерпретации соответствующего подъязыка. В наибольшей степени справедливо это для установления специальных теорий в указанных дисциплинах: при развитии этих теорий устраняются посторонние и выявляются новые виды интерпретации.
Под интерпретацией при этом не обязательно понимать нечто вроде застывшей формулы, отражающей статичную ситуацию, без отражения человеческого действия. Под интерпретацией – в рамках специальных теорий – мы понимаем такой режим "прочтения" выражения (восприятия выражения в той или иной манифестации), который заключается в том, что одновременно со сканированием самого выражения выполняются те действия, которые навязываются человеку-интерпретатору правилами интерпретации выражений данного вида и в данной ситуации. Вне специальной теории, разумеется, бессмысленно говорить о правилах интерпретации: скорее тогда имеются конвенции и стратегии интерпретирования.
(с.85-87)
Демьянков В.З.
1978
Метод построения системы автоматического лингвистического анализа наименований экономических показателей в ИПС. использующей естественный язык. – М.: Изд-во Моск. ун-та, 1978.
Демьянков В.З.
1978а
Процедура преобразования словосочетаний естественного языка на язык числовых индексов (применительно к построению информационно-поисковых систем экономических показателей). – Дисс. на соиск. уч. степ. канд. филол. наук. – М.: МГУ, филологический факультет, 1978.
Демьянков В.З.
1979
Англо-русские термины по прикладной лингвистике и автоматической переработке текста: Порождающая грамматика. – М.: Изд-во Всесоюзного центра переводов, 1979.
Демьянков В.З.
1979а
Формализация и интерпретация в семантике и синтаксисе (по материалам американской и английской лингвистики) // ИАНСЛЯ, 1979. Т.39. № 3. С.261-269.
Демьянков В.З.
1981а
Принципы языковой интерпретации // Теоретические и прикладные аспекты вычислительной лингвистики. М.: МГУ, 1981. С.89-106.
Демьянков В.З.
1982
Понятие гипотетической интерпретации в морфологии // Вычислительная лингвистика: Теоретические аспекты: Вопросы автоматизации лексикографических работ. – М.: Изд-во Моск. ун-та, 1982. С.31-73.
Демьянков В.З.
1982б
Англо-русские термины по прикладной лингвистике и автоматической переработке текста: Вып.2. Методы анализа текста. – М.: Всесоюзный центр переводов ГКНТ и АН СССР, 1982.
Демьянков В.З.
1985
Основы теории интерпретации я ее приложения в вычислительной лингвистике. – М.: Изд-во Моск. ун-та, 1985.
Демьянков В.З.
1985а
Общая теория интерпретации и ее приложение к критическому анализу метаязыка американской лингвистики 1970-80-х гг. – Дисс. на соискание уч. степени доктора филол. наук. – М.: Ин-т языкознания АН СССР, 1985.
Демьянков В.З.
1986а
Новые тенденции в американской лингвистике 1970-80-х гг. // ИАНСЛЯ, 1986. Т.45. № 3. С.224-234.
Демьянков В.З.
1988а
Лингвистическая теория в 80-е годы за рубежом: Введение // Проблемы современного зарубежного языкознания: 80-е годы. М.: ИНИОН АН СССР, 1988. С.5-59.
Кибрик А.Е.
1982
Проблема синтаксических отношений в универсальной грамматике // НвЗЛ. Вып. XI. М.: Прогресс, 1982. С.5-36.
Степанов Ю.С.
1985
В трехмерном пространстве языка: Семиотические проблемы лингвистики, философии, искусства. – М.: Наука, 1985.
Филлмор Ч.
1968
Дело о падеже /Пер. с англ. // НвЗЛ: Лингвистическая семантика. – М.: Прогресс, 1981. Вып.10. С.369-495.
Филлмор Ч.
1977
Дело о падеже открывается вновь /Пер. с англ. // НвЗЛ. М.: Прогресс, 1981. ..
Bierwisch M.
1970
Fehler-Linguistik // LI 1970, v.1, p.397-414.
Bresnan J.W.
1982
The passive in lexical theory // J. Bresnan ed. The mental representation of grammatical relations. – Cambr. (Mass.); L.: MIT, 1982. 3-86.
Burkart R.
1983
Kommunikationswissenschaft: Grundlagen und Problemfelder: Umrisse einer interdisziplinären Sozialwissenschaft. – Wien; Köln: Hermann Böhlaus Nachf., 1983.
Butterworth B.L.
1981
Speech errors: Old data in search of new theories // A. Cutler ed. Slips of the tongue and language production. – The Hague: Mouton, 1981. 627-662.
Chomsky N.
1981
Lectures on government and binding. – D.; Cinnamon: Foris, 1981.
Chomsky N., Lasnik H.
1977
Filters and control // LI 1977, v.8, 425-504.
Fay D.
1981
Substitutions and splices: A study of sentence blends // A. Cutler ed. Slips of the tongue and language production. – The Hague: Mouton, 1981. 717-749.
Foley W.A., Van_Valin R.D.J.
1984
Functional syntax and universal grammar. – Cambr. etc.: Cabr. UP, 1984.
Gardiner A., Sir
1932
The theory of speech and language. – 2nd ed-n, 1951. – O.: Clarendon, 1932.
Horn G.M.
1983
Lexical-functional grammar. – B. etc.: Mouton, 1983.
Kühne W.
1983
Abstrakte Gegenstände: Semantik und Ontogenese. – F.M.: Suhrkamp, 1983.
Linell P.
1983
How misperceptions arise // K. Dahlstedt ed. From sounds to words: Essays in honor of Claes-Christian Elert 23 December 1983. – Umeå: Almqvist & Wiksell, 1983. 179-191.
Meringer R., Mayer C.
1895
Versprechen und Verlesen: Eine psychologisch-linguistische Studie.
Montague R.
1974
Formal philosophy: Selected papers / Ed. by R.H.Thomason. – N.H.; L.: Yale UP, 1974.
Welsh C.K.
1983
Putnam's stereotypes and compositionality // CLS, 1983, v. 19, 396-407.
Предисловие. .. . .... ..... .... .... ..3
Глава 1. Интерпретация человеческая и интерпретация машинная.. . .. . ... . .... .5
1.1. Анатомия понятия «интерпретация» ....... 7
1.2. Процедура интерпретирования .......... 9
1.3. Цели интерпретации ............. .12
1.4. Объекты интерпретации ............ .13
1.5. Воплощение результатов интерпретации .... .14
1.6. Опорные пункты и инструменты интерпретации . .17
1.7. Субъект интерпретации: личностные аспекты . . .18
Глава 2. Интерпретирующий подход к ошибкам продуцирования и понимания речи. .. . . ..23
2.1. Ошибочность выражения ............. .25
2.2. Совершенство интерпретации ......... .28
2.3. Непонятность, непонятливость и непонятость . .30
2.4. Ошибки понимания.... . ... . . . . ...33
Глава 3. Специальные теории интерпретации в общем языкознании.. . .38
3.1. Генеративные модели в 1970-1980-х гг. .... 43
3.2. Формальные модели негенеративного типа .... 47
3.3. Неформальные модели общения ......... .49
3.4. Неформальные теории языковой репрезентации . .50
Глава 4. Приложение специальных теорий в вычислительной лингвистике ...55
4.1. Интерпретация как постановка и решение задачи .................... 57
4.2. Строение системы интерпретации ........ 60
4.3. База данных.... . .. . . . . . . . . . . .64
4.4. Грамматика наименований ........... .65
4.5. Интерпретирующий компонент ......... .77
4.6. Системы первого и второго уровней ...... .82
Заключение ....................... 84
Литература ....................... 85