В.З. Демьянков
This page copyright © 2003 V.Dem'jankov.
http://www.infolex.ruМОРФОЛОГИЯ И МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ
ЭКСПЕРТНАЯ СИСТЕМА МОРФОЛОГИЧЕСКИХ ЗНАНИЙ
ФОРМАЛЬНЫЕ МОДЕЛИ МОРФОЛОГИИ
СЛОВОИЗМЕНЕНИЕ И СЛОВООБРАЗОВАНИЕ
ЛЕКСИКОН В МОРФОЛОГИИ
ГИПОТЕТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ В МОРФОЛОГИИ
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА
Научно-исследовательский вычислительный центр
В.З. ДЕМЬЯНКОВ
МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ТЕКСТА
И ЕЕ МОДЕЛИРОВАНИЕ
Издательство Московского университета, 1994 (Электронная версия монографии, вышедшей небольшим тиражом)
ББК 81.1
Д 30
УДК 410.417.801
Рецензенты:
доктор филологических наук, профессор А.Е.Кибрик,
доктор филологических наук, профессор Б.Ю.Городецкий
Печатается по постановлению Редакционно-издательского совета
Московского университета
Демьянков В.З.
Морфологическая интерпретация текста и ее моделирование. М.: Изд-во МГУ, 1994. 206 с.
ISBN 5-211-03219-5
Учебно-методическое пособие посвящено морфологической проблематике создани экспертных систем лингвистических знаний. Дается обзор современного состояния разработки морфологических интерпретаторов, рассматриваются концепции и методы современной морфологии. Особенное внимание уделяется концепции универсальной морфологии, нашедшей применение в экспертной системе морфологических знаний, настраиваемой на параметры различных естественных языков.
Для студентов старших курсов и аспирантов, специализирующихся в области теоретического и прикладного языкознания, а также разработчиков систем искусственного интеллекта.
077(02) 94 заказное ББК 81.1
ISBN 5-211-03219-5 © Московский государственный университет, 1994
Как и интерпретация вообще, морфологическая интерпретация истолкование словоформ опирается на постоянно меняющуюся базу знаний.
Наилучшей моделью такого изменения является при уровне научной технологии последних лет экспертная система. Создание этой экспертной системы было основной нашей задачей.
Цель данной книги тройная. Во-первых, описать основы морфологического моделирования. Во-вторых, дать преподавателям достаточный справочный материал по современным морфологическим теориям, особенно по теориям словоизменени (словообразованию мы надеемся посвятить не меньшую по объему работу). В-третьих, вкратце описать построенную нами оболочку экспертной системы лингвистических знаний.
В первой главе рассмотрены задачи теоретической морфологии, во второй проблематика экспертных систем. Эти две главы вводят в нашу проблематику с двух разных сторон. В третьей главе описывается спектр "формальных моделей морфологии". Читатель должен сам решить, какой подход ему наиболее близок, мы не стремимся навязать ему свои вкусы.
В четвертой главе речь идет об основных проблемах словоизменения и о том, как обычно решают эти проблемы морфологи. В пятой же главе мы рассматриваем морфологические аспекты лексикона языка, в первую очередь, те, которые затрагивают морфологическую интерпретацию словоформы. Наконец, шестая глава посвящена нашей концепции морфологической интерпретации, устройству экспертной системы и приемам обращения с нею.
-4-МОРФОЛОГИЯ И МОРФОЛОГИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ
Термин "морфология" как название раздела языкознания, занимающегося установлением и описанием морфемного состава конкретного языка [132, с.17], заимствован в 1859 г. Шлейхером из биологии [328, с.9] в понимании, близком к тому, что Гёте называл морфологией в естественных науках. Цель лингвистической морфологии описание структуры слов, рассматриваемых как вторичная сущность. Эта структура определяется подобно молекуле как конфигурация "кирпичиков" смысла.
Это значение термина унаследовано и структурализмом, к задачам морфологии относившим устанавление разложимости слов т.е. сегментирование и классифицирование мельчайших значимых элементов [132, с.17]. Поскольку "для знания слова говорящему нет необходимости знать, т.е. воспринять и усвоить в отдельности все словоформы, которыми оно может быть представлено" [42, с.22], морфологи с полным правом предполагают, что "слово (в общем случае) представляет собой комплексную знаковую единицу, то есть членится на элементы знакового характера" [6, с.31].
Каталогизировать мельчайшие элементы, установив законы их комбинирования, а тем самым исчислив все возможности языка, было в духе девятнадцатого века. Вспомним таблицу Менделеева. Судьба этой идеи в языкознании значительно сложней. Филологи давно уже отказались от надежды свести описание эволюции слов в индоевропейских языках к комбинированию четырехсот или пятисот базисных корней, тем самым разгадав секреты происхождения языка. А ведь именно так ставилась задача в Оксфордских лекциях Макса Мюллера [260]. История индивидуальных языков больше не рассматривается прямолинейно в дарвинистском русле, а сфера морфологии да и языкознания в целом больше не ограничивается историей языка [247, с.3]. Морфологией чаще называют более общий раздел языкознания, занимающийся "формами слов" в различных употреблениях и конструкциях [247, с.3].
Первоначальная идея каталога морфем (как теперь стало принято называть эти элементы языка) трансформировалась в попытки
-5- более широкого взгляда на структуру языка, что привело к бурному и продуктивному развитию морфологических исследований в последние годы см., например, обширную библиографию [71], охватывающую 1960-1985 гг. и содержащую в качестве индекса таксономию терминов морфологии.Можно выделить три типа определений морфологии. Это исследование:
1. Морфемного состава языка [132, с.17], то есть звуков и звуковых комплексов, связанных со значением и образующих "знаменательные (морфологические) части слов, каковы: корень, префикс, суффикс, окончание и основа; при этом она показывает, как язык пользуетс ими для изменения слов по склонениям и спряжениям, а также для словопроизводства. Вместе с тем морфология группирует самые слова по характеру их значения и формы в те наиболее крупные разряды, которые известны под названием частей речи" [4, с.91]. Это значит, что морфология исследует отношения между минимальными языковыми единицами вместе с их семантическим содержанием [97, с.V]. Например, "то, что дает право смотреть на всякий звук или совокупность звуков речи, обладающие известным значением, как на морфемы вообще[ ], как в данном языке создаются те отношения между морфемами разных типов, которые порождают слово с точки зрения его внутреннего устройства[ ]; так, она изучает не звук, вид и значение различных морфем, а только возможные в данном языке отношения между морфемами, порождающие слово как известную форму (думаю, что, говоря так, употребляют этот термин в духе учения Фортунатова)" [9, с.219]. В сферу морфологии входят лексические и грамматические категории, проявленные морфемами слова [241].
2. Форм слов [35, с. 37], а точнее, структуры слов и путей, которыми структура слов отражает отношение этих слов к другим словам как в рамках некоторой конструкции, их включающей (предложения), так и в рамках всего словаря языка [64, с.146]. В иных терминах изучение конструкций, в которых роль играют "связанные формы" [3, с.195]. Такую структуру иногда
-6- называют "внутренней структурой" слов [198, с.113]. Цель морфологии построить теорию дл описания таких структур в любом языке. Причем, по Е.С.Кубряковой: "Тенденция поставить во главу угла не морфему, а слово сближает современный период развития морфологии за рубежом с традициями отечественного языкознания, для которого морфология была всегда не столько учением о морфеме, как, например, для дескриптивистов .., сколько учением о слове и репрезентирующих его морфологических структурах" [27, с.158]."Техника" описания в различных концепциях бывает разной. Например, кроме поняти морфемы, используют понятие процесса: о словах говорят как "формирующихся" сущностях. Так, форма feet представляется как foot плюс замена [u] на [i]. При такой постановке вопроса морфология описывает процессы синтеза и анализа слов при использовании содержимого лексикона и правил продуцирования слов [205, с.17-18], а задача морфологии описать и объяснить процессы создания, использования и восприятия единиц со статусом слова в речевой деятельности, выяснить роль морфологических процессов и морфологических единиц в осуществлении речевой деятельности [26, с.60].
Например, в одной из реализаций такого подхода стремятся выяснить соответстви "между глубинно-морфологическим ("морфолексемным") представлением словоформ и их фонетической (или графической) репрезентацией" [6, с.16]. Причем: "переход от смысловой записи к (глубинно-)морфологическому представлению высказывания осуществляется в пределах семантического и/или синтаксического, а не морфологического компонента. Дл морфологии же глубинно-морфологическое (в наших терминах морфолексемное) представление словоформы (типа "1 лицо единственного числа наст.-буд. времени от глагола играть" или играть 1 ед.наст., "им. падеж единственного числа от сущ. дом" или дом им.ед. и т.п.) считается заданным извне" [6, с.16].
Компромисс между "морфемоориентированным" и "словоориентированным" подходами представлен той концепцией, в которой считается, что морфология "призвана описывать словоформы данного языка более экономным способом, чем простое их перечисление (т.е. чем просто составление списка словоформ с сопоставленным
-7- каждой словоформе значением). Эта задача выполнима постольку, поскольку в общем случае слово представляет собой сложную структуру, не элементарный знак, а сочетание элементарных знаков, т.е. комплексную знаковую единицу с означаемым, членимым на элементы, которые сами являются означаемыми, и, соответственно, с означающими, членимыми на элементы, которые сами являются означающими[ ] Иными словами, возможность отказаться от "словарного" способа описания соответствий между формой и содержанием словоформ обеспечивается фактом наличия частичного фонетико-семантического сходства каждой данной словоформы с рядом других" [6, с.55].3. Формы означающих в широком смысле [145, с.361] не отдельных морфем и не словоформ, а более общих объектов основных значений и конструкций, представленных в языке, и их взаимосвязей в данной лингвистической системе независимо от их дополнительного значения [46, с.267]. Речь идет о группировках "языковых средств с точки зрения их формальной близости в противоположность науке о языковой номинации и науке о языковом соотнесении" [33, с.200]. Иногда эта задача расшифровывается как исследование не слов (это задача морфосинтаксиса), а продуктивности форм выражения и принципов перекодировки языковых содержаний [168, с.58]. Именно в этом значении используется данный термин в словосочетании морфология сказки.
В данной работе мы используем термин морфология скорее в первых двух значениях, а термин морфологическая интерпретация связан у нас с компромиссом между морфемоориентированной и словоориентированной трактовками морфологии.
Традиционные грамматики видели в изучении слов и отношений между словами контекст для решения даже проблем, сегодня относимых к ведомству синтаксиса и фонологии. Морфология была краеугольным камнем лингвистики в целом [64, с.146].
В русле когнитивистской волны последних лет общую цель морфологической теории видят в объяснении наиболее обычных для человеческих языков свойств морфологических систем (например,
-8- фузию, алломорфию и т.д.) через призму когнитивных характеристик человека как такового [97, с.3].Кроме этой глобальной цели, морфологи-теоретики стремятся ответить на следующие вопросы, касающиеся синхронии языка [245, с.97]:
1. Каковы базисные единицы морфологической структуры и каковы отношения между этими единицами?
2. Как сигнализируются или реализуются эти единицы в фонологической структуре предложения?
3. Каковы критерии морфологического анализа конкретного языка?
В 1940-х начале 1950-х гг. ответы на первые два вопроса казались тривиальными. Обсуждался в основном третий вопрос. Первые два вопроса особенно заволновали лингвистов в 1970-е годы. Какова же причина такой динамики интереса к морфологии?
Главный вопрос в 1940-е гг. был связан с выделением морфемы: как организовать формальную процедуру этого выделения, которая давала бы "объективную" картину [245, с.114]. Высшим достижением в этой области обычно считают работу З.Харриса [165]. С распространением идей генеративизма (см. [108]) этот вопрос перестал интересовать теоретиков, хотя по-прежнему он не до конца ясен для составителей практических грамматик и словарей.
Объяснение этому состоит в следующем. Если рассмотреть историю теоретического языкознания за последние 125 лет, можно заметить, что интерес к морфологии возникал только в теоретических течениях, достигших определенной зрелости [64, с.146]. Например, младограмматики перешли к морфологии, только "освоив" фонологию. Так же обстояло дело с американским структурализмом, а затем и с генеративизмом. Именно зрелым состоянием генеративизма и объяснимо то, что после довольно долгого перерыва к середине 1970-х годов морфология вновь стала одним из важнейших полигонов для лингвистической теории.
Были и дополнительные причины для отсутствия интереса к морфологии в 1960-е гг. (о них очень подробно и убедительно говорится в работе Е.С.Кубряковой [26, c.7-9]). Например, иллюзия завершенности, законченности и даже исчерпанности морфологической
-9- проблематики как разработки процедур и условных приемов "вычленения морфем и их отождествления, установления дистрибуции морфем и их окружения и т.д." Это впечатление, впрочем, создалось не на пустом месте: дистрибутивная методика, действительно, к тому моменту исчерпала себя как самоцель и не могла больше ставить каких-либо интересных вопросов перед лингвистом-теоретиком. Эта теоретическая опустошенность отсутствие теоретической проблематики, перспектив для морфолога того времени построить объяснительную теорию языка, которая соответствовала бы стандартам объяснительности, наводила на мысль, что морфология (того времени) не соответствовала общенаучным стандартам теории."Методический" этап языкознания к этому времени был позади, и лингвисты-теоретики не признавали уже за чистой методикой статуса теории. Новые стандарты объяснительности требовали также "другого стиля мышления более абстрактного уровня рассуждений, использования большого количества формул или близких к ним построений, иной степени отвлечения от конкретных данных, знания логики и отчасти математики и т.д." [26, c.8].
Сказалось и увлечение синтаксисом, даже мода на синтаксис в то время. Все остальные традиционные лингвистические дисциплины должны были (в соответствии с духом времени) только обслуживать синтаксическую теорию. Собственно морфология как комплекс проблем, связанных с соположением элементарных значимых единиц в рамках слова растворилась в фонологии и синтаксисе. Тогда обычно считали, что морфология вспомогательный уровень структуры между фонологией и синтаксисом. На нем описывается внутренняя структура, или "форма" слов (при этом под словом понималась последовательность морфем), а синтаксис описывает, как эти слова сочетаются в рамках предложений. Заметим, что такой взгляд, согласно которому между синтаксисом и морфологией нет четкой границы, не был нововведением генеративистов: он встречается значительно раньше (см., например, [272]). В начале 1970-х гг. положение это квалифицировалось как чрезмерное огрубление [235, с.96].
Менее существенным хотя и часто упоминаемым фактором было якобы пренебрежительное отношение к "поверхностной структуре"
-10- языка. Мне хотелось бы напомнить, что правильность и семантические свойства именно "поверхностных" реализаций "скрытых" (или "глубинных" и "семантических") языковых структур были тем основанием, на котором исследователь строил свою порождающую грамматику. Именно реальные предложения, нарушающие стройные гипотезы об исходной репрезентации предложений данного языка "контрпримеры" для теории, погребли огромное количество несостоявшихся грамматических построений. Когда царит дух опровержимости ("фальсифицируемости", у К.Поппера) как непременного качества хорошей научной теории, наблюдаемые "поверхностные структуры" играют решающую роль. Теория морфологии, сложившаяся к 1960-м годам вне генеративизма, мало зависела от реальных примеров и контрпримеров несмотря на обилие иллюстративного материала в публикациях того времени. Это и предопределило отношение к ней.В начале 1990-х гг., когда имеется большое количество конкурирующих концепций, морфологические теории различаются по следующим "параметрам" [80, с.487]:
- стандарты объяснительности,
- ставится ли вопрос об описании семантических свойств сложных слов и как это описание организовано,
- использование понятия морфологической продуктивности,
- какая ось структуры слова парадигматическая или синтагматическая находится в центре исследования,
- трактовка отношения между морфологией и синтаксисом.
Все предложенные когда-либо модели морфологии, трактующие словоизменение, вслед за Ч.Хокеттом [171] условно разбивают на три группы [154, с.11]:
1. Модель "единица и упорядочение", связанная с установлением инвентар морфологических элементов (морфем) языка и выяснением того, какие их комбинации допустимы, а какие нет.
2. Модель "единица и процесс", в которой из исходных элементов получают поверхностные структуры.
3. Модель "слово и парадигма", в которой слово подчинено парадигме.
Ниже кратко охарактеризуем каждую из этих групп.
-11-При этом методе полный морфологический анализ языка включает [171]:
- инвентарь морфем (единиц items, по Хокетту),
- указание порядка следования морфем в слове,
- инвентарь морфов реализаций морфем в словоформах.
Словоформу анализируют как комбинацию морфем, расположенных в некотором порядке, и оперируют терминами статики [75, с.401]. Например, глагольное словообразование описывается так [75, с. 402]:
1. Каждая глагольная форма, функционирующая как обозначение третьего лица единственного числа настоящего времени, причастия или герундия состоит из основы и флексии.
2. Различные фонематические представления конкретной основы, взятой вне флексии, и различные фонематические представления флексии, взятой вне основы, считаются морфемными альтернантами некоторой морфемы.
3. Один из альтернантов морфемы может быть нулевым, но не может быть морфем без ненулевых альтернантов.
4. У разных морфем могут быть общие альтернанты.
5. Фонематически различные формы, встречающиеся в одном и том же окружении и не являющиеся свободными вариантами друг друга, считаются морфемно разными.
Затруднения возникают из-за "внутренней флексии", особенно аблаута [245, с.98-99], cp. sink sank, drink drank, sing sang и т.д.: налицо неуникальное соотношение форм. Говорить о мене i на a как о "морфе" (см. [164, с.167], [266]), с заменяющим статусом, значит ставить под сомнение принцип линейного расположения сегментов [69], [171].
В работе [75] утверждается, что слово sank целиком является сигналом дл лексического элемента sink, а "прошедшее время" представлено нулевым морфом в конце слова. Это решение удовлетворило не всех [266], а потому Хокетт обратился к иным моделям объяснения. Однако в "стратификационной грамматике" [217], [218], [148] к этому решению вернулись:
1. Указанные примеры дают основание для разграничени
-12- различных уровней слоев анализа ("страт" отсюда и название концепции). Альтернанты обычной морфемы D, выражающей прошедшее время, содержатся в формах типа waited, hissed, turned, shown (в последнем случае морф -n вместо ожидаемого ed). Имеем три уровня анализа для словоформы waited:WAIT прич. прош. вр. weit D weit id
Самый верхний уровень задан в терминах морфем из лексикона, второй промежуточный морфонематический уровень (morphon у С.Лэма), третий фонетический.
2. Есть процедура трансдукции перехода с одного слоя на другой.
Словоизменение описывается в терминах процессов, дающих словоформы от исходных основ [75, с.399]. Так, претеритная форма waited считается результатом присоединени суффикса к основе wait, took образуется от take в результате мены гласной, built в результате мены согласного в основе build, sold
- от sell в результате мены гласного и добавления согласного суффикса, went от go в результате супплетивизма, put от put с помощью нулевой мены.
Слово уподобляется серии "волн" (а не частиц-морфов), когда пик одной волны соответствует одной морфеме, пик следующей волны другой морфеме, а промежуточное пространство заполнено аморфной жидкостью [273], [275, с.656], [276].
Например, в латинском склонении в форме mensas (род. падеж ед. числа от mensa "стол") пик первой волны mens, пик второй волны s, а долгий гласный a между ними промежуточный материал.
Образование форм рассматривается как процесс "волнообразования", состоящий из трех стадий:
1. Построение исходной репрезентации, когда пики морфем записываются одна за другой в нужной последовательности. Скажем, к sink справа присоединяется Past Tense, к mens присоединяетс
-13- s и т.д.2. Некоторая часть морфем (типа Past Tense) влияют на соседние морфемы. Так, sink превращается в sank. Исчезая, такие морфемы запускают процесс изменени i в a.
3. Наконец, к работе приступает морфонемика, сопоставляющая репрезентации, возникающие на первых двух стадиях. Так, получив в качестве показателя прошедшего времени D, корень hiss дальше взаимодействует с этой флексией, в результате последн оглушается, превратившись в сегмент t.
Динамические термины этого подхода наследие древности [245, с.104]. Третьей стадии соответствуют правила сандхи. Использовались правила этого типа и у структуралистов [77]. Однако эксплицитно динамическую окраску получило морфологическое описание словоизменения в генеративных грамматиках, начиная с модели "Синтаксических структур" [108, с.32], а затем широко использовалось в стандартной генеративной фонологии [115].
Этот подход использует традиционное понятие парадигмы словоизменения [245, с.108]:
1. В каждой лексеме выделяется основа.
2. Выделяется серия морфологических процессов, запускаемых при наличии соответствующих свойств грамматического слова.
Например, в итальянском основой лексемы cantare "петь" считается canta. Если получаемому (или интерпретируемому) слову приписано свойство "будущее время" или "сослагательное наклонение", то добавляется r с ударением на последующем слоге. Если слову приписано свойство "кондиционалис" и т.д., добавляется ударное e. Получаема форма преобразуется по морфонематическим правилам. Например, базисная репрезентаци canta-r-e-bb-ro (bb и ro добавляются в результате еще каких-то процессов) преобразуется так, что второе a переходит в e (в результате взаимодействия с ударением в следующем слоге), вставляется гласная e для разделения bb и ro. Окончательный результат: canterebbero. Особенности этого подхода, вопросы, им решаемые, продемонстрируем на следующих примерах [245, с.107], ср. [281]:
-14-1. Сравним формы итальянского языка: donna "госпожа" donne "госпожи" (мн.ч.), monte "гора" monti "горы" (мн.ч.), ragazzo "мальчик" ragazzi "мальчики", dito "палец" dita "пальцы". Можно ли сказать, что окончания "сигнализируют" об единственном числе, противопоставляемом множественному (ср. [274] и [111, с.170 и след.])?
2. Возьмем в итальянском же форму canterebbero "они пели бы". Где в точности можно провести границу между морфемами (ср. [244], [215])? Ведь из сопоставления с другими формами и основами видно, что:
- сослагательное наклонение сигнализируется сегментами: r, e, bb, (e)ro,
- третье лицо сегментами bb, (e)ro,
- множественное число сегментом ro.
3. Почему элемент, входящий в последовательность морфем, идентифицируетс признаками до и после корня? Почему морфема в начале слова предписывает выбрать тот или иной конкретный альтернант морфемы после нее или даже в конце слова?
Сторонники подхода "слово и парадигма" так отвечают на эти вопросы [247, с.144]. Морфемы линейно упорядочены, но являются не самостоятельными сущностями, а всего лишь свойствами конкретного слова в целом. И наоборот, контрастные свойства слова в целом считаются отдельной морфемой. Морфемы обычно, но не всегда, можно прямо указать в слове.
Признаки, приписанные некоторому морфосинтаксическому свойству, т.е. "экспоненты" (exponents) этого свойства [247, с.144], соответствуют противопоставлениям, навязываемым парадигмой для данной лексемы. Экспонирование (exponence) бывает кумулятивным (cumulative), развернутым (extended), слитым и накладывающимся (overlapping).
Например, в русском языке падеж и число приписаны окончаниям кумулятивно: одно и то же окончание экспонирует и ту, и другую категорию. При развернутом же экспонировании морфологическим признакам приписаны две или большее количество позиций в слове. Например, в древнегреческих формах leluka, leloipa вид маркирован одновременно с помощью редупликации и суффиксом
-15- и/или чередованием корня. В арабском настоящее время экспонировано одновременно префиксом (a, ta, na и т.д.) и соответствующим чередованием корня (в прошедшем времени имеем katab, в настоящем ktub). Ср.: aktubu "(я) пишу", naktubu "(мы) пишем", katabtu "(я) писал", katabna "(мы) писали" и т.д.В отличие от кумулятивного экспонирования, слитое экспонирование фузия результат особого процесса, сандхи, и связано с фонологической, а не морфологической закономерностью. Например, в испанском языке в форме второго лица множественного лица действительного залога настоящего времени vivis < viviis "(вы) живете" (cp. comprais "(вы) покупаете") окончание is являет пример фузии, а не кумулятивного экспонирования [247, с.147]. Исторически фузия в данном случае представляет развернутое экспонирование.
Пример накладывающегося экспонирования лицо и число в древнегреческом, никогда ни экспонированные порознь, как и залог и время. Эти категории как бы накладываются друг на друга.
Затруднения с данным подходом, основанным на понятии слова как физически данной единицы (исключение шаг в сторону абстракции делается разве что для понятия лексемы) возникают при описании очень многих моментов словоизменения. Тогда исследователю приходится прибегать примерно к тем же "маленьким хитростям", что и при подходе "единицы и арранжировка".
Все указанные модели имеют свои сильные и слабые стороны. Некоторые теоретики подумали поэтому, что для разных типов языков следует использовать и разные подходы [281, с.137], а языки можно отнести к тому или иному типу в зависимости от оптимальной для него морфологической концепции (ср. [242], [234], [70], где близкое положение принимается дл фонологического описания).
Однако эта установка принципиально противоречит общенаучным стандартам теории [245, с.108]:
- универсальности, то есть применимости к любому объекту (языку), более того,
-16-- безоговорочности, то есть применимости к каждому конкретному исследуемому объекту (к языку, в данном случае) в максимальной степени, без каких-либо оговорок об особых, специальных случаях.
Экспертная система лингвистических знаний, по определению, должна работать при самых разных теоретических предпочтениях потенциального пользователя и позволять верифицировать произвольную концепцию на фоне материала конкретного языка. Наша задача состоит поэтому в разработке не метаязыка или еще одной концепции морфологии, а метаметаязыка, на котором формулируемы произвольные концепции без вмешательства во внутреннюю механику системы.
Морфологическая система конкретного языка определяется как свойства и взаимосвязи языковой системы в целом, затрагивающие структуру слов (точнее, "морфологических слов" [328, с.35]) и словоформ. Она задается принципами, определяющими синхронную структуру слова (и взрослого носителя языка, и ребенка) и морфонематические изменения в истории языка [178, с.42-43]. Эту систему можно представить и как совокупность наборов (множеств) элементов, находящихся в бинарных оппозициях с остальными членами, когда каждый набор соответствует некоторой морфологической подсистеме, скажем, системе вида или времени, числа или лица. Морфологическая система в целом совокупность не отдельно взятых этих членов, а неделимых групп. Отсюда вытекает возможность оперировать этой системой в терминах абстрактной алгебры [90, с.141].
Видимо, в силу такой глубокой внутренней организации морфологическая система "в наименьшей степени, сравнительно с другими сторонами языка, подвержена воздействию со стороны других языков, родственных или неродственных, а поэтому в большей степени доступна для определения ее собственных закономерностей развития" [28, с.4].
-17-Есть два основания, по которым морфологию подразделяют на поддисциплины:
1. Тип рассматриваемого объекта. С этой точки зрения морфология подразделяется на две большие области [247, с.38]:
- словоизменение, занимающееся процессами, связанными с флексией,
- словообразование, в которое входят две подобласти исследования:
- деривация; например, рассматривается, как слово рисование и рисунок получаются от рисовать; деривация связана с теми случаями, когда имеется по крайней мере один форматив (-унок, -ование), не употребляемый самостоятельно,
- композиция, или основосложение: как образуются единицы типа ice-cream от ice и cream, а русское пароход от пар и ход; то есть случаи, когда обе части основы представляют собой самостоятельные основы.
2. Внутренняя организация морфологического описания. По этому основанию выделяются "модули" [331, с.198-199]:
- морфосинтаксис правила группирования морфологических единиц в более крупные образования в слова и/или словоформы,
- правила чередования,
- морфонематические правила,
- лексикон, или "лексический компонент", в котором не только собраны все лексические единицы конкретного языка, но и заданы импликативные связи между их различными свойствами ("правила лексической избыточности").
Понятие "слово", существенное для разграничения морфологии и синтаксиса, всегда определяют в рамках общетеоретической концепции. Поэтому водораздел между этими дисциплинами также концептуально зависим [247, с.7].
-18-Стремясь к единообразию теории, З.Харрис [166] объединял морфологию с синтаксисом. Его "синтаксическая морфология" исследует морфологическую организацию предложений, закономерности соединения форм языковых знаков в предложения [87, с.114]. Поэтому, скажем, показатель времени является независимой составляющей предложения, вне глагола как слова [255, с.2].
Чаще же разграничивают синтаксис и морфологию [261, с. 279], ср. [272]. Синтаксис занят внешними функциями слова и отношениями между словами в предложении, а морфологи внутренней структурой слов и отношениями между словами в рамках парадигмы [247, с.154]. Промежуточные случаи словообразование. Если трудно отграничить словоизменение от деривации [261, с.309], берут на вооружение "словообразовательный подход к словоизменению".
Поскольку же внутренняя структура слова кажется неуниверсальной, свойственной конкретному языку, часто полагают, что морфологические критерии ненадежны при универсально-синтаксическом описании [59, с.18]. Скажем, использование именительного и эргативного падежей не указывает прямо на синтаксическую структуру: языки часто прибегают к смешанному типу, когда переходные глаголы в форме перфекта или прошедшего требуют эргатива, а в иной форме номинатива. Понятие "личная форма глагола" являетс морфологическим, а синтаксис, основанный на морфологии, в силу указанной презумпции, не считается вполне универсальным [117, с.67]. В некоторых языках местоимения подчиняютс иным законам, чем полные именные составляющие.
Поэтому приходится быть начеку и устанавливать, отражает ли морфологическа реализация синтаксические отношения или камуфлирует их.
Презумпция неуниверсальности морфологии была причиной недоверия к морфологической типологии [49, с.300]. Мы полагаем, что морфология конкретного языка, как и синтаксис, дает параметризацию универсального каркаса. Этот каркас универсальна морфология "оболочка" нашей экспертной системы языковых (в частности, морфологических) знаний. Человек-эксперт, заполняющий или корректирующий сведения, хранимые в этой системе, параметризует конкретный язык.
-19-Известно, что грамматические отношения в рамках словосочетания морфологически маркируются либо в главе, либо в зависимом члене составляющей, либо в обоих членах, либо ни в одном [265, с.56]. Наболее распространенной (по количеству языков) является маркировка главы (как, например, в тюркских и в венгерском языках), ср. венг.:
az ember ház-a (букв. артикль + человек + дом + показатель принадлежности) "дом человека".
А теоретики чаще рассматривают в качестве наиболее типичной противоположную маркировку, доминирующую в индоевропейских языках, типа русского дом человека. Человек-эксперт должен одинаково ровно относиться ко всем четырем логическим возможностям универсального каркаса.
Языки параметризуются относительно частей каркаса в соответствии с используемыми типами маркировки, обладающими, кстати, консервативным характером, а потому дающими ключ к генетическому родству языков. (Интересно, что в отличие от словообразования, в словоизменении каждого конкретного языка последовательно используется только один из указанных типов.)
В морфосинтаксисе рассматриваются контуры связей между языковыми средствами и процедурами составления предложений [168, с.38]. Части предложения и процедуры комбинирования этих частей взаимозависимы. Поскольку языковая форма есть единство содержания и выражения, проявленное во взаимосоотнесении частей и процессов их комбинирования, исходным материалом для морфосинтаксического анализа, по мнению приверженцев этой гибридной дисциплины, является "мысль" (в смысле Gedanke у Г.Фреге), подлежащая выражению [168, с.8]. Задача же морфосинтаксиса состоит в сегментировании слов [168, с.53].
Морфосинтаксис как методика анализа предваряющий этап рассмотрения языковых фактов в аксиологическом (семантико-референциальном и понятийном) ключе. Путь этого анализа таков [139, с.217-218]:
1. Начиная с наиболее крупных единиц, исследователь спускается все ниже до самых мелких единиц, держа в фокусе внимания не слово или морфему, а словосочетание.
2. Словосочетания типологизируются как глагольное, именное,
-20- внекатегориальное. Считается, что в каждую языковую единицу входят:- один непременный элемент ядро,
- остальные элементы (наличие и природа которых зависят от природы единицы в целом и/или ядра), иерархически подчиненные ядру или даже более крупному образованию,
- те категории, которые придают единице языковой статус.
3. Анализ внутри словосочетания, приводящий к установлению функциональных групп и формативов.
Именно морфосинтаксической является так называемая морфологическая типология Дж. Гринберга [12], позволяющая [253, с.2] наглядно параметризировать морфологическую структуру разных языков и сопоставлять эти параметры у разноструктурных языков. Основна методическая гипотеза этой типологии: можно установить (в количественных терминах) основные морфологические и синтаксические процедуры на основе пяти формальных оснований классификации:
- общая сложность слова,
- техника соположения составляющих в рамках слова,
- наличие или отсутствие корневых, словоизменительных и словообразовательных элементов,
- порядок следования элементов, подчиненных корню (префиксов и суффиксов),
- корреляции с отношениями между словами.
Как отмечает Б. Комри [121, с.43], вряд ли какой-либо реальный человеческий язык можно отнести к чисто изолирующим, агглютинативным, фузионным, полисинтетическим, на основе параметров, вычисляемых на при помощи перечисленных критериев. Каждый язык занимает некоторую позицию между противоположными полюсами на шкале: синтез (среднее количество морфем на слово)
- фузия (степень, в какой морфемы в рамках слова поддаются членению, при двух полюсах: агглютинация и фузия). Морфологическая типология задает континуум переходов от одного элементарного типа к другому. Некоторые из вычисляемых индексов логически не элементарны [121, с.48]. Например, индекс фузии связан с двумя логически независимыми параметрами: со степенью выделимости морфем и с отсутствием чередований.
-21-Итак, можно не просто параметризовать языки, но и установить взаимозависимости между различными параметрами. Для этого необходим инструмент, более тонкий и надежный, чем обычная картотека лингвиста. Именно таким инструментом и является экспертная система лингвистических знаний.
Морфонология, или морфофонология, или (особенно в американской лингвистике) морфофонемика, или (поскольку термин "морфофонемика" предполагает существование фонемного уровня) "системная фонемика" ([110, c.87], см. также [326, с.273]), составляюща граничную зону между морфологией и фонологией, содержалась в неявном виде в различных лингвистических традициях. В индийских грамматиках санскрита были детальные правила чередования [206]. И.А.Бодуэн де Куртенэ [5] усовершенствовал этот подход и предложил детализированную общую теорию сандхи, гуна и врдхи, создав, по [140, с.63], предпосылки дл собственно морфонологии.
Отцом-воссоздателем морфонологии был Н.С.Трубецкой, писавший: "До сих пор морфонология была в Европе одной из самых заброшенных областей грамматики. Если сравнить в этом плане теории древних греков и римлян с теориями древнееврейских, арабских и в особенности древнеиндийских грамматистов, то бросается в глаза недостаточное понимание морфонологических проблем в период античности и средневековья в Европе. Однако и в новое время такое положение не претерпело существенных изменений. Современная семитологи попросту позаимствовала морфонологические теории у арабских и древнееврейских грамматистов, не приведя их в соответствие с современными научными точками зрения. Индоевропеисты положили в основу морфонологии индогерманского праязыка морфонологические теории индийцев, тщательно их разработав, вследствие чего возникла так называемая индоевропейская система аблаута и вся теория индоевропейских корней и суффиксов" [47, с.115]. И далее: "Однако если рассмотреть
-22- результаты, полученные современной индоевропеистикой в этой области, то становится ясно, что в сущности они не имеют ничего общего с собственно морфонологическим методом: корни ("основы") и суффиксы приобретают здесь характер метафизических сущностей, а аблаут становится своего рода магическим действом. Характерной чертой является также отсутствие здесь связи с каким-либо живым языком" [47, с.115].Морфонологи стремились выявить факторы чередования морфов одной морфемы, не объяснимые чисто фонологически. В этом была новизна их подхода: предшественники Трубецкого не признавали, что "морфонология не только для праязыка, но и для каждого отдельного языка составляет особую и самостоятельную область грамматики: обычно морфонологию трактовали как результат компромисса или взаимодействия между историей звуков и историей форм и рассматривали одну часть морфонологических явлений в фонемике, а другую в морфологии" [47, с.115]. Морфонология же Трубецкого "заставила обратиться к поискам других причин, вызывающих чередования в составе морфов одной морфемы или же сохраняющих эти чередования несмотря на мощные процессы унификации и нормировани речи; она помогла увидеть в числе этих факторов содержательные и функциональные" [26, c.12-13].
В США морфонология в середине 1930-х годов стала одним из главных полигонов американского структурализма [77].
Как и названия других разделов грамматики, термин "морфонология" имеет два основных значения [18, с.42]:
- все случаи или система определенных явлений языка,
- учение, исследование, описание или теория таких явлений, в том числе, исследование принципов, обусловливающих эти явления.
К морфонологическим явлениям относят:
1. Материальные аспекты морфемы: грамматические и традиционные чередования [2, с.59], звуковые и фонемные модификации морфем, связанные с различными окружениями последних [18, с.42]; то есть, чередования соответственных фонем в рамках чередующихс форм (shapes) одной и той же морфемы, для образования морфологических элементов (в первую очередь, морфологические чередования) [1, с.52-53]. Это фонемное модифицирование морфем не зависит непосредственно от собственно позиций фонем
-23- [39]. Морфонемика путеводитель по полному списку альтернантов морфем или некоторого разряда форм конкретного языка [75, с.416], своеобразный справочник по фонологической структуре морфемы, а конкретнее по морфонологическим рядам, сводимым к традиционно чередующимся фонемам [32, с.101-118].Эти аспекты связаны с фонемной формой морфем, слов и конструкций в отвлечении от значений ("биосоциальной функции") [169, с.20], типичного облика морфем [170, с.63]. Поскольку во всех языках есть морфемы, морфонемика существенна всегда, даже если у каждой морфемы языка есть ровно одна фонемная реализация [170, с.63], ср. иное мнение у Трубецкого: "Только такие языки, которые не имеют морфологии в собственном смысле этого слова, могут обойтись также и без морфонологии: для подобных языков некоторые разделы, обычно относимые к морфонологии (например, раздел о фонологической структуре морфем), должны включаться в фонологию" [47, с.115].
В морфонологии, таким образом, рассматривается формирование фонемного облика морфем: типичный облик альтернантов, типы чередования и различные контекстные факторы (как фонологические, так и грамматические), предопределяющие условия, в силу которых выбирается тот или иной альтернант морфемы в конкретном окружении [170, с.63].
2. Материальные аспекты слова: структура слова и составляющих его компонентов, заданные в терминах фонем и просодем; в частности, ударение, порядок следования и сочетаемость компонентов слова, правила их варьирования чередования фонем, интерфиксация и др. [38].
3. Материальные аспекты еще более высокого уровня: морфологическое использование фонологических средств конкретного языка [47, с.115], особенно фонологических различий [45, с.21-22]. Такая формулировка дала основание считать [16, с.486], что формирование морфонологии как лингвистической дисциплины результат "последовательного перенесени внимания исследователей с субстанции на структуру, на отношения". Во всяком случае, рассматриваются соотношения между фонологическими и грамматическими структурами (последние задаются в виде иерархии непосредственно составляющих) предложения [104, с.343]
-24- процессы, приводящие к грамматичным последовательностям фонем [108].Как видим, классы объектов морфонологии аналогичны классам объектов морфологии (см. раздел выше), но ограничены "материальной" стороной.
Поскольку объекты морфонологии столь различны, естественно стремление классифицировать задачи этой дисциплины, а соответственно, и ее разделы.
Полная морфонологическая теория, по [47, с.116-117], состоит из следующих трех разделов (из которых только первый несомненно значим для всех языков):
1. Теория фонологической структуры морфем; конкретнее, применительно к русской морфонологии [51, с.33], порядок и состав фонем корня, суффикса, префикса, окончания. Иногда этот раздел называют морфолексикой, в противоположность собственно морфонемике [296, с.249]. Например, в генеративных грамматиках морфолексические явлени описываются с помощью упорядоченных между собой правил, преобразующих нефонологическую запись (представление, репрезентацию) морфемы (заданную в виде индексов, наборов синтаксических и семантических признаков) в исходную фонологическую форму (или формы) в морфонематическую репрезентацию. В первых генеративных грамматиках [109] терминальные символы синтаксического дерева предложения превращаютс в фонетическое описание высказывания в результате именно правил морфолексики. И только после этого морфонематическая запись преобразуется в "поверхностную репрезентацию" [246]. Так, в "Синтаксических структурах" Н.Хомского [108] упоминаются следующие правила:
walk --> /wok/
take + PAST --> /tuk/
past --> /d/.
2. Теория комбинаторных звуковых изменений, которым подвергаются отдельные морфемы в морфемных сочетаниях; по [51, с.33], модификации порядка и состава фонем при связывании этих
-25- элементов в слово. Эти вариации, называемые иначе внутренними сандхи, Л.Блумфилд приравнивал морфонемике в целом [77, с.244] и отличал от морфолексической вариации. Имеем:- регулярные модели таких модификаций и их место в системе словообразования и словоизменения;
- нерегулярные явления, такие как [31,с.127-130]:
- чередование конечного согласного основы: новый новь, вертолет вертеть, дикий дичь, сладкоежка еда;
- сдвиг ударения: водопровод проводить;
- усечение основы: крепкий крепость, глубокий глубина, пятипалый палец;
- интерфиксы -л, -в-, -т- в сложениях с нулевым суффиксом: старожил, стеклодув, шерстобит;
- наложение морфем: лермонтовед, яблокрад.
3. Теория звуковых чередований, выполняющих морфологическую функцию то, что иногда [51, с.33] характеризуют как закономерности выбора морфологических элементов, зависящие от состава и порядка фонем в них. Эта "фонология морфологических процессов" описывает фонологические отношения между различными формами реализации, или алломорфами, входящими в слово [205, с.17-18]. Логически возможны три случая:
- чередование (альтернация), когда разница в фонологическом оформлении морфемы связана с морфологическим различием, ср.: скептиК скептиЧеский;
- вариация, когда разница в фонологическом оформлении не связана с морфологическим различием, ср. англ.: burnt burned;
- конверсия без перефонологизации, когда морфологические различия не связаны с фонологическими, например: set как имя, как глагол и как прилагательное.
Морфонемные чередования создают фонетическое расстояние между альтернантами, в одних случаях большее, в других меньшее. Историю морфонемики конкретного языка можно рассматривать как минимизацию расстояния между алломорфами [120, с.51]. Такова судьба некоторых видов чередования (lenition) в валлийском, градация согласных по силе в финском, палатализация в венгерском, спирантизация велярных в турецком. Эти случаи
-26- трудно объяснить иным способом скажем, как избегание неоднозначности или исключений.По какому же принципу сочетаются морфемы в рамках структуры слова? Из множества кандидатов интересным представляется "принцип дополнительности по маркированности" (principle of markedness complementarity), предложенный М.Шапиро [286, с.259]: противоположно маркированные основы и суффиксы притягиваются друг к другу, а идентично маркированные отталкиваются. Так, в японском основы, оканчивающиеся на гласный, немаркированы, а на согласный маркированы. Суффиксы же, начинающиеся на гласный, немаркированы, а на согласный маркированы, ср.: tabe-ru, iki-ru, nusum-u, kos-u [287, с.146].
Указанное трехчастное деление морфонологии не исчерпывает всего терминологического разнообразия в отношении разделов этой дисциплины. Тот же объем задач, но с иными подразделениями и в иных терминах имеется в виду в работе [40,с.148]:
- учение о фонологической структуре сем,
- учение о неопределенности их фонологических структур,
- учение о функциональном использовании неопределенности семы (внутренняя флексия, инфиксация); наиболее важна именно эта задача, хотя есть языки типа турецкого, дл грамматики которых она не существенна.
Есть проблемы в разграничении морфонологии и фонологии, морфонологии и морфологии и даже морфонологии и синтаксиса. Об этом и пойдет речь в следующих разделах.
Морфонология, по большинству определений, охватывает фонологические "приспособления", зависящие от морфологического и/или синтаксического изменени выражения, вызванного морфологическим ядром языка [232, с.129]. "Морфонемна репрезентация" [232, с.103] создана для того, чтобы указывать продуктивные (закономерные) взаимосвязи между фонологически и морфемно соотнесенными формами. Важнейшая функци морфонологических правил получение и интерпретация словоформ. Анализ словоизменения и словообразования во многих конкретных языках [232,с.103]
-27- показывает, что на вход этих правил должны подаваться поверхностные формы, а не инварианты морфем. Причем именно фонемные (а не морфонемные) свойства форм зачастую предопределяют результат работы этих правил.Морфонология исследует не только фонемную структуру морфем, но и чередование морфем как морфологический процесс [304, с.128-129]. Если конкретное морфологическое чередование достаточно регулярно и характерно для языка, чередующиеся фонемы могут рассматриваться как морфологически однородное множество. Морфонема элемент класса этих фонем, рассмотренных как компоненты конкретных морфем, ведущих себя сходным образом в морфологическом отношении, то есть, занимающих сходную позицию в рамках одной и той же серии мутаций. Морфонема никогда не смешивается с фонемой как таковой, даже когда все реализации конкретной фонемы являются членами одного и того же морфонемного класса. Морфонемная запись гибрид между фонологическим и морфологическим представлениями слова, поскольку чисто "морфологическая" запись была бы значительно менее наглядна.
Морфонологическая запись выглядит как последовательность символов фонем и морфонем. А именно [164, с.25], морфему можно записать как комбинацию символов, не меняющихся от контекста к контексту. Например, для морфемы knife "нож", чередующейся с knive (knives "ножи"), имеем запись /naiF/, в которой F компактно представляет набор фонем и указывает на возможность чередования f v. Это F соответствует реализации f в слове knife и реализации v в слове knives. Можно описать условия, когда имеет место одна реализация и когда другая: скажем, перед показателем множественного числа имеем реализацию v, а в остальных случаях f. Таким образом, всевозможные чередования морфем сводятся к чередованиям частей морфемы то есть, к морфонемам [164,с.226-227], и не нужно для каждой морфемы эксплицитно задавать список морфов, ее представляющих: достаточно записать морфему в терминах морфонем и задать набор чередований (с указанием условий, при которых эти чередования происходят), реализующих морфонемы. В нашем примере, использу морфонему F, можно описать свойства целого класса морфем типа: wife "жена", wolf "волк" (ср. формы множественного числа: wives,
-28- wolves). Соответственно, морфонематическая репрезентация этих морфем такова: /waiF/, /wulF/. Такая запись содержит символы и морфонем, и простых фонем. Последние записываются (условно) строчными, а не заглавными буквами, в отличие от морфонем. Использование понятия морфонемы в рамках комбинированной записи и дает экономию описания [164, с.232].Задача морфонолога сводится тогда к тому, чтобы "определять строго синхронически как все морфонемы, существующие в каждом [ ] языке или диалекте, так и место, занимаемое данной морфонемой внутри морфемы" [45, с.21-22].
Морфонему можно поэтому определить так:
- если идти в анализе сверху вниз основная единица морфем, состоящая из разных (в том числе, и в диалектном отношении) вариантов фонем, не противопоставляемых в рамках одной и той же лексической единицы. Бывают систематические чередования морфонем подстановки, модификации, замены [294, с.307],
- если идти снизу вверх звуки, фонемы и/или комплексы фонем, чередующиеся в зависимости от грамматических условий [23], [18, с.42],
- наконец, с точки зрения результата описания "образ, состоящий из двух или нескольких фонем, способных замещать друг друга согласно условиям морфологической структуры внутри одной и той же морфемы" [45, с.21].
Пользуясь понятием морфонемы, лингвист достигает наглядности, но за счет расширени алфавита элементарных символов для записи морфем: к символам фонем добавляются символы морфонем. Следует ли принимать такое расширение всерьез, как соответствие реальности языка, или считать его простым приемом описания? В этом вопросе мнения лингвистов расходятся.
Сторонниками этого взгляда были основоположники морфонологии [45, с.21]. По [264, с.507], важность морфонемы как структурной единицы еще не до конца осознана исследователями. Постблумфилдианцы просто отмахнулись от этой единицы и от методов описания, с нею связанных. Однако морфонемы реальные
-29- фонологические единицы, а не простые фикции описания.Те, для кого морфонема всего лишь исследовательский прием, считают, что после слияния исторически различных фонем теряется навсегда и их идентичность порознь, а последующая фонологическая судьба навсегда едина [175, с.117]. М.Халле [158, с.70] поставил это положение под сомнение, считая, что фонемы, совпавшие на каком-либо этапе эволюции, позже могут возникнуть как полностью различные сущности. Те, кто считают морфонему не фикцией, утверждают [264, с.515]: несмотря на это слияние, звуки, больше не составляющие фонем, могут продолжить свое самостоятельное существование, но на морфонемном уровне. А поскольку слившиеся фонемы ведут себя с синхронной точки зрения не одинаковым образом, будущее их поведение также не обязательно будет одинаковым.
Этого взгляда придерживаются те, кто считает, что хотя морфонология по-своему элегантна, она заставляет абстрагироваться от реальной речи [173, с.221]. Ведь комбинированная запись соответствует некоторой абстракции от фонологической, а потому есть опасность смешать исследовательский прием (в данном случае понятие морфонемы) с реальностью исследуемого явления. Морфонема не входит в язык, а является "маленькой хитростью", приемом лингвиста, не больше и не меньше. Осознание этого позволяет избежать смешения реальности языка с простотой описания [173, с.221].
По логике научного исследования, поскольку понятие морфонемы появилось как удобный прием описания и не является непосредственно наблюдаемой сущностью, тяжесть доказательства реальности лежит на лингвисте, утверждающем, что морфонема больше, чем прием.
В шестой главе мы попытаемся ответить на этот вопрос в следующей формулировке: какая система морфологической интерпретации
-30- будет работать лучше: с морфонемами или без них?Когда описание языка представляется в виде набора правил, работа которых организована по образцу формального механизма (прототипом в этой области часто являетс программа ЭВМ в той степени, в какой она соответствует представлениям лингвистов о когнитивных способностях человека), неизбежен вопрос о том, где, в каком "компоненте" собраны морфонологические правила. Можно выделить следующие группы концепций.
В целом ряде работ конца 1950-х начала 1960-х годов
М.Халле и его соратники по генеративной фонологии [157], [48] пытались показать, что морфонология является частью фонологии, поскольку иначе придется принять, что одни и те же правила входят в оба компонента грамматики, и описание будет пещрить повторяющимис деталями (см. об этом подробнее [140, с.63]). Фактически это возврат к позиции Панини. Взят он на вооружение и в стандартной генеративной фонологии [115].
Разновидностью этого взгляда является тот, при котором не отрицается зависимость морфонологических чередований от морфологии, но морфонология все равно считается частью фонологии. Это компромисс в рамках "лексической фонологии" [79], [256]. Для одного и того же морфологического элемента постулируются несколько лексических статей, а лексические статьи, не маркированные в морфонемном отношении, считаются исключениями.
В этой концепции принимается, что морфонология автономна, несмотря на (кажущуюся) избыточность получаемого описания [177], [222], [128], [98]. Морфонология место встречи морфологии и фонологии языка. Задача морфонологии в рамках описания языка показать, чем заканчивается в конкретных случаях поединок
-31- между противоборствующими тенденциями фонологии и морфологии. В частности между стремлением к формальной прозрачности в морфологии и к наиболее полному соответствию языкового выражения правилам фонологии [205, с.7]. Доводы таковы.1. Как и фонологические правила, морфонематические продуктивны: им подчинены даже заимствованные основы, неологизмы, бессмысленные слова и языковые игры [126, с.8]. Однака различна их мотивация. Правила морфонемики обусловлены грамматически и/или лексически (действительны для одних категорий слов или морфем языка и не действительны для других), а фонологические автоматичны, обусловлены чисто фонологически и не знают исключений [126,с.41].
Как неотъемлемая часть языка воспринимается морфонология и носителями языка, и теми, кто его только усваивает [55, с.11]. В "естественной фонологии" [128] разграничение морфонемики и фонологии параллельно противопоставлению правил процессам [331, с.99]. Отсюда следующее отличие:
2. Фонологические правила при усвоении языка не выучиваются, а просто "не подавляются", поскольку отражают исторические естественные процессы, обусловлены грамматически (или морфемно), потому конфигурации и/или сегменты, возникающие по фонологическим правилам, вполне возможны в иных фрагментах того же языка [123]. А морфонологические правила должны выучиваться как надстройка над фонологическими [126, с.42]: выражения, допустимые чисто фонологически, подвергаются цензуре морфонологии. Недаром ошибки и детей и взрослых связаны именно с игнорированием какого-либо морфонологического правила.
3. Правила морфонемики (или, если угодно, "морфонологические конвенции") имеют отдельную судьбу в истории языка, зачастую характеризуя технику выражения одновременно нескольких морфологических категорий: скажем, лица, числа и времени [55, с.11]. Большинство этих правил возникают как фонологические, создающие фонологически немотивированные чередования в морфологии, а тем самым разрушающие иконичность морфологии. Постепенно морфонемные чередования, сопровождающие определенные морфологические операции, становятся избыточными индикаторами этих операций, даже частью морфологического знака, а когда
-32- уходит в небытие сам этот знак, морфонемное чередование может стать отдельным морфологическим знаком [126, с.51]. Одним из типичных видов изменения является отказ от чередования, то есть восстановление иконической функции, когда одна форма основы обслуживает целую парадигму. По Дардену [126, с.58], когда основа исходной грамматической формы достаточно информативна с точки зрения фонологии, чтобы предопределить необходимость чередования, то именно она становится входом в правило морфонемики: исходные грамматические формы подвержены выравниванию в наибольшей степени, так что количество операций, совершаемых над этими формами, минимизируется.4. Когда фонологическое правило теряет автоматичность и становится грамматически обусловленным, морфонемика отражает знание носителя языка о правильных формах. Семантически значимое наличие или отсутствие чередования при конкретном суффиксе играет прагматическую роль [152, с.176].
Итак (по [125, с.79], но в отличие от концепции [196]), представление о морфонологии как об отдельном компоненте заставляет принять, что правила морфонемики заведуют чередованиями фонем, обусловленными грамматически или лексически. "Автоматические чередования", приводящие к фонологической нейтрализации, также иногда называют морфонемными.
В то же время, в некоторых концепциях этой группы отвергают следующие положени (которые другим кажутся верными):
1. Правила, работа которых зависит от наличия границ каких-то определенных классов, не являются фонетическими, а потому относятся к морфонемике [319], [177, c.14].
2. Внешние сандхи результат грамматического переструктурирования в диахронии, при котором лексической репрезентацией является фонетическая форма слова, произнесенного в изолированном положении [319].
3. Все слова во всех своих формах перечислимы в рамках грамматики [319].
4. Все алломорфы перечисляются в рамках грамматики, причем чередования сегментов представляются как дизъюнктивный набор при каждой морфеме [184], [177, c.73-74].
5. Все правила выражают наиболее очевидные обобщения, относящиес
-33- к поверхностной структуре [177, c.13].6. Влияние фонологии на правила морфонемики сводится к структуре слога и к фонотактическим ограничениям [179].
В этой концепции, как и в классической компаративистской позиции Курыловича [30], морфонология считается частью морфологии [327], [232], пусть даже описание избыточно. Так считают сторонники естественной порождающей фонологии [97, с.V]: морфонемика исследует отношения между алломорфами фонологическими репрезентациями для вариантов одной морфемы, однако является частью морфологии, поскольку именно последняя обусловливает процедуры морфонемики. По [140, с.64-65], морфонологические чередования сводимы к чисто фонологическим условиям правильности (скажем, структуры слога и слова), но вне функции этих чередований. Остальные же чередования относятся к морфологии, будучи результатом морфологических операций. Итак, ни фонологическая природа морфонологических чередований, ни стремление исследователей к экономии при организации грамматики не могут убедить в том, что морфонология полностью отделена от морфологии [140, с.75].
Морфонологические чередования, в отличие от фонологических [140, с.65]:
1. Не имеют фонологических или фонетических ограничений. Например, морфонологическими чередованиями не являются: оглушение согласного на конце слова в немецком, ср. t d в паре Tag "день" (читается: tak) Tage "дни" (читается: tage) и чередование нуля с фонемой e в испанском: tren "поезд" trenes "поезда", но alumno "ученик" alumnos "ученики".
2. Не автоматичны (в смысле: [172]), то есть допустимы только в некотором конкретном морфологическом контексте. Ср:
- нем.: Wald Wälder "лес" "леса",
- исп.: bueno bondad "добрый" "доброта",
- франц.: électrique électricité "электрический" "электричество",
- англ.: wife wives "жена" "жёны".
-34-Участвуя в формировании слова, они часто сопровождаются какой-либо морфологической операцией типа аффиксации, усечения или редупликации, причем связаны с меной морфологических категорий, ассоциированы с некоторой морфологической функцией, т.е. сигнализируют о морфологическом противопоставлении.
3. Не все слова соответствующей морфологической категории подвергаются их действию. Например, умлаут в немецком используется для формирования форм множественного числа далеко не всех существительных.
4. Не всегда бывают "естественными чередованиями", т.е. результатом фонологических процессов (в смысле "естественной фонологии").
5. В истории языка не являются динамичными, т.е. не могут самопроизвольно менять сферу действия, переходя от одного морфологического контекста к другому. В то же время, они могут развиваться даже когда исчезают первоначальные фонологические их причины. А при этом семиотическая мотивация у правил морфонемики не меньше, чем у фонологических, отличие состоит только в деталях механики работы. Поэтому [287, с.156] морфонологические чередования нельзя считать окаменевшими рефлексами фонологических правил.
Различаются два типа морфонологических чередований, а соответственно, два типа правил, обладающих морфонологическим эффектом [232, с.129-130]:
- фонотактические ограничения на план фонетики (фонотактические правила) действительны для всех поверхностных форм, как участвующих в чередованиях, так и не участвующих,
- не мотивированные фонотактически собственно морфонологические правила.
Представители этого взгляда считают, что морфонология не существует как отдельный компонент, а по кусочкам представлена в разных компонентах описания (как и полагали до Трубецкого) и не заключена в колбу фонолога (вопреки мнению Халле) [104, с.343]. Иначе говоря, морфонемика разнородное и логически не
-35- всегда последовательное собрание структур (patterns) и связей.Хотя фонологические различия обычно отражают грамматические и наоборот, однако омонимия часто разрушает эту идилическую симметрию. Омонимия в сочетании с объемом и сложностью семантического универсума время от времени затрудняет анализ. Так, часто бывает, что на некотором уровне следовало бы постулировать два элемента, а не один, но с помощью чисто фонологических приемов нельзя разделить эти два элемента. Поэтому морфонология нотация, алломорфы и процессы всего лишь удобные инструменты описани (как полагал, например, Хокетт [172, c.32-36]). Чем яснее и прозрачнее морфонемное описание и чем ближе оно к ходу исторического развития, тем лучше. Иногда эти два критерия ясности и историчности совпадают, см. [305, с.2], где отмечается сходство пути построения формул морфонемики и реконструкции фонологической истории языка (хотя: "Наиболее удачна формулировка фактов синхронии обычно не выглядит как реконструкция реального исторического развития"). Задача только в том, чтобы узнать, когда лучше придерживатьс одного критерия, а когда другого.
Вопрос, существует ли морфонология, не стоит сводить к выяснению ее местожительства: является ли она частью фонологии, частью морфологии, живет отдельно или по кускам представлена везде. Вряд ли Трубецкой хотел непременно поселить морфонологию отдельно. Это было бы аналогично желанию поселить всех африканистов в Африке, а русистов в России, чтобы люди занимались своим делом по месту прописки.
Итак, не важно, где "живет" морфонология: важно, где она работает. А работает она везде, где есть материальная реализация семантических единиц морфем, слов, предложений, текстов.
-36-ЭКСПЕРТНАЯ СИСТЕМА МОРФОЛОГИЧЕСКИХ ЗНАНИЙ
В первой главе мы только вскользь коснулись идеи экспертной системы морфологических знаний как универсального "метаметаязыка" морфологии. Обратимся теперь к вопросу о предназначении экспертной системы вообще.
В результате широкого распространения персональных ЭВМ построение специальных систем знаний о языке в последние годы стало весьма актуальным занятием. Даже простые системы редактирования текста (с переносом слова со строки на строку, корректировкой орфографии, локализацией ошибки в согласовании имени и прилагательного, когда это существенно), обладающие зачастую весьма ограниченными лингвистическими возможностями, пользуются большой популярностью. По внутреннему устройству эти системы обработки слова, или "морфологические процессоры", сильно отличаются от остальных информационных систем.
В существующих "редакторах" использованы далеко не все ресурсы естественных языков. Например, обычно человек не бракует необычную (не хранимую, ранее не занесенную в систему) основу, построенную по морфологическим законам данного языка. Существующие редакторы бракуют нехранимые основы.
Мы полагаем, что качественно более эффективный, чем существующие, морфологический процессор нельзя построить только с помощью приемов информатики и "маленьких хитростей" случайно обнаруживаемых закономерностей языка. Необходимо опереться на достижения современной общей морфологии как раздела языкознания. Чем шире такой фундаментальный фон, тем больше свобода оправданного маневра при построении системы морфологической обработки текста.
Современные представления о морфологии в теоретическом языкознании, опирающиес на теорию интерпретации, на типологию, на огромный фактический материал конкретных языков, создают фундамент для построения систем морфологических знаний. Простой механический перенос этих данных с "бумажного" на "машинные" носители информации менее перспективен, чем универсальные оболочки для экспертных систем языковых знаний.
-37-Такие системы не только накапливают информацию о языке в некотором внутреннем формате, но и используют ее для распознавания и синтеза текстов (в режиме верификации). Усовершенствование редакторов текста для конкретного языка тогда можно рассматривать как результат такой оптимизации этих систем, когда из всего богатства универсальных средств отбираются только процедуры и параметры, существенные для конкретного языка, остальные же типы знаний полезные для какого-либо иного, но не данного языка и усложняющие работу, выносились бы за скобки.
В отличие от обычных баз данных, экспертная система для лингвиста не простое хранилище сведений: на основе своих обновленных сведений она должна давать анализ произвольному выражению объектного языка и синтезировать при необходимости словоформы конкретной лексемы, коль скоро задан требуемый набор грамматических категорий.
Например, для русского языка система должна уметь анализировать выражения типа лесами, недоигравшимися, бело-сине-красному соответственно: лес в форме мн.ч.Т.п., недоиграть в форме причастия прошедшего времени действительного залога мн.ч.Т.п., бело-сине-красный в форме м./ср.рода ед.ч.Д.п. Обратная задача: по лексеме в "заглавной" форме и по набору грамматических признаков синтезировать нужную словоформу.
Аналогия с экспертной системой в медицине заключается в том, что "диагноз" и "методы лечения" (в нашем случае синтез и корректировка словоформ) зависят от сведений, полученных предварительно от человека-эксперта и в силу этого обладают авторством. Такой режим работы с системой назван верификацией потому, что именно он позволяет установить, насколько верна лингвистическая концепция человека-эксперта, опрашиваемого системой. В нашем случае симптомами правильности концепции являются анализ и синтез словоформ, соответствующие интуиции носителя языка.
При построении экспертной системы лингвистических знаний необходимо ориентироваться на учет универсалий и фреквенталий (соответственно, несомненных и частотных законов) языка в качестве элементов базы знаний, то есть, на представления о том, что бывает и чего не бывает в человеческом языке.
-38-Идея создания экспертной системы возникла в 1970-х годах, когда исследователи в области искусственного интеллекта занялись построением базы знаний, обладающей элементами искусственного интеллекта [142, с.186]. Экспертная система программа для ЭВМ, дающая решение (на уровне эксперта) для проблем в некоторой области и обладающая [93, с.164]:
- эвристичностью, т.е. способностью производить умозаключения на основе знания фактов и формальных знаний, объединенных в теорию;
- прозрачностью, т.е. способностью давать объяснения для своего выбора хода рассуждений и отвечать на вопросы о хранимых знаниях;
- гибкостью в усвоении, интегрировании и использовании новых знаний по ходу работы для получения последующих своих решений.
Несколько более конкретно [142, с.186], эта система:
1) ориентирована на конкретную область экспертизы;
2) способна делать выводы из посылок, сформулированных не до конца четко, даже на основе недостоверных предписаний;
3) умеет правдоподобно объяснять ход размышлений;
4) факты отделяет от механизмов логического вывода;
5) способна пополняться по ходу и в результате работы, охватывая все более широкие наборы знаний;
6) обычно основана на наборе правил, в том числе на практических правилах, формулируемых экспертом-человеком при объяснении хода мыслей;
7) дает прямой совет, а не заставляет спрашивающего делать нужные выводы (как было бы в случае обычных баз данных);
8) обладает коммерческой ценностью, в отличие от многих иных систем искусственного интеллекта, "игрушечного" типа.
Необходимость в экспертных системах диктуется следующими обстоятельствами:
1. Нужно исключить зависимость от субъективности живого эксперта или группы экспертов.
2. Требуется интегрировать знание, полученное из разных
-39- источников. Особенно важно это для тех областей, в которых уровень развития теории не позволяет достаточно хорошо структурировать знания, когда два эксперта только изредка приходят к единому мнению.3. Знание одного эксперта необходимо использовать сразу в нескольких разных местах.
4. Необходимо преодолеть слабости человека, в частности, исключить эмоции.
Экспертная система предполагает [213, c.18] наличие:
- эксперта-донора знаний,
- "инженера знаний", извлекающего знания из эксперта и упорядочивающего их,
- структуры понятий для формализации и хранения данных,
- язык программирования для задания алгоритмов.
Общие свойства экспертных систем [213, c.28-29]:
1. Нацеленность на имитацию эвристического поведения человека-эксперта: методы сбора данных, логического вывода, стратегии обработки информации, принципы подтверждения и/или опровержения гипотез.
2. Конкретность области знаний, затрудняющая обобщения.
3. Практическая направленность.
По конструкционным свойствам различаются следующие типы экспертных систем [213, c.58-59]:
1. Информационная система программа, непосредственно разрабатываема программистом в режиме непосредственного общения с экспертом. Правила, применяемые системой для логического вывода, не зависят от узкой области знаний. Недостатки: трудности обновления, ревизии и обобщения хранимых знаний.
2. Система обобщения процедур: допускает постоянное взаимодействие между "инженером знаний" и экспертом, но специальные знания выявляются в результате процедур, работающих на некоторой эвристической основе. Например, система диагностики инфекционных заболеваний.
3. Автоматизация работы "инженера знаний": основана на диалоге между экспертом и программой, обычно позволяющей вести диалог с экспертом.
4. То, что пока еще является утопией: система, полностью
-40- заменяющая эксперта, работающая индуктивно, сама собирающая и обобщающая нужную информацию, проводящая экспертизу на основе фактических данных, литературы и опроса специалистов.Главная идея и ценность экспертной системы моделирование динамики знаний. Основные компоненты экспертной системы:
- база знаний,
- механизмы логического вывода,
- модуль расширения и усвоения знаний,
- интерфейс для формулирования пояснений,
- генератор подзадач, вытекающих из проблемы, стоящей перед системой [105, с.294].
По поводу последнего компонента отметим следующее. Рассуждение на основе знаний объектной области у человека связано с тем, что общая задача как бы разбивается на подзадачи, образующие иерархию. Каждой подзадаче соответствуют своя типология знаний и свои критерии правильности решения. На разных этапах рассуждения экспертная система занимаетс одной из подзадач. К наиболее общим классам подзадач относятся:
1) классификация,
2) абстрагирование от конкретной ситуации,
3) целенаправленный поиск знаний,
4) синтез объекта по уточненному плану действий,
5) проверка гипотез,
6) выведение следствий из компоновки гипотез.
В качестве единиц хранения "элементарных знаний" выступают не только декларативные сведения, но и меняющиеся от эксперта к эксперту предписания правила, что делать при том или ином состоянии обследуемого объекта [254, с.209]. Для лингвистов понятие правила сегодня не нуждается в обширных пояснениях: формулировкой лингвистических правил правил языка и речи мы занимаемся всю свою профессиональную жизнь. Моделирование лингвистических правил как базового набора означает необходимость соответствующей архитектуры экспертной системы. Системы, базирующиеся, среди прочего, на хранимых представлениях для правил, позволяют отражать знания, расширяющие возможности эксперта и в то же время по-новому воплощающие в жизнь принцип модульности в сочетании с принципами "логического
-41- программирования" [254, c.209].К обычным аспектам поведения экспертной системы к хранению знаний и к решению задач отнесено и взаимодействие человека с системой по ходу решения задачи, сотрудничество в логическом выводе и по ходу модифицирования базы знаний [269, с.402]. Обращаясь к помощи экспертной системы по ходу написания текста на ту или иную конкретную тему, пользователь может опираться на двоякую помощь системы:
- выработка аргументации,
- оформление этой аргументации в форме, приемлемой для потенциальных адресатов.
Программы текстовых редакторов в большей степени пока что нацелены на вторую задачу [269].
Общение пользователя с экспертной системой не зависит от глубины проникновения во внутреннюю механику системы. В то же время, это регламентированное общение, поскольку нерегламентированный диалог сложен для самого человека, требует большего сосредоточени внимания, чем тот вид, который явился результатом многих лет программистских наработок со своими широко известными в практике приемами и уловками: "меню", подсказки варьирующейся обстоятельности, демонстрационные примеры и т.п. Там, где пользователю разрешено вводить сложные высказывания, имеем следующие проблемы (ср. [223, с.49]):
- переработка текстов как последовательности слов: интерпретация сложных синтаксических структур и перевод их в семантическое представление при учете контекста;
- представление знаний внутри самой системы, разработка вспомогательных средств дл формализации, хранения и поиска знаний при обработке показаний экспертов;
- техника дедукции: процедуры доказательства;
- формализация объектного знания, в нашем случае формализация знаний о языке-объекте.
В этом вопросе есть две стороны:
- содержание знаний,
-42-- репрезентация знаний, форма хранения, предназначенная для эффективного поиска, переупорядочения и модифицирования.
Эти стороны неразделимы. Например, изобретение нового формального аппарата дл представления знаний открывает новые перспективы и для содержательного расширения объема знаний. Чаще всего используются следующие подходы к кодированию знаний для того, чтобы чисто формальным "синтаксическим" путем устранять недостоверные сведения, противоречия и обновлять информацию по ходу новых показаний эксперта:
1. Система "продукции" [270]. Знание представляется как набор правил, каждое из которых состоит из двух частей: из антецедента и консеквента, или условия и результата, или (как в порождающей грамматике) левой и правой частей. Однако, в отличие от типичной программы для ЭВМ, "продукция", или "деривация", в рамках такой базы знаний не представляет собой последовательность предписаний, которые следует выполнить одно за другим. Скорее имеется в виду неупорядоченный набор правил (в этом сходство с поздними версиями генеративной грамматики), соответствующий в своем "пакете" некоторому элементу базы знаний. Такой элемент может быть легко введен в состав уже имеющейся базы знаний иерархии "пакетов". При необходимости в этой иерархии можно произвести перестановки. Сам же "пакет" легко ввести в состав уже имеющегося набора знаний, также, при необходимости, модифицируемого в остальных частях.
2. Модификация исчисления предикатов первого порядка, когда знание представляют как высказывание, в котором отсутствуют модальный компонент и кванторы. Эта техника во многом повторяет предыдущую [200, с.74]. Используется также "процедурное представление" части знаний, как в языке программирования пленнер: в то время как в представлениях указанного выше первого типа речь идет о "знаниях, что", здесь скорее формулируются "знания, как". Используется аппарат семантических сетей, аналогичных тем, которые нашли свое применение в психологии для моделирования мыслительных ассоциативных связей в памяти человека. В качестве надстройки фигурируют языки "фреймов". Семантическая сеть состоит из:
- узлов, представляющих объекты, понятия или ситуации;
-43-- бинарных отношений между этими узлами.
Наконец, при этом же подходе используются системы "продукции", опирающиеся на "правила продукции" типа тех, которые составляют "машину Поста" (предложенную еще в 1943 г.) и широко известны как "правила непосредственно составляющих (НС)" в порождающих грамматиках. Система продукции состоит в таких концепциях из трех частей:
- база правил продукции, каждое из которых читается так: "Если выполнено условие А, то выполни действие В"; в частности, "правила переписывания" интерпретируют "действие" как замену одного символа последовательностью других символов;
- отражение контекста, дающее свойства реального состояния, того, при котором работает данное правило и которое меняется после этой работы;
- интерпретатор, регулирующий применение правила и решающий, какое из конкурирующих правил должно работать в данном случае и каковы дополнительные изменения, которым должен подвергнуться контекст в результате.
3. Аппарат "сверхкатегорий" [193, с.325-329]. Понятия организованы в иерархии, связи внутри которых структурированы так, чтобы осуществлять логический вывод на основе перехода от общего к частному и обратно. Принимаются следующие положения:
- организация понятий в памяти такова, что более конкретные частные поняти наследуют свойства, "признаки", от более общих; возможно и "структурное наследование", когда понятия, входящие в определенную структуру, наследуют признаки некоторой "сверхкатегории" этой структуры. Например, знание понятия продажа предполагает знание понятия передача;
- понятийных категорий больше, чем лексических;
- с помощью одного понятия можно пояснить другое, что не всегда означает, что одно из них зависит от другого.
Эффективность подхода оценивается по гибкости решения проблем и обновления базы знаний в результате работы эксперта с системой. Помимо адекватности и точности, существенна и "плотность" (density), или "детализированность" [155, с.565-583], количество связей между отдельными понятиями в базе знаний, то есть, насколько детально разработана область
-44- знаний относительно концепции и хранимых знаний.Экспертное владение материалом, среди прочего, предполагает способность улавливать скачки от более разработанной, детализированной, области к менее детализированной и наоборот. Плотность системы проявляется в ее реакции на профессиональные параметры пользователя: то, что в качестве адекватного ответа она может предложить хорошему специалисту, показалось бы избыточным или неправдоподобным дилетанту. Сведения о "местном" падеже в русском языке нерусисту простому носителю языка (в школе слышавшему о "предложном" падеже) покажутся подозрительными, пока ему не продемонстрируют контрастную пару в лесу в лесе. Итак, одной из важнейших характеристик экспертной системы является способность дифференцированно "общаться" с различными типами пользователей. Строя систему для консультации школьников, студентов и академиков по родному языку, следует учитывать и этот человеческий фактор.
Наконец, задача модифицирования базы знаний, а как частный случай устранени противоречий. Хранимые сведения могут вступать в противоречие с новыми, поступающими даже от одного и того же эксперта. Есть две тактики [240, с.26]:
- комплекс превосходства, консервативность: подозревать в неаккуратности данные более поздние по времени появления;
- комплекс неполноценности: в неправильности подозревается не последняя по времени информация, а та, которая вызвала конфликт мнений.
Пусть, например, все объекты были разбиты на непересекающиеся классы А, В и С, а через некоторое время некий объект охарактеризовали как обладающий одновременно свойствами А и В. Система ревизии мнений выбирает среди альтернатив одну, прогнозирует последствия предпочтения, сопоставляет полученные результаты при различных выборах. Если противоречие выявляется, пересматривается база знаний, в противном же случае прибегают к консервативной технике.
Дальнейшее усовершенствование экспертных систем в учете технологии лингвистического исследования: в аккуратном описании и моделировании операций, выполняемых обычно лингвистами при исследовании и упорядочении материала. В некотором смысле, это
-45- возвращение к дескриптивистской постановке вопроса, но в рамках одной из подзадач пополнения экспертной системы. Важное отличие от "методического" периода в истории языкознания состоит в том, что главным при таком пополнении является наличие общелингвистической концепции, верифицируемой с помощью системы при морфологической интерпретации.Для разработчиков экспертной системы нелингвистических знаний этот вопрос обладает скорее практической, чем теоретической значимостью [147, с.250]. Иное положение, когда разрабатывается экспертная система для хранения и пересмотра данных о языке: возможности системы будут различными в зависимости от морфологической концепции создателей.
Мы строим универсальный метаметаязык морфологии, на котором выразим максимально широкий спектр морфологических концепций как зарегистрированных, так и возможных. Усовершенствование метаметаязыка заключается не только в расширении типов языка-объекта, морфология которого может задаваться в рамках системы, но и типов концепций морфологической репрезентации и структуры языка в целом.
Наше положение в этой связи таково: понимая текст, носитель языка способен дать объяснение каждому отдельному слову (не всегда это объяснение у разных носителей языка будет совпадать), опираясь при этом на свои гипотезы о морфемном составе, т.е. о "внутренней форме" слова [14]. Морфологический интерпретатор решает свою задачу, когда адекватно моделирует эту деятельность человека, в разной степени владеющего данным языком: степень компетентности в языке может варьироваться от нуля до бесконечности.
Далее будем разграничивать понятия следующим образом. Лемматизацией будем называть идентификацию словоформы (текстовой формы слова) как представителя некоторой лексемы, хранимой в словаре. Для этого используются алгоритмы анализа словоформ, устанавливающие базисную, или основную ("заглавную"), форму лексемы. В иной формулировке [322, c.38] лемматизаци
-46- сведéние словоизменительных парадигм (представленных словоформами) к формам, считаемым заглавными.Морфологическая интерпретация словоформы расширение поняти лемматизации на тот случай, когда лексема (или основа словоформы, если ее рассматривать в качестве ключа поиска) не обязательно хранится в словаре, а "вычисляется" по аналогии, на основании других хранимых единиц словаря и свойств анализируемой формы.
Например, словоформу недоперебежишь нельзя лемматизировать, если в словаре нет лексемы недоперебежать или соответствующей ей основы. Но эту форму можно морфологически проинтерпретировать, если в словаре есть лексема бежать или ее основа. В языках с богатым словообразованием морфологическое распознавание текста состоит в интерпретации словоформ.
Морфологическая интерпретация ставит следующие проблемы:
- установление заглавной (фонологической и/или орфографической) формы лексических единиц, той, по которой как по ключу можно найти сведения о семантике, синтаксисе и прагматике всей лексической единицы;
- двустороннее соотнесение заглавного и реального (текстового) лексических представлений.
Ранние системы распознавания текста ориентировались, главным образом, на языки с бедной морфологией или на те, в которых легко отделить основу от флексий [231, c.266]. Алгоритм состоял в распознавании аффиксов и/или флексий в составе словоформы (по сравнительно небольшому списку вспомогательных морфем), после чего оставшаяся часть словоформы гипотетическая основа искалась в лексиконе. Обычно вся эта техника выглядела как анализ справа налево. К началу 1980-х годов картина изменилась:
1. В поле зрения попали агглютинативные языки (тюркские, финно-угорские, языки американских индейцев), с богатой и зачастую экзотической (на фоне английского) морфологией. Для них тактика "от флексии к основе" непродуктивна. Более правдоподобна
-47- тактика "слева направо": вычисление сначала основы, а затем флексий.2. Появился целый ряд идей о двуступенчатости распознавания слова, о соотнесении слов одновременно на лексическом уровне и на уровне хранимых словоизменительных парадигм.
Разработанная нами и описываемая в шестой главе экспертная система лингвистических знаний позволяет хранить данные о языке и выяснять, насколько удачна та или ина морфологическая концепция анализа и продуцирования форм языка. Уместно будет в общих чертах описать сначала несколько известных систем.
В "эксперте-распознавателе слов" [293, с.89] каждое слово языка рассматривается как источник сложных экспертных знаний о процедурах понимания слова в различных контекстах. Авторы системы опирались на следующие гипотезы:
1. Знание языка у человека организовано, прежде всего, как знание слов, а не правил.
2. Понимание языка, в первую очередь, координирование информации между модулями-миниэкспертами (составляющими большую систему "эксперта в области слов"), делящими между собой области влияния в языковом и понятийном окружении. Это значит, что большую экспертную систему для языка надо строить, базируясь на представлениях о том, как должны быть отражены нерегулярности языка, исключения из правил, и только в следующую очередь как трактовать главные закономерности языка.
В другой концепции морфологическая обработка слова представляется как выявление внутренней структуры слова: анализ слова в виде дерева НС, где в качестве непосредственно составляющих фигурируют объединения морфов [283, с.17]. Выделяются следующие компоненты процессора словоформ:
- парадигматический компонент, задающий словоизменительные ("флективные") свойства словоформ с помощью категорий рода, лица, числа, падежа, времени и наклонения;
- селективный компонент, задающий синтаксическую сочетаемость словоформ в виде логических выражений (приписываемых словоформе);
- иерархический компонент, задающий понятийные иерархии, иногда в корне отличные от деления слов на части речи;
- компонент зависимостей, определяющий, какие синтаксические
-48- зависимости характерны для данного слова и какую роль в них может играть слово;- компонент упорядочения слов в предложении.
В третьей концепции [186, с.114] алгоритм, работая в тексте по принципу слева направо, опирается на различительные признаки письменного текста. Число таких признаков сравнительно невелико. Распознанная графическая форма слова далее сверяется со словарем, упорядоченным в виде дерева, что позволяет быстро и легко определить "окрестность" слов, близких к данному по внешнему виду (по сочетаемости букв). В зависимости от того, каково количество слов в такой окрестности, определяется и вероятность правильности прогноза. В среднем же такая окрестность составляет два с половиной слова. Система гарантирует распознавание 85 100 % слов в произвольном тексте. Эта механика нашла широкое применение, на ней основано большое число работающих анализаторов слов для английского языка.
Эвристической ценностью в моделировании человеческой интерпретации слов обладают:
- традиции морфологического описания такие, как латинская, китайская, семитская, индийская;
- возможности разнообразных версий формальных грамматик;
- психолингвистические исследования ошибок.
В поисках общетеоретического (метатеоретического) подхода исследователи подошли вплотную к осознанию следующих идей:
1. В отличие от автомата, человек редко держит в голове все возможности интерпретировать слово. Столкнувшись с трудностями, процессор, как и человек, должен либо повысить свою бдительность, использовать более надежные стратегии поиска и собственно морфологической обработки словоформы (скажем, проверить, не было ли распознаваемое слово результатом какой-либо редкостной морфологической альтернации, сочетания с неожиданными элементами или с малоупотребительными флексиями), либо признать ошибочность слова, либо же, наконец, признать свою некомпетентность. Степень "мобилизационной готовности" варьируетс
-49- в зависимости от этих факторов [150, c.145].2. Распознаванию слова помогает учет возможного значения словоформы в целом, его упреждающая семантическая интерпретация: "внутренний лексикон" человека допускает при необходимости и семантический поиск, что роднит его с базами данных стандартного типа. Не случайно, например, при афазии Брока (вид аграмматизма) этот семантический поиск доминирует, вытесняя иные стратегии [330, с.239-231].
3. Семантическая обработка происходит обычно параллельно фонологической/графической. Поэтому человек способен воспринимать малапропизмы (основанные на фонологическом сходстве слов), создающие своеобразный семантический эффект. Однако одни исследователи [146, с.247] считают, что сходство форм обычно констатируется интерпретатором только после того, как получены (в результате семантического поиска) несколько конкурирующих гипотез об анализе слова; другие [301, с.573] что всегда оба вида поиска одновременно имеют место при интерпретации слова, параллельны, согласуются между собой по промежуточному результату (см. также [127], [300]). Третьи же [137] пытались так представить семантический и формальный поиск, чтобы сделать результат одного из них исходным для другого (см. также [94]). Скорее всего, различные виды взаимодействия, в том числе и перечисленные, одинаково реальны [297]. Выбор определяетс предшествующим опытом интерпретации текста [106].
4. Следует различать результаты, полученные неосознанно, и те, которые явились результатом дополнительных усилий, своеобразных "грамматических размышлений" человека. Первые (в частности, даже когда у распознанной лексемы оказывается много равноправных лексических значений) не усложняют значительно всю процедуру обработки, не приводят к "аналитической перегрузке", в то время как вторые могут привести к переутомлению и к перерасходу ресурсов памяти и терпения человека [307, с.375]. Процессор слов должен быть организован так, чтобы и в нем такой перерасход (менее, впрочем, тягостный, чем у человека) происходил, по крайней мере, не в тех звеньях, которые соответствуют работе подсознани человека.
5. На работе процессора слов сказывается конечная цель
-50- [92, с.98-99]. Компьютер должен использоваться более эффективно, чем пишущая машинка дл ввода и редактирования текста. Это- средство для создания текстов, а потому нужна обратная связь для исправлении ошибок и избегания недоразумений. Каждая замеченная интерпретатором ошибка и любое подозрительное выражение либо автоматически заменяется на вариант, предлагаемый "редактором", либо легитимизируется, т.е. заносится в память как правильное и дальше уже подозрений вызывать не будет. Выбор делает человек, а претворяет в жизнь машина. Примерно так работают наиболее популярные системы; к ним добавляются еще автоматические тезаурусы [92]. От процессора слов требуется максимальная бдительность в сочетании с терпимостью и скромностью, иначе легитимизация авторского словоупотребления станет для пользовател мучением.
Для морфологической интерпретации текста распознавание слова сопряжено со следующими моментами [65, c.533]:
- установление лексической идентичности идентификация лексемы, из которой вытекает набор синтаксических и семантических свойств словоформы как представител лексемы;
- построение морфологической репрезентации, отражающей словоизменительные категории, передаваемые данной словоформой.
Распознавание слова решение трех задач [238, c.71]:
- лексический доступ отображение речевого или письменного сигнала на представление в виде лексической формы;
- выбор, или селекция установление того, что в наилучшей степени может соответствовать речевому входу;
- интеграция включение полученного результата (то есть синтаксической и семантической информации, содержащейся в лексемах) в рамки более общих процедур.
Лексическая обработка включает [317, c.2]:
- предварительный лексический "контакт", или "атаку",
-51- когда слушатель/читатель воспринимает речь/текст как вход и генерирует представлени (репрезентации), соположимые с теми видами представления, в рамках которых задаетс поисковый образ формы слова для конкретной лексической единицы; эти репрезентации называются контактными;- активизацию: лексические статьи, оцененные как достаточно близкие к контактной репрезентации на первой фазе, гипотетически считаются изменившими свои характеристики и поэтому отличными от глубинного представления;
- селекцию, или выбор: после первых двух фаз продолжается аккумулирование физических данных до тех пор, пока в результате сопоставления с данными лексикона, параллельно этому накоплению, не будет локализована нужная лексическая статья в словаре; такой процесс выглядит как дифференциация (когда прообраз требуемой статьи обрастает все большим количеством деталей), как редукция (противоположный случай) или как проста идентификация (при гипотезе о точном совпадении эталона с экземпляром слова в речи);
- констатация распознанности слова;
- "лексический доступ" тот момент, когда всевозможные свойства хранимой лексемы фонологические, семантические, синтаксические и прагматические становятся полностью доступными интерпретатору, "приземлившемуся" на территории соответствующей статьи в словаре.
В поисках нужного слова по словарю активизируется значительно больше единиц, чем затем понадобится. Этот избыток слов может нечаянно, в виде вкраплений, встретиться в речи или, соответственно, в виде коннотаций (порой весьма навязчивых) обнаружиться в интерпретации чужой речи данным носителем языка. Общие стратегии поиска лексической статьи или ее морфологической обработки [54, c.175]:
- "понтонная" стратегия: значение слова выбирается в качестве временного мостика еще до того, как рассматривается в деталях физический звуковой или письменный облик слова; провести в жизнь эту стратегию в чистом виде затруднительно, поскольку имеет место параллелизм и взаимодействие различных фаз распознавания и продуцирования речи, так что семантическое
-52- упреждение так или иначе должно опираться и на учет физического облика речи;- каскадная модель, когда считается, что при продуцировании речи уже имеютс готовые значения, а формы могут еще только находиться в процессе становления;
- "расширяющаяся активация" (spreading activation), при которой значение и форма слова взаимозависят и при продуцировании, и при распознавании речи, а именно: любое продвижение к значению вызывает соответствующие поправки при рассмотрении формы, а любые дифференциация, редукция или наложение форм приводят к корректировке гипотез о значении целого слова.
В случае устной речи, помимо обычных задач, есть еще распознавание границ слова, усложняющее строение системы, но дающее более глубокое понимание сути лексического поиска. Слушающий не ждет, пока звуковое слово прозвучит целиком: восприятие речи (как, впрочем, и восприятие письменного текста) обладает опережением физического сигнала [239]. Эффективный лексический поиск можно поэтому связать и с умением правильно идентифицировать начало слова и отобрать кандидата из большого числа вариантов. Как показывают экспериментальные исследования [118], [119], [237], процедура распознавани начала слова непосредственно соотнесена и с процедурой лексического поиска.
Одним из индикаторов границ слова является просодия [306, с.520 и след.]. Аналогичную роль играет при лексическом поиске в письменном тексте пунктуация: пробелы, точки, запятые, разбиение на абзацы и строчки и т.п. Поэтому получается, что лексическое представление хранимых языковых единиц морфов, слов и т.д. отражает и то, что традиционно внеположено лексике просодию в широком смысле. В частности, смена сильных и слабых слогов также связана с лексическим поиском. По [151], сильные слоги являются ключевыми: сопоставление распознаваемой цепочки со слабыми слогами эталона слова начинается только после успешного выдвижения гипотез, связанных с сильными слогами.
При восприятии письменного текста лексический поиск опирается на гипотетическое озвучивание текста читающим, на гипотезы о просодической интерпретации в качестве ведущей. В итоге одну часть (априорно одинаково вероятных) предположений читающий
-53- игнорирует, а другую выводит на передний план. Иногда [306] считается, что лексикон позволяет вести поиск слова не только по внутренней форме (по наличию и линейной последовательности морфов), семантике и синтактике, но и по слоговой и даже по метрической структуре (по структуре мор). "Сговор" семантики и просодии свойство не только поэтической речи.Лексический доступ при распознавании письменного текста включает следующие подпроцессы [84, c.108]:
1. Распознавание формы букв, что тривиально, если нет, скажем, диграфов. Однако в немецком не однозначно распознавание буквенного сочетания "sch" как "s+ch" или как "sch" целого знака, читаемого примерно как русское "ш".
2. Построение поискового образа слова, ключа для поиска лексической статьи во внутреннем лексиконе. В частности, отделение неплотно прилегающих к основе префиксов в русском языке (ищем глагол разбежаться при текстовой форме переразбежавшись в предложении Иванов не взял высоту два метра семнадцать сантиметров; переразбежавшись, он поставил новый мировой рекорд) и отвлечение от того, что идет после первого ведущего морфа в слове (таков, например, поиск отглагольного имени по глагольной основе без учета суффикса -ние в русском языке).
3. Выбор лексического "бункера", вокруг которого концентрируются лексические единицы с данным поисковым образом. В обычном алфавитном словаре таким бункером можно считать место в словаре, где идут слова, начинающиеся на данную букву, в китайском словаре слова, начинающиеся на данный иероглиф.
4. Собственно поиск в рамках найденного бункера, когда решающим фактором являетс относительная частотность (соответственно которой и упорядочены лексические статьи внутри бункера), причем в зависимости от обстоятельности поиска иногда прекращают дальнейшие поиски, как только найдено первое решение, а иногда стремятся найти все возможные решения.
5. Проверка после нахождения статьи. В отличие от фазы поиска (когда "ключ" примеряется к заголовку лексической статьи), учитываются все детали, считаемые существенными в рамках лексикона данного языка. Если проверка дает отрицательный результат, поиск возобновляется.
-54-6. Считывание лексической статьи собственно "лексический доступ": все содержимое лексической статьи становится доступным процессору.
Собственно лексическим поиском в этой схеме можно назвать фазы с третьей по пятую, пока еще не локализована лексическая статья. Все эти фазы взаимодействуют таким образом, чтобы поддерживать, а не затруднять выполнение соответствующих операций в рамках других фаз-модулей. Конструкторы морфологического процессора стремятся оптимизировать такое взаимодействие. В частности, по [73, c.197], морфологический процессор для сложных слов в английском и голландском языках должен быть устроен так, чтобы в рамках целого предложения слова с деривационными суффиксами обрабатывались легче, чем без них. Слова с "синтаксически ориентированными" аффиксами, типа перфектных форм глагола на ge-, облегчают распознавание целого предложения.
Вслед за С.Андерсоном [65, c.535] можно предположить, что в лексиконе при морфологической обработке отыскиваются корни или "производные основы", являющиес "несущей конструкцией" словоформы.
Скажем, в арабском лексиконе основа takallam "разговаривал" (так называема пятая порода от основы kalama "говорил"), получаемая регулярным образом от исходного корня (в данном случае от корня klm), ищется по исходному корню (klm). И только потом рассматривается множество парадигм "парадигматическое пространство" данной лексической единицы, позволяющее определить, входит ли словоформа в такое парадигматическое пространство. Это пространство в лексической статье можно обозначить некоторым символом, по которому как по ключу ищетс описание парадигмы в отдельном хранилище информации. Тогда лексикон представим в виде набора пар:
- лексический ключ корень или производная основа,
- морфолого-парадигматический указатель.
В экспертной системе эта информация содержится:
- в виде процедур, встроенных в процессор, в сам его алгоритм,
-55- и соответствующих универсальным, то есть действительным для всех человеческих языков, процедурам морфологической интерпретации;- в виде "наполнения", или параметров, действительных специально для данного языка и внеположенных алгоритму, но регулирующих работу алгоритма таким образом, что в сочетании с универсальными процедурами получается реальный набор правил словообразования и словоизменения конкретного языка, во всех частностях и исключениях.
Универсальный компонент должен предусматривать по возможности полный набор выбираемых параметров различительных признаков конкретного языка относительно данного процессора, разумеется. Эти параметры не что иное как типологические характеристики, исследуемые лингвистами уже давно и известные во многих деталях.
Например, языки располагаются на непрерывной шкале "флективность агглютинативность". "Кумулятивные" парадигмы (в смысле работы [102, c.601]) с омонимией окончаний, как парадигмы склонения и спряжения в латинском, русском и многих других флективных языках, должны использоваться при морфологической интерпретации так же, как и парадигмы без такой омонимии, что неверно для агглютинативных языков. Если процессор настроен на работу с агглютинативным языком, то соответствующие морфологические процедуры, сталкиваясь с омонимией словоизменительных элементов, должны прибегать к несколько иной стратегии поиска в рамках парадигматического пространства, чем в случае парадигм без такой омонимии.
В результате эволюционного развития человеческих процедур поиска во внутреннем лексиконе сложились две различные, но взаимоподдерживающие подсистемы. Одна ориентирована на быстрое и легкое для говорящего продуцирование речи, а другая на легкое и быстрое распознавание ее [54, c.200]. Эта эволюция привела и к сложным механизмам взаимодействия обеих подсистем лексической и словоизменительной идентификации.
-56-ФОРМАЛЬНЫЕ МОДЕЛИ МОРФОЛОГИИ
Рассмотрев проблему морфологии и морфологической интерпретации в общих чертах, а также возможности, предоставляемые лингвисту экспертной системой, мы подходим к проблеме выбора: какую концепцию морфологии предпочесть.
Наше предположение состоит в следующем. Удачно построенная экспертная система лингвистических знаний должна быть в состоянии реализовать подход в рамках произвольной разумной (не "безумной") концепции морфологии. Иными словами, эта система должна обладать метаязыком для метаязыков современных морфологических теорий. Речь идет не о том, чтобы совместить несовместимое, а о том, что экспертная система морфологических данных должна "настраиваться" на произвольную морфологическую идеологию и на произвольные параметры языков-объектов.
Итак, наша экспертная система метаязык метаязыка языкознания. В данной главе мы попытаемся продемонстрировать не только разнообразие морфологических концепций последних лет, но и существование единого стержня, объединяющего эти теории. Возможно, именно это положение имел в виду Ю.С. Степанов, выдвинувший в свое время идею о взаимодополнительности различных методов в языкознании [44] и показавший продуктивность этой идеи на языковом материале.
Начнем мы с генеративной концепции как одной из наиболее известных. В первых ее версиях предполагалось, что морфология часть грамматики, описывающая репрезентации слова, поставляемые на вход в фонологию. В этом морфология аналогична базовому компоненту в стандартной генеративной модели синтаксиса: в базе генерируютс репрезентации предложения, подаваемые на вход в трансформационный компонент. Сегодн фонологию и морфологию соотносят более сложным образом [60, с.17].
В предгенеративной структуралистской концепции "автономной фонемики" предполагалась следующая цепочка преобразований,
-57- связывающих морфемы с фонетической реализацией (подробнее см. [58, с.1-2]):морфемы
правила реализации,
↓ неавтоматические чередовани
морфонемы
морфолексические правила,
↓ автоматические чередовани
фонемы
↓ правила аллофонии
фонетические сегменты
Преобразование морфемной репрезентации в фонетическую (звуковую) связывалось с двумя промежуточными уровнями: с морфонемикой и фонемикой. Каждый такой уровень накладывал свои ограничения на работу правил указанного перехода как сверху вниз, так и снизу вверх.
В рамках первых версий трансформационной порождающей грамматики морфологи занимала второстепенное место, на первом был синтаксис. В тех же вопросах, которые к морфологии имели традиционно близкое отношение, в центре внимания находилась фонематическая структура [58, с.1-2]. (И это несмотря на то, что магистерская диссертация Н. Хомского была посвящена морфонологии [107].) Вопрос о месте морфологии в устройстве грамматики в целом практически не стоял.
Именно в этот период конца 1950-х начала 1960-х гг. М. Халле (особенно см. [158]) утверждал, что нет необходимости в вышеуказанных промежуточных уровнях. По его мнению, репрезентация с формальными характеристиками автономного фонемного уровня искусственно усложняет структуру грамматики и приводит к утрате важных обобщений.
Со временем фактически все названные выше промежуточные уровни в лингвистических описаниях были реабилитированы.
Так, в "стандартной генеративной фонологии" [115] поверхностная структура, к которой приходят синтаксисты, переводитс
-58- в фонологическую структуру по правилам "переприспособления" (re-adjustment rules). Фонологическая структура задается в терминах системной фонемики и подвергается прежде всего работе морфонологических правил. Последние входят в набор фонологических правил, однако отличаются от остальных тем, что для их работы необходимо указание на морфологический контекст, в частности, на морфологический класс, характеризующий данный фонологический сегмент. И только после этого работают собственно фонологические правила, дающие репрезентацию в терминах бинарных фонологических признаков с заполненными значениями. Полученные репрезентации затем переводятся в более конкретные числовые значения (скажем, на квазинепрерывной шкале), указывающие на артикуляционные акустические свойства системно-фонетической реализации всей структуры предложения в целом.Это распределение обязанностей между правилами фонологии привело к пересмотру взаимодействия правил (в концепции [115] берется на вооружение принцип дизъюнктивной упорядоченности). Однако (см. [58, с.2]) эмпирическое применение этой модели натолкнуло на мысль о том, что такой способ взаимодействия характерен только для чисто фонологических правил и не затрагивает "правила фонетической детализации" (фактически правила аллофонии в структуралистской модели). Правила же аблаутного чередования и передвижения гласных (как в английском) мотивированы морфологически, а не фонологически [58, с.1-2].
К началу 1970-х гг. неудовлетворенность "стандартной фонологической моделью" спровоцировала появление целой серии контр-концепций, объединенных под названием "естественной фонологии" (в [24] дается подробное изложение и теоретического климата фонологии тех лет, и конкретной аргументации данного направления). В одной из разновидностей этой фонологической модели морфология заняла видное место.
А именно [58, с.3-10], морфологическими правилами назывались те, которые связаны с указанием на идентичность конкретных морфем, лексических единиц или классов морфем. Эти правила
-59- в "нормальном" прочтении могут выражать идею о том, что некоторое преобразование следует произвести в форме множественного числа, перед формой первого лица единственного числа, в форме настоящего времени действительного залога, после лексической единицы ox "вол" и т.д. Фонологические правила те, контекст которых ограничен исключительно фонологическим составом преобразуемой цепочки (куда включаются также границы элементов и указание на главные лексические классы), например: "перед переднеязычными", "на границе слова", "перед гласным верхнего подъема, в формах существительного". Работа фонологических правил состоит в мене значений того или иного признака, квалифицированного как различительный в рамках исходных фонологических представлений. В отличие от фонологических правил, фонетические правила работают в контексте, задаваемом в терминах только фонологического / фонетического состава цепочки, включая сюда фонетически проявленные границы (такие, как границы между словами или сочетаниями слов), и оперируют некатегориальными значениями или недистинктивными признаками.Названные типы правил не объединяются в какие-либо компоненты (как это было в модели, критикуемой Халле), а работают вперемежку. В частности, явление редупликации, по [58, с.3-10], свидетельствует о том, что морфолексические правила могут работать после некоторых правил "чистой" фонологии.
Общий вывод был таким: хотя правила различны, они не объединены в какие-либо компоненты. Но морфологические правила чаще всего работают раньше других в силу стремления к "прозрачности" фонологических правил, т.е. стремления к наименьшей зависимости от контекста.
К концу 1960-х началу 1970-х гг. и в стандартной генеративной модели, и в "порождающей семантике" структура слова считалась изоморфной структуре предложения. Чередования и иные изменения формы морфологических элементов (объект правил алломорфии) относились к ведению фонологии. Морфология включалась в фонологию [60, с.15]. Появление "лексикализма" в
-60- теории трансформационных порождающих грамматик ознаменовало начало развити противоположной тенденции.В противоположность "трансформационной гипотезе", при которой стараются найти трансформационный источник для сложных единиц поверхностной структуры, в работе о номинализации [112] Н.Хомский видит источник сложности структуры слова не только в синтаксической деривации, но и в словообразовании.
Например, есть существительные, действительно образованные в результате трансформации целого предложения, а есть и производные имена существительные, иногда совпадающие с первыми в фонологическом представлении. Таковы герундивы типа beingи giving (ср. глаголы be "быть" и give "давать"). Так, имеем [72, c.438-439] (астериск *, как и всегда в генеративных работах, означает неправильность выражения):
John's being certain that Bill will win
John's certainty that Bill will win
John's giving Mary the book
* John's gift of Mary the book
Различия между этими выражения таковы:
- производные существительные, но не герундивные имена, употребляются в конструкциях, получаемых без трансформаций, меняющих грамматические отношения;
- производные имена иногда обладают свойствами, отсутствующими у герундивных имен; например, определенный артикль the, неопределенный артикль a, детерминаторы типа some не допустимы с герундивом giving, ср.: the belief (* the believing) that John was killed;
- герундивные имена обладают, кроме того, и свойствами глагольной составляющей, ср.: John's having given (*'s having gift) the book to Mary;
- в отличие от сентенциальных герундивов (всегда на -ing), производные имена образуются очень разными суффиксами: -ty, -ness, -t, нулевая морфема и т.п.;
- семантические отношения между герундивным именем (но не производным существительным) и соответствующим предложением регулярно и предсказуемо.
Отсюда вытекает, что герундивные имена получаются трансформационным
-61- путем, а остальные производные имена генерируются непосредственно в исходной структуре еще до работы трансформаций. Семантическое сродство производных имен с сентенциальными перифразами (типа belief, certainty при предикатах believe, certain) и с производными прилагательными (believable) следствие того, что:- схемы правил НС вводят в структуру предложения единицы, обладающие в лексиконе "составными лексическими статьями";
- есть в лексиконе правила избыточности.
Итак, номинализация феномен лексической, а не трансформационной (синтаксической) деривации, ср. [144].
Последствия лексикализма для общей теории грамматики:
1. В синтаксисе постулируется синтаксическая автономия морфологически сложных лексических единиц, что заставляет рассмотреть подробнее их внутреннюю структуру. Синтаксические процессы теперь считаются менее продуктивными и более зависимыми от свойств лексических единиц, чем представлялось в начале истории генеративизма [78, c.354].
2. Восстанавливаются границы между морфологией и синтаксисом. Трансформации теперь не участвуют в словообразовании [190, c.12-13]. Возникают новые представления о функции и строении трансформационных правил [83], [188], [189].
3. В фонологии отказываются от чересчур сложных репрезентаций и запутанных фонологических дериваций, поскольку значительная часть фонологического варьировани перенесена в сферу морфологии. Морфология вновь вышла на лингвистическую арену.
4. Возникает особенный интерес к свойствам лексикона и к правилам интерпретации [181, c.92].
5. Сама гипотеза, сформулированная еще на завершающей стадии развития "стандартной модели" [112], является ведущей идеей всех модификаций "расширенной стандартной теории" (РСТ). Были попытки внедрить лексикализм в падежную грамматику [302, c.12] и в другие теории.
6. Пересматривается статус глубинной структуры [113] в грамматике. Появляются новые доводы для "сплющивания" глубинной структуры, теперь очень близкой к поверхностной [174].
7. Постоянно возвращаются к следующей мысли: поскольку
-62- без трансформационных правил так удобно описывать факты (а трансформационный компонент, в принципе, приводит к недетерминированности грамматики [268]), почему бы не отказаться от понятия трансформации, вместо него основываясь в грамматическом описании исключительно на правилах (или конвенциях) интерпретации поверхностной структуры? Грамматика больше напоминает алгоритм распознавания, чем продуцирования.В обновленной модели М.Халле начала 1970-х гг. [159] (см. также [99, с.48]) морфологи состоит из трех компонентов:
- список морфем,
- правила формирования слов,
- фильтр для слов-исключений.
Первые два компонента задают все потенциальные слова. Фильтр исключений нужен из-за морфологических и семантических особенностей производных слов. Например, существительные на -al допускают или не допускают формы на -ation в зависимости от того, к какому классу относятся исходные основы, ср.:
reversal, recital, proposal, transmittal reversion, recitation, proposition, transmission;
refusal, rehearsal, acquittal, arrival при недопустимых: refusation, rehearsion, acquitation, arrivation.
Есть еще глагольные основы, принимающие суффикс -ation, но не -al. Ср.: derivation, description, conversion, confusion при недопустимых derival, describal, conversal, confusal.
Всем морфологически потенциальным, но не реальным словам фильтр исключений приписывает признак [-LEXICAL ITEM].
Под этим названием фигурирует цикл работ, в особенности [289], [290], в которых предлагался "динамический" подход к структуре слова (см. также [174]).
-63-Все неатомарные слова порождаются каждый раз заново, повторяя историю их появления и развития (как и в стандартных порождающих грамматиках, принимается, что диахроническое развитие повторяется в рамках синхронии). В центре внимания вопрос о том, каковы ограничения, накладываемые аффиксами на основы, к которым они присоединяются, и каковы ограничения на совместную встречаемость аффиксов в рамках слова.
Все аффиксы делятся на две группы в соответствии с фонологическим поведением; соответственно и связанные с ними фонологические правила подразделяются на две группы, одна из которых работает раньше другой. Правила постановки ударения работают в промежутке между двумя этими группами правил. Вот почему некоторые аффиксы (например, те, которые вводятся после правил постановки ударений) никогда не сказываются на структуре ударени своей основы. Правила, генерирующие правильные последовательности морфем и работающие последними, связаны с наличием "строгой грамматической границы" (символ #), а первые правила этого свойства не имеют и связаны с введением слабой грамматической границы (символ +), никак не сказывающейся на фонологии слова.
Критики этого положения в целом и его деталей [79], [57] предлагают противоположный взгляд: группы правил сами по себе не упорядочены между собой, правила перемешаны, результат зависит от вида границы в морфонематической репрезентации. Однако существенно (и это видно из работ [290], [66]), что ограничения указанного типа действительны на всех уровнях представления лексических единиц.
В рамках синтаксических описаний большая роль, приписываемая лексическим правилам, проявлялась в том, что все большее число синтаксических конструкций описываетс как результат взаимодействия именно правил лексикона, а не синтаксических трансформаций. Начинается экспансия лексикона.
Например, в расширенной стандартной модели имеем следующие группы синтаксических правил [180, c.1], из которых первые
-64- две называются "альфа-передвижением" (alpha movement):1) передвижения именных составляющих (NP movements),
2) передвижение форматива вопросительности (wh-movement),
3) операции со связанной анафорой (в частности, приписывание антецедентов местоимениям, когда устанавливается, какой элемент предложения кореферентен возвратному местоимению).
В "реалистичной грамматике" (J.Bresnan) первый и последний виды правил отнесены к разряду лексических, а не синтаксических [88]. В более ранней версии роль трансформаций заключалась в соотнесении между собой элементов синтаксической структуры, находящихся в синтаксически разъединенных позициях (long distance phenomena), например, при описании многих случаев анафоры. В более поздних версиях [89], [202] и эти явления получили интерпретативное объяснение. Конструкции, зависящие от подкатегоризации лексических единиц (то есть от валентности лексемы в широком смысле), в лексиконе непосредственно соотносятся с семантическими репрезентациями без перехода от глубинных структур к поверхностным [174, c.10].
Перераспределяются, соответственно, и роли компонентов грамматики. Например, в концепции [116, c.72-74] эти роли таковы. Правила НС генерируют синтаксические структуры. После лексического вставления в полученные структуры вводятся словоформы полностью сформированные слова. Трансформационные правила могут только менять порядок слов. Согласование (ранее считавшееся результатом трансформаций) описывается как ограничение на лексическое вставление: единица читала может быть вставлена в предложение, только если лексическая единица в субъектной позиции помечена категориями женского рода и единственного числа одновременно. Лексическая статья единицы видела состоит, как минимум, из четырех частей:
1) фонологическая: вид=е=л=а;
2) морфологическая: глагол / прошедшее время / женский род / единственное число;
3) синтаксическая: задает следующее окружение для единицы: N / nom / fem / sing___N / acc;
4) семантическая: ВИДЕТЬ(X,Y).
Лексическое вставление, таким образом, состоит в проверке
-65- того, есть ли согласование между: а) морфологическими и синтаксическими свойствами, с одной стороны, и б) окружением синтаксической части лексической статьи, с другой. Порядок, в котором вставляются лексические единицы, не играет роли. Лексические правила, или правила лексикона:- дают все возможные лексические единицы, при необходимости вводя в каждую лексическую статью избыточную информацию;
- констатируют, что лексикон, содержащий некоторую конкретную словоформу данной лексемы, должен также включать и другие (детально задаваемые) словоформы этой лексемы.
Главный вопрос в образовании слова отношение аспектов структуры слова (в частности, флексий) к синтаксическим процессам. Для лексикалистов деривационна морфология, несомненно, относится к ведомству лексикона, сложнее дело со словоизменением [199, с.474]. Мнения "лексикалистов" разделились.
В так называемой "интерпретативной" морфологии [61] считается, что словообразование зависит от результата синтаксиса, а потому представлено постсинтаксическими правилами интерпретации. По мнению сторонников "лексической фонологии", словоформы генерируютс в лексиконе [221], [225], [324], [210], что в еще более сильной "расширенной лексикалистской гипотезе" формулируется так: синтаксические правила не могут опираться ни на какие аспекты структуры слова [221].
В более позднем варианте в обобщенной лексикалистской гипотезе (Generalized Lexicalist Hypothesis) принимается, что никакое небазовое синтаксическое правило не может оперировать элементом морфологической структуры [220, c.132], [219, c.230]. Иначе говоря, после того как лексическая единица вставлена в структуру предложения, она воспринимаетс как целый и неделимый элемент, является "островом".
При таком взгляде, по [263, c.170], словоизменение и словообразование не разграничиваются, что усложняет семантическую интерпретацию и заставляет отказаться от принципа композиционности ("принципа Фреге"). Отсюда еще одна модификация гипотезы:
-66- синтаксические правила могут оперировать флективными элементами, но не вмешиваются в деривационную морфологию.Итак, "расширенная лексикалистская позиция" совокупность следующих трех положений:
1. Лексические, а не синтаксические правила формируют производные (в словообразовательном и/или словоизменительном отношении) слова.
2. Лексические правила не оперируют синтаксическими составляющими при формировании морфологически сложных слов.
3. Лексические правила все входят в лексикон.
Критики считают [61, с.573], что эта гипотеза слишком сковывает маневр исследователя, не позволяя описывать все факты естественного языка. На это отвечают таким уточнением [199, с.474]. Синтаксические правила могут, конечно, указывать на морфологические признаки (пусть не элементы), но для их работы структура слова несущественна. Например, правила согласования указывают на падежные признаки, признаки числа, рода и т.д., но не на конкретные суффиксы или префиксы, являющиеся носителями этих признаков.
Лексическая гипотеза подвергается критике изнутри и извне генеративизма. Критики находят примеры, с трудом трактуемые в рамках этой концепции, и отмечают, что эти положения приводят к дублированию синтаксических элементов в рамках лексикона. Кроме того, выразить некоторые интересные обобщения, относящиеся к синтаксическому способу получения сложных структур, в этой теории бывает проблематично [82, c.144]:
1. Грамматика без трансформаций затемняет, по [78, c.354-355], работу других грамматических модулей.
2. В некоторых языках (например, в одном из диалектов эскимосского), по [295, c.63], производные существительные образуются от глагольных лексем в результате синтаксических трансформаций. Иная трактовка затруднит объяснение видовых, обстоятельственных элементов и отрицания в продуктивных синтаксических структурах.
-67-3. По С. Андерсону [61, c.573], лексикализм справедлив как положение о взаимной независимости синтаксиса и словообразовательной, но не словоизменительной структуры слова, поскольку для некоторых синтаксических правил существенны словоизменительные категории слов, входящих в синтаксическую структуру предложения.
4. Возможно, несправедлива эта гипотеза и по отношению к части словообразования. В частности [228, c.187-188], в предложении McCarthyites are now puzzled by him "Маккартисты озадачены им" анафорический элемент him "им" может быть кореферентен как с именем McCarthy "Маккарти" (но не McCarthyites "маккартисты"!), так и с существительными за пределами данного предложения (впрочем, для русского эквивалента первая возможность исключена В.Д.). Иногда [228, c.194-197] полагают, что лексическая гипотеза должна рассматриваться на фоне свойств кореференции исключительно в рамках предложения.
5. Отнесение правила к лексическим или синтаксическим не связано с тем, какова область его работы предложение или слово. Одинаково допустимы синтаксические правила, производящие морфологические операции, и лексические правила, осуществляющие синтаксические операции. Возможна даже (как видно из материала японского и английского языков) суффиксация целого предложения [303, c.229].
6. По [61, с.585], неверно, что синтаксические правила не оперируют элементами (внутренней) структуры слова: лексикализму противоречат факты приписывани конфигурационных свойств словам, морфологическое согласование в рамках более крупных синтаксических структур (включая копирование как ингерентных признаков, так и конфигурационных, присоединяемых при согласовании к "согласующейся единице"), поведение глагольного согласования в предложениях с личной формой глагола в качестве синтаксического элемента (в бретонском языке выглядит как местоимение). В рамках традиционных теорий морфологии эти случаи считались рядоположенными явлениями словоизменительной (т.е. не деривационной) морфологии, образующими "естественый класс". По [61, с.587], словоизменительная морфология та, которая существенна для синтаксиса. Поэтому одна и та же категория может
-68- быть словоизменительной в одних языках, но деривационной в других в зависимости от степени интегрированности ее в рамки синтаксических принципов. Так, в языке фула роль диминутивов при согласовании проявляет словоизменительный характер (не так в языках типа русского, немецкого и английского, где уменьшительность деривационная категория). И наоборот [61, с.594], деривационная морфология как и простое лексическое перечисление оперирует в лексиконе независимо от синтаксиса и поставляет материал для лексического вставления в рамки предложения (т.е. для синтаксиса).7. Неморфологические аспекты лексических правил рассматриваются только как факторы, ограничивающие возможности аффиксации. Исследуются далеко не все возможности лексических правил, лишь морфонологические (исключение представляют работы Р.Джеккендоффа [191]). Упускается из виду, что и другие уровни репрезентации ограничивают возможности формирования слов, а также сами подвержены модифицированию [174].
Как известно [249, с.22], структуралисты делили языки на две морфологические группы:
1) конкатенативные, основанные главным образом на префиксации и суффиксации,
2) неконкатенативные, использующие правила инфиксации, редупликации и аблаута; причем выделяются языки типа:
- семитских, с разрывными морфемами, или супрафиксами,
- австронезийских, с морфемами в виде непрерывных цепочек, но допускающие инфиксы или редуплицирующие другой сегментный материал.
Просодическая, или неконкатенативная, модель возникла в 1970-80-е гг. в работах М. Халле, Ж.-Р. Верньо, Дж. Харриса. В ней нашли свое продолжение идеи "длинного компонента" (long component theory), развивавшиеся еще З. Харрисом [163], [164] и в ранней работе Н. Хомского [107]. В 1940-50-х гг. стремились построить строгую, чисто формальную модель неконкатенативных систем семитского типа. Теперь же [251], [250] речь идет о
-69- применении идей "аутосегментной фонологии" к морфологическому описанию. Главную роль играют нелинейные фонологические репрезентации. Технические приемы описания связаны с понятиями линий связи и ярусов (tiers). Морфема является главным полем, на котором разворачиваются события в процедурах такой морфологии.Информация о канонической организации каноническом образце (canonical pattern) сегментов в какой-либо форме представляется на ином ярусе, чем информация о реальных разновидностях сегментов, представленных в форме слова. Ярус канонического образца называется просодической диаграммой (prosodic template). Важной (во всяком случае, дл семитских языков) является разновидность просодической диаграммы, состоящая из указаний на последовательность фонем в терминах согласных и гласных CV-skeleton ("согласногласный скелет"). Есть еще просодические диаграммы, задающие единицы более высокого уровня слоги (sigma templates), метрическую стопу, части таких единиц и комбинации единиц различных уровней. Ярусы с сегментным материалом связываются с просодическими диаграммами посредством аутосегментных правил связи [249, с.22].
В силу этих свойств лексическая статья имеет структуру дерева, в котором доминирование интерпретируется как отношение производности: доминированный узел указывает на единицу, полученную в результате деривации от более высокого узла [251, с.386]. Все морфологические правила имеют вид:
A --> B / X,
где A, B, X цепочки элементов возможно, и пустые. Не только неконкатенативные (типа семитских), но и конкатенативные языки с аблаутом, как утверждается в работе [251, с.361], можно описать с помощью таких правил (в терминах замены цепочек в цепочечном же контексте).
Это "европейская концепция" морфологии [129, с.73], испытавшая влияние "естественной фонологии". Человеческий язык рассматривается как система решения задач, таких как когниция и коммуникация. Исходной целью этого направления была параметризаци
-70- языков. Основные положения [130, с.519]:1. Явные и скрытые морфологические универсалии коренятся в экстраязыковых факторах, таких как специфика перцепции человека и общесемиотические принципы (отсюда задача построения семиотической метатеории). На этих факторах основаны шкалы естественности: наиболее естественное менее естественное и т.д. до наименее естественного. Естественностью называется относительная маркированность. По [248, с.2], естественность обратно пропорциональна маркированности. Так, морфологический процесс или структура считаются естественными, если:
- широко распространены и/или,
- относительно рано усвоены и/или,
- относительно устойчивы в отношении языкового изменения или часто регенерируются, возникают в развитии языка.
2. Функциональность. Одна функция обслуживается несколькими морфологическими техниками, не ранжируемыми по степени предпочтения в отличие от шкалы естественности. Одна техника может обслуживать более одной функции.
3. Языки типологизируются на основании возможностей выбора и применимости базисных техник.
4. Модели морфологии интерактивны: словообразование взаимодействует со словоизменением, а морфология в целом с фонологией (в концепции естественной фонологии), с синтаксисом и с лексиконом.
Классификация естественных морфологических процессов такова [248, с.2]. Синтагматические процессы противопоставлены парадигматическим. Первые бывают аддитивными или неаддитивными, вторые же аналогическими и субституирующими. Среди аддитивных процессов различаются сегментные и несегментные, среди неаддитивных модуляторные, связанные с нулем, субтрактивные и контаминация. Наконец, сегментные процессы бывают двух типов: аффиксация и редупликация.
Вводится понятие градуируемой диаграмматичности [248]: отдельные техники ранжированы по степени относительной иконичности. Наиболее естественная техника занимает высшую позицию на этой шкале иконичности:
1) аффиксация;
-71-2) аффиксация с внутренней модификацией;
3) внутренняя модификация, типа: pfeifen priff, Mutter Mütter;
4) нулевая аффиксация, или конверсия;
5) субстракция, или вычитание. Например, в немецких диалектах имеем: Fisch "рыба" с долгим i в единственном числе и с кратким во множественном, Hond "собака" в единственном и Hon во множественном;
6) супплетивизм.
Эта шкала сказывается при усвоении языка, отражая последовательность внедрени соответствующих техник: от наиболее естественных к наименее естественным [285, с.29]. На основе классификации морфологических процессов и этой шкалы В.Дресслер предложил универсальную шкалу естественности для техник словоизменения и деривации.
Суть данной теории состоит в трактовке морфем, входящих в состав слова, как аналогов слова в синтаксической структуре: морфемы могут принимать те или иные типы аргументов и соответствующим образом делать вклад в семантику целого слова.
Все морфемы как корневые, так и аффиксальные имеют свои лексические статьи и содержат, среди прочего, следующую информацию [227, с.252]:
- категория и подкатегоризация: к какому типу лексических единиц морфема может присоединяться;
- семантическая репрезентация, аргументная структура (в виде кортежа, состоящего из семантических ролей агент, тема, цель и т.п. при глаголе);
- диакритические характеристики.
Морфемы вставляются в деревья с бинарным ветвлением, не обладающие еще метками узлов, но отвечающие условиям подкатегоризации вставляемых единиц. Узлы этих деревьев затем проходят маркировку в соответствии со следующими четырьмя "конвенциями о распространении признаков":
1. Все признаки корневой морфемы (основы stem), включа
-72- категориальные признаки, просачиваются вниз вплоть до первого неветвящегося узла, доминирующего данной морфемой. Если, скажем, морфема standard помечена признаком N (имя), то узел непосредственно над нею получит метку N. Например, из дерева, указанного слева, по этой конвенции получим дерево, указанное справа:│ │ →
│ │
[[standard]N [ize]V
ЪДДДДДДДБДДДДДДДїN │
│ │
[[standard]N
[ize]V
2. Все признаки аффиксной морфемы, включая признаки категории, просачиваются до
первого ветвящегося узла, доминирующего над этой морфемой. Поэтому из предыдущего
дерева получим:
V
N │
│ │
[[standard]N
[ize]V
3. Если ветвящийся узел остался без меток даже в результате работы второй конвенции,
то он получает признаки в наследство от ближайшего вниз помеченного узла. Так, из дерева
слева получим дерево, указанное справа:
ЪДДДДДДДБДДДДДДДї
│ V →
│ │
[counter [attack]V]V
V ЪДДДДДДДБДДДДДДДї│ V
│ │
[counter
[attack]V]V
4. Если две основы образуют составную основу (являются "сестрами" в морфологическом дереве слова), то признаки более
-73- правой в дереве основы продублируются у доминирующего узла.Эта конвенция в отличие от предыдущих не универсальна, а действительна только дл языков типа английского. Пример будет дан ниже.
В результате самый верхний узел морфемного дерева слова получит тот же набор признаков и категорий, что самый внешний аффикс, если аффиксы в этом слове есть, а в противном случае
- тот же, что и самая праволежащая основа (если имеются только основы). Вот как
получается результирующее дерево слова:
a. ЪДДДДДДДБДДДДДДДї (бинарное дерево без меток)
б. ЪДДДДДДДБДДДДДДДї (после вставления морфем)
[branch]
[brown]
в. ЪДДДДДДДБДДДДДДДї (по конвенции 1)
N A
│ │
[branch]
[brown]
г.
A
N A
│ │
[branch]
[brown]
Вся конкретная информация хранится в лексиконе в виде лексических статей. Компонент
порождения, использующий лексикон, продуцирует большее множество структур, чем
допустимо данным языком, а затем отфильтровывает посторонние. Это отфильтровывание
осуществляется с помощью "принципа связывания аргумента", для формулировки которого нам
потребуется сначала ввести дополнительные понятия [227, с.257].
Внутренними аргументами (в смысле [325]) называются все обязательные (т.е. лексически заданные lexically specified)
-74- аргументы, кроме подлежащего.Семантическими аргументами являются те составляющие предложения, которые не являются обязательными, или лексически заданными. К таким аргументам относятся локатив, инструменталис, составляющие образа действия, агентив и т.п.
Свободным аргументом называется основа, не связанная ни с какой лексической единицей, принимающей аргументы.
При этом глаголы и предлоги считаются принимающими аргументы, т.е. морфемами, лексические статьи которых имеют аргументные структуры. А вот существительные и прилагательные, вообще говоря, аргументов не принимают.
Принцип связывания аргументов формулируется как двойное положение следующим образом [227, с.258]:
1. В конфигурации вида:
[]V[]X , []P[]X, []X []P , []X[]P
(где Х соответствует произвольной категории) узел с меткой V или P должен связывать все внутренние аргументы.
2. Если одна основа с меткой категории является свободной в рамках сложной основы, другая подоснова которой способна принимать аргументы, то первая должна интерпретироваться как семантический аргумент этой второй, т.е. как локатив, составляюща образа действия, инструменталь или бенефактив.
Во избежание недоразумений сразу же укажем, что речь идет о концепции, разрабатываемой большой группой ученых, в частности, М.Халле, П.Кипарским, К.Мохананом и др.
Эту концепцию следует отличать от одноименного подхода в рамках "реалистичной грамматики" М.Брейма [86, с.59], где считается, что лексические статьи содержат указание не только на заглавную форму аффикса, но и на всевозможные его фонологические ("фонетические", в терминологии автора) реализации. Например, в лексической статье дл аффикса перфекта в английском языке указываются:
- фонетические варианты: d, t, id,
-75-- глагольные функции,
- общелексические правила избыточности: сочетаемость с показателем перфекта в рамках глагольной составляющей, главой которой является глагол с этим аффиксом.
Главное же в концепции М. Брейма: правила лексической фонологии трактуются как инструкции о комбинировании морфем при соблюдении допустимой (в данном языке) лексической избыточности или (что то же самое в интерпретативной грамматике М.Брейма) как фильтры сочетаемости этих морфем с лексемами. Ниже пойдет речь о другой концепции о той, которую столь же уместно называть фонологией составляющих (phrasal phonology), "стратифицированной морфологией" (level-ordered morphology) [210] и лексической морфологией [323, с.21-22]. Лексическая фонология выработала своеобразные принципы трактовки материала [149, с.218] и организации описания.
Цель этого подхода к структуре слова [210, с.131]:
- построить теорию морфологии и лексикона, в которой морфология разделена на уровни;
- исследовать законы лексической репрезентации и работы фонологических правил;
- разработать "метрическую теорию" ударения.
Раз морфология вся в лексиконе, можно отказаться от трансформаций, из-за которых приходилось считать правила упорядоченными. "Внешнего" упорядочения правил нет [255, с.2].
Как же это реализовано "технически"? Деривация и словоизменение организованы в серию уровней, каждый из которых связан (ассоциирован) с некоторым набором фонологических правил, обладающих соответствующей сферой действия. Упорядочение уровней приводит к упорядочение морфологических процессов образования слова [211, с.3]. Результат же каждого такого процесса подвергается в рамках самого лексикона работе фонологических правил того же уровня. Это позволяет провести базисное разграничение между фонологическими правилами, связанными с одним или несколькими уровнями в лексиконе, и теми, которые работают над комбинациями слов в предложении. Первые правила "лексической фонологии" образуют циклы, поскольку могут работать после каждого шага словообразовани на своем морфологическом уровне. Вторые же правила постлексической фонологии нецикличны.
-76-Таким образом устанавливается соответствие между линейным порядком значимых элементов в слове и последовательностью фонологических процедур. Потому возникают предпосылки для типологии языков, основанием для которой являются факторы (синтаксические, семантические и/или фонологические), определяющие порядок морфем в слове [197, с.104].
Исходные положения [323, с.21-22]:
1. Лексикон содержит внутренние модули, упорядоченные между собой блоки, характеризующие работу морфологических и фонологических правил. Вследствие этого имеет место сложное взаимодействие между морфологическими и фонологическими правилами. Морфология и фонология не отгорожены друг от друга.
2. Лексические правила строго цикличны и не вносят никаких различий и типов сегментов, которые отличались бы от тех, что в лексиконе уже есть. Это своеобразное обобщение гипотезы Эмондза [134], согласно которой трансформации не могут создавать никаких типов структур, отличных по типу от тех, что создаются базовым компонентом грамматики.
3. Система фонологических правил внеположена разбиению на модули: одно и то же правило может входить и в лексический, и в постлексический модуль. В этом отличие от "естественной порождающей фонологии" и от "естественной фонологии": различаются не типы правил (как в последних), а модули [257, с.591]. Можно поэтому отказаться от апеллирования к границам слова и морфем (в стандартной генеративной фонологии для этого используютс символы +, #): достаточно морфологической информации в терминах составляющих (в скобочной записи) и лексических слоев, или уровней [257, с.575-576].
Фонологические правила объединены с правилами образования слова и работают в лексиконе [204, с.489]. Фонологический компонент разбит на две автономные подсистемы, правила и принципы которых обладают абсолютно разными свойствами [204, с.463]:
1. Лексическая подсистема помещает фонологические правила в рамки лексикона, где они взаимодействуют со словообразовательным компонентом. Постлексическая же подсистема работает над фонологическими словами в рамках поверхностного синтаксиса. Лексические правила работают над тем, что получится после
-77- каждого процесса формирования слова, а потому цикличны и могут зависеть от очень частных лексических свойств и даже допускать исключения. Постлексические правила обычно не принимают во внимание внутреннюю морфологическую и лексическую структуры.2. Постлексические правила работают в рамках морфемы, а лексическим правилам требуется более широкий контекст.
Фонологические правила работают и в лексиконе, и в синтаксисе. Лексикон организован по уровням, определяемым множеством морфологических (словообразовательных и словоизменительных) процессов. Фонологическое правило допускается к работе над некоторой компактной областью, состоящей из одного или нескольких уровней лексикона и/или синтаксиса [212, с.135]:
Базисные лексические статьи |
||||||||
↓ |
||||||||
уровень 1 морфология |
↔ |
|||||||
ФОНОЛОГИЯ |
||||||||
уровень 2 морфология |
↔ |
|||||||
↓ |
||||||||
уровень n морфология |
↔ |
|||||||
↓ |
||||||||
синтаксис |
↔ |
|||||||
(Вертикальные стрелки обозначают переход сверху вниз от базисных лексических статей к фонологии и от морфологии к синтаксису.)
Наборы фонологических правил, работающих в рамках лексикона и синтаксиса, получают обозначения, соответственно, лексической и постлексической фонологии. Эти наборы могут пересекаться: одно и то же правило может принадлежать обоим множествам, и таких случаев много. Однако в разном качестве работают эти правила по-разному, подчиняясь принципам, регулирующим работу каждого из этих компонентов. Правила лексической фонологии работают циклично, однако внешнее упорядочение у них отсутствует. Постлексические правила работают "по всему полю" (across the board) и нецикличны; более того, они, видимо, автоматичны, в следующем смысле: они не обладают доступом к лексическим
-78- и морфологическим признакам и, в частности, поэтому не имеют лексических исключений. В этом отношении постлексические правила напоминают правила аллофонии в классической фонемике. Однако, в отличие от последних, постлексические правила могут обладать нейтрализующим эффектом.Эта модель, по мнению ее сторонников, обладает следующими достоинствами [199, с.475]:
1. Дает деривационной морфологии доступ к словоформам в качестве параметра универсальной грамматики. Эта опция действительно используется в некоторых языках, как в исландском, где суффикс образования прилагательных и наречий -leg , присоединяемый к основам без флексии как в слове alvarlegur "серьезный" (Им.п. муж.рода от существительного женского рода alvara "серьезность"), также может присоединяться к существительному с флексией генитива (ognarlegur "ужасный, страшный" от Род.мн. ognar от существительного женского рода ogn "ужас"). То же в английских формах типа uninhabited, когда inhabited считается словоформой причастием прошедшего времени, используемым для образования прилагательного.
2. Объясняет словоизменение в терминах более общих принципов, необходимых даже за пределами морфологии таких как принцип просачивания признаков, так что отпадает необходимость в чисто морфологических принципах.
3. Позволяет дать обобщенное описание для операции основосложения, деривации и словоизменения. Эта операция выглядит как присоединение морфемы в соответствии с ее "субкатегоризационной рамкой" (subcategorization frame) [208].
4. Эта модель, основанная на понятии морфемы, более обща и более гибка (в эмпирическом отношении), чем конкурирующие модели, также основанные на понятии процесса.
Лексическая фонология разрабатывает положение (высказанное еще в середине 1970-х гг. в различных работах) о том, что лексикон состоит из упорядоченных слоев (strata), или уровней, а каждый морфологический процесс аффиксации связан с некоторым
-79- конкретным уровнем [161, с.57].Например, в английском все аффиксы класса 1 (-ic, -ion, -ity, in-), связываемые в стандартной генеративной фонологии [115] с особой границей +, присоединяются на слое 1, а аффиксы класса 2 (типа -ness существительного, -ed прилагательного, -hood, un-), ассоциированные с границей # в той же концепции, присоединяются на слое 2. Таким образом, хотя аффиксы класса 2 могут присоединяться к основам, содержащим аффиксы класса 1 или класса 2, обратное неверно: аффиксы класса 2 не могут присоединяться к основам, содержащим аффиксы класса
2. Ср. правильные цепочки grammaticality, grammaticalness, guardedness и неправильную *guardedity.
Однако кроме этих двух типов бывают еще как минимум три следующих. На слое 3 образуются составные основы (compound formation), а на слое 4 происходит словоизменение по общему правилу (типа в английском образования форм множественного числа или прошедшего времени и причастий глагола). Почему? Да потому, что регулярные флексии могут присоединяться к словам любого типа как с суффиксами, так и без них, как к составным, так и ровно с одной корневой морфемой. Но после того, как флексия присоединена, нельзя больше добавить никаких суффиксов. Нельзя и присоединить слово, получившее флексию, слева в рамки составного образования (кроме некоторых особых случаев).
Есть еще и пятый слой, постлексический, на котором слова объединяются в более крупные синтаксические единицы.
Языки варьируются по количеству слоев, но всегда есть как минимум два слоя: лексический и постлексический.
Правила фонологии взаимодействуют со слоями морфологии таким образом, что фонологические правила приписаны к конкретным морфологическим слоям (служащим областью их работы), причем каждое конкретное фонологическое правило работает только на том слое, к которому оно приписано. В английском языке фонологические правила работают на одном из пяти уровней, причем есть правила, работающие более чем на одном уровне. Например, на уровне 1 работают правила укорочения и удлинения гласного.
В концепции [161, с.59] указатели границ слова, морфемы и т.д. не приравниваются по статусу к сегментам (в этом отличие
-80- от стандартной генеративной фонологии), а считаются указателями начала или конца составляющей в рамках цепочки. После того как все правила проработали на данном уровне, указатели границ между морфемами стираются, так что правила, работающие на последующих уровнях, не могут опираться на информацию о морфемном составе данного уровня таков смысл соглашения о стирании скобок [161, c.61].Известно, что аффиксация уровня 2 и основосложение (уровень 3) могут подаваться на
вход друг друга, ср.: (re((air)(condition))), где скобками помечены границы
морфем, входящих в слово. Эти два процесса не разграничены по морфологической
дистрибуции в отличие от противопоставления уровней 1 и 2. Имеем "петлю" между уровнями
2 и 3:
1: деривация класса 1, нерегулярное словоизменение
┌→2: деривация класса 2
└3: основосложение
4: регулярное словоизменение.
Эта петля свидетельствует о различении фонологических уровней вне разграничения по морфологической дистрибуции.
Правила постановки ударения, работающие на уровне 1, по всей видимости (по крайней
мере, для английского), являются циклическими поэтому-то весь уровень 1 считаетс
циклическим [161, с.66]: эти правила работают над каждой морфологической составляющей
данного уровня как над основой, так и над каждой составляющей, возникающей в результате
морфологических процессов сразу же после каждого такого морфологического процесса.
Результат работы фонологических правил снова может подаваться на вход в морфологию. В
общем виде имеем такую схему циклической работы:
|
|||||||||||||||||||||||||||||||
Морфология (уровень X) |
ЦИКЛИЧЕСКИЙ УРОВЕНЬ (фонологические правила, напр., уровень 1 в англ.) | ||||||||||||||||||||||||||||||
|
скобками пометить границы морфологических составляющих):
(th'eatre) --> ((th'eatr)(ic)) --> ((the'atr)(ic)) -->
(the'atric) --> ((the'atric)(al)) -->
Кроме цикличных уровней, есть еще и нецикличные. На нецикличных уровнях все
морфологические процессы действуют блоком, после которого только и могут работать
фонологические правила этого же уровня. Имеем:
НЕЦИКЛИЧЕСКИЙ УРОВЕНЬ ↓
↔ |
|||||||||||||||||||||||||||||||
Морфология (уровень X) |
Фонологические правила (напр., уровень 2 в англ.) | ||||||||||||||||||||||||||||||
|
Фонологические правила лексикона упорядочены в группы, по "уровням" [143, с.101]. Результат работы правил каждого уровня подается на вход в фонологию. В результате имеем лексическую статью и довесок, обрабатываемый морфологическими правилами следующего уровня. После работы на последнем уровне морфологических правил и после фонологических правил приходим к лексическому уровню, именно на нем слова и хранятся в лексиконе. Постлексические фонологические правила переводят лексическое представление в поверхностную форму. Причем [257]:
1. Лексические процессы не выходят за границы слов.
2. Постлексические операции не обращают внимания на внутреннюю структуру слова и не знают исключений.
Версии лексической фонологии, различаясь между собой в деталях, сходятся в упорядочении лексических уровней. Однако в
-82- одних версиях (К.Моханан) каждое фонологическое правило помечено в соответствии с тем, на каком уровне оно может работать, при том что в конце каждого морфологического уровн фонологические правила работают без ограничений. В других версиях как у П.Кипарского фонологические правила работают без ограничений на каждом уровне, но допустимы уточнени типа: "Правило R не может работать на уровне L". Правила лексического уровня отличаются от правил постлексического уровня не только порядком работы, но и в следующих отношениях [214, с.108]:Лексические правила: | Постлексические правила: |
- работают в рамках слова | не привязаны к границам слова |
- имеют доступ к внутренней | имеют доступ только к структуре НС |
структуре слова | |
- предшествуют всем постлексическим правилам | работают после всех лексических правил |
- цикличны | работают ровно один раз |
- работают в производном контексте | работают across the board |
- сохраняют структуру | могут нарушать структуру |
- могут иметь исключени | автоматичны |
- либо работают, либо нет | работают "в определенной степени" |
Различные морфемы, как и правила, могут иметь различный статус. Например, в некоторых языках (как в австралийском языке нгиямбаа) различаются клитики лексического и постлексического уровней [214, с.109].
Принимаются следующие положения о правилах, работающих в рамках лексикона [162, с.78]:
1. Каждое правило, обладающее лексическими исключениями, работает в рамках лексикона (хотя не каждое лексическое правило имеет исключения).
2. Правила, для работы которых существенна внутренняя структура слова, являютс лексическими.
3. Правила, относимые к лексическим, работают циклично. Итак, есть два вида правил: циклические и постлексические. Первые работают в рамках лексикона и взаимодействуют с
-83- морфологическими правилами. Постлексические же правила работают в рамках фонологического компонента, упорядоченного после синтаксического. Иногда [81, с.1] разграничивают два вида лексических правил (в рамках лексикона):- циклические, взаимодействующие с морфологией,
- постциклические, работающие после морфологии.
Тем самым разграничиваются фонология слова и фонология предложения, а модули
взаимодействуют так [81, с.3] (лексикон выделен желтым цветом):
Список слов / основ |
|||||||||||||||||||
|
|||||||||||||||||||
морфологические правила |
циклические фонологические правила |
||||||||||||||||||
|
|||||||||||||||||||
постциклические фонологические правила |
|||||||||||||||||||
СИНТАКСИЧЕСКИЙ КОМПОНЕНТ |
|||||
ФОНОЛОГИЧЕСКИЙ КОМПОНЕНТ (постлексические правила) |
|||||
- допускающие выход за рамки слова и использующие свойства структуры НС или синтаксической структуры в широком смысле,
- "субфонемные правила", оперирующие неразличительными признаками (вставлением их, конкретизацией "спецификацией") и работающие или не работающие в зависимости от них.
Лексические правила, работающие в рамках лексикона, а потому перед всеми постлексическими правилами, и нечувствительные к фонологическому материалу в соседних словах, делятся на два классса:
-84-- фонологическое приспособление (phonological adjustment), поводом для которого является соположение морфем; например, таково правило спирантизации /k/ в английском, когда имеем: electric /elektrik/ electricity /elektrisiti/, под влиянием морфемы -ity;
- модифицирование сегментной структуры, когда исходная форма не удовлетворяет фонотактическим условиям правильности слова скажем, требованиям к слоговой структуре.
Иногда [257, с.575], в отличие от концепции [211], считают, что каждый лексический слой должен характеризоваться как область либо циклической, либо нециклической работы правил. То есть, различаются цикличные и нецикличные слои в грамматике. Одно и то же правило работает циклично в цикличном слое и нециклично в нецикличном, в соответствии со следующими принципами установления области действия (Principles of Domain Assignment) [257, с.578-579], [161, с.58]:
1. Немаркированной областью действия правила является постлексический модуль, причем в немаркированном случае каждое правило связано с одним единственным слоем в качестве своей области работы (морфологический контекст дает позитивные указания на то, может ли работать данное правило). Область работы правила это набор непосредственно смежных слоев.
2. В отсутствие оснований для противного, в область работы конкретного правила входит минимальное число слоев.
3. Если нет причин для противного, самый нижний слой включается в сферу действи правила (в работе [161, с.58] наоборот: самый высокий допустимый слой считается областью работы правила, где самым нижним слоем считается слой 1; в названных двух работах принцип один и тот же, но различны способы нумерации слоев).
В силу этого [161, с.58], в немаркированном случае все фонологические правила работают на постлексическом уровне и только на нем. Неизвестно, есть ли языки, в которых все фонологические правила работают только на постлексическом уровне.
Отнесение фонологических правил к лексическому и/или постлексическому компоненту связано со следующим [257, с.579]:
1. Правила, для работы которых необходима морфологическа
-85- информация, а также правила, работающие до них, относятся к лексическому модулю.2. Границы слов нарушаются лишь в постлексическом модуле.
3. По умолчанию, когда нет оснований для противного, правила работают только в постлексическом модуле.
Эти репрезентации задаются исключительно в терминах различительных (distinctive), или контрастивных (contrastive), признаков данного языка, а потому лексико-фонологические правила могут оперировать только различительными признаками и не могут апеллировать ни к каким избыточным, или предсказуемым, фонологическим признакам (к предсказуемым признакам относится, скажем, придыхательность взрывных в английском) [149, с.219]. Из-за этого (как показывается на примере описания консонантной системы языка малаялам, где имеется семь возможностей различного места артикуляции у взрывных и у назальных согласных) значительно сокращается необходимый набор противопоставлений на исходном уровне [257, с.575].
Есть три уровня фонологической репрезентации: исходный, лексический и фонетический. Исходная репрезентация подается на вход в фонологические процессы в рамках лексикона. В результате получается лексическая репрезентация, которая затем подается на вход в постлексические правила. Лексический "алфавит" состоит из "лексических фонем" и не обязательно должен совпадать с исходным алфавитом (состоящим из "исходных фонем"). Лексический алфавит предопределяет восприятие звуков речи у каждого носителя языка, а также суждения носителей языка о различительности сегментов [257, с.575-576].
Свойства фонологических репрезентаций в лексиконе [162, с.78]:
1. Исходные репрезентации не избыточны: в них специфицированы только непредсказуемые значения признаков. Избыточность избегается следующим образом [149, с.243]:
1.1. Признаки, не являющиеся различительными в некоторой части инвентаря исходных сегментов, не должны фигурировать в
-86- качестве характеристики сегментов этой части инвентаря и бракуются "фильтрами признаков".1.2. Из исходных форм удаляются спецификации признаков, не являющиес маркированными ни в каком конкретном фонологическом контексте. Все остальные признаки (неизбыточные) обладают более или менее предсказуемым (немаркированным) значением, они только и могут задаваться в рамках исходных форм.
2. Неспецифицированные значения признаков вставляются в результате работы конкретноязыковых правил и универсальных правил маркированности. Оба типа правил цикличны.
3. Конкретноязыковые правила работают до универсальных.
Суммарно имеем [149, с.248]:
1. Абсолютные ограничения на лексические репрезентации:
- действуют на всей территории лексической фонологии, от начала до конца;
- исключают всякую возможность оперировать каким-либо конкретным значением какого-либо признака;
- задают "возможные" (в противоположность "невозможным") для данного языка фонологические репрезентации;
- формулируются в виде статичных фильтров;
- выражают характерные избыточные признаки в рамках неполной, но однозначно дополняемой теории.
2. Высказывания о маркированности для исходных форм:
- шаг за шагом (подобно упорядоченным правилам) устанавливают значения признаков по ходу лексической деривации; немаркированные признаки, содержащиеся в исходных формах, получают значение в результате этого;
- преобразуют привативную оппозицию в эквиполентную;
- устанавливают, что является "более предпочтительной" (менее маркированной) репрезентацией, а что "худшей" (более маркированной), но не задавая "хорошие" ("возможные") и "плохие" ("невозможные") репрезентации;
- являются не чем иным как лексическими правилами фонологии, а потому могут менять признаковые спецификации у неисходной репрезентации;
- выражают часть "недоопределенной" теории, отвечающую за элиминирование немаркированных признаковых спецификаций.
-87-Основные разногласия между самими разработчиками концепции связаны с положением о том, что одно и то же правило может работать в обоих модулях. Некоторым это положение кажется недостаточно аргументированным. Более правдоподобным такие исследователи считают классический стиль разграничения, когда правило может быть отнесено либо к одному модулю, либо к другому [143, с.101].
Сторонники "интерпретативной морфологии" (С.Андерсон, П.Мэттьюз и др.), критику лексическую фонологию, считают, что следует вернуться к классическому разграничению деривационной и словоизменительной морфологии. Деривация интегрирована в лексикон, а словоизменение составляет постсинтаксическую часть описания. Морфология ограничиваетс внутренней структурой слов, а словоизменение составляет независимую часть [153, с.189]. Таким образом, словообразовательная морфология часть синтаксиса [153, с.193]. В этом отличие от лексикалистской, в частности "лексической", морфологии, где оба раздела рассматриваются как часть лексикона. Словообразование в лексикалистской морфологии не играет особенной роли, поскольку словоформы всегда генерируются в рамках лексикона.
СЛОВОИЗМЕНЕНИЕ И СЛОВООБРАЗОВАНИЕ
Разграничивались словообразование и словоизменение далеко не с самого начала грамматической традиции. У Дионисия Фракийского этого разграничения не было, а у Марка Теренция Варрона оно было [308, с.37-44]. Для Варрона фундаментальным было различие между declinatio voluntaria (установление формы существительного по воле говорящего) от declinatio naturalis (класс существительного по природе референта предмета, им обозначаемого). Дионисий же не различает деривацию и словоизменение, его многочисленные типы и подтипы имен основаны на содержании, т.е. на значении, а не на форме. У него находим такие типы, как "патронимы", "синонимы", "названия народов", но не "первое склонение", "второе склонение", "третье склонение" и т.д. Интересно, что Варрон классифицировал склонения, исходя из того, как выглядит морфема аблатива единственного числа, к чему позже пришли структуралисты.
Противопоставление словоизменения и словообразования основано на следующей гипотезе (не всегда высказываемой явно): принципы, которым подчиняется структура слова [61, с.571], могут быть огрубленно подразделены на те, которые регулируют дистрибуцию морфем или компонентов слова, и те, которые регулируют вариации формы, проявленные этими элементами.
В.В.Виноградов [8, с.44] различал семь "основных методов образования форм слов":
1. Сложение слов или словоформ: самый красивый, буду читать, я хотел бы и т.п. Ср. аналогичное этому образование слов: заблагорассудиться, пятьдесят, никто и т.п.
2. Окончания и суффиксы: щец (от щи), выиграть выигрывать, колено колени колена коленья и т.п., ср. в просторечии формы склонения наречи завтра: до завтрава, к завтраму. Ср. также: сеть и сетка, пузырь и пузырек, мех и мешок.
3. Аффиксация: бледнеть побледнеть; дичать одичать; скверный прескверный и т.п. Ср.: покинуть (соотносительно с
-89- кинуть); прекрасный (ср. красный) и т.п. Переходный комбинированный тип представляют формы предложного падежа имени существительного: о славе, (тосковать) по отце (ср. тосковать по братьям) и т.п.4. Одновременное, комбинированное применение суффиксации и префиксации. Например, в выражении прекраснейшей души человек; предобрейший форма элятива слова добрый. Однако это редкий способ. Ср. образование слов вроде: нагуляться, насидеться, заречье, предплечье.
5. Внутренняя флексия плюс звуковые чередования основы, чаще всего в связи с суффиксацией. Например: село сёла, заподозрить заподазривать, заходить захаживать. Ср.: резать и разить, нести и носить и т.п.
6. Превращение разных слов в формы одного слова или врастание слова в систему форм другого слова. Например: идти я шел, говорить сказать, уходить уйти, плохой хуже, ребенок дети (супплетивизм).
7. Превращение союзного сочетания форм разных слов в форму одного из этих слов грамматически возобладавшего. Например: возьму и скажу (крайне редкий и неустоявшийся тип).
К резервным относится, по В.В. Виноградову [8, 44], удвоение при образовании усилительных форм: сидит-сидит, синий-синий, едва-едва, еле-еле и т.п. Ср.: чуть-чуть, вот-вот, ни-ни.
"Материальное" сопоставление флексии (окончания) со словообразовательным аффиксом находим у Г.О. Винокура [10, с. 400]: "[ ] в случае комплексных морфем наличие хотя бы одного из членов комплекса служит вполне достаточной гарантией того, что в языке та же основа реально существует и в соединении с каждым другим членом данного комплекса порознь. Если какой-нибудь из таких ожидаемых случаев и отсутствует в языке (например, отсутствует первое лицо единственного числа от глаголов типа победить и т.п.), то это своеобразное проявление дефектности именно данного слова, чего никак нельзя сказать при отсутствии слова дамих при жених и т.п." Для словоизменения нетипичны лакуны, а для словообразования типичны.
Другие отличия аффиксов от окончаний [10, с.400] таковы:
- первые невозможны без вторых, но вторые возможны без
-90- первых,- окончание заканчивает собой разложимый знак: первый всегда предшествует второму,
- окончание может быть только после основы,
- аффиксов в слове может быть и несколько, но окончание только одно,
- окончания никогда не являются в звуковых чередованиях, а аффиксы могут представлять собой и чередующиеся вариации звуковых комбинаций, например сладок сладка,
- окончания могут составлять и нуль звука, тогда как аффикс в виде нуля звука, если и возможен в исключительных случаях, то только в слиянии с нулем звука окончания. Таковы: погиб, вез, где в нуле звука слиты суффикс и окончание (ср. погибли, везли).
Различия эти не справедливы для арабского, где при спряжении глагола в настоящем времени имеем: yatakallamu "(он) разговаривает" и yatakallamuwna "(они) разговаривают" (мы пользуемся транслитерацией, а не фонетической транскрипцией), где ya флексия 3 лица, ta показатель пятой породы (то есть словообразовательный аффикс), kallam производное от корня klm при образовании пятой породы, u флексия единственного числа, uw флексия множественного числа, na показатель того, что форма завершена и к ней не будет присоединена энклитика (местоименный прямой объект). Несомненно справедливо и универсально только последнее утверждение о невозможности нулевого словообразовательного аффикса.
Да и в русском слове, как полагает И.Г. Милославский (с которым мы солидарны), может быть до четырех словоизменительных элементов, или флексий, ср.: перепис-ывавш-ий-ся (учениками диктант). Возможны следующие позиции флексий в русском слове [34, с.233-239]:
1) после основы в конце слова (дом-а, добр-ый, нес-у),
2) после основы перед словоизменительным элементом (нес-л-а, скаж-и-те),
3) после основы перед словообразовательным элементом (мо-ю-сь, мол-ят-ся),
4) после словообразовательного элемента в конце слова
-91- (нес-л-а, ид-и-те),5) после словоизменительного элемента перед словоизменительным элементом (стро-ящ-ий-ся дом),
6) после словоизменительного элемента перед словообразовательным (берег-и-те-сь).
Есть ли универсальные различия между словообразованием и словоизменением? На этот вопрос в рамках "естественной морфологии" В. Дресслер [131, с.5] отвечает так. Словоизменение и деривация не образуют два разных класса. Есть "прототипичная" деривация и "прототипичное" словообразование как противоположные полюсы на морфологической шкале:
1. Парадигмы словоизменения, вообще говоря, значительно менее дефектны, чем деривационные категории или "деривационные парадигмы". Соответственно, значительно меньшее количество форм бракуются в словоизменении, чем в словообразовании.
2. Принцип композиционности (Г. Фреге) почти всегда справедлив в словоизменении и играет второстепенную роль в деривации. Производные слова значительно чаще идиоматичны, чем словоформы, рассматриваемые на фоне заглавного слова.
3. Формы словоизменительной парадигмы чаще выравниваются по аналогии, чем дериваты одной и той же основы.
4. Словоформы относятся к той же синтаксической категории (классу слов), что и заглавные формы: типовое словоизменение не меняет категорию, а типовая деривация меняет.
5. Формативы словоизменения обычно подчиняются более строгим фонотактическим условиям, чем формативы деривации.
6. Словоизменительные формативы обычно занимают периферийную позицию в словоформе (и/или в начале, и/или в конце).
По [97, с.12], есть два фактора, определяющих, что данное семантическое понятие будет закодировано в виде словоизменительной категории:
1. Семантическое понятие должно быть крайне существенным для значения основы, к которой присоединяется критерий релевантности, или существенности.
2. Оно должно быть семантическим понятием достаточно высокой степени общеприложимости критерий общности.
Наиболее существенны обычно понятия необщезначимые. Расположив
-92- морфологические категории на шкале релевантности, увидим, что самые общие (common) категории лежат в центре (достаточная, но не очень высокая релевантность), и что изменени значения проявляют тенденцию к лексикализации [97, с.12]:Имеем, в частности, следующее соотношение [97, c.24]:
КАТЕГОРИЯ | ||
валентность | ||
залог | ||
вид | ||
врем | ||
наклонение | ||
согласование по числу | ||
согласование по числу | ||
согласование по роду |
Существенность, или релевантность, зависит от когнитивной или культурообусловленной "выделенности" (salience): неважно, в какой степени сущность, событие или качество разложимы на семантические признаки, они воспринимаются как отдельна форма, составляющая окружение для сущностей, событий или свойств, и им может соответствовать лексическая единица. Итак, два семантических элемента существенны друг для друга в той степени, в какой результат их комбинирования называет нечто, обладающее
-93- высокой культурной или когнитивной выделенностью [97, с.14].Общность же случай, когда (словоизменительная) категория характеризует все основы семантического или синтаксического класса, а ее наличие обязательно (облигаторно) в соответствующем синтаксическом контексте. Морфологический процесс тем более общ, чем менее семантически содержателен [97, с.16-17].
Граница между деривацией и словоизменением очень подвижна [29], [299]. Чемпионом в этой области являются языки банту, обладающие префиксами класса [259, с.254].
В литературе упоминаются следующие критерии:
1. Очерченность границ (boundedness): флексия неотделима от основы и/или привязана непосредственно к основе, и/или только узкий класс единиц может отделять в словоформе ее от основы [97, с.26-27]. Флексии почти полностью исключают неосновные грамматические морфемы на границах (до или после) словоформы (основосложение не в счет) [328, с.47] и находятся в дополнительной дистрибуции с иными средствами, привносящими то же значение [101, с.4]. Отсюда шестой критерий Дресслера.
2. Обязательность: словоизменительная категория всегда проявлена при допустимой основе, всегда есть средства выразить эту категорию при любой основе. Поэтому, скажем, если есть класс основ, не имеющих формы каузатива, каузатив следует считать деривационной, а не словоизменительной категорией [97, с.26-27]. Ср: "обязательность (понимаемая как определенность соответствующего признака на всем множестве лексем из соответствующего класса) [ ] возможна только при том типе семантических оппозиций, который характеризуется свойством непривативности" [36, c.146]. Привносимое флексией значение входит в конечный набор (или "категорию") взаимоисключающих свойств, одно из которых должно быть выражено в любой словоформе, принадлежащей к соответствующему классу слов [101, с.4].
3. Предсказуемость значения: если в грамматике необходимо перечислять значения комбинаций с различными основами, то категория не считается словоизменительной [97, с.26-27]. Проявляетс
-94- это свойство как семантическая неоднородность, "неэлементарность правил выбора соответствующих показателей" [36, c.147-148]. А правила употребления словообразовательных показателей семантически однородны и содержат только случайные лексические ограничени [36, c.147-148].4. Значимость отсутствия: при словоизменении отсутствие некоторого показателя должно трактоваться как значимое ("нулевое выражение"), а не как отсутствие категории [97, с.26].
5. Ориентация на распознавание: словоизменение обычно использует процедуры, основанные на распознавании, а правила словообразования приводят к расширению лексикона. Это отражено и пятым критерием Дресслера: строгие фонотактические требования к флексиям позволяют легче распознавать слово.
6. Грамматикализованность: словоизменение более грамматикализованно, чем деривация [131, с.5].
7. Синтаксическая значимость критерий, выдвигавшийся [6, с.126-127] Ф.Ф.Фортунатовым и его школой: словоизменительными отношениями связаны словоформы, различающиеся только синтаксическими значениями. "Словоформы, различающиес номинативными значениями, то есть словоформы, семантическое различие между которыми отражает реальные различия между соответствующими "предметами мысли", связаны межсловными (словообразовательными) отношениями" [6, с.126-127]. Другая версия: флекси синтаксически обязательна [154, с.10]. Третья версия: значение, вносимое флексией, подчинено ограничениям на совместную встречаемость со свойствами других членов того же предложения; например, ограничениям, регулирующим управление, согласование или consecutio temporum [101, с.4]. Синтаксичность словоизменения проявляется в том, что флексии
- внеположены выбору лексической единицы, например [50, с.193]: "Присутствие или отсутствие прошедшего не имеет никакого отношения к ограничению выбора лексической единицы, точно так же как наличие лексической единицы buy ничего не говорит о том, присутствует ли также прошедшее";
- зависят от класса лексемы; таковы выбор и допустимость в рамках словоформы тех или иных чередований; например, по [299, с.183], в славянских языках глагольное словоизменение
-95- связано с иными морфонематическими чередованиями, чем именное.Глагольное словообразование характеризуется сочетаемостью в одном и том же случае целого букета чередований таких как консонантные, вокальные, беглый гласный, просодические; при именном словоизменении наборы чередований ограничены.
Этот критерий небесспорен. Некоторым исследователям представляется, что есть существенные различия между отношениями типа стол стола или пишет писал и отношениями типа стол столик или писать переписать (последние два обычно считаются словообразовательными). (По [6, с.127], на этом основано различение лексемы и ономатемы.) Контрпримерами являются и упоминаемые Г.О.Винокуром [10, с.412] наречия типа: зимой, хорошо, шутя, "слова не какого-нибудь особого класса, а слова, принадлежащие к одному из трех основных классов слов русского языка, но только поставленные в особые синтаксические условия". Они могут быть разложены на части, а их окончания "как бы вынуты из тех комплексов, к которым они принадлежат, и потому создают слова с изолированной комплексной формой. Окончания наречий это все-таки окончания, а не аффиксы".
8. Регулярность, продуктивность, стандартность, не присущие словообразованию (критику этого см. [36, c.146]) и состоящие в том, что флексии:
- вносят общее значение, однозначно выявляющееся из значений составляющих [328, с.47] и проявленное всеми членами соответствующего класса слов; выражение этого значени "полностью продуктивно" [101, с.4]; ср. второй критерий Дресслера;
- не меняют принадлежность лексемы, "подвергаемой" словоизменению, к части речи [328, с.47] или вообще к классу слов [101, с.4], см. четвертый критерий Дресслера. Если следовать
В. фон Гумбольдту, это естественно, поскольку вытекает из предназначения флексии: "Совершенство языка требует, чтобы каждое слово было оформлено как часть речи и несло в себе те свойства, какие выделяет в категории данной части речи философский анализ языка. Необходимой предпосылкой для этого является флексия" [13, с.155];
- при чередованиях, нарушающих единообразие форм, склонны к выравниванию [328, с.47], ср. третий критерий Дресслера;
-96-- почти однозначно задают вспомогательные элементы (типа тематических гласных) в фонологической структуре [328, с.47];
- организованы в недефектные парадигмы, так что значительно меньшее количество форм бракуются в словоизменении, чем в словообразовании см. первый критерий Дресслера.
9. Внешняя автономия при синкретизме, например [252, с.797]: две разные именные словоформы одной лексемы не могут представлять один и тот же падеж, если их дистрибуция зависит от внешнего контекста.
10. Единственность: при синкретизме член парадигмы, для которого данна словоизменительная категория является релевантной, должен обладать только ею [252, с.797].
В этой области имеем два полярных суждения:
1. Возможно единообразное описание словоизменения и словообразования, ср.: "Ничуть не отрицая специфичности ряда проблем, стоящих перед исследователем словообразования, мы исходим из принципиальной возможности единого описания в рамках морфологии общих дл словоизменения и словообразования аспектов" [6, с.27].
Если следовать Е. Курыловичу, можно элиминировать словоизменение путем постепенного расширения области деривации. Однако: "Если же мы хотим сохранить это понятие любой ценой и обеспечить ему право на существование, следует различать основные понятия лексической и синтаксической функции, разграничивать сначала эти функции в форме флексии и затем устанавливать их иерархию" [29, с.65].
При "лексическом подходе" [255, с.2-3] в лексиконе хранятся словоформы, в готовом виде вставляемые в синтаксическую структуру. Признаки типа [+Past], [+Prog], [+Modal] выражают необходимую морфосинтаксическую информацию и позволяют грамматике без помощи трансформаций задавать правильный порядок следования вспомогательных глаголов и согласование по числу и лицу. А потому противопоставление словообразовани словоизменению не сказывается на устройстве лексикона.
-97-2. Словоизменение и словообразование должны описываться по-разному, ср. [26, с.45]: "решение о том, считать ли какую-либо формально выраженную категорию деривационной или же грамматической, имеет серьезные последствия для описания данного языка". От этого зависит, по [26, с.45]:
- чт\o включается в собственно грамматическую (парадигматическую) часть описани языка на уровне слова, а чт\o в словообразование;
- вся грамматическая паспортизация слова в словаре;
- "понимание того, как концептуализируется мир через призму языка и какую картину мира демонстрирует изучаемый нами и отдельно взятый язык" [26, с.45].
И при этом разделении имеется выбор разных возможностей. Например, во многих моделях порождающей грамматики [61], [66], [68], [289], [279, с.155-156] считают, что деривация и большая часть основосложения происходят в лексиконе (то есть, предложение строится из уже готовых основ), а словоизменение после синтаксиса (тогда из основ, к которым словоизменительные элементы присоединены в качестве отдельных составляющих, получаются словоформы). Продуктивные правила словоизменения отделены от продуктивных правил деривации и от непредсказуемых (т.е. нерегулярных) морфологических операций.
В других концепциях [226] считают, что и словоизменение, и деривация происходят в лексическом компоненте.
В третьих [288, с.351] полагают, что в лексиконе заготовлены морфологические чередования основ, а не сами словоформы.
В четвертых [279] пытаются показать, что некоторые продуктивные правила словоизменения должны предшествовать деривации. Взаимодействие флексии имен обладаемого в посессивной конструкции и образование глаголов обладания в некоторых языках американских индейцев указывают, что входом в деривацию могут быть даже целые словоформы, с полным комплектом флексий: основой таких глаголов является завершенна форма существительного [288, с.351]. Да и в русском языке можно найти примеры словообразования от словоформы, ср.: трехсторонний, пятиярусный, просторечное мое деньрожденье, моему деньрожденью.
-98-Наличие флексии в языке скорее правило, чем исключение: "Совершенное отсутствие флексий в китайском Беккер признает явлением неорганическим, исследование коего может принести языкознанию только такую пользу, какую физиологии исследование уродливости организмов" [37, с.51]. Это вытекает из интегративной функции, заключающейся в том, что флексии:
1. Организуют в иерархию "взаимосвязи между всеми морфологическими элементами, всеми морфологическими оппозициями и корреляциями данной морфологической системы" [17, c.187].
2. Объединяют словоизменительные категории в набор осей, справедливых для данного лексического класса ("в парадигму" членов этого класса), так что любую лексическую единицу можно отнести к некоторому набору противопоставленных категорий в рамках каждой из таких осей [63, с.164]. Получаются своеобразные пропорции, соответствующие заглавным и частным формам [328, с.47]. Ср.: человек : человека = яблоко : яблока.
3. Будучи "наиболее бесплотной частью слова" [10, с.404], "не знаками предметов мысли, а знаками значений, то есть как бы знаками второй степени" [10, с.402], "не дополняют значени основ, а лишь указывают способ их применения в каждом данном случае движения мысли" [10, с.401], "придают основам известные свойства, необходимые им для того, чтобы они могли функционировать применительно к данным условиям изложения, сообщения и т.д." [10, с.401-402]. Флексия "такой элемент словоформы, который выражает обязательное для данного круга словоформ синтаксическое или обязательное и регулярное для данного круга словоформ номинативное значение" [34, с.233-239].
4. "Комплектуют" слово, маркируя его отношения в рамках более крупных структур, в результате основы, обладающие логически несамопротиворечивым значением, но не фигурирующие в речи отдельно, входят в более крупные структуры [63, с.162].
5. Служат "одновременному рассмотрению понятия в его внутренних и внешних связях" [13, с.127].
-99-Как и для живых организмов, по [182, с.48], можно установить приблизительно пропорциональное соотношение между сложностью функции и длиной флексии нарушаемое разве что фузией. Например, латинские окончания множественного числа обычно более длинны, чем единственного. В флексии номинатива больше фонем, чем вокатива, но меньше, чем генитива, датива и аблатива.
Но вот нулевая флексия беззвучный сегмент, являющийся членом словоизменительной парадигмы. Что же, у него нет никакой функции? Или функция его "бесконечно проста"? Р. Якобсон [195, с.109] считал, что нулевое окончание, как и нулевая степень чередования (в русском: рот рта), противопоставленная в рамках грамматических чередований, полностью соответствует определению нулевого знака по Ш. Балли: знак, облеченный определенным значением, но без какой-либо материальной поддержки в отношении звука. Язык может удовольствоваться оппозицией чего-то с нулем не только в плане означающих, но и означаемых.
Словоизменение, по [332, с.372-373], можно задавать с помощью следующих средств:
- правила реализации (чередования и морфолексика);
- признаки, такие как падеж и лицо, отличные от пучков значений, принимаемых признаками, таких как прямой (vs. косвенный) падеж или второе (vs. не второе) лицо. Допустимо указание на пучки признаков, такие как падеж-род-число;
- упорядоченный набор (абстрактных) "прорезей", или "слотов": каждое конкретное правило предоставляет материал для конкретных слотов, причем несколько различных правил могут давать материал для одного и того же слота. Упорядочение правила относительно других зависит от упорядочения слотов.
Определенным усложнением картины является понятие "макрофлексия", определяемое (относительно пучка некоторых морфосинтаксических свойств) [101, с.50] как множество словоизменительных реализаций этого пучка, состоящее из всех реализаций, входящих в одну макропарадигму.
Из синтаксической ориентации словообразования [61] делают
-100- следующие выводы. Словообразование:1. Входит в фонологический компонент грамматики и никак не должно сказываться на семантической интерпретации предложения. В то же время, в некоторых языках (например, в слейв атапаскском языке американских индейцев) подлежащее, дополнение и дейктические местоимения имеют статус флексий и обладают свойствами согласования. А поэтому приходится принять, что некоторая часть регулярного словоизменения предшествует деривации [280, с.156]. Итак, представление, при котором словообразование включено в лексикон, а словоизменение постлексический процесс, слишком упрощает соотношение частей морфологии.
2. Согласно концепции "управления и связывания" (Government and Binding, GB) (как в работе [271, с.75]), флексия в синтаксической структуре образует отдельную составляющую и может выступать в роли управляющего элемента (точнее, proper governor), а потому начальный фрагмент грамматики таков:
S --> NP Infl VP
Infl --> [[Tense][AG]].
Идеальной реализацией флексии в таком представлении является "внешняя" флексия аффикс, присоединяемый к основе и легко от нее отделяемый при анализе. В концепции "лексической грамматики" [174, с.26] лучшей реализацией идеала является внутренняя флексия, которая, хоть и маркированна, нацелена на выполнение общей задачи извлечь всю флексию из синтаксиса. Ведь если бы флексия появлялась по синтаксическим правилам, словоизменение требовало бы многократного взаимодействия между синтаксисом и лексиконом. "Лексическа грамматика" идеалом считает однократное, а не многократное взаимодействие между модулями. Если выражаться в технических терминах, здесь речь идет об однократном "обмене данными" между лексиконом (внешним носителем информации) и синтаксической (оперативной) памятью.
Так мы подходим к информационно-поисковым метафорам, заставляющим рассмотреть когнитивную сторону словоизменения.
В. фон Гумбольдт в 1830 году писал: "Создание грамматических
-101- форм подчиняется законам мышления, совершающегося посредством языка, и опирается на соответствие (Congruenz) звуковых форм этим законам. Подобное соответствие должно так или иначе иметь место в каждом языке; различна лишь степень соответствия, причем ущербность и несовершенство могут проявиться либо в недостаточно ясной осознанности вышеупомянутых законов, либо в недостаточной гибкости фонетической системы. Впрочем, ущербность в одном отношении всегда сразу же вызывает неполноту в другом[ ] Спрашивается в таком случае, как можно представить себе процесс формирования в народном духе простейшего элемента совершенного языкового строя, а именно процесс превращения слова в часть речи при помощи флексии? Рефлектирующего языкового сознания у истоков языка предполагать не приходится, да такое сознание и не имело бы в себе творческой силы, необходимой для формировани звуков. Все достижения, какими язык обладает в этих поистине жизненно важных частях своего организма, имеют своим первым источником живость и образность видения мира. Больше того, поскольку возрастание интеллектуальной силы и ее способность минимально отклоняться от истины зависят от высшего согласия всех духовных способностей, а идеальнейшим цветением этих последних является язык, постольку все почерпнутое народом из созерцания мира само собою и непосредственно воздействует на язык. Это имеет прямое отношение к образованию флексии. Предметы как внешнего наблюдения, так и внутреннего ощущения предстают нам в двояком аспекте в их особенном качестве, придающем им отличительную индивидуальность, и в их всеобщем родовом понятии, которое для достаточно живого созерцания всегда тоже проявляется в тех или иных наблюдаемых или угадываемых чертах [ ] Созерцательность, которая питается живейшим и гармоничнейшим напряжением всех духовных сил, улавливает без остатка все, что можно воспринять в созерцаемом предмете, причем не смешивает отдельных сторон последнего, но отчетливо разграничивает их. Из понимания двух аспектов всякого предмета, из чувства правильного соотношения между обоими, из живости восприяти того и другого словно сама по себе рождается флексия как языковое выражение всей полноты созерцаемого и ощущаемого" [13, с.155]. -102-При изучении когнитивных функций словоизменения исходят их того, что усвоение морфологии языка ребенком и морфологическое изменение в истории языка основаны на одних и тех же принципах, как формальных, так и субстанциональных. Например [178, с.21], на основании наблюдений над последовательностью усвоения категорий лица и времени глаголов и над ошибками в детской речи можно сформулировать гипотезы и об изменении по аналогии в диахронии, и о морфонематических чередованиях основы в синхронии. В детской речи чередования основы связаны с образованием форм времени, но не лица. Формы существительных в единственном числе усваиваются раньше форм множественного числа, настоящее время прежде прошедшего времени, изъявительное наклонение перед сослагательным (субъюнктивом), формы третьего лица единственного лица раньше остальных [178, с.21-22].
Д.Слобин [292] на материале 40 разных языков продемонстрировал рабочие принципы, задающие "аналитические" стратегии в языке ребенка. В частности (см. также [178, с.25-29]):
1. Исходные семантические отношения должны маркироваться явно и четко. Это положение соответствует т.н. "универсалии Гумбольдта" [318, с.184]: супплетивизм менее желателен, чем единообразие языковой символизации. И корни, и грамматические формативы должны не чередоваться и быть неповторимыми.
2. Исключения избегаются.
3. Использование грамматических формативов должно обладать семантической нагрузкой.
По [178, с.30], формальному выражению противопоставления предшествуют семантическое и когнитивное развитие ребенка. Семантические характеристики первичны, являются основными и усваиваются раньше, а формальные свойства добавляются только потом. Это значит, что формальные сложности должны уступать место более прозрачному соотношению между звуком и значением. Немаркированные категории влияют на маркированные, не наоборот.
Когнитивной же интерпретации поддаются принципы естественности, которым подчинены структура и развитие словоизменительных систем естественных языков. К наиболее важным принципам относятся [329, с.92]:
1. Системная конгруэнтность: системы структурируются типологически
-103- единообразно на основе базисных параметров.2. Устойчивость класса: предпочтительны системы, классы которых независимо мотивированны, а парадигмы построены в соответствии с наиболее общими структурами.
3. Единообразие и прозрачность, структурирование по формуле: "одна функция одна форма".
4. Конструкционная иконичность, которая благоприятствует системам, кодирующим немаркированные категории как не обладающие признаками, а маркированные как носители признаков.
5. Фонетическая иконичность, благоприятствующая системам, в которых категории закодированы конгруэнтными фонетическими средствами.
Непосредственное отношение к выявлению когнитивных механизмов имеет сопоставление регулярного словоизменения с нерегулярным. По [277, с.230], механизмы у них различны. Регулярное словоизменение (типа: walk walked) описываетс грамматическими правилами, "запаянными" в человеческий мозг. Нерегулярное же словоизменение (типа: sing sang) бывает непредсказуемым в различной степени, а потому, на первый взгляд, требует простого запоминания [277, с.233]. Регулярно образуемые словоформы результат использования обычного правила о нанизывании символов. Нерегулярно же образуемые формы запоминаются как пары слов, а отношения между членами пар хранятся в структуре ассоциативной памяти, обладающей свойствами, постулируемыми в коннекционистской концепции искусственного интеллекта.
Так, формы string и strung хранятся как два отдельных слова, однако ментальная репрезентация этой пары частично совпадает с тем же соотношением, что и у единиц типа shrink и bring. Иначе говоря, хранятся и модели соотнесения пар. Отсюда и "ложная аналогия". Скажем, употребление формы brung (вместо правильного brought "принес") результат того, что были забыты те части репрезентации, в которых закодированы существенные свойства, позволяющие идентифицировать лексическую статью.
По духу это объяснение близко к тем генеративным концепциям, в которых продуктивные правила морфологии не отождествляются с морфолексическими правилами избыточности (с помощью этих последних отражаются сходства в рамках лексической памяти,
-104- но без неограниченного образования новых форм с помощью продуктивных правил). Правила избыточности эпифеномены того, как структурированные лексические единицы препарируются для занесения в память. Отсюда вытекают [277, с.234] когнитивные различи между нерегулярностью и регулярностью, сказывающиеся на времени восприятия выражений и на других свойствах, наблюдаемых при усвоении языка и при нарушениях речи:- для нерегулярных (в отличие от регулярных), т.е. запоминаемых, единиц существенны частотность и сходство;
- нерегулярные (т.е. задаваемые списком) формы доступны и для других процессов получения слова, в отличие от регулярных (нелексических, а потому свободно создаваемых) единиц, не обязательно доступных другим процессам;
- поскольку регулярности и нерегулярности обслуживаются столь разными механизмами, "поломки" в одной системе не обязательно сопровождаются "поломками" в другой.
Парадигма, нестрого говоря, множество взаимосвязанных форм [141, с.87]. В некоторых теориях этот термин употребляют расширительно (см. [43], [15], а особенно [216]). В более стандартном же смысле о структуре парадигмы говорят в терминах отношений между формами, обычно определяя принадлежность к парадигме как функции данной базовой ("заглавной", basic) формы [141, с.87]. Например: "Каждая из этих групп называется парадигматической группой, или парадигмой, а каждая форма, входящая в группу, называется словоформой (inflected form) или флексией (inflection)" [76, с.210]. Иногда рассматривают искусственную заглавную форму если нет реальной для конкретной (как правило, нерегулярной) лексемы [76, с.205].
В структурной лингвистике парадигматическими отношениями называли "отношени между единицами, принадлежащими одному и тому же уровню и одному и тому же формальному классу и допускающими замену (субституцию) одна другой" [22,с.200]. Видно,
-105- что в одном понятии связываются воедино, как минимум, три вещи: отнесенность к одному и тому же классу, одновременность существования и подстановочность.Два последних фактора объединяют в рамках понятия парадигматической оси, то есть [321, с.82-83]:
1. Ось замещения когда берут конкретную позицию на синтагматической оси и заменяют один элемент другим. Эта процедура имеет решающее значение в тестах на коммутацию и на минимальную пару, используемых в фонологии и семантике, и соответствует понятию парадигмы в системах словоизменения.
2. Ось одновременности. Например, при представлении фонемы в виде пучка различительных признаков последние считаются существующими одновременно на парадигматической оси. Признаки, входящие в состав таких фонем, существуют одновременно "симультанно" в языковой системе, часть которой они составляют. Язык есть парадигматическая система, в которой категории, или элементы, или признаки сосуществуют симультанно и аккордом сочетаются при образовании единиц.
Эти понятия характеризуют то, что обычно называлось парадигмой слова, которая есть одновременно:
- цепи слов, создаваемые цельными комплексами морфем, представляющими собой своеобразное единство, "во всей полноте своих членов переносимое от слова к слову, в пределах того же разряда" [10, с.399];
- система грамматического изменения слова [41, с.77];
- "такая система форм, при которой одно слово имеет различные формы словоизменения, каждая же из этих форм служит для обозначения определенных и одних и тех же синтаксических отношений, а в то же время тождественные своими формальными показателями словоизменения разных слов одного класса служат для обозначения тождественных синтаксических отношений, в которые вступают эти слова" [28];
- таблица, определяемая морфологическими измерениями языка. Клетки этой таблицы словоформы. Парадигмы обычно заполнены целиком. В этом словообразование коренным образом отлично от деривации. Даже при супплетивизме парадигма очень редко бывает дефектной, да и то лишь в силу внешних обстоятельств. Так, во многих языках отсутствуют некоторые формы связочного
-106- глагола [67, с.13]. Бывают иногда фонотактические и просто фонологические причины дл отсутствия определенных форм [160];- совокупность групп тесно соотнесенных форм таких, как личные формы конкретного времени, среди которых наиболее естественно ожидать единообразия морфонематического выражения. Эти сравнительно небольшие множества форм не просто образуют списки, а кучкуются ("тусуются") вокруг одного-двух наименее маркированных членов, являющихс исходными формами для остальной группы. Например, в спряжении испанского глагола таким членом является обычно форма третьего лица единственного числа, которая, в силу своей высокой частотности, широкой сферы употребления и раннего появления в детской речи, воспринимается как исходная для образования личных форм того или иного времени. Впрочем, иногда эту привилегированную роль исполняет также и форма первого лица единственного числа [96, с.47];
- полный набор слов, морфологически соотнесенных между собой по своей основе (stem) и участвующих в одной и той же морфологической конструкции [278, с.224];
- для некоторой части речи в конкретном языке структура P словоизменительных реализаций у всех комбинаций морфосинтаксических свойств, предопределенных нелексически, причем каждое слово этой части речи обладает всеми реализациями P и только ими [101, с.48-49]. Каждая парадигма относится к одной и только одной макропарадигме [101, с.76], котора определяется [101, с.50-69] как:
а) совокупность двух или большего количества сходных парадигм, все словоизменительные различия каждой из которых объяснимы чисто фонологически, или последовательно коррелируют с различиями в синтаксических свойствах, предопределенных семантически или лексически, или
б) единичная парадигма, не комбинируемая указанным образом с другими.
Итак, парадигма состоит из слов. Слово как элемент парадигмы называется паралогом (paralog), а морфемы, составляющие множество флективных аффиксов в парадигме, называютс параморфемами [313, с.327]. Паралог основа в сочетании с параморфемой. Единицу же, которая "возникает в результате абстракции
-107- отождествления всех словоформ, различающихся только синтаксическим значением (то есть словоформ, имеющих одно и то же несинтаксическое, или номинативное, "ономатологическое", значение)", называют ономатемой [6, с.127] или [20] "номинатемой".Кроме словоизменительных, есть еще:
- словообразовательная, точнее, деривационная парадигма (derivational paradigm), статус ее проблематичен [185, с.10];
- парадигма всех морфологически соотнесенных форм морфемы (контрастирующие части парадигмы называются парадигматическими элементами [291, с.320]);
- семическая парадигма, составленная из всех сочетаний в данном языке некоторой многозначной лексемы, скажем, глагола (типа дать). Множество допустимых словоупотреблений с этой единицей составляет серию, определяемую парадигматически, как и во всякой парадигме, в ней общий элемент сочетается со всеми членами, причем есть и общее семическое ядро [316, с.107].
Можно выделить, по [278, с.224], следующие два основных вида, или типа,
парадигматических множеств (множеств парадигм), в зависимости от того, что играет роль
основы:
Тип 1 | Тип 2 |
- мало классов | - много классов |
- регулярная морфофонемика | - проблематичная или нерегулярная морфофонемика |
- полный комплект | - есть лакуны |
- значения целого есть сумма значений частей | - возможна идиоматичность |
- морфемные комплексы не допускают никакого своеобразия свойств классов | - нет своеобразия свойств классов у морфемных комплексов |
В шестой главе мы называем парадигмой систему флексий, каждая из которых задаетс отдельной статьей в "словаре флексий", содержащей, среди прочего, и требования к основе, к которой такая флексия может присоединяться. У нас словоизменительная парадигма не система словоформ, а множество (в теоретико-множественном смысле) адресов описаний флексий в отдельном
-108- списке. Есть хранилище парадигм, каждая единица которого представляет указанное множество. Каждой основе (в словаре основ данного языка) приписан адрес парадигмы в этом хранилище парадигм. Наша парадигма то, что иногда называют "словоизменительным типом" (ср. [21]).Концепции парадигмы расходятся в трактовке заглавной формы (basic form, leader word, model word). Эта форма при склонении существительных в русском языке обычно совпадает с формой единственного числа именительного падежа, а при спряжении глаголов с инфинитивом. Для арабских глаголов заглавная форма обычно совпадает с формой прошедшего времени третьего лица единственного числа мужского рода и т.д. Со времен Присциана в европейских грамматиках заглавная форма считается членом парадигмы [141, с.87]. У Л.Блумфилда заглавная форма считалась "темой", по которой строятся конкретные словоформы, а у П.Мэттьюза семантической абстракцией, ядром значения, лежащим в основе множества форм данной лексемы [243, с.272-273].
Можно выделить два подхода. При одном "конвенционалистском" заглавную форму считают всего лишь удобной отправной точкой для описания остальных форм той же парадигмы. Так считали индийские грамматисты, задававшие чистые корни глаголов, не совпадающие ни с каким членом парадигмы. При другом же "натуралистическом" заглавную форму воспринимают как единицу, в системе языка (в данном случае в парадигме) обладающую уникальными свойствами, а не удобную фикцию грамматистов.
Конвенционалистом был, например, М.Халле [156], когда попыталс продемонстрировать, что немецкое спряжение легче описывать, если в качестве заглавной формы взять не инфинитив (как обычно), а форму третьего лица единственного числа имперфекта. Инфинитив "вычисляется" из этой формы более или менее однозначно даже без информации (которой глаголы обычно снабжаются в словаре), является ли глагол "слабым" или "сильным": указанная форма у "слабых" глаголов кончается на -te, а у "сильных" выглядит как аблаутное чередование чистого корня. По
-109- форме blieb "остался" однозначно вычисляется форма инфинитива bleiben "остаться", по ritt "скакал" reiten "скакать". При традиционном же решении требуется дополнительно указывать, что у глагола bleiben в имперфекте долгий гласный корня blieb, а у глагола reiten краткий гласный, ritt. Впрочем, обилие дополнительных правил требуется и при решении Халле.Бывают и приятные совпадения заглавной формы, обосновываемой "конвенционалистом", с традиционной. Так, в работе [203, с.87] в качестве заглавной формы русского глагола выбирается инфинитив как наиболее "предсказуемый" в следующем смысле:
1. Основы других членов той же парадигмы часто короче, у них, например, иногда отсутствует тематический гласный, ср.: испортить испорчу. Проще сформулировать правило удаления (произвольного) гласного, чем вставки (конкретно для каждого класса глагольной основы). Достаточно единообразно представлены и правила чередовани согласного: основа инфинитива и в этом отношении удобнее остальных, ср.: кричать кричу (ч не меняется) и прятать прячу (чередуются т и ч).
2. Инфинитив традиционная заглавная форма глагола.
3. Инфинитив одна из наиболее частотных глагольных форм. "Натуралистом" был А.И. Смирницкий, считавший, что у заглавных форм наиболее общее значение: "в них то, что обозначается данными словами, представляется по возможности отвлеченным от тех или иных отношений к чему-либо другому к предмету, времени, признаку и пр. Поэтому, естественно, что при изоляции слова, когда обозначаемое им рассматривается по возможности отвлеченно, вне определенной ситуации и связанных с ней отношений, слово берется в его "основной" форме, и эта форма оказывается по существу наиболее подходящим представителем слова, как такового. Так, например, общий падеж не имеет в виду никакого специфического отношени данного предмета к чему-либо другому, а грамматическое единственное число не настаивает на отнесении данного существительного именно к одному предмету, так как существительным в единственном числе может обозначаться любой предмет данного класса и весь класс в целом (a dog is an animal, man is mortal)" [41, с.94].
Антиконвенционализм в духе конца двадцатого века: в противоположность
-110- дескриптивистам, при описании языка сегодня ищут опоры в самой природе языковых явлений. Подтверждение для выбора заглавной формы ищут в истории языка, в детской речи и в речевых ошибках. Эта форма как и все в языке должна обладать "психологической реальностью". И не всегда заглавное слово натуралиста совпадает с традиционной заглавной формой.Так, по [56, с.10], заглавное, или "ведущее", слово служит образцом дл морфологического изменения, которому подвергаются другие слова. Например, испанское digo "(я) говорю" законный фонетический наследник латинского, а остальные глаголы, не имеющие в латинском прямых предков, в свое время подверглись изменению по аналогии с глаголом digo. ("Ведущие выражения" есть и в синтаксисе идиом, и в глагольной морфологии. Так, выражение hot and cold, начинающееся сочетанием hot and, послужило родоначальником для таких идиом, как hot and bothered, hot and heavy, hot and spicy [236, с.347].)
В то же время, критерии установления естественного заглавного слова иногда противоречат друг другу. Так [141, с.91], заглавная форма должна быть и наименее маркированной. В силу "локальных принципов" маркированности [310], есть только относительная немаркированность и нет абсолютной:
1. Когда имя упоминается в перечислении или говорят о какой-то группе предметов, такое имя является локально немаркированным во множественном, а не в единственном числе.
2. В языках с падежами имена места локально немаркированны в местном падеже, а имена орудий в инструментальном.
3. Глаголы восприятия и эмоций бывают локально немаркированными в форме первого лица.
Значит ли это, что в парадигме следует выделять несколько заглавных форм дл каких-либо подпарадигм, относительно которых эти заглавные формы минимально маркированны? Или следует отказаться от натурализма вообще? Каждый решает для себя сам.
Традиционно основой (stem) называют [101, с.207]:
1) фонологическую основу, ср.: "mensa "стол" относится к
-111- именам с основой на -a-",2) реализационную основу: "Основа перфекта для amo "любить" выглядит как amav-",
3) морфолексическую основу: "Основа косвенных падежных форм единственного числа для iter "путь" имеет вид: itiner".
Действительно, возьмем определения основы из нескольких разных работ. Основа (stem, base, Basis) это:
- "такие знаки, которые самим своим устройством принудительно требуют того или иного своего восполнения другими знаками и в этом обнаруживают свою неполноту и незаконченность[ ] они обладают не значением в строгом смысле этого понятия, а лишь его возможностью, которая реализуется так или иначе, в зависимости от того, какие знаки присоединяются к основам в качестве их восполнителей" [10, с.399]; "В отличие от значений аффиксов, значения основ не могут рассматриваться только как части более сложных значений. Они возможны именно как отдельные и цельные значения, но это еще не подлинные значения, а только намек на значение, которое начинает жить полной жизнью в языке лишь при условии его воплощения в цельном разложимом слове того или иного типа" [10, с.401];
- именно та часть слова, "которая поступает в распоряжение грамматики, будучи непосредственно связана с системой формообразующих суффиксов, оформляющих слово" [41, с.56], поэтому-то "выделение основы, отделение ее от формообразующих суффиксов не вызывает больших затруднений" [41, с.59],
- морфема, в отличие от аффиксов, не субкатегоризующая другие морфемы [227, с.252],
- эндоцентрическая часть слова, если она есть, или (в противном случае) само слово [167, с.165].
Сочетание основы с тематическим формативом дает "тему" слова [10, с.403], или "туловище", которое, по Ф.И. Буслаеву, есть "серединная группа звуков, будет ли то корень, например бы, или корень с окончаниями и приставками, например быть, из-бытокъ, [ ] в отличие от облекающих его оконечностей, то есть приставок и окончаний, например, в формах: пре-из-бытокъ, пре-из-быточ-е-ство" [7, с.93].
В литературе приняты следующие разграничения.
-112-1. Реальные основы противопоставляются потенциальным, тем, "которые невозможно соотнести с какими-либо другими морфемами ввиду их изолированности" [46, с.269]. По ходу развития языка "потенциальные элементы могут стать реальными, например, scavenge "убирать мусор" в scavenger "мусорщик", и наоборот. Тем же термином можно обозначить фонемы или группы фонем, которые нужно рассматривать как модифицирующие реальную основу, хотя они больше нигде не встречаются", например: fort-ress "крепость", kin-dred "кровное родство; сродство", front-ier "граница" [46, с.269].
Именно реальным, но не потенциальным основам приписан тип парадигмы набор флексий, в сочетании с которыми основа превращается в реальную словоформу языка.
2. Первичные основы противопоставляются вторичным, или производным, которые представляют собой структуру вида: "основа плюс аффикс" [10, с.404]. В иной терминологической системе [247, с.40] деление более дробное: простые основы противопоставляются сложным (морфологически полученным из простых в результате добавления деривационного элемента) и составным (compound). Причем: "есть слова, по структуре своей составляющие вполне условные обозначения соответствующих предметов действительности, и слова, составляющие в известном смысле не вполне условные, мотивированные обозначения предметов действительности, причем мотивированность этого рода обозначений выражается в отношениях между значащими звуковыми комплексами, обнаруживающимися в самой структуре этого рода слов. Эти слова и суть слова с производными основами. Вот почему значение слов с производной основой всегда определимо посредством ссылки на значение соответствующей первичной основы, причем именно такое разъяснение значения производных основ, а не прямое описание соответствующего предмета действительности, и составляет собственно лингвистическую задачу в изучении значений слов (ср., например, обычные приемы толковых словарей)" [11, с.421].
Производная основа, таким образом [52, с.51]:
- членима на морфы;
- как членимое целое зависит от соответствующей непроизводной (как производная она существует постольку, поскольку
-113- существует ей соответственная непроизводная);- ее целостное значение соответствует совокупности значений составляющих ее частей;
- имеет не прямую денотацию, а опосредованную, через установление определенной связи одних предметов с другими.
Различение производных и непроизводных основ связано не только с технологией выделения парадигм, но и с выяснением более фундаментальных параметров языка. Так, по [194, с.29-30], слово W категории K считается непроизводным, если оно морфологически не отличается от корня этого W (т.е. не содержит каких-либо аффиксов, присоединенных к W), в противном случае оно считается производным. К аффиксам при этом относятся не только префиксы, инфиксы, суффиксы, но и другие виды словоизменительных средств такие как супплетивность, редупликация, чередования гласного корня и/или заполнение консонантного скелета соответствующими гласными. В этой связи важную роль играет понятие морфологического единообразия, которое можно определить так: словоизменительна парадигма P языка L морфологически единообразна (morphologically uniform), если и только если P содержит либо только непроизводные словоформы, либо только производные. Типологическое исследование показывает, что эллипсис подлежащего в предложении ("нулевой субъект") допустим только в тех языках, словоизменительные парадигмы которых морфологически единообразны.
Проблема состоит в следующем. Если непроизводная основа является реальной (ср. выше противопоставление реальных основ потенциальным), то как вычислить парадигму ее? Например, лексема рог в русском языке склоняется так: рог, рога, рогу и т.д., в форме множественного числа именительного падежа имеем: рога (с ударением на флексии). Основа носорог на первый взгляд кажется производной от основы рог. Однако форма множественного числа именительного падежа у нее выглядит как носороги (с безударным и). Это означает, что ей приписано другое множество флексий, то есть иной словоизменительный тип. Поэтому, несмотря на кажущуюс семантическую производность, придется признать, что носорог не является производной основой от рог.
Итак, главный критерий таков: словоизменительный тип производной
-114- основы должен быть вычислим из словоизменительного типа основы-источника (в обычном случае равен ему). Именно этому критерию отвечают альплагерь, пионерлагерь, спортлагерь, концлагерь: у всех у них набор флексий тот же, что и у основы лагерь (лагер на письме, поскольку ь графическая флексия, заменяемый элемент, подобный а, ю, ем и т.д.).Это свойство фундаментально для распознавания словоформы. Оно позволяет ограничить словарь основ непроизводными основами: словоформа (в том числе, с производной основой) будет распознана тогда и только тогда, когда вычленяется ее непроизводная основа.
Отсюда вытекает, что к непроизводным основам относятся не только те, которые включают хотя бы одну корневую морфему, но и просто суффиксы (или цепочки суффиксов), однозначно задающие словоизменительный тип. Например, суффиксы и суффиксоиды скоп (ср. радиотелескоп, кинескоп и т.д.), ист (флейтист, интернационалист и т.д.).
3. Непроизводные основы бывают несвязанными (свободными) и связанными; последние те, которые "известны только в составе производных основ родственных слов и неизменно выступают в связи либо с теми или иными "нефлексийными" аффиксами, либо с другой основой". Например: ул (ср. улица), слад-, анарх-, шиб- [52,с.139]. Причем: "Отношения между производными основами, содержащими в себе связанные основы, можно охарактеризовать как отношени равнопроизводности". Связанные основы результат следующих причин [52, с.139-140]:
- утрата словообразовательным гнездом исходного слова, имевшего свободную основу, ср.: скуд-ный, дород-ный,
- исходное слово семантически расходится с производными от него словами, ср.: настроить расстроить, исследовать обследовать, праздник праздновать,
- усложнение основ, обусловленное заимствованием слов, находящихся между собой в отношении равнопроизводности, ср.: энтузиаст энтузиазм, импортировать экспортировать, а также процессы словообразования по аналогичным образцам, ср.: бензин бензовоз, суверенитет суверенный, акмеизм акмеист.Связанные основы отличаются от остальных непроизводных
-115- отсутствием маркировки словоизменительного типа: при единицах типа суверен, акме не указывается никакой тип словоизменения.Среди множества функций укажем следующие. Парадигма:
1. Используется в продуцировании и интерпретации словоформ. Например, по [203, с.9], грамматический синтез форм русского глагола протекает в два шага, соответственно, на двух уровнях: на морфолого-морфонологическом и на акцентуационном. На каждом из этих уровней, в свою очередь, имеем два шага: интерпарадигматический и интрапарадигматический. Таким образом, на морфолого-морфофонологическом уровне строится основа (интерпарадигматически), а затем словоформа (интрапарадигматически). На акцентуационном уровне сначала (интерпарадигматически) строится исходное акцентуационное представление, а затем производятся передвижки ударения (интрапарадигматически).
2. Характеризует конкретное слово "именно как слово, как целую единицу, остающуюс тождественной самой себе в различных представляющих ее словоформах" [41, с.24], причем "взятая как целое, как данная система форм, рассматриваемая как бы извне, со стороны других парадигм и отличная от них, парадигма данного слова характеризует его именно как слово определенного типа, определенного грамматического разряда, определенного грамматического класса. Таким образом, характеризуя слово в целом, извне, по отношению к другим словам, парадигма каждого данного слова выполняет и лексическую операцию: она являетс определенным оформлением слова и тем самым выступает как словообразовательное средство. И это средство словообразования и применяется при конверсии" [41, с.77].
3. Формирует в кооперации с другими парадигмами в лексико-семантической области "поля слов" (Wortfelder), или семантически мотивированные классы языковых знаков [87, с.82].
4. Играет роль в морфонологии [320, с.260].
5. Регулирует диахронические изменения языка. Например [120, с.58-59], фактором, препятствующим парадигматической связности (paradigmatic coherence), является слишком больша
-116- фонетическая дистанция между альтернантами. Из-за стремления к такой связности и элиминируются чередования, вызывающие большую фонетическую дистанцию между альтернантами.6. Направляет усвоение языка. Например, сторонники естественной фонологии подчеркивают [319], что при изучении языка усваиваются парадигмы то есть, системы словоформ, а не заглавные формы лексемы. Знакомые слова не требуют работы правил, а просто уже построены в соответствии с этими правилами и хранятся. Правила используются только при образовании новых слов [124, с.110]. (Другие [141, с.91] считают, что усвоение языка на парадигмы не опирается. Все нужные формы получаются как-то иначе, исходя из любой заданной, а не только по "заглавной".)
Парадигма исследовательский прием для фиксирования лексической соотнесенности разных форм лексемы [141, с.87]. Парадигма ключ к упорядочению лексикона. Важнейшими подходами к такому упорядочению, по [319, с.348-349], являются следующие:
1. От каждой парадигмы в лексикон делегирована одна-единственная "заглавная" формы (base form). Продуктивность образца отражена как большая или меньшая степень общезначимости правил, порождающих парадигматические формы. В вырожденном случае, а именно, для супплетивных парадигм, правила имеют случайный характер и выглядят, скажем, так: go went / PAST. Есть еще "младшие" (minor) правила правила детализации для нерегулярных чередований, типа: sit sat / PAST.
2. Супплетивная парадигма задается как список словоформ, хранимый в лексиконе, а все закономерности и продуктивные, и непродуктивные задаются в виде правил порождения. Это позиция антилексикалистская ("трансформационалистов"), принятая, например, в стандартной генеративной фонологии [115].
3. Супплетивизм задается в лексиконе списками, непродуктивные закономерности правилами дистрибуции, а продуктивные
- правилами порождения [183].
4. Парадигмы в лексиконе задаются списками словоформ. Для форм, уже имеющихся в лексиконе, правила считаются задающими
-117- отношения избыточности, а когда в лексикон вводятся новые, неизвестные до этого слова ("новые" для говорящего и для языка в целом), эти же правила функционируют как правила порождения, при котором приоритет имеют правила с меньшим количеством ограничений (подход естественной фонологии [319, с.349]).Теперь кратко изложим наш подход к парадигме.
Парадигма не простое множество словоформ одной лексемы, а иерархия их относительно определенных категорий.
Назовем граммемами словоизменительные ("грамматические") категории. Каждой словоформе в парадигме ставится в соответствие не только лексема, но и множество граммем. Например, домами словоформа лексемы дом со следующими граммемами: число, множественное, падеж, творительный, играющими словоформа лексемы играть с таким набором граммем: время, настоящее, причастие, залог, действительный, число, множественное, падеж, творительный. Описание флексии задает как минимум:
- материальную оболочку (ами, ющ, ими),
- множество граммем.
Выше говорилось, что словарь основ содержит единицы, содержащие указание на парадигматический класс. Здесь добавим, что есть и флексии, содержащие указание на парадигматический класс случай, когда к одной флексии в словоформе присоединяютс другие. Например, одна из трактовок флексии причастия настоящего времени действительного залога -ющ- такова: к ней присоединяется вполне определенный класс флексий, задаваемый в виде номера парадигматического класса так же, как и в случае основ. При распознавании и продуцировании словоформы наборы граммем, содержащиеся в описании всех флексий словоформы, складываются как обычные множества. Так, последовательность флексий -вшими, обладает набором граммем, полученным в результате сложения наборов дл флексий -вш причастие, действительное, прошедшее, время и -ими число, множественное, падеж, Творительный. Фигурные скобки символизируют множество, порядок перечисления элементов в котором не существенен. Наиболее
-118- естественно перечислять эти элементы в том порядке, в каком граммемы оприходованы в генеральном списке.Не любой набор граммем допустим в качестве грамматической характеристики какой-либо флексии. Например, для русского языка допустим набор падеж, именительный, родительный, винительный, но недопустим набор инфинитив, причастие: для первого можно найти хотя бы одну флексию (ов, как в словоформе дураков), а для второго такой флексии нет.
Парадигма одна из реализаций (подматрица), далеко не всегда полная, всевозможных допустимых сочетаний граммем данного языка. Комбинаторика граммем выявляетс эмпирически, гипотетико-дедуктивным способом.
Традиция представлять список словоформ, входящих в парадигму, не в произвольном порядке и не по алфавиту словоформ или флексий (хотя логически этого можно было бы ожидать), а по ранжиру граммем, связана именно с ощущением этой иерархии граммем. Например, склонение существительных представляют обычно в виде списка, в котором сначала перечисляются формы единственного числа, а затем множественного. В каждом из подсписков порядок форм далее определяется "номером" падежа: сначала идут формы именительного, затем родительного, после этого дательного и т.д. падежей. Эта же иерархия отражена и в склонении причастных форм в спряжении глагола.
Отсюда ясно, что парадигма связана:
- с каталогом всех граммем,
- с отношениями подчиненности граммем,
- с "порядковыми номерами" граммем в этом каталоге.
Весь набор граммем можно представить в виде ориентированного графа (конкретнее, дерева) подчиненности, узлы которого помечены номерами граммем. В нем граммема "число" подчиняет себе граммему "падеж", "время" граммему "число" и т.д. Назовем этот граф "генеральной иерархией". Сочетаемость граммем относительно конкретной лексемы представляет собой дерево, вкладывающееся в генеральную иерархию, начиная с определенного узла. Категорию лексемы можно представить как вершину этого графа. Это значит, в частности, что категории "существительное" непосредственно подчинена в русском языке граммема "число"
-119- (категории падежа дальше выявляются по дереву автоматически). Категории прилагательного, в русском же языке, непосредственно подчинены граммемы "степень сравнения" и "род".Иерархизация связана, кроме прочего, с нумерацией граммем. Традиционно граммема падежа подчинена граммеме числа, последняя же подчинена граммеме "время" (которая, в свою очередь, прямо или нет в зависимости от резонов исследователя подчинена категории глагола) и т.д. При нетрадиционном для русской грамматики порядке категорий имели бы, скажем, сначала перечисление всех форм именительного падежа (в единственном, а затем во множественном числе), затем родительного (в единственном, а затем во множественном числе) и т.д.
Существенна иерархия граммем не только для синхронии, но и для истории языка. Например [224, с.182], для реконструкции развития трех контрастирующих окончаний, различающих номинатив единственного числа мужского, женского и среднего родов в некоторых склонениях индоевропейских языков. Падежи, выражающие "адвербные" отношени (инструменталь, дательный, аблатив, локатив и некоторые употребления генитива) являютс поздними явлениями: их окончания варьируются от диалекта к диалекту. Окончани множественного числа для этих падежей не зафиксированы в хеттском (это значит, что в этом языке граммема "падеж" подчинена граммеме "множественное", а не "число" и тем более не категории "существительное"). Явления сандхи в санскрите говорят также в пользу того, что эти окончания появились поздно (окончание локатива множественного числа у основ на -s- указывают, по В. Леманну, что эта конструкция входит в сферу деривации, а не словообразования). Противопоставление по роду существенно главным образом для номинатива и аккузатива, что является результатом переиерархизации граммем рода и падежа друг относительно друга. Так, для русского языка граммема "одушевленность / неодушевленность" подчинена граммеме "винительный" (которая, в свою очередь, подчинена граммеме "падеж"). Для иных языков граммема "одушевленность / неодушевленность" либо не существует, либо, наоборот, подчиняет себе граммему падежа.
Так образуются новые подпространства в иерархии.
-120-Противоположный случай отмирание некоторого подпространства иерархии. Пример этого исчезновение склонения как семантическая перекатегоризация, вероятно, связанная с целым языковым ареалом. По Н.С. Трубецкому [315, с.98-100], можно выделить "метрополию склонения" (Kernland der Deklination), в общих чертах занимающую территорию окраинных государств: Финляндию, Эстонию, Литву, а также Польшу, Чехословакию, Венгрию, Югославию, Турцию, (тогдашний) Советский Союз, Монголию и Японию. К западу и к югу от этой метрополии склонение либо неизвестно, либо сохранилось очень плохо. Граница между метрополией и периферией склонения пролегает, в частности, через славянский регион. Так, в противоположность чешскому, словацкий язык занимает (и в этом отношении, и географически) территорию как раз посередине между польским и украинским.
Укажем только несколько принципов.
1. Принцип серийности. Иерархизация граммем в рамках парадигмы сказываетс на практическом обнаружении всех парадигм. Одна из техник выявления парадигм сериаци (seriation) составление "серий" словоформ, когда выясняют для конкретной лексемы, какие формы соотнесены между собой и какова иерархия этих форм [312, с.301]. При этом прежде всего устанавливаются граммемы, сопутствующие модификациям базовой формы (или основы). Множества полученных форм "серий" и называются парадигмами. Могут быть парадигмы разного уровня абстракции. В частности, бывают парадигмы парадигм.
2. Принцип пропорциональности, входящий в технологию получения парадигм по Г.О. Винокуру [10, с.399]: "Например, тот факт, что слово жена разлагается на основу жен и окончание -а, принудительно связан с тем фактом, что основа жен- соединяется также с окончанием -ы, -е, -у, -ой, -ами, ах и т.д. и, кроме того, с тем, что тот же комплекс окончаний, как нечто целое, возможен и при многих других основах вроде стен-, голов-,
-121- рук-, баб- и т.д. Подобные цельные комплексы морфем представляют собой, следовательно, своеобразное единство, во всей полноте своих членов переносимое от слова к слову, в пределах того же разряда, и создающее те цепи слов, которые именуютс парадигмами".3. Единообразие морфонологического эффекта, производимого флексиями одного и того же парадигматического типа.
Например, по [138, с.58], глаголы русского языка делятся на четыре парадигматических класса (основы на -о, на -е, на -ии суффиксальные) в силу следующих критериев:
1) чередования конечного согласного основы; соответственно, имеем три типа: спряжение на -о (нести, несу, несешь), на -е (висеть, вишу, висишь) и на -и (писать, пишу, пишешь);
2) гласный в окончании 2 л.ед.ч. 3 л.мн.ч. Этот критерий существенен, когда чередование согласных не дает однозначного результата. Например, когда глагольный корень кончается на шипящий или на палатальный ("йотированный") согласный, ср.:
ржать ржу ржешь спряжение на -о,
держать держу держишь спряжение на -и,
засмеять засмею засмеешь спряжение на -о,
стоять стою стоишь спряжение на -и,
ударить ударю ударишь ударят спряжение на -и;
3) ударение постоянно или меняется; глаголы с постоянным ударением на окончании относятся к спряжению на -о, а с переменным на -е или на -и;
4) наличие или отсутствие тематического гласного в инфинитиве; в последнем случае глаголу приписывается тип спряжения на -о, если нет еще суффикса; к спряжению на о относятся поэтому глаголы дуть (дую, дуешь) и мыть (мою, моешь), но не сеять, засевать, веять, завевать, хаять, рисовать (рисую, рисовывать) и т.п.
Однако парадигмы выделяются не с безграничным размахом. Приходится стремиться к минимуму серий или парадигм. В этом суть следующего принципа:
4. Принцип парадигматической экономии [100,с.127]: общее число парадигм должно быть близким к минимуму, логически совместимому с общим набором флексий, и никогда не приближаться к
-122- логическому максимуму. Этот принцип продемонстрирован на примере индоевропейских, уральских, банту и австралийских языков.Более поздняя версия его [101, с.31] (Inflexional Parsimony Hypothesis) гласит: даже когда есть больше одной словоизменительной реализации у данной комбинации морфосинтаксических свойств, каждая основа должна выбирать для себя одну реализацию если (при конкуренции двух или большего количества флексий) внешние условия не вызывают необходимости контраста, диктуемой некоторой семантической или стилистической функцией. Впрочем [267, с.266], принцип экономии уступает в соперничестве со стремлением к взаимнооднозначному соответствию между значением и формой ("одно значение одна форма").
Составление парадигм является скорее искусством и не основано на совершенно формальных критериях, позволяющих в конкретном случае решать, следует ли выделять одну, две или три парадигмы [141, с.87]. Разубедить в этом не может даже столь блестящая техника словоизменительного описания, как [19]. Можно только поражаться, насколько удачен общий результат для русского языка словарь А.А. Зализняка [21].
5. Допустимость множественности парадигм для одной и той же лексемы, при неизменности основы для подпарадигмы [203].
Так, парадигма некоторое подмножество множества всех форм (скажем, конкретного глагола) [203,с.14]. Например, имеем парадигму настоящего времени, парадигму прошедшего времени и т.д. Каждая такая парадигма образуется от отдельной основы, а все такие основы в своей совокупности образуют лексему одного слова. Для русского глагола имеем 12 парадигм [203, с.21]:
- инфинитив,
- личные формы настоящего времени,
- деепричастие настоящего времени,
- причастие настоящего времени действительного залога,
- причастие настоящего времени страдательного залога:
- полные формы,
- краткие формы,
- повелительное наклонение,
- личные формы прошедшего времени,
- причастие прошедшего времени действительного залога,
-123-- деепричастие прошедшего времени,
- причастие прошедшего времени страдательного залога:
- полные формы,
- краткие формы.
По [203, с.23], основа для каждой такой парадигмы не меняется, в отличие от концепции [21], в которой пассивное причастие прошедшего времени образуется:
- от инфинитивной основы в классах 1, 3, 10,
- от основы 1 л.ед.ч.наст.вр. в классах 4, 5,
- от основы 3 л.ед.ч.наст.вр. в классах 7, 8,
- от основы прош. вр. муж.рода ед.ч. в классах 9, 11, 12, 14, 15, 16.
Таким образом, проводится принцип единообразия основы [203, с.23], когда парадигмы соотнесены не столько с лексемой, сколько с системой: все глаголы образуют форму пассивного причастия прошедшего времени просто от основы пассивного причастия прошедшего времени. В силу этого каждый глагол имеет четыре основы (для многих регулярных глаголов одна основа получается из какой-то другой, однако бывают глаголы, в которых соответствующие правила различны) [203, с.39]:
- основа инфинитива, от которой образуется инфинитив,
- основа настоящего времени, от которой образуются:
- личные формы настоящего времени,
- деепричастие настоящего времени,
- активное причастие настоящего времени,
- пассивное причастие настоящего времени,
- императив;
- основа прошедшего активного:
- личные формы прошедшего времени,
- активное причастие прошедшего времени,
- деепричастие прошедшего времени;
- основа прошедшего пассивного причастия.
ЛЕКСИКОН В МОРФОЛОГИИ
В отличие от словаря, ориентированного на массового пользователя, лексикон как понятие теоретического языкознания трактуется в привязке к конкретной концепции, входя в теоретическую модель. В этом качестве он тесно соотнесен с грамматической (или синтаксической) частью этой модели [201, c.42-43].
Есть несколько оснований для группировки этих концепций.
Различаются три концепции [233, c.4-5]:
1. Статьи не зависят друг от друга. Наиболее распространенная реализация этой гипотезы состоит в том, что каждое слово как с аффиксами, так и без них хранится в качестве самостоятельной единицы. Лексический поиск ("доступ", lexical access) заключается в поиске целой единицы, а время поиска обратно пропорционально функции от частотности единицы. Этому противоречит то, что время распознавания форм косвенных падежей не зависит от частотности.
2. Декомпозиция сложных основ. Хранятся корни и аффиксы, и есть еще правила установления допустимости комбинации морфем в слово. Два варианта этой гипотезы: декомпозиция происходит
- перед поиском во внутреннем лексиконе,
- после этого поиска.
3. Сателлитные статьи. Каждая словоформа соответствует отдельной единице лексикона, однако репрезентация заглавной формы (именительный падеж имени, инфинитив глагола и т.д.) обладает выделенным статусом, играет центральную организующую роль. Поэтому быстрее всего распознаются заглавные формы.
Концепция полной увязки между собой статей лексикона нашла свою реализацию, в частности, в работе [333ç.309], где лексикон полное (а потому избыточное) перечисление свойств лексических единиц порознь. К этим свойствам относится "словоизменительный
-125- список" (i-list), соотносящий морфологические признаки словоформы от данной лексемы с фонологическими.Например, в словоизменительный список английской лексемы rob "красть" входят следующие сочетания признаков:
время: настоящее, лицо: 1, число: единственное /rob/,
время: настоящее, лицо: 2, число: единственное /rob/,
время: настоящее, лицо: 3, число: единственное /robs/.
Морфологические правила составляют компонент "оформления" в грамматике, предшествующий морфонологии, но следующий за синтаксисом и внешними сандхи. Единицами лексикона оперируют три группы морфологических правил:
1. Правило импликации предсказывает одни свойства единицы на основании других. Например, имена определенного рода относятся к некоторому определенному классу склонения.
2. Правило реализации предсказывает содержание некоторых словоизменительных списков. Например, указывает, что форма множественного числа существительного образуется с помощью прибавления определенного фонологического материала к основе.
3. Правило словообразования из существования одних единиц выводит существование и свойства других единиц (дериватов). Например, каждому качественному прилагательному, содержащемуся в лексиконе, ставится в соответствие некоторое абстрактное существительное, полученное в результате добавления определенного аффикса к основе этого прилагательного. Ср.: худ худоба.
В "динамической" модели утверждают [97, c.134]:
1. Слова в лексиконе помечены как обладающие различной лексической силой, увеличивающейся при каждом удачном фонологическом и/или семантическом сопоставлении хранимого слова со словом в обрабатываемом тексте.
2. Морфологически сложные слова, построенные по продуктивным, но нечастотным моделям, обладают репрезентацией с теми же семантическими признаками и с некоторой подматрицей фонологических признаков. Например, слово played имеет репрезентацию play плюс "суффикс прошедшего времени".
3. Морфологически сложные слова, построенные по продуктивным частотным моделям, обладают отдельной лексической репрезентацией, но ассоциированы с морфологически родственными
-126- словами посредством "лексических связей" как семантической, так и фонологической природы.4. Лексические связи (а тем самым морфологические отношения) варьируются по степени близости в зависимости от числа и природы признаков, составляющих эти связи.
5. Лексическая сила и лексическая связь не являются чисто языковыми механизмами это общие принципы, справедливые для всех видов психологической переработки данных человеком. Лексическая сила проявление принципа, согласно которому повторение есть вид закрепления (в ментальном или физическом смысле), а лексическая связь результат организации человеком своего окружения по отношениям сходства и различия.
Следующие концепции дают разную экономию лексической репрезентации, объема лингвистических вычислений и различаются по простоте усвоения [85, c.292-297]:
1. Репрезентация производного слова содержит полную фонологическую матрицу и указание на морфемный состав. Основная проблема: каков механизм, позволяющий человеку, усваивающему язык, экономно распорядиться ресурсами памяти? Ведь о произношении морфем он может узнать из статей о родственных словах.
2. Лексические статьи и правила полностью соответствуют духу стандартной порождающей фонологии конца 1960-х годов [115]. Тогда меньшее количество статей дл производных слов должно содержать информацию о произношении. Но требуются довольно абстрактные репрезентации исходных форм, а отсюда избыток правил, переводящих эти формы в стандартное произношение.
3. Статья для производного слова отражает только тот материальный облик (произношение слова), который не вычислим на основании лексических статей для частей слова. Если произношения морфемы как отдельной основы и в рамках этого слова не совпадают, ничто не поможет установить общий знаменатель в терминах реальных (не абстрактных) сегментов, из которого выводимы все варианты произношения одной и той же морфемы. Отсюда необходимость отдельно указывать алломорфы в статьях дл
-127- морфем и место основного ударения в производных словах.Экономия памяти достигается, но усложняется распознавание слова: должны "вычисляться" составные части и место ударения. Эта задача, впрочем, облегчается тем, что продуцирование и понимание производного слова так или иначе требуют обращения к лексическим статьям для компонентов его в поисках семантической репрезентации. Если уж оптимизировать устройство статей в этой области, то следует предположить, что не просто фонологические репрезентации, но и семантические репрезентации для одних и тех же морфем должны храниться дважды; скажем, для добр, подл в рамках соответствующих двух статей, а отдельно в рамках статей для производных типа доброта, подлость.
4. Лексические статьи организованы в соответствии с п.2, но допускается только ограниченный класс фонологических правил и единиц, получающих алломорфы. Освоить новую статью значит зарегистрировать достаточно продуктивные чередования фонем в конкретных контекстах.
Должны ли статьи лексикона содержать указание на реализацию лексических единиц в фонетических, фонемных, системно-фонемных или каких-либо иных терминах [311, c.59]? В некоторых работах конца 1960-х годов [207], [209] считалось, что фонологические репрезентации в рамках лексикона должны быть минимально абстрактными, наиболее приближенными к реальному звучанию. Некоторые шли даже дальше, предлагая модель лексикона, содержащего все словоформы [319], [222].
В конце 1970-х гг. выделяли [91, c.58-66] три позиции:
1. Хранятся основы и аффиксы, причем фонологические правила имеют очень абстрактный вид (далеко не всегда связаны с конкретными материальными оболочками морфем, выполнены в терминах различительных фонологических признаков), выражают закономерности любой степени продуктивности так в стандартной генеративной модели [115], [159].
2. Хранятся словоформы, все члены парадигм заданы явно, а закономерности задаютс правилами избыточности [319].
-128-3. Содержатся только слова, какой-либо аспект которых не выводим из частей. Менее продуктивные "морфемообусловленные" закономерности задаются с помощью правил избыточности в лексиконе, и только самые продуктивные закономерности выражаютс фонологическими правилами [66]. Все основы и производные формы, в семантическом, фонологическом или каком-либо ином отношении нестандартные, хранятся в лексиконе. Таким образом, различен статус предсказуемых форм и запоминаемых целиком. Лексикон упорядочен по значениям, так что одному описанию значения ("слоту") соответствует ровно одно слово.
По [311, c.59], наиболее разумна концепция компромиссная между лексиконом, основанным на морфемах, записанных в абстрактно-фонологических терминах (скажем, когда морфема записывается в виде последовательности сегментов, каждый из которых имеет вид пучка фонологических признаков), и лексиконом конкретных слов (то есть лексиконом словоформ). Зачастую чередования могут быть описаны только в терминах единиц более крупных, чем отдельные морфемы. Слово в лексиконе должно быть задано, по [311, c.70], в фонемном виде, близком к поверхностному, но с указанием символов границ морфем:
1. Абстрактная запись для морфемы в виде "общего знаменателя", из которого по правилам выводятся все реальные звучания, годилась бы, если бы единицами лексикона были только морфемы. Но если такими единицами являются еще и объединения морфем, не нужна единая исходная форма для соотнесенных морфем.
2. Контраст между алломорфами одной морфемы (зависимость выбора алломорфа от контекста) делает избыточным представление морфемы в каком-то абстрактном виде в рамках тех единиц лексикона, в которых иных алломорфов данной морфемы и не бывает.
3. Единый источник устанавливается, по идее, только для того, чтобы отразить соотнесенность альтернантов. Это рабочий прием. Но если существуют другие способы соотнести альтернанты между собой скажем, посредством лексических правил избыточности, не затрагивая процессы реальной переработки текста на основе уже имеющегося лексикона, то они предпочтительнее абстрактных морфемных представлений, поскольку требуют меньших ресурсов времени при обращении к лексикону. Иное дело, когда
-129- речь идет о фонетически мотивированных чередованиях [298]; [177]. Тогда имеет смысл различать следующие случаи:- альтернанты порождаются из абстрактных источников,
- лексикализованные альтернанты по правилам лексической избыточности интерпретирующего, а не порождающего типа.
В литературе последних лет можно выделить несколько крупных концепций (см., например, [136, c.138]). Вот некоторые.
Статьи лексикона описывают свойства отдельных морфем, а составные морфологические формы порождаются только в результате работы системы правил. Напомним, что Л. Блумфилд [3, с.170] лексиконом называл весь запас морфем языка. Лексикон у него [3, с.303] приложение к грамматике, содержащее список основных нерегулярных (поскольку значение каждой морфемы принадлежит ей лишь в силу условной традиции) форм. Это продолжение древнеиндийской и семитских традиций, где заглавием статьи лексикона является абстрактный корень.
Частные реализации этой концепции таковы:
1. В стандартной генеративной фонологии [115] предполагалось, что лексикон задает описание морфем. В более поздних концепциях [112], [66] единицами лексикона считаютс определенные сочетания морфем.
2. Хранятся только корни как комплексы фонологической и семантической информации. Правила словообразования получают слова (иногда только основы) из этих корней [230, c.632].
3. В лексикон, или "морфикон" (термин С. Лэма), включаются морфы "минимальные знаковые единицы, на которые членятся словоформы". Такой список меньше списка словоформ более чем в 10 раз, а примененительно "ко всем словоизменительным и (регулярным) словообразовательным формам такого языка, как русский, [ ] меньше списка словоформ не менее чем в 100 раз" [6, с.57].
4. Лексические статьи представляют формативы, никакое фонетически
-130- мотивированное правило не начинает работать до тех пор, пока эти формативы не присоединены к более крупным цепочкам полных слогов. Это означает, что лексические репрезентации неизбыточны и записаны в терминах архисегментов [176, c.536]. Иногда предполагают при этом [327ç.267], что в лексиконе морфемы помечены как "маркированные" или "немаркированные" во всех областях: в области фонологических, синтактико-морфологических ("лексикосинтаксических") и морфологических (классы флексий) признаков. Помеченные таким образом корневые морфемы (основы) вводятся в состав предтерминальных цепочек по правилам формирования синтаксических структур. Сложнее дело обстоит с производными словами: они вставляются в деревья синтаксической структуры в зависимости от контекста, а как формулируется эта зависимость не очень ясно.5. Корни как в семитской традиции не просто перечисляются, а организуются в группы в соответствии с принципами получения основ, выражающих деривационные отношения между "биньяним" (породами). Между прочим, сопоставительное исследование структур имеющихся словарей древнееврейского языка (и современного иврита) показывает, что использовались следующие четыре возможности структуры лексикона [201, c.56]:
- все слова получаются, исходя из корней, которые только и хранятся в лексиконе;
- большинство слов, но не все, получаются из корней;
- только глаголы получаются из корней (так в словарях современного иврита);
- каждое слово представляется отдельной статьей (наименее распространенный прием).
В таком лексиконе собраны в качестве самостоятельных единиц все возможные морфологические формы каждой лексемы, так что морфологически производные формы имеют тот же статус, что и одноморфемные. Это негативная реакция на структуралистский и трансформационалистский подходы к грамматике, в которых принимают, что лексикон содержит основы (причем аффиксы, возможно,
-131- хранятся в отдельной секции лексикона), а слова "генерируются" в результате работы деривационных и словоизменительных правил [319, c.367-368]. Разновидности реализации:1. Лексикон всех форм плюс аппарат правил, так что задаются закономерные соотношения между различными составными формами стратегии формирования слова (или правила избыточности), объединенные в отдельный компонент лексикона.
2. Хранятся представители только главных лексических категорий (в смысле "Аспектов" Н. Хомского [111]): глаголы, существительные или прилагательные (наречия считаютс разновидностью прилагательных). Каждой синтаксически различной словоформе конкретной лексемы соответствует отдельная лексическая статья. Все деривационно соотнесенные формы обладают отдельными статьями [67, c.12]. В этом сходство со словарем Вебстера.
3. Форма лексической единицы близка к реальному произношению слов; фонологические правила не обладают функцией описания правильных форм поверхностной структуры исходя из более абстрактных репрезентаций, а только соотносят эти (перечисленные в лексиконе) формы между собой, то есть, их главная роль интерпретирующая: вместе с морфологическими правилами, фонологические служат скреплению воедино единиц лексикона. Для любых двух слов, произношение и значения которых содержатся в лексиконе, правила устанавливают, соотнесены ли эти слова морфологически [282, c.555], [222].
4. Лексикон как организация данных по фонологическим основаниям объясняет фонологические оговорки (ошибки) типа малапропизмов когда вместо одного слова употребляется другое, фонологически, но не семантически близкое к требуемому. Упорядочение единиц в таком лексиконе ориентировано на фонологическую репрезентацию слова, с учетом линейного расположения фонем [137]. Этим объясняется, почему малапропизмы чаще связаны со сходством начал, а не середин слов. Выдвигается следующая гипотеза: малапропизм случай, когда вместо требуемого слова выбирается его ближайший сосед в лексиконе. Впрочем [187], на упорядочении слов в лексиконе сказывается не только начальная позиция, но и конечные, упорядочение в лексиконе не однозначно связано с расположением фонем только слева направо возможны
-132- и иные типы сортировки. Слова с деривационными суффиксами хранятся целиком: сложные слова не порождаются, а хранятся. Таким образом [122, c.107], лексические единицы, хранимые в словаре, соответствуют целым словам, которым приписана морфологическая структура, заглавная и полная формы и т.д.Если принять, что в лексиконе собрана вся информация о непредсказуемых связях между формой и значением, приходится предположить также, что лексикон не ограничиваетс хранением слов, в нем есть и более крупных единицы [62, c.4]. Это список с избыточными лексическими статьями, обобщения по поводу которых выглядят как правила интерпретации, а не продуцирования новых статей, что объясняет следующие явления [262, c.293]:
1. В лексиконе хранятся выражения, элементы которых обладают непредсказуемой сочетаемостью: фразеологизмы, истинные идиомы и т.п. Ср. выражения типа высокое начальство не крупное начальство в отличие от крупного военачальника и крупного рогатого скота, при неправильном высоком рогатом скоте.
2. Форма лексической статьи для истинных идиом не та же, что для фразеологизмов: у истинных идиом значение как целая сущность привязана к синтаксически сложной статье. "Ценность", или информативность,лексической статьи для идиом не та же, что для остальных единиц: вся информация о лексической единице, выводимая из остальных мест лексикона, не добавляет информативности этой статье. Информативно уже само указание о существовании статьи для фразеологизма и о вхождении в него данных слов, а не других. А для истинной идиомы информативно и ее истолкование, перифраз. Правило избыточности при этом аналогично по функции фонологическому правилу ассимиляции.
Принят "укрупненный" лексикон и в работе [192, c.177], в которой он определяется как
набор единиц вида:
Кратко опишем подход, реализующий лексикалистскую концепцию лексикона и давший образец для многих подражаний.
В этой концепции [191, с.667] отказываются от положения о том, что лексикон простое хранилище заученной информации, а творческий аспект во владении языком принадлежит только синтаксису. Р. Джеккендофф считает, что структура лексикона также лежит в основе креативности языка. (М. Бирвиш [74, c.84-85] десятью годами ранее также утверждал, что лексические единицы, подобно синтаксическим, порождаются по правилам, а не хранятся в окончательном виде в памяти.)
По [191, с.639], есть два подхода к лексикону: с полными статьями и с обедненными статьями. При достаточно удачной процедуре измерения информативности и содержательности можно установить, какой подход и в каком случае лучше. Для английского языка подход с полными статьями лучше для каузативных глаголов, составных имен и идиом.
"Обедненный" лексикон близок к трансформационалистскому (антилексикалистскому) подходу. Например, глаголу decide соответствует полностью заданная статья, а единице decision производной от decide либо не соответствует никакая статья (это крайний трансформационализм, когда производные единицы не хранятся, а только генерируются при необходимости), либо обедненная, неполная. Правило избыточности заполняет отсутствующую информацию, исходя из содержимого статьи для decide, при получении предложения, включающего слово decision, скажем, на этапе лексического вставления. Как и при трансформационалистском подходе, независимое информационное содержание для decide
- decision в сумме не должно быть значительно больше содержания для статьи decide, поскольку избыточные моменты не дублируются в статье для производной лексемы.
В типовой лексической статье обедненного лексикона указываются [191, с.643]:
- номер статьи, то есть индекс, позволяющий делать ссылки на данную статью в других местах лексикона, без воспроизведени
-134- в явном виде остальных параметров; именно таковы отсылки к статье decide в рамках статьи для decision;- фонологическое представление;
- синтаксические признаки;
- семантическая репрезентация.
Пример обедненной статьи для decide:
┌ | ┐ | |
│ 784 | │ | |
│ /decid/ | │ | |
│ +V | │ | |
│ +[NP1 __ on NP2] | │ | |
│ NP1 decide on NP2 | │ | |
└ | ┘ |
"Полный" лексикон содержал бы в этом случае указания на свойства и decide, и decision, так что правила избыточности не играли бы никакой роли в получении предложения, но зато использовались бы для оценки меры информативности лексикона. Избыточной считалась бы информация в лексической статье, предсказуемая самим существованием некоторой соотнесенной лексической единицы. При "полном" лексиконе нет необходимости в указании на номер лексической статьи [191, с.643].
Главное сформулировать правила лексической избыточности для адекватного описани частичных отношений и нерегулярности лексикона [191, с.639]. Правило избыточности соответствует высказыванию типа: "Лексическая статья Х, обладающая такими-то свойствами, соотнесена с лексической статьей Y, обладающей такими-то свойствами". Например правило, помеченное как (1):
(1)
┌ | ┐ | ┌ | ┐ |
│X | │ | │Y | │ |
│/y+ion/ | │ | │/y/ | │ |
│+N | │ | │+V | │ |
│+[NP1's __ (P) NP2 | │ | │+[NP1 __ (P) NP2] | │ |
│ABSTRACT RESULT OF | │ ↔ | │NP1 Z NP2 | │ |
│ACT OF NP1'S Z-ING | │ | │ | │ |
│NP2 | │ | │ | │ |
└ | ┘ | └ | ┘ |
Для decision достаточно иметь в обедненном лексиконе такую статью:
┌ | ┐ | |
│ 375 | │ | |
│ получено из 784 по правилу (1) | │ | |
└ | ┘ |
Информативность лексикона оценивается так [191, с.643]:
1. Определяется объем независимой информации, вводимой в лексикон в результате добавления n отдельных новых лексических статей. А именно, объем независимой информации, полностью заданной лексической статьей W, есть:
- информация о том, что W в лексиконе хранится, плюс
- вся та информация, содержащаяся в W, которая не может быть предсказана из существования некоторого морфологического правила избыточности, позволяющего описать содержимое статьи W на основе сведений о лексических статьях, уже имеющихся в лексиконе, и о семантических правилах, плюс
- "цена" указания на правила избыточности R. Эта цена для правила R при оценке информативности лексической статьи W равна произведению объема информации, содержащейся в статье W и предсказываемой по этому правилу, на некоторое число из промежутка от 0 до 1, соответствующее степени регулярности правила R при деривации статьи W [191, с.666].
Напомним, что в некоторых фонологических концепциях [284] оптимальной считаетс лексическая репрезентация, при которой минимальное общее число условий правильности морфемной структуры (morpheme structure conditions) характеризует максимально возможное число лексических статей в лексиконе. У Джеккендоффа это положение нашло свою конкретизацию.
2. Определяется информативность лексикона в целом, исходя из того, что полные независимые статьи заставляют учитывать еще и неполные статьи. Информационное содержание лексикона в целом определяется следующим образом. Пусть лексикон содержит n лексических статей W1, W2, , Wn. Каждая перестановка Р целых чисел от 1 до n соответствует некоторому порядку введения статей в лексикон: сначала введена единица W1, затем W2 и т.д. При каждой перестановке вычисляется информативность растущего
-136- лексикона. Так получим оценку всех возможных вариантов лексикона с этими n статьями. Из двух лексиконов, содержащих один и тот же набор статей (в разном порядке введенных), выше оценивается лексикон с меньшим информационным содержанием.Развивая эту тему неполноты, пытаются психолингвистически показать [309, c.347], что лексикон каждого носителя языка содержит много недозаполненных статей, в которых отсутствует информация о синтаксическом поведении единицы, предикатной или падежной структуре, употребимости, природе концептуальной или морфологической соотнесенности с другими единицами лексикона, значении, фонологической или орфографической реализации в определенных контекстах. Можно "знать" слово, сомневаясь в его произношении, написании и употреблении.
Активным словарем в этой связи можно назвать набор всех лексических единиц, дл которых имеется лексическая статья полная или неполная. Пассивный же словарь состоит, в первую очередь, из единиц с полными или с почти полными статьями. Эти словари конкурируют между собой [309, c.354]. Ядерный лексикон набор базисных, независимых друг от друга лексических статей языка. Из этого набора получается расширенный лексикон, содержащий производные лексические статьи [53, c.240].
Носители языка не всегда сразу соотносят усваиваемую единицу с хранимыми. Одни делают это быстрее, другие дольше. Иногда хранят даже дублирующуюся морфологическую информацию в рамках двух лексических статей, не соотнося их. Кроме того, далеко не всегда усваивают "исходную" единицу раньше морфологически производных от нее: лексикон иногда содержит статью для производной единицы и не содержит исходной единицы. Чем больше мы знаем о слове, тем менее склонны менять статью о нем в лексиконе. Воспринимая необычную речь, скорее полагают, что ошибся собеседник, чем ревизуют лексикон [309, c.353-354].
Но при решении включить в лексикон новую единицу первым шагом будет констатаци наличия слова [309, c.347]. Минимальная лексическая информация "Х является словом языка L" есть сигнал к началу пополнения статьи (обычно на неосознанном уровне): накапливаетс корпус цитаций, иллюстрирующих употребление слова, и определяются фонологические, синтаксические,
-137- семантические и стилистические свойства. Объем и типы добавляемой информации зависят от воспринимаемых высказываний, а еще больше от способностей "лексикографа" обобщать материал, строить дефиниции и комментировать значения и/или употребления слова. Если слово известно только по письменному тексту, информация о произношении может временно отсутствовать: "по умолчанию", письменный текст соотносится со звуком, но не всегда адекватно особенно в таких языках, как английский. И наоборот, слово, которое только слышали, но никогда не видели в тексте, бывает зафиксировано без орфографической информации. Во всяком случае, на промежуточных этапах усвоения лексикона всегда возможны лексические статьи со случайными упущениями.О критике подхода в целом см. [258], [174, c.6].
В этом подходе [174, c.26] слова (в том числе словоформы) рассматриваются как атомарные единицы по отношению к синтаксическим правилам. В противоположность классическому генеративному подходу, словоизменительные морфемы не вводятся в предложение на правах синтаксических единиц, которые затем к основам "приделываются", адаптируются трансформационным путем.
Лексикон содержит не только единицы, но и процедуры. Первые отвечают за все аспекты формирования слова, кроме словоизменения, и отражаются полными лексическими статьями (в духе Р. Джеккендоффа), дополненными лексическими правилами, выявляющими избыточную информацию. Словоформы не хранятся, а морфологически интерпретируются [174, c.26] как члены парадигм.
Образование новой лексемы на основе словоформы (а не лексемы) разновидность образования новой лексемы исходя из потенциальной, но не реализованной лексемы, основа которой совпадает с этой словоформой. В рамках этого подхода форматив ов в словоформе очков (Род.п.мн.ч.) от очко и в деривате очковый следует трактовать как две разные сущности: в первом случае это флексия, во втором словообразовательный суффикс. Обилие в некоторых языках флексий, совпадающих по форме со словообразовательными аффиксами, сторонников этой концепции не смущает.
-138-Правила словоизменения трактуются как процедуры реализации (spell-out rules), когда форма единицы, обладающей некоторым набором (морфологических) признаков, подвергаетс модификации. Например [174, c.27]:
/ X / --> /X+a/
┌ ┐
│+F │
│-G │
└ ┘
Виды признаков, учитываемых словоизменением [174, c.27]:
- морфосинтаксические (как при согласовании),
- морфолексические, т.е. локальные, не проникающие на более высокие уровни (например, видовые признаки глагола).
Лексическая репрезентация указывает на процедуры, отвечающие за поведение лексических единиц. Это "план поведения" единиц (впрочем, с неясной степенью детализации). Так, фонетическая часть отражает тщательное произнесение слова.
Лексикон напоминает базу данных, то есть организацию с многими системами доступа: единица может быть найдена в нем по семантическим, синтаксическим, фонологическим (в частности, просодическим) характеристикам и т.д. [135, с.138-144].
Согласно одной из гипотез [133, c.124], как и в базах данных, различные виды информации хранятся в различных компонентах лексикона порознь, распределены по подлексиконам, взаимодействующим между собой на правах модулей.
Опираясь на результаты психолингвистических экспериментов [133, c.145-146], иногда полагают, что подкомпоненты лексикона связаны и между собой, и с внеязыковыми знаниями:
1. Лексикон содержит множество независимых подлексиконов (специализированных по типу информации), между которыми установлены каналы связи. Обычно есть, например, фонологический, семантический и (для грамотных носителей языка) орфографический подкомпоненты. При нарушениях речи типа дислексии связи между этими подкомпонентами нарушаются.
-139-2. Фонологические статьи включают абстрактную фонемную репрезентацию, а иногда и запись в терминах системной фонемики. По ходу продуцирования речи фонологическая цепочка переводится в эту репрезентацию, по которой затем как по программе работает речевой аппарат, физически выполняющий команды. При восприятии же акустический сигнал переводится в фонематические репрезентации, по которым устанавливаются семантическая и/или орфографическая репрезентации.
3. Списки в рамках фонологического подкомпонента упорядочены по начальным сегментам и по структуре начальных слогов (возможно, и еще глубже). Не исключено, что есть и иные типы организации данных в этом подлексиконе: скажем, в одном списке содержатс односложные слова, в другом двусложные и т.д., отдельно слова, упорядоченные по конечным сегментам и т.д.
4. Если слово пишется не по основным правилам орфографии, заводится подлексикон орфографических репрезентаций, обычно же действуют обычные (продуктивные) правила, позволяющие читать и писать новые и даже бессмысленные слова.
5. Морфологически родственные слова, видимо, занесены в одну статью или в совокупность статей с перекрестными отсылками. Неясно, как выглядят отсылки к морфологически сложным словам, содержащим аффиксы. Поскольку носитель языка умеет разлагать сложные формы на составные морфемы, и поскольку при нормальном употреблении и при ошибках могут возникнуть незаконные комбинации как связанных, так и свободных морфем, отдельные морфемы также должны упоминаться морфологическими правилами, задающими способы допустимого сочетания морфем, в дополнение к списку сложных форм. Скорее всего, список слов с аффиксами, вызывающими чередование основы, хранится отдельно от основ. В этом отличие от слов, корневые морфемы которых не подвергаются ни регулярному словоизменению, ни регулярной деривации.
6. Лексические и грамматические морфемы либо помечены особым образом, либо (а возможно, и одновременно) хранятся в отдельных частях лексикона, это видно из распознавания. Дериваты есть в лексиконе, но неясно, хранятся ли словоформы.
7. Признаки подкатегоризации слов есть в лексиконе, но неясно, хранится ли эта информация в отдельном подлексиконе
-140- при использовании системы адресации, или же она дана явно в каждой статье в рамках некоторого обычного подкомпонента.8. В лексико-семантическом подкомпоненте статьи соотнесены по признакам класса, или по "семантическим постулатам".
9. То, что лексикон содержит лексико-семантические репрезентации, не означает, что в него включено "знание о реальном мире", хотя и ясно, что лексикон взаимодействует с внеязыковыми знаниями при выборе языковых единиц или при восприятии их. Факты агнозии указывают, что возможна диссоциация лексического и неязыкового знания, то есть, лексическое знание хранится отдельно от внеязыкового.
Лексикон как база данных реализован в тех подходах к моделированию морфологии, в которых [103, c.215] лексические единицы служат ключом к семантической информации лексикона. Значения слов представляют в виде расширенных семантических сетей, опирающихся на "алфавит" примерно из двухсот атомарных единиц. Чтобы не хранить слишком большие массивы данных, в том числе словоформы, лексикон дополняют морфологическим анализатором, а также используют различные способы кодировки и упорядочения единиц, ускоряющие поиск.
К таким приемам относится индексация лексических статей по отношению деривации в семитских языках. Например [251, c.359], каждой лексической статье ставится в соответствие схема в виде дерева сообразно правилам получения "пород" от корня. Для арабского корн ktb "писать" имеем [251, c.392]:
ktb
┌─┴──┬────┐
kataba kitaab kuttaab
┌┴───┬─── ┬───┬────┐
maktab kattab kaatab ktatab kitaabat
│
takaatab
В этом дереве фонологические формы упорядочены по отношению лексической деривации, для которой есть отдельное морфологическое правило [251, c.393], так что:
-141-1. Отношения типа "быть производным от" выразимы в терминах структурированной лексической статьи, оцениваемой через призму некоторого морфологического правила.
2. От формы лексической статьи и зависит способ подачи семантических, морфологических и фонологических отклонений.
Лексические репрезентации (ЛР) являются ключами, по которым в лексиконе как в базе данных ищутся нужные элементы. Эти ЛР хранятся в постоянных "списках" и служат в качестве неразложимых атомов (терминальных элементов) в синтаксических конструкциях [95, c.258]. Гипотеза о "полном списке" выдвинута была еще Л. Блумфилдом [3]: все лексические репрезентации, которые могут когда-либо понадобиться носителю языка, вычислены и хранятс в лексиконе, а не получаются по мере необходимости. В пользу этой нулевой гипотезы, по мнению некоторых психолингвистов, имеется больше всего данных из области восприятия и продуцирования речи, исследования письма и т.д. [95, c.261].
Альтернативы гипотезе о полном списке [95, c.280-281]:
1. Модусно-нейтральная ЛР. Для каждого слова (или морфемы и т.д.) имеется ЛР, заданная в коде, нейтральном по отношению к "модусу". То есть, одна и та же ЛР обслуживает письменный, устный модусы, модусы восприятия и продуцирования и т.д. При обращении к лексикону модусно-ориентированные ЛР транслируются в модусно-нейтральный вид.
2. Модусно-ориентированные ЛР. Для каждого из возможных модусов есть свой отдельный список ЛР: так, одно и то же слово представлено по-разному в списке для слухового восприятия, для слухового продуцирования, для чтения и для написания. Нет и не может быть модусно-нейтральных ЛР. Причем не обязательно у слова бывают ЛР для всех модусов.
3. Модусно-ориентированные плюс модусно-нейтральная ЛР. Это комбинация первых двух гипотез. Переход от ЛР к значению происходит только через модусно-нейтральную ЛР.
4. "Эмические ЛР". Различия между входом в лексикон и выходом из него формулируются в ориентации на общий канал: дл
-142- канала устного восприятия в терминах фонем, для визуального канала графем. Единица кот обладает одной фонемной записью (как для восприятия, так и для продуцирования) и одной графемной записью (также для двух разных модусов). В одной из разновидностей этого подхода [95] предполагается, что есть "фонологический лексикон", обслуживающий устное восприятие и продуцирование, соотнесенный с "семантическим лексиконом", также обслуживающим устное восприятие и продуцирование речи, и с графемным лексиконом.Психолингвистические эксперименты опровергают следующие гипотезы [95, c.289-290]:
1. Только заглавные формы хранятся в лексиконе, а словоизменительные и словообразовательные производные вычисляются по ходу восприятия и/или продуцировани речи с помощью правил. (В действительности лексической репрезентацией обладают и базовые, и производные формы.)
2. ЛР представляет морфемы, а не слова. Например, оказалось, что ошибочные производные слова (при оговорках) в одинаковой степени затрагивают и основы реальных слов, и единичные морфемы, не составляющие слово.
3. Существуют модусно-нейтральные ЛР либо как единственные, либо как вспомогательные (индексирующие) сущности лексикона. (Скорее следует принять, что фонемные и графемные ЛР четко разграничены.)
Кроме того [95, c.289-290]:
1. Возможно, есть отдельный список функциональных слов (впрочем, понятие это расплывчато).
2. Зависимость вида ЛР от частотности единицы правдоподобна, но неясны причины частотности.
3. Группировка морфологически соотнесенных форм хорошо видна при выполнении некоторых психологических тестов в рамках разных модусов, но нет несомненных свидетельств тому, что группировка связана с какой-либо одной базисной формой или что некоторая более абстрактная ЛР является "заголовком" при этом.
-143-ГИПОТЕТИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ В МОРФОЛОГИИ
Теперь попытаемся применить рассмотренные выше концепции к построению экспертной системы морфологических знаний.
Под морфологической интерпретацией (МИ) мы понимаем соотнесение текстовой и словарной форм лексемы при установлении грамматических помет словоформы. Интерпретаци текстовой формы, приводящая к заглавной форме, обычно называется лемматизацией, а интерпретация словоформы (в том числе, заглавной), когда указывают еще дополнительно требуемый набор граммем и получают текстовую форму синтезом. Принципиально важно то, что при обоих направлениях МИ используется один и тот же набор данных и стратегий интерпретации.
Мы представляем себе МИ так. Носитель языка интерпретирует текстовую форму, идя от ее начала к концу, но не побуквенно, а поморфно, то есть выделяет сперва начальные морфы (префиксы в русском языке, корни в финском и других языках, не имеющих префиксов, флексии в языках типа арабского и т.д.), а затем один за другим и остальные элементы, на каждом этапе "накладывая" текущий остаток анализируемого выражения на хранимое множество морфем и выдвигая гипотезы о такой наложимости в дальнейшем.
На каждом этапе могут выдвигаться сразу несколько гипотез, большая часть которых отсеивается по ходу дела. Гипотезы упорядочены определенным образом (каким именно см. ниже). Количество одновременно выдвигаемых гипотез определяется числом тех морфов, которые могут быть отождествлены с началом текущего остатка в рамках текущей главной гипотезы. Неподтвержденность какой-либо гипотезы означает исключение всех подчиненных ей подгипотез. Поэтому множество текущих гипотез пульсирует: то расширяется, то сужается. Последнее когда начало остатка, полученного в рамках главной гипотезы, не совпадает ни с какой хранимой морфемой (или алломорфом ее).
Морфологические анализ и синтез в общем случае МИ не
-144- наложение хранимых основ и вычленение флексии из остатка (такой подход часто называют анализом слева направо) и не наложение хранимых же флексий и установление того, хранитс ли готовая основа, сопоставимая с остатком (анализ справа налево). Хранятся только непроизводные основы (о которых мы говорили в четвертой главе). Производные основы вычисляются по ходу МИ.Другое отличие от предыдущих попыток имеет общенаучный характер. Предшествующие системы автоматических морфологических анализа и синтеза были обычно (см. вторую главу) привязаны к какой-либо одной, доминирующей концепции морфологии. Иногда эта концепция была очень упрощенной особенно когда задача была чисто практической. Мы же предлагаем систему, задающую метаязык метаязыка современной морфологической теории.
В этой главе демонстрируется применимость системы для разных языков, показываютс приемы обращения с формальным аппаратом для различных "трудных" случаев, выразительные возможности нашего метаметаязыка.
Система МИ основана на принципах гипотетической интерпретации, в особенности на следующих положениях:
1. МИ заключается в выяснении гипотетического морфного состава у анализируемой словоформы, когда идут от более ранних по времени появления в тексте единиц к более поздним. Таким образом определяется гипотетическая основа словоформы поисковый образ лексемы с ее морфологическим классом, в рамках конкретной лексикографической традиции (а такие традиции, как мы знаем, очень различны, ср. русскую и арабскую традиции). Морфологический класс основы, неформально говоря, соответствует набору флексий, с этой основой сочетающихся, т.е. словоизменительной парадигме. Каждая флексия в таком наборе снабжена соответствующими грамматическими пометами. Каждая из полученных гипотез относительно морфного состава верифицируется по ходу появления в поле зрения последующих сегментов текста. Такое положение можно было бы назвать принципом "слева направо", если отвлечься от того обстоятельства, что это название скорее
-145- справедливо для письменностей слева направо (как в большинстве европейских языков); дл семитских языков наш принцип, апеллирующий ко времени, но не к пространству на бумаге, должен бы называться принципом справа налево.2. Основной инвентарь лексикон (в блумфилдовском понимании термина) и представляет информационную систему морфем, а тем самым, морфов. Морфы интерпретируются т.е. синтезируются и/или анализируются на основе данных лексикона и процедур альтернации, заносимых человеком-экспертом в определенном формате и хранимых в отдельном месте системы.
3. Кроме лексикона, есть другие вспомогательные хранилища языкового материала, вводимые и пополняемые экспертом в соответствии с его теоретическими установками. Есть, в частности, словари непродуктивных основ, флексий, постфиксов, парадигм, граммем и т.д. (см. ниже).
4. При МИ и реальные, и потенциальные основы строятся из морфем, задаваемых лексиконом. Основы в словаре основ задаются в виде цепочек номеров морфем, то есть кодируются. Этот прием позволяет достичь экономии. Однако эксперт, пользующийся нашей системой, кодировки не увидит: перед ним всегда материальный буквенный облик основы непосредственно, а не цепочка чисел.
5. Лексикон позволяет интерпретировать словоформы не путем наложения образцов, хранимых в словарях (т.е. не при сопоставлении реальных лексем, хранимых в словаре обычного типа, с выделяемой гипотетической основой у словоформы), а конструированием таких образцов промежуточных гипотетических МИ по интерпретируемому объекту. Именно поэтому мы говорим об интерпретации: ход интерпретации (в программистском понимании), "протокол" ее, обладает обратной связью с "обрабатываемым" объектом и этим отличается от работы программы, предварительно "транслированной" на язык машинных кодов.
6. Чередования основ трактуются как чередования морфем, в эти основы входящих. У нас нет противопоставления "поверхностного" уровня "глубинному". У нас нет и "зашитого" в алгоритм системы набора правил, переводящих представления одного уровня в представлени другого. Каждое преобразование промежуточного представления морфемы (когда по правилам альтернации получаетс
-146- на основе исходного вида морфемы еще одно реальное воплощение морфемы, а не ее абстрактное недовоплощение) у нас трактуется не как переход с одного уровня на другой, а как выдвижение гипотез о соотнесении сегмента текста с одной из лексических статей лексикона.Есть два режима работы экспертной системы, оболочка которой построена нами:
- пополнение и исправление базы знаний,
- верификация.
Работа в режиме пополнения и исправления базы знаний облегчается набором вспомогательных процедур, таких как переупорядочение данных, нахождение требуемой единицы по маске, модифицирование данных, работа в режиме меню, демонстраци альтернативных решений. Эти вспомогательные процедуры облегчают работу человека-эксперта с данной базой.
В режиме верификации словоформы анализируются и синтезируются на основе занесенных экспертом данных. При такой работе у пользователя спрашивают, какую словоформу он хочет проинтерпретировать, и если он еще желает получить другие формы той же лексемы, то в режиме меню позволяют выбрать те граммемы, которые должны быть в синтезируемых словоформах. Например, все формы единственного числа или все формы мужского рода. Можно затребовать и синтез всех форм. По ходу работы системы в этом режиме указываются абсолютно все подтвержденные гипотезы об окончательной МИ словоформы, сколько бы их ни было, в порядке убывания правдоподобия, а на экране монитора указываются:
1) характеристики работы системы, позволяющие сопоставлять по эффективности различные решения эксперта:
- длина обрабатываемого слова,
- условные обозначения,
- номер варианта,
- число морфов в слове,
- динамика гипотез,
- время первого отклика,
-147-2) разбиение слова на морфемы,
3) акцентная схема,
4) корректировка орфографии,
5) лемматизация,
6) комментарий к корректировке,
7) парадигма данной лексемы, ограниченная запрошенным списком граммем или полна (список всех допустимых словоформ).
МИ включает указание на заглавную форму в соответствии с грамматической традицией или с желанием эксперта и набор грамматических признаков словоформы. Например, в русской традиции заглавная форма существительного выглядит обычно как форма именительного падежа единственного числа, прилагательного как полная форма положительной степени мужского рода именительного падежа единственного числа, у глагола как инфинитив и т.п. Для арабского языка заглавная форма глагола выглядит как "первая порода" в форме прошедшего времени третьего лица единственного числа мужского рода.
Ударение ставится во всех распознанных формах. Принципиальное значение имеет то, что исправление ошибок в тексте не основано на заранее составленном списке вероятных опечаток. Нахождение ошибок, объяснение их и указание более правильной словоформы все это результат работы морфологического интерпретатора, ориентированного одновременно и на анализ, и на синтез словоформ. Например, система предлагает вариант портфелей вместо портфелев, людьми вместо людями, играют вместо играят, играемой вместо играемойся и т.п.
Всем хранимым единицам приписан статус: действительно или отменено ("на пенсии"). Последнее когда единица не должна приниматься во внимание при интерпретации словоформ, как бы не существует. Изменение статуса единицы может иметь последствия для работы системы непосредственно при МИ.
Кроме лексикона словаря морфем есть еще словари непроизводных основ, флексий и постфиксов. Все словари составляют часть лексикона в общем смысле, однако по техническим причинам
-148- удобно говорить о них как об отдельных сущностях.В лексиконе содержатся морфемы характеристики строительного материала дл реальных и потенциальных основ, как производных, так и непроизводных. Носитель языка обычно знает: орфографический вид заглавного морфа, категорию (выбор здесь традиционный: корень, префикс, суффикс и т.п.), набор допустимых чередований, акцентные характеристики и требования к контексту в рамках основы. Например, префикс аг- требует, чтобы после него в основе шла морфема, начинающаяся на г, например: агглютинация при неправильном агпортфель. На основе всех этих знаний интерпретатор и бракует посторонние гипотезы.
Имеем два раздела лексикона: собственно лексикон и отсылочный. В статье собственно лексикона указываются:
1. Физический облик "заглавный морф" морфемы, являющийся отправным пунктом дл получения всех алломорфов. Пользователь вправе задавать этот облик и исключительно в алфавите фонем (или букв), а может быть и сторонником морфонем, то есть задавать этот физический облик при участии дополнительных символов. О достоинствах и недостатках каждого подхода см. ниже.
2. Набор номеров чередований, присущих данной морфеме. Например, в русском языке есть класс правил, традиционно объединенных под названием "беглый гласный". По этим правилам е и ё переходят в одних позициях в ноль, ср.: день дня, а в других в ь, ср.: лён льна. Если исследователь, пользующийся экспертной системой, может обойтись одним правилом (указывающим контекст, в котором чередование должно происходить), названный класс будет состоять ровно из одного правила. Информация о самих чередованиях хранится отдельно (см. далее), в данном же разделе пользователю предлагаетс только выбрать нужные единицы этого хранилища чередований по их названиям.
3. Имя класса морфемы: квалификация морфемы как корня, суффикса, префикса и т.п. Эта информация существенна при установлении того, соответствует ли данное слово "грамматике классов морфов": суффикс не может быть в начале слова, префикс в
-149- абсолютном конце слова или перед флексией и т.д.4. Указания на два набора чередований соответственно, соседних слева и справа морфем т.е., на множества наборов правил, аналогичные тому, которое указано в п.2, но относящихся к соседним в сегменте (непосредственно слева и/или справа) морфам. Если такое множество включает все возможные чередования данный морф всеяден, допускает у соседа абсолютно любую альтернацию. Иногда это бывает не так: морф (т.е. альтернант данной морфемы) может требовать, чтобы предшествующая и/или последующая морфема подверглась одним чередованиям и не подвергалась другим. В таком случае указанное множество наборов не будет полным. Если же это множество пусто значит, данный морф требует, чтобы морфема перед ним или после него не подвергалась никаким чередованиям. Между прочим, альтернанты одной и той же морфемы могут различаться в отношении этого набора, что означает, что соответствующее правило альтернации изменяет исходный набор. Например, все корни, начинающиеся на е,ё, ю, я, требуют, чтобы префикс непосредственно перед ними, кончающийся на согласный, имел на конце ъ, ср.: подъехал при неправильных подехал и подоехал. Если предусмотреть в статьях для соответствующих префиксов указание на нужное чередование например, под именем "пополнение префикса", в статьях для соответствующих корневых морфем (типа ех) указание на чередование слева будет включать "пополнение префикса".
5. Набор указаний на условия, которым должны отвечать морфемы слева и/или справа от данной морфемы в рамках интерпретируемого слова, для того, чтобы гипотеза о вхождении данной морфемы в это слова считалась подтвержденной.
6. Акцентный класс морфемы, дающий возможность вычислять акцентные характеристики основы.
Следующие виды информации играют вспомогательную роль:
7. "Огрызок" заглавного морфа, фигурирующий в упорядочении статей для морфем. Имеет вид целого числа. Если это число равно нулю, статья относится к тем, которые следует отождествить с началом данного сегмента в первую очередь, раньше всех остальных: начало (самая первая буква) какого-либо альтернанта данной морфемы не совпадает с началом заглавного морфа этой
-150- морфемы. Если же число это больше нуля значит, на упорядочении морфем сказываетс отрезок заглавного морфа данной длины.8. Номер первой основы, по словарю основ, оканчивающейся на какой-либо альтернант данной морфемы.
Пример описания морфемы:
ПОРЯДКОВЫЙ НОМЕР: 12
ЗАГЛАВНЫЙ МОРФ: аг
КАТЕГОРИЯ МОРФА: префикс
АКЦЕНТНЫЙ ТИП: 0
СЕЛЕКТИВНЫЕ ОГРАНИЧЕНИЯ:
первая буква морфемы справа равна последней этого морфа
АЛЛОМОРФЫ:
СТАТУС: действительно
АЛЛОМОРФЫ У МОРФА СЛЕВА:
ИНВАРИАНТНЫЙ ОГРЫЗОК: аг
ПЕРВАЯ ОСНОВА НА ЭТОТ МОРФ:
ПОЛЯРНОСТЬ ОГРАНИЧЕНИЙ: +
Статьи в лексиконе упорядочены по алфавиту огрызков заглавного морфа. Если начало остатка интерпретируемого сегмента нельзя отождествить ни с одной из морфем, у которых огрызок равен нулю, а к тому же и нет морфем, огрызок которых начинается так же, как и данный сегмент, значит, работа в рамках данной гипотезы останавливается: это тупик.
Теперь об отсылочном лексиконе. Это вспомогательный список, которого пользователь даже не видит: список строится автоматически после каждого изменения собственно лексикона, и предназначение его помочь искать морфемы, у которых в результате чередований меняютс самые первые сегменты физического облика. Например, в русском языке к таким морфемам относятся корни, начинающиеся на и (ср.: ищу подыщу, играю отыграю), а также морфемы типа: ен (как в слове оборотень, ср. оборотня, где чередование приводит к суффиксу н) или ёк (как в словах типа василёк василька, уголёк уголька, где имеем чередование с ьк). Структура статьи такова:
1. Начальный сегмент (одна или большее число букв) морфов-альтернантов, например: ь, н.
2. На что следует заменить начальный сегмент, чтобы по
-151- нему можно было найти статью в собственно лексиконе: например, на ё, ён, е или даже (как в случае древнегреческой редупликации, см. ниже) ноль.Статьи в отсылочном лексиконе, как и в собственно лексиконе, упорядочены по алфавиту физического облика.
Такое решение приводит к тому, что при интерпретации любого сегмента, на любом этапе, имеем всегда две группы гипотез об анализе начала сегмента:
- этот сегмент начинается так же, как и заглавный морф морфемы, идущей в начале этого сегмента, что исчерпывает все будущие гипотезы в случае слов типа бегаем, дне, море;
- начало этого сегмента не совпадает с заглавным морфом искомой морфемы, поэтому по вспомогательному лексикону и устанавливается, есть ли морфемы, хотя бы один альтернант которых начинался бы так же, как данный обрабатываемый сегмент, и если есть, устанавливаются все возможные покрытия этого сегмента в рамках этой гипотезы. Это не означает, впрочем, что нужную морфему вы автоматически найдете в собственно лексиконе: такая гипотеза может быть и посторонней.
Покажем, чего же мы добиваемся в результате всех этих усложнений исходной простой идеи.
Здесь и далее символы класса морфемы таковы:
* корень # флекси
_ префикс $ постфикс
= суффикс
Словоформа вынашивать на самых первых этапах выдвижения гипотез будет интерпретироваться так:
1. В_ЫНАШИВАТЬ
2. ВЫ_НАШИВАТЬ
В рамках гипотезы 1 имеем для ЫНАШИВАТЬ:
1.1. ЫН*АШИВАТЬ
(где ын альтернант морфемы ин, как в слове иной), и т.д., в
результате чего, скажем, получится (среди прочего) такое разбиение: В_ЫН*А=ШИ*В=АТЬ#.
В рамках же гипотезы 2 имеем далее:
2.1. НА_ШИВАТЬ
2.2. НАШ*ИВАТЬ
-152-Гипотеза 2.1 совпадает с одной из промежуточных гипотез в рамках исходной главной гипотезы 1. Наш алгоритм устроен так, чтобы, если в рамках разных гипотез рассматривается в точности один и тот же подсегмент, то не приходилось бы каждый раз дублировать распознавание этого подсегмента: для этого и были разработаны своеобразные форматы дл протоколирования результатов интерпретации, значительно экономящие время интерпретации и соответствующие интуиции о человеческой интерпретации.
Далее в рамках подгипотезы 2.1 имеем:
2.1.1. Ш*ИВАТЬ,
а в рамках подгипотезы 2.2
2.2.1. ИВА=ТЬ.
Теперь сопоставим хотя бы две из потенциально верифицируемых гипотез:
ВЫ_НА_Ш*ИВА=ТЬ# (корень Ш тот же, что и у глагола шла),
ВЫ_НАШ*ИВА=ТЬ#
Видим, что второй результат (более правдоподобный семантически) по количеству выделенных морфем отличается от первого. Наш алгоритм ориентирован на такое сопоставление гипотез, чтобы сначала выдавались более "короткие" морфемные цепочки, затем и остальные по возрастанию количества морфем, выделенных в интерпретируемой словоформе. Таким образом, вторая строка из приведенных выше результатов финиширует раньше первой, что вполне соответствует интуиции о предпочтительности этой второй гипотезы. Неформально говоря, у гипотез общие части "вынесены за скобки", как в алгебраическом выражении.
Степень вероятности гипотез, ранжирование гипотез, в конечном итоге определяетс длиной распознанных морфов и их классом. Скажем, можно упорядочить корни перед суффиксами и префиксами, чтобы раньше отсеялись посторонние гипотезы.
Самая первая гипотеза в связи с приведенной словоформой у нас была связана с выделением корня ын. Если предположить, что заглавный морф этой морфемы имеет вид ин, то следует обратиться к отсылочному лексикону, который содержит следующее указание: попытайся распознать два сегмента: ЫНАШИВАТЬ и ИНАШИВАТЬ.
Теперь можем вернуться к проблеме морфонемы (см. главу первую, раздел 6.3). Вопрос в том, нужны ли морфонемы.
-153-Морфонемную запись придумали для того, чтобы минимизировать количество "основных алломорфов" для морфем. Благодаря этому приему не надо, например, хранить две разных единицы рук и руч в словаре морфем русского языка: достаточно хранить, скажем запись руК (где К морфонема).
Представим себе, что мы пользуемся морфонемами, а "входом" в статью является не запись рук и не запись руч, а запись руК. Символ морфонемы К, вообще говоря, не обязательно распознается как совпадающий с к или ч, это особый символ. А значит, при распознавании слова руками, когда интерпретатор дойдет до статьи руК, он не сразу отождествит начало словоформы с морфом рук: потребуется еще как минимум одна операция, переводящая морфонему К в фонему к. То есть, и слово руками, и слово ручкапри обращении к словарю морфем потребуют одинакового числа операций идентификации. Но если физический облик в статье о морфеме представлена одним из реальных алломорфов данной морфемы, то по крайней мере для части словоформ распознавание будет происходить быстрее, чем для остальных словоформ, включающих ту же морфему, но представленную другим аллофоном.
Итак, решение с морфонемами у нас приводит к более долгому времени распознавания, чем без морфонем. И это бы еще ничего, ведь ЭВМ обрабатывает слово в течение считанных долей секунды. Хуже то, что время обработки слова без единого чередования такое же, как и при чередовании.
Поэтому несколько более привлекательным решением является запись без морфонем. Это не значит, что экспертной системой не сможет пользоваться сторонник морфонем. Нет, это вполне допустимо. Но в режиме верификации он сможет убедиться в меньшей психологической реальности МИ с морфонемами.
Как задать чередования без прямого списка алломорфов?
Можно выбрать следующий путь. Помимо поля заглавного морфа, статья для морфемы содержит еще указание на множество номеров чередований, которым она может подвергаться и которые приводят ко всем возможным алломорфам. В отдельном месте перечисляются соответственно по номерам все правила, которые характеризуют данное чередование. Например, чередование под названием "первая палатализация" может быть оприходовано в
-154- списке чередований под номером 3 (условно) и представлено правилами, по которым меняетс последний согласный морфемы: к меняется на ч, г на ж и т.д. При распознавании словоформы слева направо делаются попытки отождествить "голову" очередного остатка словоформы, по возможности без просмотра заведомо посторонних вариантов, со всеми подходящими хранимыми морфемами. Так, начало словоформы руками не будет накладываться на морфемы, не начинающиеся на р и при этом обладающие пустым набором чередований. Отождествить начало этой словоформы с морфемами раб, руб и т.д. также не удастся. До тех пор, пока мы не дойдем до статьи с заглавным морфом рук. Тогда отождествление произойдет с первой же попытки. А отождествление начала словоформы ручонками с морфемой рук произойдет только после того, как в результате генерирования всевозможных (кстати, не очень многочисленных) алломорфов данной морфемы интерпретатор не получит алломорф руч.Теперь посмотрим, что произойдет, если по ошибке в словоформе выбран неправильный или несуществующий алломорф данной морфемы. Скажем, как будет распознаватьс словоформа ручами. В словоформе будет распознана морфема рук (по алломорфу РУЧ). Будет установлен номер парадигмы для основы, составленной в точности из морфемы рук. Обнаружится, что и окончание -ами в порядке. Однако в статье дл этой флексии -ами в указании на множество чередований, которым должен быть обязательно подвергнут непосредственно предшествующий левый сосед, мы не найдем номера чередования "первая палатализация". Да и вообще, флексии склонения существительных в русском языке обладают нулевым множеством чередований, обязательных у левого соседа по словоформе. Итак, словоформа будет распознана, но система сгенерирует по данной основе и по данному окончанию другую словоформу руками. Что и будет указано.
Почему бы тогда не хранить заранее заготовленный список всех алломорфов? На самом деле возможно и это. Однако кто заполняет этот список? Интерпретатор при усвоении новых морфов под диктовку носителя языка или на основании компактной информации о наборе допустимых чередований? Лучше, очевидно, второе. Список алломорфов разумно генерировать перед каждым сеансом
-155- верификации экспертной системы, то есть перед распознаванием и продуцированием словоформ. Однако такое решение одно из многих, и выбор его также предоставляетс человеку-эксперту.Следовательно, с информационно-поисковой ("когнитивистской") точки зрения более правдоподобным является не перечисление заготовленных алломорфов в лексиконе, а указание на множество номеров чередований, которым морфема может подвергаться. Историческое изменение типа утраты каких-либо алломорфов у морфемы объяснимо тогда как выпадение соответствующего номера из этого множества или даже как стирание в списке чередований всех или части правил, входивших в характеристику конкретного чередования. Например, в современном русском языке нет алломорфа руц, который требовался в местном падеже в древнерусском языке, однако чередование к/ц осталось, ср.: лик лицо. Это значит, что в статье для рук стерлось упоминание номера чередования, при котором к чередуется с ц ("вторая палатализация"), а в статье для лик это упоминание осталось.
Мы не исключаем возможности списка аллофонов. Если правильно задать все требуемые
единицы языка (морфемы, правила и чередования), можно распознавать и строить тот же набор
правильных словоформ, что и без этого списка. Но иным будет время отклика и тип
поправимых ошибок: при решении без списка алломорфов распознаются даже словоформы,
построенные с морфонематическими нарушениями, а с таким списком некоторые подобные
словоформы распознаны не будут. Такова участь, например, словоформы руце, котора
при нашем решении исправима как руке предложный падеж единственного числа от
лексемы рука.
Пример 1. Валлийские мутации
Особенно показательна необходимость вспомогательного лексикона для языков типа валлийского (вообще, для кельтских языков), в которых чередования сегментов начала слова скорее правило, чем экзотика (в русском, скажем, орфография камуфлирует фактические чередования и ы начала слова после предлогов, оканчивающихся на согласный, тем облегчая задачу распознавания). Как видно из приводимых ниже соотношений, в валлийском есть три вида чередований традиционно они называются "мутациями":
-156- озвончение (soft mutation), назализация и спирантизация. Например, в зависимости от интерпретации притяжательного местоимения ei. Морфемы, хранимые в собственно лексиконе в "словарной форме", соответственно и следует пометить. Начальный сегмент |
Словарна форма |
После притяжательного местоимения |
||
|
ei "его" |
fy "мой" |
ei "ее" |
|
c |
ceffyl "лошадь" |
geffyl |
ngheffyl |
cheffyl |
p |
pen "голова" |
ben |
mhen |
phen |
t |
tad "отец" |
dad |
nhad |
thad |
g |
gardd "сад" |
ardd |
nghardd |
без изм. |
b |
basged "корзина" |
fasged |
masged |
без изм. |
d |
desg "парта" |
ddesg |
nesg |
без изм. |
ll |
llong "корабль" |
long |
без изм. |
без изм. |
m |
mam "мать" |
fam |
без изм. |
без изм. |
rh |
rhosyn "роза" |
rosyn |
без изм. |
без изм. |
^a --> g
(и так далее, для всех гласных, зафиксированных после мутирующего g в наличном морфемном словаре)
^b --> p
^m --> b ^ch --> c ^mh --> p ^d --> t ^n --> d ^dd --> d ^ngh --> c ^f --> b ^nh --> t ^f --> m ^pg --> p ^g --> c ^r --> rh ^l --> ll ^th --> tПример 2. Редупликация в древнегреческом
В древнегреческом языке при образовании форм перфекта, плюсквамперфекта и так называемого "будущего третьего" происходит
-157- своеобразное удвоение корня: к корню в начале слова присоединяется или в точности первый согласный плюс e, или модифицированный согласный с e. Например, в транслитерации, имеем:γράφω – γέγραφα – (я) пишу – писал,
λύω – λέλυκα – (я) развязываю – развязывал,
πλάττω – πέπληγα – (я) ударяю – ударял,
χωρέω – κεχώρηκα – (я) иду – шел,
φονέυω – πεφόνευκα – (я) убиваю – убивал,
θύω – τέθυκα – (я) жертвую – жертвовал, и т.д.
Общее правило таково. Редупликация с буквальным повторением первого согласного корня бывает, когда корневой морф начинается сочетанием несонорного непридыхательного с плавным согласным или когда корень начинается простым согласным (кроме ρ). Модификация же происходит, когда начальный согласный основы презенса придыхательный.Это явление можно трактовать следующим образом. В отсылочном лексиконе имеем целый ряд статей, которые выглядят так:
γέ -->
πέ -->κε --> χ
πέ --> φλέ -->
τέ --> θВ некоторых статьях второе поле представлено пустой цепочкой. Это значит, что если интерпретируемая словоформа выглядит как γέγραφα –, то выдвигаются две гипотезы:
- надо поискать в основном лексиконе морфемы, физический облик которых совпадает с началом γέγραφα – буквально (гипотеза об отсутствии редупликации);
- надо поискать в основном лексиконе морфемы, физический облик которых совпадает с началом γραφα – буквально, причем морфема будет считаться найденной, если в основном лексиконе у нее указано, что допускается (в качестве чередования) редупликация, которая выглядит именно как γέγραφα.
"Редупликация" же задается, как обычно, набором правил.
-158-Словарь основ хранит только непроизводные основы, то есть, те и только те, грамматические свойства которых не вычислимы на основе исключительно морфемного состава.
Основами здесь мы называем последовательности морфем (бывают и основы, состоящие ровно из одной морфемы), грамматические свойства которых не "вычисляются" из составных частей. В характеристики основ входят: сама последовательность морфем (во внутреннем представлении кодируемая как последовательность номеров по списку морфем), набор допустимых чередований у последней морфемы этой последовательности (поскольку основа может быть в этом отношении отличной по свойствам от входящей в ее состав морфемы), номер парадигмы, акцентные характеристики, а также (что особенно существенно для супплетивных основ, см. ниже) указание на граммему, допускаемую при словоизменении (если это необходимо: в противном случае указывается параметр "безразлично"), и на граммему, при словоизменении не допустимую (также бывает указание "безразлично"). Более конкретно:
1. "Физический облик" основы в виде последовательности составляющих ее морфем. Поскольку лексикон морфем выглядит как последовательность статей, каждая из которых имеет свой номер (по порядку в лексиконе), внутреннее представление физического облика основы цепочка номеров морфем. Эти морфемы в рамках конкретной основы представлены каким-либо своим алломорфом, не обязательно совпадающим с заглавным морфом морфемы. Как правило, вид алломорфа каждой такой морфемы в составе основы автоматически вычислим, исходя из состава основы.
2. Указание на набор чередований основы, аналогичный соответствующему описанию для морфемы. Обычно этот набор у основы совпадает с набором для морфемы, завершающей физический облик основы. Однако для этого случая и предназначено данное поле статьи вполне можно представить себе основу, для которой это не так, т.е. набор чередований не вычислим.
3. Номер парадигмы словоизменения, к которой относятся лексемы, реальная основа которых оканчивается (в морфемном представлении) на данную основу. У лексем делать, переделать,
-159- недоделать и т.п. различны реальные основы (цепочки морфем, идущие перед флексией инфинитива), но одна и та же хранимая основа дел (в данном случае, представленна цепочкой из ровно одной морфемы), по которой вычисляются словоизменительные свойства (здесь: устанавливается номер парадигмы) реальных основ. Номер парадигмы имеет вид целого числа от 0 до 255 и соответствует некоторому множеству номеров флексий, хранимому как отдельная сущность в отдельном списке парадигм (см. ниже).4. Указание на акцентный тип основы (достаточен один символ), обладающее следующим свойством. В статью для флексии, среди прочего (см. ниже), входит и описание акцентных возможностей этой флексии, имеющее вид множества символов (а не единичного символа, как в описании основы). Если акцентный тип основы входит в множество акцентных возможностей данной флексии, то это значит, что сочетание этой основы с данной флексией будет иметь ударение на флексии, иначе же на основе. В вырожденном случае, флексия (типа а в значении "И.п.мн.ч." у слов типа трактора, профессора), всегда находящаяс под ударением, имеет максимально полное акцентное описание (полный набор символов акцентуации), а флексия, у которой такое описание представлено нулевым множеством, никогда не бывает под ударением. Таким образом, если основа ДАР, как и в грамматическом словаре А.А. Зализняка [21], помечена как относящаяся к акцентному типу c, а акцентный набор флексии ов включает, среди прочего, указание на b, c и т.д., то форма даров получит ударение на флексии. Зато флексия ом не должна содержать в своем акцентном описании указание на тип с, поэтому-то ударение в словоформе даром на основе, а не на флексии.
Нетрудно представить себе алгоритм, с помощью которого по произвольному набору флексий можно построить классификацию основ языка каждый класс основы будет иметь свой символ, так чтобы каждой флексии был приписан акцентный тип в виде множества таких символов.
5. Номер описания (в отдельном списке) набора основ, супплетивных для данной. Например, основе ид таким косвенным путем ставятся в соответствие основы ш, шё, шед. Такое описание нужно, чтобы объяснить, как столь разные физические облики
-160- втискиваются в одну таблицу словоизменения лексемы. Итак, основы с физическими обликами ид, ш, шё, шед имеют один и тот же номер в данном поле. Под этим номером в списке супплетивов содержится цепочка из номеров названных основ.6. Указания на:
- номер граммемы, наличие которой в описании флексий, присоединяемых к данной основе, обязательно (в вырожденном случае может присоединяться любая граммема);
- номер граммемы, наличие которой в описании флексии, присоединяемой к данной основе, запрещено (возможно, что не запрещается никакая граммема).
Например, знамя основа, при которой разрешена только граммема "Именительный", но запрещена граммема "Множественное"; знамён допускает граммему "Множественное", не запрещая никаких граммем; знамен допускает граммему "Единственное", но запрещает граммему "Именительный". Отсюда и своеобразие таблицы склонения лексемы знамя.
7. Номер слогообразующего элемента (в частности, гласного) в рамках физического облика основы, на который может падать ударение, если ударна основа. Например, для основы портфел этот номер равен 2: второй гласный от начала может получить ударение при склонении лексемы портфель. Конечно, интуитивно более оправданным было бы говорить не о номере слогообразующего элемента, а о номере морфемы в рамках физического облика основы: ведь в статье для каждой морфемы уже имеется акцентуационное описание. Однако тогда возникла бы трудность с лексемами типа озеро (ср. озёра), состоящих из одной морфемы, получающих, в зависимости от флексии, ударение то на первом, то на втором гласном этой единственной морфемы. При нашем решении выход более чем прост: мы полагаем, что имеем дело с супплетивной основой, физический облик которой не меняется, но различны номера слогообразующих элементов.
В словаре основ избыточным считается наличие таких двух единиц, которые либо ничем (ни по какому полю) не отличаются друг от друга, либо отличаются только тем, что физический облик одной из них полностью составляет завершающую часть физического облика другой. Таковы, например, статьи для ДЕЛ(АТЬ) и
-161- ПЕРЕДЕЛ(АТЬ) (как глагольные основы, а не как основы существительных!). Основа передел удаляется на пенсию специальной процедурой, обслуживающей экспертную систему, статья для нее приобретает статус отмененной.Единицы словаря основ упорядочены не по алфавиту физического облика (чего следовало бы ожидать по аналогии со словарем морфем), а следующим образом. Ведущим в упорядочении является последняя, завершающая морфема физического облика. Все статьи с одной и той же ведущей морфемой в словаре расположены кучно, образуют своеобразный бункер: между ними нет основ с иной ведущей морфемой. Сначала перечисляются все основы с одной ведущей морфемой, затем все основы с другой ведущей морфемой и т.д. Это позволяет при интерпретации словоформ ускорить порождение гипотез о непроизводной основе при данном морфемном составе анализируемого сегмента. Если выдвигается гипотеза о том, что данным морфом завершается основа (и что, следовательно, дальше идет флексия, а такое бывает, когда последняя из констатированных в рамках главной гипотезы морфем являетс суффиксом или корнем), мы направляемся (опираясь на указание в статье для последней морфемы в данной цепочке поле номер 8) в словарь основ и отбираем в нем подходящие основы. Отбор в этом списке основ-кандидатов завершится при выходе из бункера.
Внутри же такой "кучки" основ тоже целесообразно упорядочивать между собой статьи. Возьмем, к примеру, основы рог и носорог. Первая от второй отличается, в частности, в форме множественного числа: носорог имеет окончание и в именительном падеже и постоянное ударение на основе, а рог окончание а в именительном множественного и постоянное ударение на флексии во множественном числе. Это значит, что хотя по физическому облику они оказываются в одной "куче", носорог не является избыточной единицей, поскольку у этой основы иные номер парадигмы и акцентный показатель, чем у основы рог. Вот почему, анализируя выражение носорогами, мы должны предпочесть интерпретацию носорогами НОСОРОГ в форме мн.ч.Тв.п., и лишь в качестве резервной интерпретации предусмотреть такую: носорогами (НОСО)РОГ в форме мн.ч.Тв.п. (как если бы реальная основа была получена от непроизводной основы рог). Это значит,
-162- что в словаре основ статья для основы НОСОРОГ идет раньше статьи для основы РОГ по крайней мере, если мы хотим, чтобы предпочтение отдавалось именно первой.Пример лексической статьи словаря основ:
ПОРЯДКОВЫЙ НОМЕР: 655
ОСНОВА: чел*о=век*
НОМЕР УДАРНОГО ГЛАСНОГО: 3
АКЦЕНТНЫЙ ТИП: a
ЧЕРЕДОВАНИЯ:
НОМЕР ПАРАДИГМЫ: 0
СТАТУС: действительно
ПОДОСНОВЫ: чел*о=век* / люд*
ДОПУСТИМАЯ КАТЕГОРИЯ: единственное
НЕДОПУСТИМАЯ КАТЕГОРИЯ -
Флексии представлены окончаниями в русском языке, а в семитских могут присоединяться в начале словоформы. Очень может случиться, что и для русского языка эксперт пожелает считать наи- как в форме наибольший словоизменительной морфемой, т.е. флексией. Наша система не исключает этой возможности.
В статье словаря флексий указывается графический вид (например: а, ами, возможны "нулевые" флексии, представленные нулевой цепочкой), набор граммем, набор характеристик основ, допускающих эту флексию и т.д. Длина последовательности флексий в рамках одной словоформы у нас не ограничена, что позволяет одинаково легко оперировать данными как флективных, так и агглютинативных языков. Словарные статьи во многом напоминают статьи как для морфем, так и для основ:
1. Физический облик флексии выглядит как цепочка букв, типа: а, ам, ами, ь, возможно, и нулевая (последнее недопустимо для физического облика остальных морфем).
2. Описание множества чередований, обязательных для присоединяемой основы. Основа получает вид, предписываемый пересечением этого множества с соответствующим набором чередований в статье для самой основы. Так, основа ден получит вид дн,
-163- когда к ней присоединяются флексии типа я (Род.п.ед.ч.), ей (Род.п.мн.ч.), ями (Тв.п.мн.ч.) и т.п., а кон не изменяется в кн. Это означает, что чередование "беглый гласный" включено в набор указанных флексий (но не флексии ь Им.п.ед.ч.) и в набор чередований морфемы (и соответствующей непроизводной основы) ден, но не основы кон, ср.: день, дня, дней, днями, конь, коня, коней, конями.3. Указание на набор граммем, типа: Именительный, падеж, множественное, число, единственное, Предложный, причастие, деепричастие, инфинитив и т.д. (см. ниже). Внутреннее представление выглядит как множество порядковых номеров по отдельному списку граммем (см. ниже). Возможны флексии с пустым набором граммем например, тематический гласный глаголов.
4. Набор символов акцентуационных свойств, о котором говорится в п.4 описани словаря основ.
5. Набор требований, предъявляемых к основе, отфильтровывающих неправильные (по чисто фонологическим причинам) сочетания флексии с остальной частью слова. Например, флексия и (Им.п.мн.ч.) недопустима после основ, кончающихся на ц, флекси ы с теми же граммемами после основ на к, ш, щ и т.д.; флексия ой прилагательного положительной степени мужского рода именительного падежа единственного числа допустима только под ударением (т.е. когда акцентный показатель основы не входит в набор акцентуационных признаков флексии), а ей с теми же граммемами наоборот, только без ударения. Соблюденность хотя бы одного из этих условий гарантирует правильность сочетания основы с флексией если отвлечься от того, входит ли данная флексия в парадигму словоизменения, допускаемую данной основой. Во внутреннем представлении этот набор множество номеров по списку условий сочетаемости флексий с основами.
6. Флексия может быть "свободной", завершающей цепочку словоизменительных морфов в словоформе, после которой могут идти разве что постфиксы, и "несвободной", принимающей после себя еще какие-либо флексии из этого же словаря. Например, свободными являютс флексии склонения русских существительных, а несвободными флексии склоняемых причастий: вш, ющ, ем, превосходной степени прилагательного ейш и т.д. Особенно богаты в этом отношении агглютинативные языки типа тюркских. Если
-164- флексия помечена как несвободная, то в данной же статье указывается парадигма словоизменения, в которую она (на правах основы!) входит. Так, у вш, ейш тот же номер, что и у горючий.7. Указание на набор постфиксов, допускаемых после данной флексии. Флекси вш действительного причастия прошедшего времени допускает после себя ся (но не сь), флексия единственного числа первого лица настоящего времени ю только сь, флексия ем (причастие страдательного залога прошедшего времени) не допускает ни сь, ни ся. И этот набор представляется в виде множества номеров по списку префиксов.
8. Указание на набор чередований, которым данная флексия может подвергаться под влиянием левого и/или правого контекста в словоформе.
Пример статьи для флексии:
ПОРЯДКОВЫЙ НОМЕР: 10
САМО ОКОНЧАНИЕ: а
АКЦЕНТНЫЕ ВОЗМОЖНОСТИ: abc
СЛОВОИЗМЕНЯЕМОСТЬ:
НОМЕР ПАРАДИГМЫ ОКОНЧАНИЙ СПРАВА:
КАТЕГОРИЯ: Им.п.мн.ч.
КОНТЕКСТ: неособый согласный
ДОПУСТИМЫЕ ЧЕРЕДОВАНИЯ ОСНОВЫ: беглый гласный
СТАТУС: действительно
ДОПУСКАЕТ ПОСТФИКСЫ:
ЧЕРЕДОВАНИЯ: -
Пример. Сингармонизм и агглютинация в венгерском
В венгерском языке, как и в финноугорских вообще (например, в финском), а также в тюркских (особенно ярко в турецком) суффикс и/или флексия обязательно гармонизируют по ряду с гласным основы (в турецком гармония должна быть еще и по огубленности). Это свойство мы можем трактовать следующим образом.
Решение 1: все парадигмы делятся на соответствующее количество серий. Основе приписывается номер парадигмы нужной серии. Скажем, в венгерском выделяются две серии парадигм:
- те, в которых флексии имеют гласный переднего ряда, типа: -vek, -vel, el, -ek, -em и т.д.,
-165-- те, в которых флексии имеют гласный непереднего ряда, типа: -vak, -val, al, -ak, -om и т.д.
Благодаря этому имеем различие в образовании притяжательной формы существительного:
kalap "шляпа" kalapom "моя шляпа"
kert "сад" kertem "мой сад".
Решение 2: флексии, имеющие различную огласовку в зависимости от сингармонизма, трактуются как подвергающиеся чередованию. Скажем, в результате чередования флексия om приобретает вид em и т.д. Особенно экономно такое решение для турецкого.
Выбор первого или второго решения предоставляется лингвисту-эксперту с его
критериями эстетичности лингвистического описания. Так или иначе, сингармонизм легко
трактуется в рамках предложенной концепции словарей флексий и морфем. Столь же легко
можно формализовать и явление агглютинации в указанных языках. Покажем это на материале
венгерского языка. Для тех же лексем kalap "шляпа" и kert "сад" имеем
следующие возможности словоизменения, где знаком плюс мы указываем место присоединени
флексии (заметим, кстати, что в венгерском нет различения существительных по
грамматическому роду):
(1) kalap+nak | шляпа+Дат. | шляпе |
(2) kalap+om+nak | шляпа+мои+Дат. | моей шляпе |
(3) kalap+jaim | шляпа+мои | мои шляпы |
(4) kalap+jaim+nak | шляпа+мои+Дат. | моим шляпам |
(5) kalap+ok | шляпа+мн.ч. | шляпы |
(6) kalap+ok+nak | шляпа+мн.ч.+Дат. | шляпам |
(7) kert+nek | сад+Дат. | саду |
(8) kert+em+nek | сад+мой+Дат. | моему саду |
(9) kert+jeim | сад+мои | мои сады |
(10) kert+jeim+nek | сад+мои+Дат. | моим садам |
(11) kert+ek | сад+мн.ч. | сады |
(12) kert+ek+nek | сад+мн.ч.+Дат. | садам |
Флексии nak, nek, om, em, jaim, jeim не только присоединяются непосредственно к соответствующей основе, но и требуют, чтобы идущие после них флексии тоже были требуемого ряда. Иначе говоря, мы имеем дело не только с агглютинацией когда флексия сама принимает после себя еще какие-то флексии, но и
-166- с сингармонизирующей агглютинацией.С агглютинацией наша система справляется довольно просто: напомним, что флексии бывают "свободными" (после них не бывает никаких элементов, кроме постфиксов) и "несвободными", т.е. ведущими себя примерно так же, как основы. Статьи для последнего типа в словаре флексий содержат информацию о номере той парадигмы, которая определяет, какие последовательности флексий допустимы после данной, а какие нет. Разумеется, все перечисленные выше венгерские флексии (кроме, возможно, nak / nek дательного падежа) помечены как несвободные и принимающие после себя флексии своего гармонического ряда.
Но как выглядят сами парадигмы для агглютинирующих языков? Ключевую роль играет нулевая флексия в конце слова, трактуемая как показатель именительного падежа единственного числа для словоформ kalap, kert, kalapom, kertem, как показатель просто именительного падежа для форм kalapjaim, kertjeim, kalapok, kertek (3), (5), (9), (11) и т.д. Решение может состоять в том, что, как и в русском языке, в венгерском есть несколько нулевых флексий, каждая со своим набором граммем. В разных парадигмах могут содержаться указания на различные нулевые флексии: есть одна парадигма (на которую указание находим в статье для основ kalap, kert, а также для несвободных флексий типа om, em), в которую входит нулевая флексия с граммемами "единственное число" и "именительный падеж"; есть другая парадигма ее номер фигурирует в словарных статьях дл флексий типа ok, ek, jaim, jeim, в состав которой входит граммема "именительный (падеж)", но нет никакого указания на граммемы числа и т.д. Наконец, поскольку флексии nak, nek завершают словоформу, они являются "свободными", и указаний на какую-либо парадигму не содержат.
Читателю предоставляем возможность найти лучшее решение.
Пример 4. Венгерский инструментальный падеж
В венгерском языке существует особый падеж, обозначающий инструмент, с помощью которого что-либо совершается и переводимый обычно формами творительного падежа:
kalap "шляпа" kalappal "шляпой"
-167-kalapom "моя шляпа" kalapommal "моей шляпой"
tavasz "весна" tavasszal "весной"
kert "сад" kerttel "садом"
ló "лошадь" lóval "лошадью"
este "вечер" estével "вечером"
szó "слово" szóval "словом".
Из приведенных примеров видим:
- инструменталь от основ, кончающихся на гласный, образуется с помощью флексий val или vel (в зависимости от гармонического ряда основы), при удлинении гласного перед флексией (если этот гласный краткий);
- инструменталь от основ, кончающихся на согласный, образуется с помощью удвоени последнего согласного и прибавления показателя al или el (также в гармонии с гласной основы); диграфу sz соответствует простой согласный звук типа русского "с", удвоение этого согласного выглядит как ssz, а не как szsz вопреки ожиданиям (последний вариант, впрочем, встречается при разбиении слова на слоги в учебниках грамматики и при переносе слова со строки на строку, ср.: tavasz-szal).
Дополнительно укажем, что чередование по долготе последнего гласного основы и вставка вспомогательного v на стыке основы и флексии при стечении гласных в венгерском свойственно для сочетания не только с показателем инструменталя (когда происходит удлинение гласного), но и множественного числа (когда, наоборот, этот гласный укорачивается), ср.: ló "лошадь" lovak "лошади", fő "голова" fövek "головы". Наиболее естественными представляются следующие способы формализации.
Решение 1. Есть четыре флексии инструменталя: val, vel,
al, el. Описание первых двух в словаре флексий, в поле "требования к основе" содержит указание на обязательность гласного в конце основы, а описание последних двух на обязательность согласного в конце основы. Последние две флексии вызывают своеобразное чередование основы удвоение последнего согласного, которое оприходуется в списке чередований, при соответствующей квалификации случая sz. Статьи для несвободных флексий, кончающихся на согласный и допускающих после себя показатель инструменталя, содержат указание на:
-168-- парадигмы, содержащие либо al, либо el;
- чередование этой флексии, подобное чередованию основы или морфемы и заключающееся в удвоении последнего согласного.
Наконец, в описании флексий al и el содержится указание на обязательность удвоения предшествующего согласного.
Решение 2. Есть одна словарная статья для флексии инструменталя. Скажем, физический облик этой флексии выглядит как val (хотя столь же допустимы и иные решения). Эта флексия подвергается двоякому чередованию:
- сингармонизму в зависимости от последнего гласного основы или предшествующей флексии (имеем val или vel),
- выпадение первого v после сегмента на согласный.
В то же время, она требует (см. поле 2 в описании словаря флексий), чтобы основа или флексия, непосредственно предшествующая ей, подверглась чередованию "удвоения": краткий гласный удлиняется, согласный удваивается и т.д.
Как и в предыдущем примере, читатель вправе не поступаться своими принципами и может выбрать любую возможность.
Пример. Немецкие и голландские причастия на ge-
Как известно, в немецком языке пассивные причастия образуются в результате не только аблаута, но и присоединения частицы ge- перед корнем, если только перед этим же корнем непосредственно не идет какая-либо "неотделяемая" приставка. Ср.:
machen "делать" gemacht "сделан"
sprechen "говорить" gesprochen (букв.) "говоренный"
ansprechen "обращаться (к кому) с речью" angesprochen
gehen "идти" gegangen "пройденный"
angehen "касаться, относиться (к кому)" angegangen
vergehen "пройти" vergangen "пройденный".
Отделяться могут только префиксы, в инфинитиве имеющие ударение. Примеры потенциально отделяемых префиксов: an, auf, vor. К потенциально неотделяемым относятся: ver, ent, be, ge. Последний элемент ge как в gebrauchen "использовать" омонимичен формативу пассивного причастия, но не тождествен ему. Префиксы типа unter "под-" могут быть как ударными соответственно, отделяемыми так и безударными (неотделяемыми), ср.
-169-(полужирный шрифт используется вместо символа ударения):
untergehen "разрывать" untergegangen
untergehen (перен.) "подкапываться" untergangen.
Если в начале основы глагола идет последовательность из нескольких префиксов, то отделяется самая левая непрерывная часть префиксального сочетания, не содержащая ни одного неотделяемого префикса, непосредственно после которой в инфинитиве идет либо корень, либо неотделяемый префикс. В сочетании префиксов anver, anbe отделяемая часть an, а в сочетаниях veran, bean отделяемой части нет.
Аналогично тому, как мы поступили в случае греческой редупликации, для частицы ge можем резервировать статью вспомогательного лексикона, так что ge заменяется на нулевой сегмент. В то же время, правила чередования, объединенные в группу префиксального образования причастия, из исходного морфа типа geh дают gegang, а из mach gemach. Эти правила, в силу своей формулировки, могут работать только при условии, что непосредственно перед корнем идет либо отделяемый префикс, либо отделяемая последовательность префиксов, либо нет вообще префиксов. Одновременно следует поместить в статьи для флексий enи t со значением "пассивное причастие" указание на обязательность указанного чередования у морфа непосредственно слева от них. Есть две группы парадигм глагольных основ:
- для "сильных" глаголов куда включена флексия t,
- для "слабых" глаголов куда включена флексия en. Своеобразно ведет себ суффикс ier: в немецком языке он блокирует указанное чередование, ср.: transportieren "транспортировать" transportiert при неправильных * getranspor- tiert, * transgeportiert.
Видимо, суффикс ier не содержит указание на такое чередование у левого соседа. Не так в голландском языке, родственном немецкому, где допустимо: transporteren getransporteert.
Это значит, что голландский суффикс er, в отличие от ier, "транспортирует" указание на необходимость чередования, полученное от флексии, дальше налево. То есть, соответствующие правила для голландского меняют не только физический облик морфемы, расширяя ее (когда это допустимо) за счет прибавлени
-170- ge, но и набор требований к чередованиям левого соседа у этой же морфемы (см. поле 4 статьи основного лексикона).Словарь постфиксов содержит описания единиц, идущих после всех флексий в словоформе, но составляющих часть основы. Так, в лексеме делаться выделяетс постфикс ся, обладающий семантикой возвратности и в том или ином виде присутствующий во всей парадигме спряжения. Аналогичное можно сказать и о таких единицах, как -таки, -нибудь, -то (в которых дефис составляет неотъемлемую часть физического облика).
Единицы типа ся/сь в русском языке допускаются после одних последовательностей флексий и недопустимы после других. Так, ся бывает после флексий личной формы глагола, оканчивающихся на согласный, после последовательности флексий, начинающейся на показатель действительного причастия прошедшего времени вш (ср.: игравшейся) и т.д. и так же, как сь недопустимо после флексии ем пассивного причастия прошедшего времени.
О постфиксе в словаре даются следующие сведения:
1. Физический облик: ся, сь, -то, -таки и т.д.
2. Множество постфиксов, допустимых далее. Так, за ся и сь могут следовать постфиксы типа -таки (ср.: делается-то, делающийся-таки), но не наоборот (ср. неправильные *делает-тося, *делающий-такися). Это указание у нас формализовано в виде множества номеров постфиксов, взятых по этому же словарю.
3. Постфикс может быть "стандартным", т.е. в качестве "грамматических помет" принимающим набор граммем из той же генеральной иерархии, что и флексии, и "нестандартным", когда значение задается ad hoc для данной единицы. В первом случае указывается соответствующее множество граммем, подобно полю 3 для флексий. Например, дл сь и ся имеем: возвратный залог. Во втором же случае прямо задается словесна формулировка значения постфикса, как для -нибудь: "показатель неопределенности".
Пример описания:
ПОРЯДКОВЫЙ НОМЕР: 0
СТАТУС: действительно
-171-ПОСТФИКС: сь
ДОПУСТИМЫ ЕЩЕ ПОСТФИКСЫ: -таки, -то
СТАНДАРТНОСТЬ КАТЕГОРИЗАЦИИ: да
КАТЕГОРИЯ: возвратный залог
Парадигма трактуется как множество флексий.
Единицы списка парадигм описывают наборы флексий, образующие полную словоизменительную парадигму того или иного типа основ, и представляют следующую информацию:
1. Набор флексий: внутреннее представление выглядит как множество номеров по словарю флексий.
2. Часть речи: выделяются парадигмы для существительных, прилагательных, глаголов и т.д., иногда даже, если необходимо, с подразделениями, скажем: существительные мужского рода, женского рода, среднего рода (как для русского языка).
3. Тип основы, с которой может сочетаться данная парадигма. Скажем, основа на согласный, на гласный, на к и т.д. Этот тип представляет собой отсылку к единицам еще одного типа данных, используемого и в других местах системы: к списку "типов букв", задающих классификацию символов. Например, есть гласные, согласные, палатализованные, заднеязычные и т.п. Указание свойств основ, допускающих данную парадигму, существенно дл облегчения выбора нужной парадигмы при работе над словарем основ в режиме пополнения и исправления лингвистических данных.
Пример описания:
ПОРЯДКОВЫЙ НОМЕР: 0
СТАТУС: действительно
КАТЕГОРИЯ ОСНОВЫ: существительное муж.р.
ЗАВЕРШЕНИЕ ОСНОВЫ: безразлично
САМА ПАРАДИГМА:
(ноль) И.п.ед.ч. / В.п.ед.ч.неодуш.
а Р.п.ед.ч./В.п.ед.ч.одуш.
у Д.п.ед.ч.
-172-ом Тв.п.ед.ч.
е П.п.ед.ч.
ы И.п.мн.ч./В.п.мн.ч.неодуш.
ов Р.п.мн.ч./В.п.мн.ч.одуш.
ам Д.п.мн.ч.
ами Т.п.мн.ч.
ах П.п.мн.ч.
Поскольку флексии, входящие в парадигму, сами содержат еще сведения о том, какими могут быть или не быть основы, допустимые с ними, получаем довольно гибкую нотационную систему, допускающую формализацию различных теоретических взглядов на распределение языкового материала по парадигмам.
Например, вы можете считать, что флексии и и ы для множественного числа именительного падежа входят одновременно в одну и ту же парадигму, но одни основы, те, которые допустимы при одной из этих двух флексий, допустимы с нею, а другие нет. Или же можно сформировать две разные парадигмы, в одной из которых имеем указание на одну из возможных флексий, а в другой на другую. Разумеется, первое решение экономит количество парадигм. Однако и второе вполне может найти своих сторонников. Впрочем, первое решение следует предпочесть, если разграничительная линия проходит по критерию ударность / безударность основы, как в случае ов / ев (ср.: пирогов vs. зайцев), где выбор той или иной флексии связан с акцентуационными свойствами основы и/или флексии.
Данные о супплетивах позволяют для всех лексем, оканчивающихся основой на ид (как в слове идти), правильно строить и распознавать словоформы, относимые к одной лексеме, например, идешь, шла, шедшему относятся к лексеме идти именно в силу такого вида знаний. Единицы "словаря супплетивов" указывают на некоторое количество основ, хранимых отдельно в словаре основ.
В словаре основ, как мы уже говорили, указывается, какие граммемы допустимы с данной основой в составе супплетива, а какие не допустимы. Например, при основе человек следует указать
-173- в качестве допустимой граммемы "единственное (число)", а в качестве недопустимой "множественное (число)"; при основе же люд противоположное распределение граммем соответственно: "множественное" допустимо, а "единственное" нет.Итак, супплетив объединение (кортеж) двух или большего количества хранимых основ. Внутреннее представление супплетива
- кортеж номеров по словарю основ. Существенно, какой номер в таком описании стоит на первом месте. Например, если в описании супплетива человек / люди на первом месте будет номер статьи для основы люд, с парадигмой, которая, вообще говоря, характеризует существительные женского рода, то анализ слов типа сверхчеловеком в отношении категоризации будет совпадать с характеристикой соответствующей парадигмы у первого элемента супплетива, т.е. будет указано, что это существительное женского рода. Поэтому в данном случае на первом месте должен быть номер основы человек. Пример описания:
ПОРЯДКОВЫЙ НОМЕР: 19
СТАТУС: действительно
СУППЛЕТИВНЫЕ ОСНОВЫ: чел*о=век* / люд*
Граммемы словоизменительные категории конкретного языка, которые характеризуют семантическую интерпретацию словоформы. Например: род, число, падеж.
В отличие от многих существующих систем лингвистических данных, в нашей системе граммемы не "зашиты" в алгоритм анализа и/или синтеза: вся информация о граммемах может меняться.
Набор граммем организован в иерархию, так что категория "род" подчиненяет себе в русском и немецком языках три следующие граммемы: "мужской", "женский", "средний"; во французском, испанском и арабском языках этой же категории подчинены только две единицы "мужской" и "женский". Вариативны и набор падежей, и глагольных граммем.
Эта иерархия не означает, что граммемы расположены в
-174- списке соответствующим образом: порядковый номер граммем имеет иную функцию: при характеристике флексии граммемы перечисляются по возрастанию порядкового номера.Так, в зависимости от порядкового номера граммем, будем иметь при интерпретации словоформы людьми как лексемы человек одно из двух: "Т.п.ед.ч." или "ед.ч.Т.п." Порядок этот существенен для перечисления флексий в рамках парадигмы: парадигма в нашей технической реализации представляет собой множество флексий, которые при работе с соответствующими разделами системы данных перечисляются по возрастанию последовательности граммем, входящих в состав характеристик флексии. Это значит, что при первом способе упорядочения граммем (сначала число, причем в рамках этой категории сначала единственное, а затем множественное; затем падеж) первыми будут перечислены все флексии единственного числа (по порядку падежей), и только после них флексии множественного числа. При втором же способе упорядочения будем иметь, скажем, для русского, такую последовательность флексий (и генерируемых словоформ при синтезе): И.п.ед.ч., И.п.мн.ч., Р.п.ед.ч., Р.п.мн.ч. и т.д. Заметим, что и этот порядок перечисления зависит от порядка перечисления граммем в рамках категории падежа. Пример описания граммемы:
ПОРЯДКОВЫЙ НОМЕР: 12
ПОЛНОЕ ИМЯ: падеж
СОКРАЩЕННОЕ ИМЯ: п.
ТЕРМИНАЛЬНАЯ: да
ПОДЧИНЕННЫЕ КАТЕГОРИИ: И., Р., Д., В., Т., П.
СТАТУС: действительно
Нестрого говоря, "корректоры" это такие правила редактирования словоформы, которые невозможно по мнению эксперта отразить в рамках остальных видов данных. Например, тот факт, что стеклянный, деревянный и оловянный должны писатьс с двумя н, фиксируется в виде "корректора", который фиксирует нужные соотношени поверхностной структуры.
-175-Корректоры задуманы как "пожарное средство" на тот случай, если лингвист-эксперт не может придумать более удачного объяснения соотношениям в данном языке. Соответственно, когда объяснение у него сформируется, он может отказаться от каких-то определенных "корректоров". Пример описания:
ПОРЯДКОВЫЙ НОМЕР: 5
СТАТУС: действительно
УРОВЕНЬ РАБОТЫ: 0,2,4
ЗАМЕНЯЕМОЕ ВЫРАЖЕНИЕ: циган*
ЗАМЕНЯЮЩЕЕ ВЫРАЖЕНИЕ: цыган*
СТЫК МОРФОВ ОБЯЗАТЕЛЕН: да
УСЛОВИЕ РАБОТЫ: всегда
ПОЛЯРНОСТЬ УСЛОВИЙ: плюс
Эти единицы представляют условия для работы правил, для проверки правильности соположения морфем и т.п. Примеры словесного задания ограничений: "морфема начинается на согласную", "предшествующая морфема является корнем или суффиксом".
Например, условие, по которому последний гласный морфемы должен быть о, а, е или ё:
ПОРЯДКОВЫЙ НОМЕР: 4
ФОРМУЛИРОВКА: последний гласный равен о, а, е или ё
ПОЛЯРНОСТЬ: плюс
СТАТУС: действительно
ЦЕНТРАЛЬНЫЙ МОРФ: 0
ЗАТРОНУТО: буква
ИЗ КОНКУРЕНТОВ ПО СЧЕТУ ( -1,0,1,2,..): -1
НОМЕР ПОЗИЦИИ, СЧИТАЯ ОТ ЦЕНТРАЛЬНОЙ: 0
КЛАСС БУКВЫ: гласная
НАЛИЧЕСТВУЕТ ПОДЦЕПОЧКА:
КАТЕГОРИЯ МОРФА:
НАБОР ЧЕРЕДОВАНИЙ:
КЛАСС БУКВЫ:
ВКЛЮЧАЕТ:
НОМЕР СОПОСТАВЛЯЕМОГО МОРФА (при сопоставлении морфов): -
-176-ПОЗИЦИЯ В СОПОСТАВЛЯЕМОМ МОРФЕ (при сопоставлении):
СОПОСТАВЛЯЕМЫЙ КЛАСС БУКВ: оаеё
РАССТОЯНИЕ ОТ ЦЕНТР. БУКВЫ В СОПОСТ. МОРФЕ:
НОМЕР ФУНКЦИИ: сопоставление элементов
По другому условию последовательность морфем глав*ен=ен= будет помечена негативно, а бумаж*ен= позитивно:
ПОРЯДКОВЫЙ НОМЕР: 7
ФОРМУЛИРОВКА: данный морф не омонимичен предыдущему
ПОЛЯРНОСТЬ: минус
СТАТУС: действительно
ЦЕНТРАЛЬНЫЙ МОРФ: 0
ЗАТРОНУТО: физический облик морфа
ИЗ КОНКУРЕНТОВ ПО СЧЕТУ ( -1,0,1,2,..):
НОМЕР ПОЗИЦИИ, СЧИТАЯ ОТ ЦЕНТРАЛЬНОЙ:
КЛАСС БУКВЫ:
НАЛИЧЕСТВУЕТ ПОДЦЕПОЧКА:
КАТЕГОРИЯ МОРФА:
НАБОР ЧЕРЕДОВАНИЙ:
КЛАСС БУКВЫ:
ВКЛЮЧАЕТ:
НОМЕР СОПОСТАВЛЯЕМОГО МОРФА (при сопоставлении): -1
ПОЗИЦИЯ В СОПОСТАВЛЯЕМОМ МОРФЕ (при сопоставлении):
СОПОСТАВЛЯЕМЫЙ КЛАСС БУКВ:
РАССТОЯНИЕ ОТ ЦЕНТР. БУКВЫ В СОПОСТ. МОРФЕ:
НОМЕР ФУНКЦИИ: сопоставление физических обликов
Эти классы аналогичны заданию типа в языках программирования. Задаются они списочно. Например, класс "согласные" задается перечислением соответствующих согласных, для русского языка как цепочка бвгджзклмнпрстфхцчшщ, аналогично "гласные" как аеёиоуыэюя, "шипящие", "свистящие" и т.д. Имена классов, как и списки, задаютс экспертом. Наличие этих данных облегчает формулировку правил и ограничений. Пример:
ПОРЯДКОВЫЙ НОМЕР: 4
ИМЯ КЛАССА: гласные
-177-СТАТУС: действительно
САМ КЛАСС: аеёиоуыэюя
Эти типы представляют собой указание на свойства физического облика и на акцентные характеристики основы. Дизъюнктивный их набор характеризует флексии: если выполнены требования, значит флексия допустима при данной основе.
Наличие этих классов позволяет значительно сократить количество хранимых парадигм. Так, известно, что флексия -и (как в слове книги) недопустима после основы, оканчивающейся на ц, вместо нее допустима флексия ы; -ев (флексия Р.п. мн.ч.) допустима после основ на ц, только если на флексию эту не падает ударение иначе должно быть ов. Обе флексии с одинаковым набором граммем могут быть занесены в рамки одной парадигмы, поскольку обладают дополнительной дистрибуцией основ.
Итак, "типы основ" логически представляют собой разновидность "ограничений". Пример:
ПОРЯДКОВЫЙ НОМЕР: 7
СТАТУС: действительно
ПОЛЯРНОСТЬ: плюс
ФЛЕКСИЯ УДАРНА: да
ОСНОВА НА: ц
Под "правилами" имеются в виду те единицы, которые входят в наборы "альтернаций" (характеризующих, в свою очередь, то или иное чередование, см. ниже).
Примеры правил: заменить и на ы в начале корневой морфемы, идущей после префикса, оканчивающегося на согласный (ср. отыграю и играю, при неправильном отиграю), удалить последнее вхождение о в морфе (ср.: сон сна).
Для формулировки этих правил придуман особый формат, позволяющий распознавать модифицированную морфему и синтезировать алломорфы. В частности, в описании конкретного правила указываетс
-178- позиция меняемой подцепочки морфемы, на что меняется эта подцепочка, а также каков набор условий ("ограничений"), которым должна отвечать данная морфема или ее соседи (слева или справа) в рамках словоформы, для того, чтобы правило могло работать. В правиле о чередовании и/ы к таким условиям относятся: 1) морфема начинается на и, 2) это корневая морфема (класс морфемы указан "корень"), 3) морфема непосредственно слева от меняемой является префиксом.В статье для "правила" набор условий имеет внутреннее представление в виде множества номеров по списку "ограничений" (см. выше). Пример: правило замены и на ы
ПОРЯДКОВЫЙ НОМЕР: 5
СТАТУС: действительно
ОБЪЕКТ ИЗМЕНЕНИЯ: буква
ОБРАБАТЫВАЕМЫЙ МОРФ: 0
ПОЗИЦИЯ ЦЕНТРАЛЬНОЙ БУКВЫ: 1
РАССТОЯНИЕ ОТ ЦЕНТРАЛЬНОЙ ДО МЕНЯЕМОЙ БУКВЫ: 1
КЛАСС БУКВ: гласные
НА ЧТО ЗАМЕНИТЬ БУКВУ: ы
ЗАМЕНЯЕМАЯ ЦЕПОЧКА:
ЗАМЕНЯЮЩАЯ ЦЕПОЧКА:
НОВЫЙ КЛАСС МОРФЕМЫ:
МЕНЯЕМЫЙ НАБОР ЧЕРЕДОВАНИЙ:
ТИП ОПЕРАЦИИ С КЛАССОМ ЧЕРЕДОВАНИЙ:
УСЛОВИЯ РАБОТЫ:
Это набор операций (часто представленный одним правилом), которые морфеме ставят в соответствие ее алломорф. Эти множества во внутреннем представлении задаются по номерам правил.
Например, "палатализация" альтернация, включающая (для русского языка) такие правила, как: заменить к на ч (ср. пеку печешь), заменить г на ж (бегу бежишь), и т.п. Другая альтернаци
-179- имеет имя "беглый гласный" и задается как набор правил, удаляющих последнее вхождение о, е и т.п. Аналогичным образом описываются аблаутные чередования для германских языков.В отличие от многих концепций, о которых речь шла выше и в которых считается, что альтернации правила, выбирающие свою "жертву" (морф) по каким-то специфическим признакам, мы предполагаем, что набор альтернаций (в виде множества номеров альтернаций по данному списку) характеризует каждую хранимую морфему и каждую хранимую основу. У нечередующихся морфем это множество пусто, у других представлено одним элементом (например, "беглый гласный", типа: сон сна), у третьих тремя (лёг, ляг, ляж палатализация и мена гласного) и т.д. Пример:
ПОРЯДКОВЫЙ НОМЕР: 0
ФОРМУЛИРОВКА: беглый гласный
СТАТУС: действительно
ВЛИЯНИЕ НА УПОРЯДОЧЕННОСТЬ МОРФОВ: влияет
ОБЩЕЕ ПРАВИЛО: аеёо --> .
ДИЗЪЮНКТИВНЫЙ НАБОР ПРАВИЛ: -
Эти пометы представляют указание на семантико-синтаксическую категоризацию основ. Например: "существительное мужского рода", "прилагательное", "глагол". Указание на такую помету выдается в результате интерпретации словоформ.
Содержательно это означает, что кроме семантической категоризации основ есть та, которая вытекает из принадлежности основы к конкретному парадигматическому классу, к тому, что иногда называют "тип склонения" (ср.: "существительное воевода склоняетс по женскому склонению").
Итак, каждая парадигма, среди прочего, содержит указание на номер семантических категорий, характеризующий категориальные свойства основ. Пример:
ПОРЯДКОВЫЙ НОМЕР: 3
ПОМЕТА ПАРАДИГМЫ: существительное женского рода
СТАТУС: действительно
Необходимость каталогизировать все морфологически атомы языка привела к созданию морфологии. Сегодня становится актуальным построение экспертной системы более широкого круга морфологических знаний как инструмента для обобщения, применения и оценки разнообразных морфологических концепций.
Экспертная система лингвистических знаний задает метаязык для метаязыков морфологических теорий, "настраивается" на некоторую авторскую морфологическую концепцию и на параметры языков-объектов. С помощью такой системы исследователь может на основе своей оригинальной концепции описывать материал, а в режиме интерпретации конкретных примеров проверять, адекватна ли его концепция языковому материалу, словоизменительным типам в данном языке, чередованиям и отношениям супплетивизма.
В отличие от баз данных, наша экспертная система не простое хранилище сведений: на основе обновляемых данных эта система анализирует и синтезирует словоформы языка-объекта.
Моделирование морфологической интерпретации находится на стыке разных дисциплин. Для лингвиста морфологическое моделирование способ проверить на конкретном материале свои идеи об устройстве языка. Специалистам в области искусственного интеллекта сотрудничество с лингвистами позволяет усовершенствовать модели человеческой ментальности.
От этого выигрывают обе стороны.
-180-{litsec}
1. Ахманова О.С. Фонология, морфонология, морфология. М.: Изд-во Моск. ун-та, 1966.
2. Бернштейн С.Б. Введение в славянскую морфонологию // Вопросы языкознания. М., 1968. N 4. С.43-59.
3. Блумфилд Л. Язык. М.: Прогресс, 1968. 606 с.
4. Богородицкий В.А. Общий курс русской грамматики: (Из университетских чтений). Изд-е 5-е, перераб. М.-Л.: Соцэкгиз, 1935. 356 с.
5. Бодуэн де Куртенэ И.А. Опыт теории фонетических альтернаций // Бодуэн де Куртенэ И.А. Избр. труды по общему языкознанию. М.: Изд-во АН СССР, 1963. Т.1. C. 265-347.
6. Булыгина Т.В. Проблемы теории морфологических моделей. М.: Наука, 1977. 287 с.
7. Буслаев Ф.И. Историческая грамматика русского языка. М.: Гос. учебно-педагогическое изд-во Министерства просвещения РСФСР, 1959. 623 с.
8. Виноградов В.В. О формах слова // Виноградов В.В. Исследования по русской грамматике. М.: Наука, 1975. C. 32-50.
9. Винокур Г.О. О задачах истории языка // Винокур Г.О. Избр. работы по русскому языку. М.: Госучпедгиз, 1959. C.207-226.
10. Винокур Г.О. Форма слова и части речи в русском языке // Винокур Г.О. Избр. работы по русскому языку. М.: Госучпедгиз, 1959. C. 397-418.
11. Винокур Г.О. Заметки по русскому словообразованию // Винокур Г.О. Избранные работы по русскому языку. М.: Госучпедгиз, 1959. C. 419-442.
12. Гринберг Дж. Квантитативный подход к морфологической типологии языков /Пер. с англ. // Новое в лингвистике. М.: ИЛ, 1963. Вып. 3. С.60-94.
13. Гумбольдт В. фон. О различии строения человеческих языков и его влиянии на духовное развитие человечества /Пер. с нем. // Гумбольдт В.фон. Избр. труды по языкознанию. М.: Прогресс, 1984. С.34-298.
14. Демьянков В.З. Понятие гипотетической интерпретации в морфологии // Вычислительная лингвистика: Теоретические аспекты: Вопросы автоматизации лексикографических работ. М.: Изд-во Моск. ун-та, 1982. С.31-73.
15. Ельмслев Л. Пролегомены к теории языка // Новое в лингвистике. М.: ИЛ, 1960. Вып.1. С.264-389.
16. Журавлев В.К. Наука о праславянском языке: Эволюция идей, понятий и методов // Бирнбаум Х. Праславянский язык. М.: Прогресс, 1876. С.453-493.
17. Журавлев В.К. Диахроническая морфология. М.: Наука, 1991. 208 с.
18. Закиев М.З. О тюркской морфонологии // Сов. тюркология 1984, ь 1, с.35-43.
19. Зализняк А.А. Русское именное словоизменение. М.: Наука, 1967.
20. Зализняк А.А. О понимании термина "падеж" в лингвистических описаниях: I // Проблемы грамматического моделирования. М., 1973.
21. Зализняк А.А. Грамматический словарь русского языка: Ок. 100.000 слов. М.: Русский язык, 1977. 880 с.
22. Звегинцев В.А. Предложение и его отношение к языку и речи. М.: Изд-во Моск. ун-та, 1976. 305 с.
23. Ильина Н.Е. Морфонология глагола в современном русском языке. М.: Наука, 1980.
24. Кодзасов С.В., Кривнова О.Ф. Современная американская фонология. М.: Изд-во Моск. ун-та, 1981. 194 с.
25. Кубрякова Е.С. Роль словообразования в формировании языковой картины мира // Роль человеческого фактора в языке: Язык и картина мира. М.: Наука, 1988. C. 141-172.
26. Кубрякова Е.С. Морфология в теоретических и типологических исследованиях последнего времению М.: Московский гос. институт иностр. языков им. М.Тореза, 1989. 85 с.
27. Кубрякова Е.С. Понятие морфемы в современных грамматических исследованиях за рубежом // Морфема и проблемы типологии. М.: Наука, 1991. C.150-176.
28. Кузнецов П.С. Очерки по морфологии праславянского языка. М.: Изд-во АН СССР, 1961. 147 с.
29. Курилович Е. Деривация лексическая и деривация синтаксическая: К теории частей речи // Курилович Е. Очерки по лингвистике: Сборник статей. М.: ИЛ, 1962. C. 57-70.
30. Курилович Е. Основные структуры языка: Словосочетание и предложение // Курилович Е. Очерки по лингвистике: Сборник статей. М.: ИЛ, 1962. C.48-56.
31. Лопатин В.В., Улуханов И.С. К соотношению единиц словообразования и морфонологии // Единицы разных уровней грамматического строя и их взаимодействие. М., 1969. С.119-132.
32. Макаев Э.А., Кубрякова Е.С. О статусе морфонологии и единицах ее описания // Единицы разных уровней грамматического строя и их взаимодействие. М.: Наука, 1969. С.87-119.
33. Матезиус В. Поэтика создания теории структурной грамматики /Пер. с чеш. // Пражский лингвистический кружок: Сборник статей. М.: Прогресс, 1967. C. 196-209.
34. Милославский И.Г. Вопросы словообразовательного синтеза. М.: Изд-во Моск. ун-та, 1980. 296 с.
35. Пешковский А.М. Русский синтаксис в научном освещении. 7-е изд. М.: Учпедгиз, 1956. 511 с.
36. Плунгян В.А. Глагол в агглютинативном языке: (На материале догон). М.: Институт языкознания РАН, 1992. 167 с.
37. Потебня А.А. Эстетика и поэтика. М.: Искусство, 1976. 614 с.
38. Редькин В.А. Построение раздела "Морфонология" // Основы построени описательной грамматики современного русского литературного языка. М., 1966. С.7-49.
39. Реформатский А.А. Фонологические этюды. М.: Наука, 1975.
40. Скаличка В. О грамматике венгерского языка /Пер. с нем. // Пражский лингвистический кружок: Сборник статей. М.: Прогресс, 1967. C. 128-195.
41. Смирницкий А.И. Лексикология английского языка. М.: ИЛ, 1956. 260 с.
42. Смирницкий А.И. Синтаксис английского языка. М.: ИЛ, 1957. 286 с.
43. Соссюр Ф. де. Курс общей лингвистики // Соссюр Ф. де. Труды по языкознанию. М.: Прогресс, 1977. C. 31-273.
44. Степанов Ю.С. Методы и принципы современной лингвистики. М.: Наука, 1975. 311 с.
45. Тезисы пражского лингвистического кружка /Пер. с фр. // Пражский лингвистический кружок: Сборник статей. М.: Прогресс, 1967. C. 17-41.
46. Трнка Б. Несколько мыслей о структурной морфологии /Пер. с англ. // Пражский лингвистический кружок: Сборник статей. М.: Прогресс, 1967. C. 266-271.
47. Трубецкой Н.С. Некоторые соображения относительно морфонологии /Пер. с нем. // Пражский лингвистический кружок: Сборник статей. М.: Прогресс, 1967. C. 115-118.
48. Халле М. О роли простоты в лингвистических описаниях // Новое в лингвистике. М.: Прогресс, 1965. Вып. 4. С. 117-125.
49. Хойер Г. Антропологическая лингвистика /Пер. с англ. // Новое в лингвистике. М.: Прогресс, 1965. Вып.4. С.284-306.
50. Чейф У.Л. Значение и структура языка. М.: Прогресс, 1975.
51. Чурганова В.Г. Очерки русской морфонологии. М.: Наука, 1973.
52. Шанский Н.М. Очерки по русскому словообразованию. М.: Изд-во Моск. ун-та, 1968. 310 с.
53. Aissen J., Hankamer J. Lexical extension and grammatical transformations // Papers from the annual meeting of the Berkeley Linguistics Society. Berkeley, 1980. Vol.6. P.236-249.
54. Aitchison J. Words in the mind: An introduction to the mental lexicon. Oxford: Basil Blackwell, 1987. 229 p.
55. Alexander R. Directions of morphophonemic change in Balkan slavic: The accentuation of the present tense // American contributions to the Ninth International congress of Slavists: Kiev, September 1983. Vol.1. Linguistics. Columbus (Ohio): Slavica, 1983. P. 9-49.
56. Allen A.S. The leader verb as a mechanism of morphological change // Papers from the annual meeting of the Berkeley Linguistics Society. Berkeley, 1982. Vol. 8. P.10-17.
57. Allen M.R. Morphological investigations. Ph.D. dissertation. Storrs (Connecticut): University of Connecticut, 1978.
58. Anderson S.R. On the typology of phonological rules // Papers from the parasession on natural phonology. Chicago (Ill.): Chicago Linguistic Society, 1974. P.1-12.
59. Anderson S.R. On the notion of subject in ergative languages // Subject and topic. N.Y.: Acad.Press, 1976. P.1-23.
60. Anderson S.R. On the formal description of inflection // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1977. Vol.13. P. 15-44.
61. Anderson S.R. Where's morphology? // Linguistic inquiry, 1982. Vol. 13. ь 4. P.571-612.
62. Anderson S.R. Typological distinctions in word formation // Language typology and syntactic description: Grammatical categories and the lexicon. Cambr. etc.: Cambr. UP, 1985. Vol.3. P. 3-56.
63. Anderson S.R. Inflectional morphology // Language typology and syntactic description: Grammatical categories and the lexicon. Cambr.etc.: Cambr. UP, 1985. Vol.3. P.150-201.
64. Anderson S.R. Morphological theory // Linguistic theory: Foundations. Cambr. etc.: Cambr. UP, 1988. P.146-191.
65. Anderson S.R. Morphology as a parsing problem // Linguistic and psychological approaches to morphology. B. etc.: Mouton de Gruyter, 1988. P.521-544.
66. Aronoff M. Word formation in generative grammar. Cambr. (Mass.): MIT, 1976. 134 p.
67. Aronoff M. Lexical representations // Papers from the parasession on the lexicon. Chicago: Chicago Linguistic Society, 1978. P.12-25.
68. Aronoff M. Orthography and linguistic theory: The syntactic basis of Masoretic Hebrew punctuation // Language, 1985. Vol. 61. N 1. P.28-72.
69. Bazell C.E. The correspondence fallacy in structural linguistics // Studies by members of the English Department, Istanbul University Press, 1952. Vol.3. P.1-41.
70. Bazell C.E. Linguistic typology. L.: School of Oriental and African Studies, 1958.
71. Beard R., Szymanek B. Bibliography of morphology 1960-1985. Amsterdam etc.: Benjamins, 1988. 193 p.
72. Bedell G. The arguments about deep structure // Language, 1974. Vol.50. N 3. P.423-445.
73. Bergman M.W. The visual recognition of word structure: Left-to right processing of derivational morphology.- Nijmegen: Sneldruk Enschede, 1988. 260+8 p.
74. Bierwisch M. Eine Hierarchie syntaktisch-semantischer Merkmale // Studia grammatica. B.,1965. Bd.5. S.29-86.
75. Bloch B. English verb inflection // Language, 1947. Vol. 23. N 4. P.399-418.
76. Bloomfield L. Language. N.Y.: Holt, 1933.
77. Bloomfield L. Menomini morphophonemics // A Leonard Bloomfield anthology: Abridged edition. Chicago; L.: The University of Chicago Press, 1987. P.243-254.
78. Boas H.U. Formal versus explanatory generalizations in generative transformational grammar: An investigation into generative argumentation. Tübingen: Niemeyer, 1984. xvii, 460 p.
79. Booij G.E. Dutch morphology: A study of word formation in generative grammar. Dordrecht: Foris, 1977.
80. Booij G.E., Marle J. van. Modular approaches to morphology: Introduction // Modular approaches to morphology. B. etc.: Mouton de Gruyter, 1986. P. 487-491.
81. Booij G.E., Rubach J. Postcyclic versus postlexical rules in lexical phonology // LI 1987. Vol. 18. N 1. P.1-44.
82. Botha R.P. Morphological mechanisms: Lexicalist analyses of synthetic compounding. Oxford etc.: Pergamon, 1984. 164 p.
83. Bowers J.S. Adjectives and adverbs in English // Foundations of language, 1975. Vol. 13. P.529-562.
84. Bradley D.C., Forster K.I. A reader's view of listening // Spoken word recognition. Cambr. (Mass.); L.: MIT, 1987. P.103-134.
85. Braine M.D.S. On what might constitute learnable phonology // Language. 1974. Vol.50. N 2. P.270-299.
86. Brame M.K. Essays toward realistic syntax. Seattle (Wash.): Noit Amrofer, 1979. 213 p.
87. Brekle H.E. Semantik: Eine Einfuhrung in die sprachwissenschaftliche Bedeutungslehre. München: Fink, 1972. 144 S.
88. Bresnan J.W. A realistic transformational grammar // Linguistic theory and psychological reality. Cambr. (Mass); L.: MIT, 1978. P.1-59.
89. Bresnan J.W. Lecture notes. MIT, Dept. of Linguistics and Philosophy, 1979.
90. Brøndal V. Structure et variabilite des systemes morphologiques // Readings in linguistics II. Chicago; L.: The University of Chicago Press, 1966. P.139-147.
91. Broselow E. Language change and theories of lexicon // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1977. Vol.13. P.58-68.
92. Brownell G. Computers and teaching. St.Paul etc.: West Publishing Co., 1987. 425 p.
93. Buchanan B.G. Principles of rule-based expert systems // Advances in computers. Orlando etc.: Acad. Press, 1983. Vol.22. P.163-216.
94. Butterworth B.L. Some constraints on models of language production // Language production: Vol.1. Speech and talk. L. etc.: Acad. Press, 1980. P.423-459.
95. Butterworth B.L. Lexical representation // Language production: B.2. Development, writing and other language processes. L. etc.: Acad. Press, 1983. P. 257-294.
96. Bybee J. Morphophonemic change from inside and outside the paradigm // Lingua 1980. Vol. 50. N 1. P.45-59.
97. Bybee J. Morphology: A study of the relation between meaning and form. Amsterdam: Benjamins, 1985. 234 p.
98. Bybee J., Brewer M. Explanation in morphophonemics // Lingua 1980. Vol. 52. P.201-241.
99. Carroll J.M., Tanenhaus M.K. Prolegomena to a functional theory of word formation // Papers from the parasession on functionalism. Chicago (Illinois): Linguistic Society, 1975. P. 47-62.
100. Carstairs A. Paradigm economy // J. of linguistics, 1983. Vol. 19. ь 1. P.115-125.
101. Carstairs A. Allomorphy in inflection. L. etc.: Croom Helm 1987. 271 p.
102. Carstairs A., Stemberger J.P. A processing constraint on inflectional homonymy // Linguistic and psychological approaches to morphology. B. etc.: Mouton de Gruyter, 1988. P. 600-617.
103. Cercone N., Krause M., Boates J. Minimal and almost minimal perfect hash function search with application to natural language lexicon design // Computational linguistics. Oxford etc.: Pergamon Press, 1983. P.215-231.
104. Chafe W.L. Phonetics, semantics, and language // Language. 1962. Vol. 38. N 4. P.335-344.
105. Chandrasekaran B. Generic tasks in knowledge-based reasoning: Characterizing and designing expert systems at the "right" level of abstraction // Artificial intelligence applications: The engineering of knowledge-based systems: Proceedings of the second conference, Miami Beach, Florida, December 11-13, 1985. Wash.; A.: JEEE Computer Science Press; North Holland, 1985. P.294-300.
106. Charniak E. A parser with something for everyone // Parsing natural language. L. etc.: Acad. Press, 1983. P. 117-149.
107. Chomsky N. Morphophonemics of Modern Hebrew: Master's thesis, University of Pennsylvania, Philadelphia, 1951. Repr.: N.Y.; L.: Garland, 1979. 74 p.
108. Chomsky N. Syntactic structures. The Hague: Mouton, 1957.
109. Chomsky N. On the notion "rule of grammar" // Proceedings of the twelfth Symposium in applied mathematics. 1961. Vol. 12. P. 6-24.
110. Chomsky N. Current issues in linguistic theory // The structure of language: Readings in the philosophy of language. Englewood Cliffs (N.J.): Prentice Hall, 1964. P. 50-118.
111. Chomsky N. Aspects of the theory of syntax. Cambr. (Mass.): MIT Press, 1965. 251.
112. Chomsky N. Remarks on nominalizations // Readings in English transformational grammar. Waltham (Mass.) etc.: Ginn, 1970. P.184-221.
113. Chomsky N. Some empirical issues in the theory of transformational grammar // Goals of linguistic theory. Englewood Cliffs (N.J.): Prentice-Hall, 1972. P.63-130.
114. Chomsky N. Conditions on transformations // Festschrift for Morris Halle. N.Y.: Holt, Rinehart & Winston, 1975. P.232-286.
115. Chomsky N., Halle M. The sound pattern of English. N.Y.: Holt, Rinehart and Winston, 1968. 470 p.
116. Coats H.S. Russian syntax and semantics two theoretical approaches // Occasional papers in Slavic languages and literature. Seattle (Wash.): University of Washington, 1982. Vol.1. ь 1. P.67-88.
117. Cole P., Hermon G. Complement structure and islandhood in EST: A crosslinguistic study // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1979. Vol.15. P.60-69.
118. Cole R. Listening for mispronunciations: A measure of what we hear during speech // Perception and psychophysics, 1973. Vol.13. P.153-156.
119. Cole R., Jakimik J. How are syllables used to recognize words? // J. of the Acoustic Society of America, 1980. Vol.67. P.965-970.
120. Comrie B. Morphophonemic exceptions and phonetic distance // Linguistics 1979. Vol. 17. P.51-60.
121. Comrie B. Language universals and linguistic typology: Syntax and morphology. Chicago: University of Chicago Press, 1981. 252 p.
122. Cutler A., Fay D.A. One mental lexicon, phonologically arranged: Comments on Hurford's comments // Linguistic inquiry, 1982. Vol.13. N 1. P. 107-113.
123. Darden B.J. Introduction // Papers from the parasession on natural phonology. Chicago (Ill.): Chicago Linguistic Society, 1974. P.i-vii.
124. Darden B.J. On abstractness // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1976. Vol.12. P.110-121.
125. Darden B.J. On the nature of morphophonemic rules // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1979. Vol.15. P.79-89.
126. Darden B.J. Explanation and reality in phonology // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1985. Vol.21. P.40-64.
127. Dell G.S., Reich P. Toward a unified model of slips of the tongue // Errors in linguistic performance: Slips of the tongue, ear, pen, and hand. N.Y.; L.: Acad. Press, 1980. P. 273-286.
128. Donegan P.J., Stampe D. The study of natural phonology // Current approaches to phonological theory. Bloomington: Indiana UP, 1979. P.126-173.
129. Dressler W.U. On word formation in natural morphology // Proceedings of the XIIIth International Congress of Linguists, August 29 September 4, 1982, Tokyo. Tokyo: Gakushuin University, 1983. P.172-182.
130. Dressler W.U. Explanation in natural morphology, illustrated with comparative and agent noun formation // Modular approaches to morphology. B. etc.: Mouton de Gruyter, 1986. P.519-548.
131. Dressler W.U. Word formation (WF) as part of natural morphology // Leitmotifs in natural morphology. Amsterdam: Benjamins, 1987. P.99-126.
132. Drews E. Die Bedeutung von Morphemen für die Sprachanalyse: Zur mentalen Verarbeitung lexikalischer und grammatischer Morpheme. Opladen: Westdeutscher Verlag, 1989. 195 S.
133. Emmorey K.D., Fromkin V.A. The mental lexicon // Language: Psychological and biological aspects. Cambr etc.: Cambr. UP, 1988. P.124-149.
134. Emonds J.E. A transformational approach to English syntax: Root, structure-preserving, and local transformations. N.Y. etc.: Acad. Press, 1976. 266 p.
135. Engdahl E. Word stress as an organizing principle for the lexicon // Papers from the parasession on the lexicon. Chicago: Chicago Linguistic Society, 1978. P.138-147.
136. Farke H., Felix S.W. Struktur und Funktion des Lexikons in der kognitiven Sprachverarbeitung // Sprache und Wissen: Studien zur Kognitiven Linguistik. Opladen: Westdeutscher Verlag, 1990. S. 135-150.
137. Fay D., Cutler A. Malapropisms and the structure of the mental lexicon // Linguistic inquiry,1977.Vol.8. P.505-520.
138. Fegert H. Die Formenbildung des Verbs im Russischen. Heidelberg: Winter, 1986. 198 S.
139. Feuillet J. Introduction à l'analyse morphosyntaxique. P.: PUF, 1988. 223 p.
140. Ford A., Singh R. On the status of morphophonology // Papers from the parasession on the interplay of phonology, morphology and syntax. Ann Arbor (Michigan): Edward Brothers, 1983. P. 63-78.
141. Ford A., Singh R. Towards a non-paradigmatic morphology // Papers from the annual meeting of the Berkeley Linguistics Society. Berkeley, 1985. Vol. 11. P. 87-95.
142. Forsyth R. The anatomy of expert systems // Artificial intelligence: Principles and applications. L.; N.Y.: Chapman and Hall, 1986. P.186-199.
143. Fox S.E. The nature of strata in lexical phonology // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1985. Vol.21. P.101-106.
144. Fraser J.B. Some remarks on the action nominalization in English // Readings in English transformational grammar. Waltham (Mass.) etc.: Ginn, 1970. P.83-98.
145. Garde P. Limite de morphème et limite de phonème (avec application au russe) // Word,1965.Vol.21.N 2. P.360-390.
146. Garrett M.F. Experimental issues in sentence comprehension: Complexity and segmentation // Pragmatic aspects of human communication. Dordrecht; Boston: D.Reidel, 1974. P.97-114.
147. Garvin P.L. The current state of language data processing // Advances in computers. Orlando etc.: Acad. Press, 1985. Vol.24. P. 217-275.
148. Gleason H.A. The organization of language: A stratificational view // MSLL 1964. Vol.17. P.75-95.
149. Goldsmith J.A. Autosegmental and metrical phonology. Oxford: Blackwell, 1990. 376 p.
150. Goodglass H. Disorders of lexical production and comprehension // Meaning, use, and interpretation of language. B.; N.Y.: Gruyter, 1983. P.134-146.
151. Grosjean F., Gee J.P. Prosodic structure and spoken word recognition // Spoken word recognition. Cambr. (Mass.); L.: MIT, 1987. P.135-155.
152. Gross H., Chuckerman A. Functional morphophonemics: West Greenlandic Eskimo // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1982.Vol.18.P.176-184.
153. Grote M. Generatives Lexikon und autonome Wortbildungsprozesse. Gottingen: Georg-August Universitat zu Gottingen, 1987. 261 S.
154. Gunther H. Experimentelle Morphologieforschung // Experimentelle Studien zur deutschen Flexionsmorphologie. Hamburg: Buske, 1989. S.9-26.
155. Hahn W.V. Some ideas about density in knowledge bases // Language and discourse: Test and protest: A festschrift for Petr Sgall. Amsterdam etc., 1986. P.565-584.
156. Halle M. The German conjugation // Word 1953. Vol. 9. N 1. P. 45-53.
157. Halle M. The sound pattern of Russian: A linguistic and acoustical investigation. The Hague: Mouton, 1959.
158. Halle M. Phonology in generative grammar // Word 1962. Vol. 18. P. 54-72.
159. Halle M. Prolegomena to a theory of word formation // Linguistic inquiry, 1973. Vol. 4. N 1. P.3-16.
160. Halle M. Stress rules in English: A new version // Linguistic inquiry, 1973. Vol. 4. P. 451-464.
161. Halle M., Mohanan K.P. Segmental phonology of Modern English // Linguistic inquiry, 1985. Vol. 16. N 1. P.57-116.
162. Harris J.W. Autosegmental phonology, lexical phonology, and Spanish nasals // Language sound structure: Studies in phonology presented to Morris Halle by his teacher and students. Cambr. (Mass.); L.: MIT, 1984. P.67-82.
163. Harris Z.S. A grammatical sketch of Hebrew // Journal of the American Oriental Society, 1946.
164. Harris Z.S. Structural linguistics. Chicago; L.: University of Chicago, 1951. 384 p.
165. Harris Z.S. From phoneme to morpheme // Language,
1955. Vol. 31. N 2. P.190-222.
166. Harris Z.S. Co-occurrence and transformation in linguistic structure // Language, 1957. Vol.33. N 3. P.283-340.
167. Herbermann C.-P. Wort, Basis, Lexem und die Grenze zwischen Lexikon und Grammatik: Eine Untersuchung am Beispiel der Bildung komplexer Substantive. München: Fink,1981.- 384 S.
168. Himmelmann N. Jr. Morphosyntax und Morphologie: Die Ausrichtungsaffixe im Tagalog. München: Fink, 1987. 207 S.
169. Hockett C.F. A system of descriptive phonology // Language, 1942. Vol.18. N 1. P.3-21.
170. Hockett C.F. Peiping morphophonemics // Language, 1950. Vol.26. ь 1. P. 63-85.
171. Hockett C.F. Two models of grammatical description // Word 1954. Vol. 10. P. 210-233.
172. Hockett C.F. A manual of phonology. Bloomington: University of Indiana, 1955.
173. Hockett C.F. The Yawelmani basic verb // Language, 1967. Vol.43. ь 1. P.208-222.
174. Hoekstra T., Hulst H. van der, Moortgat M. Introduction // Lexical grammar. Dordrecht: Foris,1980. P.1-48.
175. Hoenigswald H.M. Language change and linguistic reconstruction. Chicago: University of Chicago, 1960.
176. Hooper J.B. The archi-segment in natural generative phonology // Language, 1975. Vol.51. N 3. P.536-560.
177. Hooper J.B. An introduction to natural generative phonology. N.Y.: Acad. Press, 1976. 254 p.
178. Hooper J.B. Child morphology and morphophonemic change // Linguistics 1979, Vol. 17. P.21-50.
179. Hooper J.B. Substantive principles in natural generative phonology // Current approaches to phonological theory. Bloomington: Indiana UP, 1979.
180. Horn G.M. Lexical-functional grammar. B. etc.: Mouton, 1983. 394 p.
181. Horrocks G.C. Generative grammar. L.; N.Y.: Longman, 1987. 339 p.
182. Householder F.W. Jr. A descriptive analysis of Latin declension // Word 1947. Vol.3. N 1-2. P.48-58.
183. Hudson G. The representation of non-productive alternations // Historical linguistics. A.: North Holland, 1974. Vol.2. Theory and description in phonology. P.203-229.
184. Hudson G. Suppletion in the representation of alternations. Ph.D.diss. U.of California, Los Angeles, 1975.
185. Hudson R.A. Arguments for a non-transformational grammar. Chicago; L.: U. of Chicago, 1976. 214 p.
186. Hull J.J. Word shape analysis in a knowledge-based system for reading text // Artificial intelligence applications: The engineering of knowledge-based systems: Proceedings of the second conference, Miami Beach, Florida, December 11-13, 1985. Wash.; A.: JEEE Computer Science Press; North Holland, 1985. P.114-119.
187. Hurford J.R. Malapropisms, left-to-right listing, and lexicalism // Linguistic inquiry, 1981. Vol.12. P. 419-423.
188. Jackendoff R.S. Speculations on pre-sentences and determiners. Bloomington: Indiana University, 1968.
189. Jackendoff R.S. Gapping and related rules // Linguistic inquiry, 1971. Vol. 2. P.21-35.
190. Jackendoff R.S. Semantic interpretation in generative grammar. Cambr. (Mass.); L.: MIT,1972. 400 p.
191. Jackendoff R.S. Morphological and semantic regularities in the lexicon // Language, 1975. Vol. 51. ь 3. P.639-671.
192. Jacobs J. Fokus und Skalen: Zur Syntax und Semantik der Gradpartikeln im Deutschen. Tübingen: Niemeyer, 1983. 298 S.
193. Jacobs P.S. Knowledge-intensive natural language generation // Artif. intelligence,1987. Vol.33. N 3. P.325-378.
194. Jaeggli O.A., Safir K.J. The null subject parameter and parametric theory // The null subject parameter. Dordrecht etc.: Kluwer Acad. Publishers, 1989. P.1-44.
195. Jakobson R. Signe zero // Melanges de linguistique, offerts a Charles Bally. Geneve: Georg, 1939. P.143-152. Repr. // Readings in linguistics II. Chicago; L.: The University of Chicago Press, 1966. P.109-115.
196. Jakobson R. Russian conjugation // Word 1948. Vol. 4. P. 155-167.
197. Jenkins C.J. Some aspects of word formation in a polysynthetic language // Proceedings of the annual meeting of the Berkeley Linguistics Society. Berkeley, 1984. Vol. 10. P.104-115.
198. Jensen J.T. Morphology: Word structure in generative grammar. Amsterdam; Philadelphia: Benjamins, 1990. 210 p.
199. Jensen J.T., Stong-Jensen M. Morphology is in the lexicon! // Linguistic inquiry, 1984. Vol. 15. N 3. P.474-498.
200. Jobst E., Nier M. (Hg.) Mikroelektronik und künstliche Intelligenz. B.: Akademie, 1987.
201. Junger J. Predicate formation in the verbal system of Modern Hebrew. A.: University of Amsterdam, 1987. 183 p.
202. Kaplan R.M., Bresnan J. Lexical-functional grammar: A formal system for grammatical representation // The mental representation of grammatical relations. Cambr. (Mass.); L.: MIT, 1982. P.173-281.
203. Kempgen S. Grammatik der russischen Verben. Wiesbaden: Harrassowitz, 1989. 597 S.
204. Kenstowicz M., Rubach J. The phonology of syllabic nuclei in Slovak // Language, 1987. Vol.63. ь 3. P.463-497.
205. Kettemann B. Die Phonologie morphologischer Prozesse im amerikanischen English. Tübingen: Narr, 1988. 443 S.
206. Kilbury J. The emergence of morphophonemics: A survey of theory and practice from 1876 to 1936 // Lingua 1974. Vol. 33. P. 235-252.
207. Kiparsky P. Linguistic universals and linguistic change // Universals in linguistic theory. L. etc.: Holt, Rinehart and Winston, 1968. P.171-202.
208. Kiparsky P. ELSEWHERE in phonology // Festschrift for Morris Halle. N.Y.: Holt, Rinehart & Winston, 1975. P.93-106.
209. Kiparsky P. Phonological representations // Three dimensions in linguistic theory. Tokyo: TEC Co., 1973. P.5-56.
210. Kiparsky P. From cyclic phonology to lexical phonology // The structure of phonological representations: Part I. Dordrecht; Cinnaminson: Foris, 1982. P.131-175.
211. Kiparsky P. Lexical morphology and phonology // Linguistics in the morning calm: Selected papers from the SICOL-1981. Seoul: Hanship, 1982. P.3-91.
212. Kiparsky P. On the lexical phonology of Icelandic // Nordic prosody III: Papers from a symposium. Stockholm: Almqvist & Wiksell, 1984. P.135-164.
213. Kirkeby O.F. Ekspertsystemer og kunstig intelligens. København: Borgen, 1987. 216 s.
214. Klavans J.L. The morphology of cliticization // Papers from the parasession on the interplay of phonology, morphology and syntax. Ann Arbor (Michigan): Edward Brothers, 1983. P.103-121.
215. Koutsoudas A. Verb morphology of Modern Greek. Bloomington: Indiana University, 1962.
216. Kuhn T.S. The structure of scientific revolutions. Chicago: University of Chicago Press, 1973.
217. Lamb S.M. Epilegomena to a theory of language // Romanische Philologie, 1966. Bd.19. P.531-573.
218. Lamb S.M. Outline of stratificational grammar. Wash. (D.C.): Georgetown UP, 1966.
219. Lapointe S.G. A lexical analysis of the English auxiliary verb system // Lexical grammar. Dordrecht: Foris, 1980. P.215-254.
220. Lapointe S.G. A comparison of two recent theories of agreement // Papers from the parasession on the interplay of phonology, morphology and syntax. Ann Arbor (Michigan): Edward Brothers, 1983. P.122-134.
221. Lapointe S.G. A theory of grammatical agreement. N.Y.; L.: Garland, 1985. 352 p.
222. Leben W.R., Robinson O.W. Upside-down phonology // Language, 1977. Vol.53. N 1. P.1-20.
223. Lehmann H. Realisierung der naturlichsprachlichen Komponente eines Expertensystems // Maschinelle Übersetzungs- Methoden und Werkzeuge: Akten des 3.Internationalen Kolloquiums des Sonderforschungsbereichs 100 "Elektronische Sprachforschung" Saarbrucken, 1-3. Sept.,1986. Tübingen,1987. S.49-66.
224. Lehmann W.P. On earlier stages of the Indo-European nominal inflection // Language, 1958. Vol. 34. N 2. P.179-202.
225. Lieber R. On the organization of the lexicon. Ph.D.d., Cambr. (Mass.): MIT. Bloomington: IULC, 1980.
226. Lieber R. Allomorphy // Linguistic analysis, 1982. Vol.10. N 1. P. 27-52.
227. Lieber R. Argument linking and compounds in English // Linguistic inquiry, 1983. Vol.14. N 2. P.251-285.
228. Lieber R. Grammatical rules and sublexical elements // Papers from the parasession on lexical semantics. Chicago: Chicago Linguistic Society, 1984. P.187-199.
229. Lieber R. An integrated theory of autosegmental phonology. Albany: State University of N.Y. Press, 1987. 209 p.
230. Lightner T.M. The role of derivational morphology in generative grammar // Language, 1975. Vol. 51. N 3. P.617-638.
231. Ligozat G. Two level morphology with an application to Turkish // Sprechen und Hören: Akten des 23. Linguistischen Kolloquiums, Berlin 1988. Tübingen, 1989. P.265-274.
232. Linell P. Psychological reality in phonology: a theoretical study. Cambr. etc.: Cambr. UP, 1979. 295 p.
233. Lukatela G., Carello C., Turvey M.T. Lexical representation of regular and irregular inflected nouns // LCP 1987. Vol. 2, N 1. P. 1-17.
234. Lyons J. Phonemic and non-phonemic phonology: Some typological reflections // International Journal of American Linguistics, 1962. Vol. 28. P. 127-133.
235. Lyons J. Foreword to Matthews // New horizons in linguistics. Harmondsworth: Penguin, 1970. P.96.
236. Malkiel Y. Essays on linguistic themes. Berkeley; Los Angeles: University of California, 1968.
237. Marslen-Wilson W.D. The limited compatibility of linguistic and perceptual explanations // Papers from the parasession on functionalism. Chicago (Illinois): Chicago Linguistic Society, 1975. P.409-420.
238. Marslen-Wilson W.D. Functional parallelism in spoken word-recognition // Spoken word recognition. Cambr. (Mass.); L.: MIT, 1987. P. 71-102.
239. Marslen-Wilson W.D., Welsh A. Processing interactions and lexical access during word recognition in continuous speech // Cognitive psychology 1978. Vol.10. P.29-63.
240. Martins J.P., Shapiro S.C. A model for belief revision // Artificial intelligence,1988. Vol.35. N 1. P.25-79.
241. Mascaro J. Morfologia. Barcelona: Enciclopedia Catalana, 1985. 150 p.
242. Matthews P.H. The inflectional component of a word-and-paradigm grammar // Journal of linguistics, 1965. Vol.1. P.139-171.
243. Matthews P.H. Some concepts in word and paradigm morphology // Foundations of linguistics,1965.Vol.1. P.268-289.
244. Matthews P.H. The main features of Modern Greek verb inflection // Foundations of linguistics,1967.Vol.3. P.262-284.
245. Matthews P.H. Recent developments in morphology // New horizons in linguistics. Harmondsworth: Penguin, 1970. P.97-114.
246. Matthews P.H. Inflectional morphology: A theoretical study based on aspects of Latin verb conjugation. Cambr.: Cambr. UP, 1972.
247. Matthews P.H. Morphology: An introduction to the theory of word-structure. Cambr.: Cambr. UP, 1974. 243 p.
248. Mayerthaler W. Morphologische Natürlichkeit. Wiesbaden: Athenaion, 1981. 203 S.
249. McCarthy J.J. Parameters in formal morphology // General linguistics, 1981. Vol. 6. P.22-24.
250. McCarthy J.J. The representation of consonant length in Hebrew // Linguistic inquiry, 1981. Vol.12. N 2.
251. McCarthy J.J. Formal problems in Semitic phonology and morphology. N.Y.; L.: Garland, 1985. 426 p.
252. Melčuk I.A. Animacy in Russian cardinal numbers and adjectives as an inflectional category // Language, 1980. Vol. 56. N 4. P.797-811.
253. Mellini M. La classificazione tipologica delle lingue di J.H.Greenberg: Valutazione critica e saggi di applicazione. Firenze: La Nuova Italia editrice, 1985. 170 p.
254. Mellish C. Logic programming and expert systems // Artificial intelligence for society. Chichester etc.: John Wiley & Sons, 1986. P.209-214.
255. Miller J. Semantics and syntax: Parallels and connections. Cambr. etc.: Cambr. UP, 1985. 262 p.
256. Mohanan K.P. Lexical phonology. Ph.D. diss. Cambr. (Mass.): MIT, 1982.
257. Mohanan K.P., Mohanan T. Lexical phonology of the consonantal system in Malayalam // Linguistic inquiry, 1984. Vol. 15. N 4. P. 575-602.
258. Moore J. Arabic derivational morphology and lexical theory // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1979. Vol.15. P.228-243.
259. Mufwene S.S. Bantu class prefixes: Inflectional or derivational? // Papers from the Regional meeting of the Chicago Linguistic Society. Chicago, 1980. Vol.16. P.246-258.
260. Müller M. Vorlesungen über die Wissenschaft der Sprache. Leipzig: Mayer, 1863. 400 S.
261. Muysken P. Quechua word structure // Binding and filtering. L.: Croom Helm, 1981. P.279-326.
262. Nagy W. Some non-idiom larger-than-word units in the lexicon // Papers from the parasession on the lexicon. Chicago: Chicago Linguistic Society, 1978. P.289-300.
263. Nerbonne J.A. Temporalia and strict lexicalism // Papers from the parasession on the interplay of phonology, morphology and syntax. Ann Arbor (Michigan): Edward Brothers, 1983. P.162-172.
264. Newman P. The reality of morphophonemes // Language, 1968. Vol. 44. ь 3. P.507-515.
265. Nichols J. Head-marking and dependent-marking grammar // Language, 1986. Vol.62. N 1. P.56-119.
266. Nida E.A. The identification of morphemes // Language, 1948. Vol.24. N 4. P.414-441.
267. Nyman M. Is the paradigm economy principle relevant? // Journal of linguistics, 1987. Vol.23. N 2. P.251-267.
268. Oehrle R.T. The grammatical status of the English dative alternation. Ph.D. diss. MIT, 1976.
269. Parisi D. Verso un sistema esperto per la elaborazione di testi // Le parole nella testa: Guida a un'educazione linguistica cognitivista. Bologna: Il Mulino, 1987. P.401-410.
270. Patten T. Systemic text generation as problem solving. Cambr. etc.: Cambr. UP, 1988. 214 p.
271. Picallo M.C. The Infl node and the null subject parameter // Linguistic inquiry, 1984. Vol.15. ь 1. P.75-102.
272. Pike K.L. A problem in morphology syntax division // Acta Linguistica Hafniensia, 1949. Vol.5. P.125-136.
273. Pike K.L. Language as particle, wave and field // The Texas Quarterly, 1959. Vol.2. P.37-54.
274. Pike K.L. Theoretical implications of matrix permutation in Fore (New Guinea) // Annalecta linguistica, 1963. Vol. 5. N 8. P.1-23.
275. Pike K.L. Language in relation to a unified theory of human behavior. 2nd, rev.ed-n. The Hague: Mouton, 1967.
276. Pike K.L. Linguistic concepts: An introduction to tagmemics. Lincoln; L.: U. of Nebraska, 1982. 146 p.
277. Pinker S., Prince A. Regular and irregular morphology and the psychological status of rules of grammar // Proceedings of the seventeenth annual meeting of the Berkeley Linguistics Society: General session and parasession on the grammar of event structure. Berkeley (California): Berkeley Linguistics Society, 1991. P. 230-251.
278. Rhodes R. Paradigms large and small // Proceedings of the annual meeting of the Berkeley Linguistics Society. Berkeley, 1987. Vol. 13. P.223-234.
279. Rice K. On the placement of inflection // Linguistic inquiry, 1985. Vol. 16. N 1. P.155-161.
280. Rice S. Unlikely lexical entries // Proceedings of the annual meeting of the Berkeley Linguistics Society. Berkeley, 1988. Vol.14. P.202-212.
281. Robins R.H. In defence of WP // TPhS 1959. P.116-144.
282. Robinson O.W. Rule ordering in a parsing model of phonology // Phonology in the 1980's. Ghent (Belgium): E.Story-Scientia, 1981. P.555-575.
283. Rüdiger B. Automatische Wortformenanalyse des Deutschen // Probleme und Methoden der automatischen Sprachverarbeitung. B.: Akademie, 1983. S.16-25.
284. Schane S.A. Generative phonology. Englewood Cliffs (N.J.): Prentice-Hall, 1973. 127 p.
285. Seifert K. Ikonizität von Pluralformen: Eine Untersuchung zur psychologischen Realität der linguistischen Theorie der "Natürlichen Morphologie". Wien: Verband der wissenschaftlichen Gesellschaften Österreichs, 1988. 215 S.
286. Shapiro M. Explorations into markedness // Language, 1972. Vol.48. N 2. P.343-364.
287. Shapiro M. The sense of grammar: Language as semeiotic. Bloomington: Indiana UP, 1983. 236 p.
288. Sherwood D.F. Maliseet verbs of possession // Linguistic inquiry, 1983. Vol.14. N 2. P.351-356.
289. Siegel D. Topics in English morphology. Ph.D. diss. Cambr. (Mass.): MIT, 1974.
290. Siegel D. The adjacency constraint and the theory of morphology // NELS 1978, Vol.8. P.189-197.
291. Skousen R. An explanatory theory of morphology // Papers from the parasession on natural phonology. Chicago: Chicago Linguistic Society, 1974. P.318-327.
292. Slobin D. Cognitive prerequisites for the development of grammar // Studies of child language development. N.Y.: Holt, 1973. P.175-208.
293. Small S., Rieger C. Parsing and comprehending with word experts: (A theory and its realization) // Strategies for natural language processing. Hillsdale (N.J.); L.: Erlbaum, 1982. P.89-47.
294. Smith H.L. Jr. The concept of the morphophone // Language, 1967. Vol. 43. N 1. P.306-341.
295. Smith L. Propositional nominalization in Labrador Inuttut (Eskimo) // Linguistics, 1981. Vol.19. N 1/2. P.63-99.
296. Sommerstein A.H. The margins of morphophonemics // Journal of linguistics, 1975. Vol.11. P.249-259.
297. Sparck Jones K. So what about parsing compound nouns? // Automatic natural language parsing. Chichester: Horwood; N.Y. etc.: Halsted, 1983. P.164-168.
298. Stampe D. How I spent my summer vacation. Ph.D. diss. Chicago University, 1973.
299. Stankiewicz E. The consonantal alternations in the Slavic declensions // Word 1960. Vol.16. N 2. P.183-203.
300. Stemberger J.P. The nature of segments in the lexicon: Evidence from speech errors // Lingua 1982. Vol.56. ь 1. P.43-67.
301. Stemberger J.P. Inflectional malapropisms: Form-based errors in English morphology // Linguistics 1983. Vol.21. N 4. P.573-602.
302. Stockwell R.P., Schachter P., Partee B.H. Integration of transformational theories of English syntax. Los Angeles: UCLA, 1968. 1057 p.
303. Sugioka Y. Interaction of derivational morphology and syntax in Japanese and English. N.Y.; L.: Garland, 1985. 244 p.
304. Swadesh M. The phonemic principle // Language, 1934. Vol.10. N 2. P.117-129.
305. Swadesh M., Voegelin C.F. A problem in morphological alternation // Language, 1939. Vol.15. N 1. P.1-10.
306. Taft L. Prosodic constraints and processing theory // Proceedings of the annual meeting of the Berkeley Linguistics Society. Berkeley, 1985. Vol.11. P.519-528.
307. Tanenhaus M.K. et al. Do listeners compute linguistic representations? / Tanenhaus Michael K., Carlson Greg N., Seidenberg Mark S. // Natural language parsing: Psychological, computational, and theoretical perspectives. Cambr. etc.: Cambr. UP, 1985. P.359-408.
308. Taylor D.J. Varro and the origins of Latin linguistic theory // L'heritage des grammairiens latins de l'Antiquite aux Lumieres: Actes du Colloque de Chantilly 2-4 septembre 1987. P.: Societe pour l'information grammaticale, 1987. P.37-48.
309. Taylor S.H. On the acquisition and completion of lexical entries // Papers from the parasession on the lexicon. Chicago: Chicago Linguistic Society, 1978. P.347-356.
310. Tiersma P.M. Local and general markedness // Language, 1982. Vol. 58. N 4. P.832-849.
311. Tiersma P.M. The nature of phonological representation: Evidence from breaking in Frisian // Journal of linguistics, 1983. Vol. 19. N 1. P.59-78.
312. Trager G.L. The Russian gender categories // Language, 1940. Vol. 16. N 4. P.300-307.
313. Trager G.L. Russian declensional morphemes // Language, 1953. Vol. 29. N 3. P.326-338.
314. Trager G.L. French morphology: Verb inflection // Language, 1955. Vol. 31. N 4 (pt.1). P.511-529.
315. Trubetzkoy N.S. Gedanken über die slovakische Deklination // Readings in linguistics II. Chicago; L.: The University of Chicago Press, 1966. P.96-103.
316. Tuţescu M. Précis de semantique française. Bucureşti; P.: Klincksieck, 1975. 214 p.
317. Tyler L.K., Frauenfelder U.H. The process of spoken word recognition: An introduction // Spoken word recognition. Cambr. (Mass.); L.: MIT, 1987. P.1-20.
318. Vennemann T. Phonetic analogy and conceptual analogy // Schuchardt, the Neogrammarians, and the transformational theory of phonological change. Frankfurt a.M., 1972. P.181-204.
319. Vennemann T. Words and syllables in natural generative grammar // Papers from the parasession on natural phonology. Chicago: Chicago Linguistic Society, 1974. P.346-374.
320. Warburton I.P. On the boundaries of morphology and phonology: A case study from Modern Greek // Journal of linguistics, 1976. Vol. 12. P.259-278.
321. Waugh L.R. The semantics and paradigmatics of word order // Language, 1976. Vol.52. N 1. P.87-107.
322. Weber N. Maschinelle Lexikographie und Wortbildungsstrukturen. Tübingen: Niemeyer, 1990. 225 S.
323. Wiese R. Silbische und lexikalische Phonologie: Studium zum Chinesischen und Deutschen. Tübingen: Niemeyer, 1988. 230 S.
324. Williams E. On the notions lexically related and head of a word // Linguistic inquiry,1981. Vol.12. P.245-274.
325. Williams E. Argument structure and morphology // Linguistic review 1981. Vol.1. P. 81-114.
326. Wojcik R.H. The phoneme in natural phonology // The elements: A parasession on linguistic units and levels: April 20-21, 1979: Including papers from the Conference on Non-Slavic languages of the USSR (April 18, 1979). Chicago: Chicago Linguistic Society, 1979. P.273-284.
327. Wurzel W.U. Studien zur deutschen Lautstruktur. B.: Akademie, 1970. 291 S.
328. Wurzel W.U. Flexionsmorphologie und Natürlichkeit: Ein Beitrag zur morphologischen Theoriebildung. B.: Akademie, 1984. 223 S.
329. Wurzel W.U. System-dependent morphological naturalness in inflection // Leitmotifs in natural morphology. Amsterdam etc.: Benjamins, 1987. P.59-96.
330. Zurif E.B., Blumstein S.E. Language and the brain // Linguistic theory and psychological reality. Cambr. (Mass); L.: MIT, 1978. P.229-245.
331.Zwicky A.M. An expanded view of morphology in the syntax phonology interface // Proceedings of the XIIIth International Congress of Linguists, August 29 September 4, 1982, Tokyo. Tokyo: Gakushuin University, 1983. P.198-208.
332. Zwicky A.M. How to describe inflection // Proceedings of the annual meeting of the Berkeley Linguistics Society. Berkeley, 1985. Vol.11. P.372-386.
333. Zwicky A.M. The general case: Basic form versus default form // Proceedings of the annual meeting of the Berkeley Linguistics Society. Berkeley, 1986. Vol.12. P.305-314.