Анатолий Анисимов - Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык Страница 43
Анатолий Анисимов - Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык читать онлайн бесплатно
Рис. 18. Структура управляющего пространства предложения
Красивая девочка весело собирает цветы
Рис. 19. Дерево зависимостей
В предложении «Улетают вдаль» выделяется одна р-связь. В подобных случаях иногда можно считать, что отсутствующая а- или р-связь соединяется с особым объектом «неопределенность». В линейной конструкции связываются отношением два объекта, хотя можно было бы допустить наличие конструкций с несколькими а- и р-связями через одно предикативное отношение. При построении управляющих пространств следует избегать таких ситуаций, хотя и это допустимо. Логика языка дает возможность обойтись только простыми линейными конструкциями и определениями. Например: «Он написал письмо брату». В этом предложении в предикативную связь вступают три объекта — он, письмо, брату. Поэтому можно было бы структуру VII этого предложения представить в линейном виде с одной а- и двумя р-связями. Но интуитивно осознается, что группа написал письмо сильнее связана, чем написал брату. В этом случае слово письмо выступает как некоторая уточняющая характеристика действия написал. Объекты Он и брату связаны предикативной конструкцией написал письмо. Поэтому более точная структура этого предложения имеет вид, изображенный на рис. 20. Семантически правильна также интерпретация этого предложения, при которой происходит связывание объектов Он и письмо через отношения написал брату (рис. 21).
«Он написал письмо брату:
Рис. 22. Еще один вариант управляющего пространства
Отличия в понимании этих двух интерпретаций находятся на уровне оттенков смысла и отражают способность мозга в динамике распознавать фразы. При анализе фразы «Он написал письмо брату» сначала распознается смысл фразы «Он написал письмо», затем добавляется новый объект для анализа — брату. Динамически меняется предикативное отношение, объединяя в одну группу написал и письмо, а затем новое отношение направляется на объект брату. Вторая интерпретация, при которой связываются в одну группу слова написал и брату, более адекватно фразе «Он написал брату письмо». Таким образом, при помощи управляющих пространств можно учитывать достаточно тонкие смысловые отличия, связанные с перестановочностью слов внутри фразы. Возможна также третья интерпретация, при которой в одну точку помещается группа письмо брату (рис. 22). В этом случае слово брату понимается как атрибутивная характеристика слова письмо. Кстати, построение деревьев подчинения также не всегда однозначно.
Таким образом, управляющее пространство предложения строится как система вложенных структур, состоящих из точек с а — р-связями между ними и содержащих внутри себя части предложений, образующих определения или линейные конструкции. Структура управляющих пространств отражает фундаментальное свойство языка порождать отношения и распространять их на соответствующие элементы.
Управляющие связи деревьев подчинения автоматически восстанавливаются из структуры а — (J-связей. Структура управляющего пространства дает более тонкую классификацию управляющим связям.
В предложениях без нарушений свойства проективности (т. е. без пересечения определений разных элементов) элементы, вложенные в точку, образуют систему составляющих. В этом смысле структура управляющее пространство одновременно обобщает и деревья подчинения, и системы составляющих. Также ясно, что управляющее пространство учитывает разрывные словосочетания, а слова, входящие в одну точку, образуют синтаксическую группу в смысле Гладкого.
Управляющее пространство предложения не связано с его последовательным порядком записи и отражает только семантику порождения и передачи отношений. Значит, структура управляющего пространства не зависит от конкретного языка и только ее трансляция в линейную запись определяется синтаксисом конкретного языка. Поэтому управляющие пространства являются хорошим кандидатом на промежуточную форму представления в системах автоматического перевода.
Заметим, что рассмотрение линейных конструкций и определений для представления синтаксических структур традиционно в лингвистических исследованиях. В том или ином ограниченном виде они часто встречаются в литературе: предикаты и синтагмы в классической лингвистике, управление и примыкание, актантное и атрибутивное отношения, отношения в ПРОЛОГ-системах обработки естественного языка. Выразительные средства модели управляющих пространств дают новую наглядную характеристику этим отношениям, учитывают управляющие и иерархические связи между группами словосочетаний и, кроме того, ориентированы иа конкретную технологию рекурсивно-параллельного программирования.
При обработке синтаксических структур естественного языка возникают две основные задачи — анализ и синтез. Задача анализа — по линейной записи текста построить соответствующее управляющее пространство, задача синтеза — по управляющему пространству построить соответствующую линейную последовательность связного текста. Вторая задача, вообще говоря, проще. При отображении линейной зависимости в текст алгоритм синтеза следует последовательности а — р-связей. При синтезе текста из определений алгоритм сначала решает вопрос, что выдается раньше — определяемый объект или его уточнение. Затем происходит выдача текста из соответствующих конструкций, образующих определение. В алгоритме анализа идет многократная свертка определений и выделение линейных зависимостей.
В программной реализации модели управляющих пространств предложений а — (J-связи реализуются как каналы в ПАРУС-системе программирования. В точках размещаются алгоритмические модули, задающие слова, их характеристики и связь с семантическими базами. По а — (J-каналам осуществляется необходимый обмен информацией для выбора необходимой синтаксически правильной формы частей речи. Разрабатывается экспериментальная версия генерации и анализа предложений русского языка. Отметим, что ПАРУС-технология ориентирована на применение в высокопроизводительных параллельных вычислительных комплексах. Поэтому предлагаемый подход допускает эффективную параллельную реализацию.
Интересна реализация управляющих пространств человеческим мозгом. Нейроны легко соединяются в переплетенные ансамбли, образуя сложные иерархические комплексы. В такой структуре нервное возбуждение может передаваться однонаправленно. Это соответствует реализации линейных а — (J-связей. Нейроны также способны образовывать замкнутые кольцевые реверберирующие цепи, в которых может долго, без затухания циркулировать электрический сигнал. На этом принципе основана кратковременная память. Как раз циклические цепи и нужны для образования замкнутых а — р-циклов. Таким образом, мозг может топологически, один к одному, моделировать управляющие пространства и строить причудливые картины мысли.
В мозге есть две особые речевые зоны — Брока и Вернике. У большинства людей обе они расположены в левом полушарии. Зона Вернике отвечает за сопоставление слов образам. Она работает с семантическими сетями памяти и отвечает за построение управляющего пространства, что соответствует пониманию речи. Зона Вернике связана дугообразным пучком волокон с зоной Брока. Последняя отвечает за анализ и синтез грамматических схем. В зоне Брока управляющее пространство транслируется в линейные последовательности речевых предложений. Эти принципы могут лечь в основу схемы нейрокомпьютера, понимающего речь.
Управляющие пространства можно использовать для получения стилистических характеристик отдельных текстов и авторов. Например, в предложении можно просчитывать количество циклических а — р-цепей, линейных соединений, глубину вложенности определений, вложенность по линейным конструкциям, другие особенности строения управляющего пространства предложений. Интересные функциональные характеристики стиля дает линейная конфигурация текста, построенная по VII. В этом случае текст графически изображается колебательной структурой, отражающей иерархию подчиненных предложений.
В отличие от классической стилеметрии, где ведется статистический учет только линейных параметров текста — частота появления тех или иных частиц, слов, междометий и т. д., в рассматриваемом случае учитывается топология мысли, ярко выражающая индивидуальные особенности мышления. Вот несколько характерных предложений В. Набокова из автобиографической прозы «Другие берега».
1. «Снег — настоящий на ощупь; и когда наклоняюсь, чтобы набрать его в горсть, полвека жизни рассыпается морозной пылью у меня между пальцев».
2. «От морского ветра губы становились солеными: пляж трепетал как цветник, и безумно быстро через него проносилась залетная бабочка, оранжевая с черной каймой».
Жалоба
Напишите нам, и мы в срочном порядке примем меры.