Стихи - Фотография - Проза - Уфология - О себе - Фотоальбом - Новости - Контакты -

Главная   Назад

Александр Михайлович Кондратов Звуки и знаки

0|1|2|3|4|5|6|

Первая в нашей стране промышленная эксплуатация МП была осуществлена в 1976 году в Чимкентском пединституте по заказу Института химии Академии наук Казахской ССР. ЭВМ системы «Минск» переводит английский текст длиной в тысячу слов, то есть около трех страниц, за двадцать — двадцать пять минут. И это, учитывая ввод текста в машину и вывод его из машины в виде отпечатанного русскими буквами перевода!

В конце 1977 года в Алмаатинском энергетическом институте проходила VII Всесоюзная конференция по генераторам низкотемпературной плазмы. Участвовали в ней и гости из других стран. Делегатам и гостям были вручены три компактные книжечки в красном переплете: англо-русский и русско-английский, французско-русский и русско-французский, немецко-русский и русско-немецкий словари-минимумы. Предназначены они для чтения научных текстов по плазме, а также для разговора с зарубежными коллегами. Автором же этих словарей была… вычислительная машина и, естественно, коллектив программистов и языковедов, составивших машинную программу. За три месяца ЭВМ проделала работу, на которую потребовалось бы несколько лет труда сектора научного учреждения.

Перед нами широкий лист бумаги. Вверху напечатан запрос: «Прошу определить общую тему документа». Далее следует французский текст статьи по технологии окраски. Внизу дается ответ на русском языке: «Документ относится к теме «электрофорез». Затем снова запрос: «Прошу дать машинный реферат документа». На него тут же дан развернутый ответ.

«В этом диалоге, казалось бы, нет ничего удивительного, — пишет профессор Р. Г. Пиотровский, руководитель группы «Статистика речи». — Именно таким образом сотни референтов-переводчиков ведут беседу со своими заказчиками. Однако приведенный текст представляет собой человеко-машинный диалог, в котором вопросы формулировал человек, а ответы на правильном русском языке без всякой подсказки выдавала машина. Учителями компьютера были языковеды, химики и математики из лаборатории инженерной лингвистики Ленинградского педагогического института имени А. И. Герцена и Кишиневского политехнического института».

Лишь совсем недавно человеческий мозг создал «мозг» электронный, вычислительные машины. На первых порах диалог человека с ЭВМ казался фантастикой. Затем настала пора радужных надежд и горьких разочарований. Но работа продолжается, продолжаются поиски подходов и методов, с помощью которых вычислительные машины включатся в человеческое общество и «электронный мозг» станет не просто чудо-счетчиком, по и надежным и верным помощником в тысяче других дел. Путь к этому — обучить машины человеческому языку.

Диалог человека и робота только-только начинается! Мы же закончим наш рассказ о МП — машинном переводе, о поисках ЯП — языка-посредника и о создании ИЯ — информационных языков словами Норберта Винера, которого называют «отцом кибернетики»: «Отдайте же человеку — человеческое, а вычислительной машине— машинное. В этом и должна, по-видимому, заключаться разумная линия поведения при организации совместных действий людей и машин. Линия эта в равной мере далека и от устремлений машинопоклонников, и от воззрений тех, кто во всяком использовании механических помощников в умственной деятельности усматривает кощунство и принижение человека».

<p>В ПОИСКАХ ЗНАЧЕНИЯ

Передача смысла, значения — вот цель нашего общения, главная задача человеческого языка и, стало быть, главная задача науки об этом языке. Можно ли описывать это значение на языке точных формул и чисел?

О том, как математическая лингвистика штурмует «святая святых» языка, расскажет очерк

В ПОИСКАХ ЗНАЧЕНИЯ

<p>Путь к семантике

Не так давно в сектор структурной и прикладной лингвистики Института языкознания Академии наук пришел человек с рюкзаком. В рюкзаке лежали словари: индонезийского, английского, русского, древнегреческого и других языков.

Человек с рюкзаком объявил: он сделал важное открытие. Чтобы определить степень развитости того или иного языка, надо мерять слова. В буквальном смысле мерять — линейкою. Оказывается, древнегреческие слова на пять миллиметров длиннее индонезийских. Стало быть, и сам язык эллинов более развит…

Конечно, это курьез. Но еще каких-нибудь два десятка лет назад даже у многих серьезных ученых представление о математической лингвистике принципиально не отличалось от представлений человека с рюкзаком. Помните, как великий комбинатор Остап Бендер, продавая астролябию, напутствовал покупателя словами: «Сама меряет — было бы что мерять». Математической лингвистике отводилась такая же роль: с ее помощью, дескать, все можно в языке измерить, были бы языки!

Но сам термин «математическая лингвистика» не совсем точен. «Нельзя сравнивать термин «математическая лингвистика» с аналогичным термином «математическая физика», — писал профессор Р. Л. Добрушин в годы, когда математическая лингвистика делала свои первые шаги. — Математическая физика — это особый раздел математики, нацеленный на специфические физические приложения; по своим методам он не менее сложен, чем любой другой раздел математики. В лингвистике же речь должна идти о первых шагах применения математики».

В пионерских работах применялся традиционный аппарат теории вероятностей и теории множеств, математической статистики и теории информации. Однако в наши дни начинается создание и своего особого математического аппарата для лингвистики, подобно тому, как он был создан для экономики с ее линейным и динамическим программированием, теорий игр и теорий массового обслуживания. Особые лингвистические проблемы привели к тому, что в математике родилась совершенно новая область — теория формальных грамматик.

В предыдущем очерке мы упоминали теорию нечетких множеств. Она также была создана математиками для решения задач лингвистики. Позже выяснилось, что аппарат этой теории имеет самые различные применения, вплоть до метеорологии. Сейчас теория нечетких множеств — одна из самых перспективных и бурно развивающихся отраслей современной математики (в нашей стране в издательстве «Знание» вышла брошюра основателя этой теории, Л. Заде, «Основы нового подхода к анализу сложных систем и процессов принятия решений» и его же монография «Понятие лингвистической переменной и ее применение к принятию приближенных решений» в издательстве «Физматгиз»).

Когда ученые попробовали применить к языку и его правилам строгие и однозначные алгоритмы, выяснилось, что они слишком просты и грубы. Теперь математики разрабатывают так называемые нечеткие алгоритмы, опираясь на теорию нечетких множеств. Образцом такого алгоритма может быть поведение слепого, когда он приближается к цели, постепенно уменьшая свои шаги…

Таким образом, в современной лингвистике наряду с традиционным аппаратом математики есть и свои специальные средства. Они применяются для описания диалектов и изменения языка во времени, для грамматики и лексики. Но при всем многообразии идей и направлений, поисков и перспектив можно увидеть общую тенденцию, которая отличает их от более ранних исследований. Тенденцию эту можно охарактеризовать словами, вынесенными в заголовок: поиски значения. Поиски путей, позволяющих проникнуть в сокровенные глубины языка, а вместе с тем — и вообще человеческого мышления, неотторжимого от языка.

На первом этапе развития математической лингвистики ученые принципиально отказывались от анализа смысла, от содержательной интерпретации высказываний, слова и т. д. Их интересовала система «языка вообще», система конкретных языков, абстрактные формулы грамматики, приложимые к этим языкам, структура языка «икс» нерасшифрованного текста, ритмическая «сетка» правил стихосложения.

Пионерская работа такого плана была сделана… около двух с половиной тысяч лет назад. Тогда великий индийский ученый Панини дал блестящий образец строго формализованного описания санскрита. С появлением быстродействующих электронных вычислительных машин как из рога изобилия посыпались работы, где давались в терминах математики формализованные описания структур различных языков. Однако вскоре стало ясно, что описание грамматики языка или его частотных характеристик, несмотря на всю свою математическую точность, недостаточно еще для решения не только основных задач языкознания, но и для решения частных и даже сугубо практических задач.

Например, для машинного перевода и автоматического реферирования текста необходимо обращаться к смыслу, к значению (вспомните язык смысловых множителей в очерке МП, ЯП, ИЯ). Для расшифровки древних текстов — таких, как кохау ронго-ронго острова Пасхи, где грамматические показатели отсутствуют почти полностью, — методы позиционной статистики, опирающейся на выявление грамматики языка «икс», непригодны. Мало чем полезна позиционная статистика и при анализе ритмики стиха, при котором неизбежно следует обращение к значению, к интерпретации того или иного «звукообраза», создаваемого этим ритмом.

Профессор Роман Осипович Якобсон привел такое красочное сравнение во время своей лекции в Московском институте иностранных языков имени Мориса Тореза. В лингвистике, игнорируя значение, мы даем формализованное описание языка, подобное тому, какое дает человек, описывая поведение курицы, предварительно отрубив ей голову. Описание это будет точным и непротиворечивым… Но разве из этого следует, что оно описывает поведение курицы с головой во всех его аспектах?

Отсюда, конечно, не следует, что математическая лингвистика — тупиковый путь, что ее итогом будет не кибернетическая формализация, а пустой формализм. Нет, в наши дни от формализации чисто «внешнего» в языке лингвистика переходит к формализации «внутреннего», от грамматики переходит к семантике, к анализу смысла.

<p>«Куздра», «бокр», «бокренок», «глокая»

Различие между ранним и нынешним этапами математической лингвистики очень хорошо показывает такой пример. Академик Л. В. Щерба давал своим ученикам для анализа, казалось бы, заумную фразу: глокая куздра штеко будланула бокра и кудрячит бокренка.

Ни в каком словаре русского языка вы не отыщете всех этих слов, хотя грамматическое оформление фразы русское (Щербе принадлежит крылатый афоризм для изучающих иностранные языки: «Лексика — дура, грамматика — молодец!», перефраз суворовского афоризма о пуле и штыке).

Опираясь на грамматику русского языка, можно многое выяснить в этой фразе, дать ее расшифровку. Слово куздра — женского рода, единственного числа. С ним согласовано стоящее впереди слово глокая — в роде и числе. Отсюда вывод: слово куздра существительное, слово глокая — прилагательное к нему.

Обратимся к глаголам. Очевидно, что ими будут слова будланула и кудрячит. Слово будланула согласовано со словом куздра в роде (женский) и числе (единственное). Значит, оно будет сказуемым при подлежащем куздра. Глагол будланула образован, очевидно, от инфинитива будлануть и явно дан в прошедшем времени. Другой глагол кудрячит столь же явно обозначает настоящее время, единственное число и также согласован с глокой куздрой.

Бокр — существительное мужского рода, единственного числа, потому что этого бокра и будланула глокая куздра (слово бокр находится в винительном падеже). Но не просто будланула, а штеко. Отсюда вывод: слово штеко — наречие.

Остается слово бокренок. Вывод напрашивается сам собой: это существительное мужского рода, единственного числа, которое, как и бокр, стоит в винительном падеже…

Дадим формальный анализ всей фразы: (кто?) куздра (какая куздра?) глокая (что сделала?) будланула (кого будланула?) бокра (как будланула?) штеко и (что еще делает куздра?) кудрячит (кого кудрячит?) бокренка. Здесь легко найти, что во фразе является подлежащим, сказуемым, определением и т. д. Иными словами, не зная смысла фразы, мы выявляем ее грамматическую структуру.

Все это — своеобразная характеристика первого этапа формализованного изучения, языка, этапа, на котором смысл, значение игнорируются. В настоящее время можно предложить анализ нашей фразы с глокой куздрой уже не абстрактно-грамматический, а семантический, смысловой. Причем опираться мы будем по-прежиему на саму структуру, только уже не внешнюю грамматическую, а внутреннюю, смысловую.

Начнем с глагола будлануть. При нем есть прямое дополнение — бокра, которое выражено одушевленным существительным (бокр имеет окончание на — а в винительном падеже; если бы это существительное было неодушевленным, оно бы имело нулевое окончание, сравните склонение слов тигр и бобр, подобных бокру). Отсюда вывод: глагол будлануть переходный. Расчленим его на части. Будл — основа, — ануть — суффикс.

В русском языке к подобного рода глаголам относятся: давануть, долбануть, звездануть, мазануть, рубануть, садануть, стегануть, толкануть, щипануть, хлестануть и т. д. Все они имеют однократное значение, выражают энергичное, насильственное воздействие на объект (нечто вроде ударить, но непременно ударить с силой и один раз). Правда, есть одно исключение—глагол сказануть, но он никак не подходит для аналогии с будлануть: можно сказануть на бокра, но нельзя сказануть бокра. Значит, глокая куздра энергично и насильственно воздействовала на злосчастного бокра. Затем она стала кудрячить бедного бокренка.

Обратимся к этому глаголу. Кудрячить имеет сходное значение насильственного воздействия на объект. Этот глагол, как и будлануть, — переходной, имеет в качестве прямого дополнения одушевленное существительное. В предложении он связан с будлануть соединительным союзом и. Кудрячить и будлануть — однородные члены предложния. Для подобного рода глаголов, выполняющих одинаковые грамматические функции и связанных соединительным союзом и, характерно и смысловое согласование.

Попробуйте сами подобрать в пару к глаголам на — ануть другой глагол во фразе, подобной нашей глокой куздре, и вы увидите, что вторым глаголом (эквивалентом кудрячить) обязательно должен быть глагол, имеющий подобный же «агрессивный» смысл. Сопоставьте вот эти две фразы: «Он долбанул его и видит его брата»; «Он долбанул его и лупит его брата». Обе фразы стилистически корявые, но первая в этом смысле более корявая, чем вторая — вторая при некоторой снисходительности к стилю не вызывает никаких возражений: в смысловом отношении она абсолютно правильная.

Итак, глаголы будлануть и кудрячить имеют четко выраженную смысловую направленность.

Проанализируем теперь наречие штеко. Что можно сказать о его смысле? Очевидно, что оно характеризует глагол будлануть. В его значение входит признак интенсивности, нечто вроде крепко, ловко. Образовано оно, вероятно, от прилагательного штекий (подобно тому, как ловко образовано от ловкий, крепко — от крепкий и т. п.). В силу этого оно не может быть обстоятельством места, времени, цели, причины и т. д., а дает характеристику глаголу будлануть. Опять-таки обратимся к глаголам на — ануть. Все качественные наречия, относящиеся к ним, непременно выражают признак интенсивности действия. В таком ряду, как крепко звезданул, ловко мазанул, шибко трепанул, равноправным членом встанет и наше штеко будланул.

А что можно сказать о бокре и бокренке? Они образуют пару, где общий корень бокр. Слово бокренок образовано от бокра при помощи суффикса — нок. И бокр и бокренок — одушевленные существительные мужского рода. Все это заставляет нас сделать вывод, что бокр — животное, самец, а бокренок — его детеныш.

В самом деле: сравните бобр — бобренок, тигр — тигренок, зверь — зверенок, жеребец— жеребенок, кот — котенок, сом — соменок. Сюда прекрасно вписывается пара бокр — бокренок.

Остается глокая куздра. То, что прилагательное глокая характеризует куздру, ясно. Но ничего другого мы о нем сказать не можем. Куздра может быть морская или речная, мохнатая или гладкая, черная или пегая, старая или молодая, мощная или тихая — одним словом, глокая. Значение этого слова-уродца может толковаться по-разному, ибо у нас нет для него рамок, подобных тем, что были найдены для глагола будлануть или наречия штеко. Единственное, что мы можем сказать определенного о прилагательном глокая — это то, что оно входит в характеристику живого существа — куздры.

Правда, возникает вопрос: почему мы должны считать куздру живым существом? Для бокра и бокренка, как вы помните, определительным признаком их одушевленности послужило окончание — а в винительном падеже. Наша куздра стоит в падеже именительном, может быть, это не живое существо, а какой-то предмет, орудие, снаряд и т. п.? Нет, ответим мы, если вспомним, что куздра будланула. Только живое существо может производить такое целенаправленное действие, как будлание — это мы доказали рядом глаголов тряхануть, долбануть, давануть, щипануть и т. п., обозначающих действие, которое способно осуществить лишь живое существо.

Что мы еще можем сказать о куздре? Было бы соблазнительно определить ее пол: если бокр — самец, то, быть может, куздра — самка, раз слово это стоит в женском роде? Действительно, большинство названий животных попадает под эту модель: тигр — тигрица, лев — львица, лис — лисица, за исключением некоторых слов вроде пантеры — она может быть и самкой, и самцом.

Что же получаем мы в итоге? Куздра, некое живое существо, по всей вероятности, самка, интенсивно произвела насильственное действие над другим существом и оказывает воздействие на детеныша этого существа.

«Этот анализ объясняет, почему подавляющему большинству не искушенных в лингвистике носителей русского языка, к которым автор обращался с просьбой дать толкование щербовской фразе, представлялась приблизительно одна и та же картина: самка сильно ударила какого-то самца и наносит удары его детенышу», — пишет Ю. Д. Апресян, советский специалист по структурной семантике.

<p>Необходимость и вероятность

Первый анализ — грамматический — был предложен Л. В. Щербой. Второй, семантический, заимствован нами из книги Ю. Д. Апресяна «Идеи и методы современной структурной лингвистики». Можно даже усилить аргументы и попытаться более точно определить бокра и его детеныша. По всей вероятности, этот бокр должен быть диким, а не домашним животным. Вспомните, что потомство животных, издавна прирученных человеком, в русском языке (и не только русском, но и во многих других языках мира) называется словами, отличными от тех, которыми именуется взрослая особь. У собаки рождаются щенята, а не собачата, у овцы — ягненок, а не овченок, у коровы — теленок, а не коровенок, а у свиньи — поросенок, а не свиненок. Зато у тигрицы — тигренок, у львицы — львенок, у орла—орленок. Так что бокр, имеющий бокренка, животное, по всей видимости, дикое, а не домашнее.

А теперь зададимся иным вопросом. Интуитивно всем нам, носителям языка, благодаря грамматике и привычным смысловым связям, рисуется примерно одинаковая картина того, что произошло с глокой куздрой академика Щербы. Но обязательно ли именно такое толкование?

Начнем с первого слова глокая. Мы определили его как прилагательное к слову куздра. Но ведь его можно трактовать и как наречие, и как деепричастие. Судите сами: куздра может быть свирепой, сильной, хищной и т. д. Однако может быть и некой, эдакой, и т. п. Как известно, мы не во всех случаях деепричастие в начале предложения выделяем запятой. Поэтому слово глокая можно трактовать и как деепричастие, типа прыгая, рыская, падая, воя, рыдая.

Мы интуитивно относим существительное куздра не просто к разряду живых существ, но именно к животным, а не людям. Однако в русском языке есть целый ряд слов, относящихся не к литературному, а обиходному пласту лексики, которым созвучна наша куздра. Вспомните такие слова, как мымра, грымза, карга, дура и т. п. Все они относятся к женщинам, а не животным. Более того, интенсивное и целенаправленное действие может осуществлять не само животное, а какой-либо его орган, например йога или лапа… Да и неодушевленный предмет также может производить такое действие, если он находится в руках человека: почему бы глокой куздре не быть эквивалентом железной кочерги или мокрой тряпки?

Слово штеко и Щерба, и Апресян, и все мы интуитивно считаем наречием. Казалось бы, в этом нет сомнения. Однако припомним названия экзотических животных, вроде дикой собаки динго или кенгуру. Может быть, не куздра, а штеко является тем самым одушевленным существом, которое так свирепо будлануло бокра и кудрячит бокренка?

Преподаватель В. А. Шорохов провел интересный эксперимент со своими учениками, студентами Института иностранных языков имени Мориса Тореза. Он подобрал восемь русских фраз, построенных по типу глокой куздры (где и куздра, и штеко, и бокр с бокренком получали различное смысловое и грамматическое оформление), и предложил студентам определить, какая из этих фраз по смыслу соответствует щербовской. Вот эти фразы: «Закусочная турка нагло обманула казака и дурачит казачонка»; «Ушлая экономка только обманула повара и морочит поваренка»; «Дикая собака динго трепанула волка и увечит волчонка»; «Описывая мальчика бегло черканула сестра и строчит сестренка»; «Слушая брата сильно психанула сестра и молчит сестренка»; «Выискивая зерна проворно гребанула ворона и кормит вороненка», «Завидевшая обидчика высоко маханула обезьяна и манит обезьяненка»; «Наглая телка крепко долбанула пастуха и увечит пастушонка».

Помимо того, изъяв все корни и оставив лишь одни грамматические окончания, Шорохов составил абстрактную модель щербовской фразы: «А-ая Б-а В-о Г-анула Д-а и Е-ит Д-енка», после чего предложил студентам ее интерпретировать. И тут будущие лингвисты, профессиональные переводчики стали в тупик. Насколько однозначно и легко они трактовали глокую куздру, настолько тяжело им было дать смысловую интерпретацию модели, хотя, казалось бы, сделать это еще легче, чем с самою глокой куздрой: ведь каркас есть — наполняй его чем угодно.

В чем тут дело? А видимо, в том, что условный глагол будлануть вызывает у нас ассоциации с реальным глаголом бодануть. Мы воспринимаем щербовское слово, имея уже подсознательную трактовку этого глагола как действия, осуществленного живым существом по отношению к другому живому существу. Иными словами, мы заранее запрограммированы на это. И когда начинаем вроде бы сугубо академический, формальный, грамматический анализ фразы, на самом деле уже имеем в голове ее смысловую трактовку. Мы дешифровали фразу, поняли ее, а потом уже разобрали по косточкам с помощью грамматики. Но ведь как раз эта самая грамматика показывает, что глокую куздру можно понимать совсем иначе. Значить, все дело не в грамматике, а в семантике. Не абстрактная геометрия грамматики, а конкретное значение, носителем которого является мозг человека, определяет трактовку придуманной глокой куздры!

…Да простит читатель автора за столь долгий разбор бессмысленной, казалось бы, фразы. Но он был нужен для того, чтобы всякий человек, владеющий русским языком, хотя и не постигший премудростей структурной семантики, смог понять и прочувствовать всю сложность и неоднозначность вопросов, на которые отвечать — и со всей строгостью науки! — предстоит той же самой структурной семантике.

Ибо, как превосходно сказал один из основоположников этой науки, польский ученый Альфред Тарский, «в обычной речи не существует фразы, имеющей точно определенный смысл. Едва ли можно было бы найти двух человек, которые употребляли бы слово в одинаковом значении, и даже в речи одного человека значение одного и того же слова меняется в различные периоды жизни. Сверх того, значение слов повседневного языка обычно очень сложно; оно зависит не только от внешней формы слова, но также и от обстоятельств, при которых оно высказано, а иногда и от субъективно-психологических факторов».

Фраза, придуманная академиком Щербой, считается образцом, классикой формального анализа, то есть анализа, построенного лишь на законах грамматики. Но мы с вами убедились, что решающая роль здесь принадлежит ассоциациям, связанным у любого человека, владеющего русским языком, с глаголами типа бодануть.

<p>Статистика ассоциации

Об ассоциациях, связях, запечатленных в нашем мозгу, писал еще Аристотель. В конце прошлого — начале нашего века были проведены первые эксперименты по установлению словесных ассоциаций. Схема экспериментов такая: человеку предлагают слово и требуют, чтобы он тотчас же назвал «первое пришедшее в голову» другое слово.

Казалось бы, мало ли что может прийти человеку в голову? Ведь ответ его зависит от образования, воспитания, культуры, возраста, пола, характера, настроения, наконец каких-либо текущих впечатлений, например, прочитанной недавно книги или увиденного спектакля. И все-таки, как показали исследования, наиболее употребительные слова рождают и определенные стандартные ассоциации. Причем если смысл слов в разных языках может быть один и тот же, то ассоциации, этим словом вызываемые, бывают порой различны.

Возьмем слово орел. Более половины участвовавших в эксперименте американцев на это слово-стимул отвечало птица.

А вот у казахов ассоциации совсем иные. Лишь четырнадцать процентов опрошенных дали ответ птица, Зато почти шестьдесят процентов казахов отвечали на орел словами беркут, лисица или заяц. Почему? Да потому, что орел-беркут, испокон веков использовался казахами для охоты на лисицу, зайца и других животных.

В 1910 году вышел в свет первый специальный словарь ассоциаций, составленный Грейс Кент и А. Розановым. В него вошли ответы тысячи испытуемых, данные на сто употребительных слов английского языка. Вслед за этим словарем появились словари ассоциаций французского, немецкого и других языков.

Совсем недавно мы получили «Словарь ассоциативных норм русского языка», включающий в себя полтысячи слов и многочисленные слова-ассоциации, которые порождало то или иное слово у нескольких сотен испытуемых. В словаре приводится и статистика этих ассоциаций, начиная с самых частых ответов и кончая единичными. Понятно, что эти числовые данные говорят о том, насколько прочна и стандартна связь того или иного слова русского языка с другим.

Возьмем, например, слово дядя. Более трети всех испытуемых ответили тетя. Это, так сказать, самая обычная ассоциация на дядю. Весьма частыми оказались ответы: мой, Ваня, родной, Степа, добрый, чужой, родственник, самых честных правил, хороший. Они порождены различными причинами: сочетаемостью слов, стандартными оборотами, литературными откликами («Дядя Ваня» — пьеса Чехова; популярная строка из «Евгения Онегина» «Мой дядя самых честных правил»; «Дядя Степа» — персонаж Михалкова). А вот единичные ответы вроде низкого роста, нудный, сантехник, Олег, футбол, батя, безумный, ирония, Гоша, река, редко вижу, прислать, полицейский и т. п. вызваны причинами чисто субъективными. У кого-то дядя низкого роста, у кого-то дядю зовут Олегом или Гошей, у кого-то дядя работает сантехником, у кого-то дядя — нудный человек и т. п.

Еще в начале пятидесятых годов нашего века была предложена методика «вычисления осмысленности» слова на основании числа ассоциаций, которые оно вызывает. Наиболее интересные результаты она дает в том случае, если мы сознательно ограничим свою задачу. Например, будем требовать не ассоциации вообще (они, как вы сами убедились на примере слова дядя, могут быть самыми неожиданными), а определенного типа ответы. Например, называя слово, мы просим привести уже не «первое пришедшее в голову» слово, а противоположное названному по смыслу.

В нашей стране был проведен интересный эксперимент на более чем пятистах испытуемых. Им предлагалось слово, испытуемые называли в ответ противопоставление. Затем эти ответы обрабатывались статистически, и мы получали возможность выразить в числах степень связи значений слов.

В ответ на слово слепой сто процентов испытуемых дали ответ зрячий (смысловой индекс противопоставления, таким образом, будет равен единице). У слова темный этот индекс оказался равен 0,94 (почти все испытуемые ответили светлый), у слова пустой — индекс 0,82 (ответом было полный) и т. д.

Но это, так сказать, один полюс противопоставления. На другом полюсе находятся слова, для которых нет столь однозначных ответов. Слово сердитый получило четыре примерно равных ответа: веселый, добрый, радостный, добродушный (а вдобавок к ним более редкие: беззлобный, ласковый, приветливый, доверчивый). Между этими двумя полюсами оказались слова, имеющие большой набор индексов, но при этом один из них доминировал. Например, слово защита имело частый ответ нападение (индекс 0,72), но помимо него, назывались слова атака, беззащитность, предательство, бессилие, доступ, брешь, удар, незащищенность, бегство, вторжение, прорыв, захват, угроза. Причем у всех этих слов индексы были очень малы, от шести сотых до одной сотой, то есть называла их ничтожная часть испытуемых.

Предлагались и другие методики измерения значений на основе ассоциаций. Например, вычисление степени близости слов-стимулов. Стандартная ассоциация на английское слово girl (девушка, девочка) — слово boy (мальчик), ее дает более семидесяти процентов испытуемых. Кроме того, были ответы со значением женщина, друг, молодая, платье, хорошенькая, милая и т. д. Стандартная ассоциация на слово boy — слово girl . Смысловая близость слов boy и girl вычисляется по формуле и равна 0,749; не следует думать, однако, что ассоциации двух слов взаимны; в ответ на слово table восемьдесят пять процентов ответило chair, а на chair ответ table не дала и половина всех испытуемых.

Советская исследовательница А. П. Клименко предложила не косвенный, а прямой метод измерения смысловых связей двух слов. Испытуемым предлагается оценить, исходя из шкалы в десять баллов, близость смысла двух слов. Данные, полученные в результате опроса многих людей, обрабатываются, и получается некая средняя величина. Вот какие числа были получены в экспериментах. Смысловая близость слов стол и год, стол и время равна почти нулю (индексы 0,4 и 0,6). Между время и погода она равна четырем баллам, между год и месяц — 7,4, между снег и погода — 7,1. Смысловая же близость между словами время и час приближается к максимальной, она равна 9,1 балла.

Любопытно сравнить эти данные с результатами, полученными по словарю ассоциаций. Наиболее частый ответ на слово час — слово время (более двадцати процентов всех ответов). Наиболее частый ответ на слово время — час (примерно десять процентов всех ответов). А самым частым ответом на слово год слово месяц, его дает приблизительно пятнадцать процентов всех носителей русского языка. Значит, как бы ни различалась методика измерения значений, она приводит к сходным результатам. И это говорит о том, что в своих поисках значения исследователи стоят на верном пути.

<p>«Измерение значений»

«Измерение значений» — так называлась монография американских лингвистов Осгуда, Танненбаума и Сучи. Она вызвала широкие отклики во всем мире. В ней рассказывалось об огромной работе, проведенной Осгудом и его сотрудниками по определению смысловых связей слов или, как говорит само название монографии, по измерению значений.

В любом языке мира есть полярные, противоположные по смыслу термины и слова: север — юг, холод — жара, большое — маленькое, красивое — уродливое, старое — новое и т. д.

Быть может, смысл слова удастся определить как некоторую точку, что находится на этих полярных словах-шкалах? Нельзя ли взять в качестве измерений, неких координат ряд подобного рода полярных, противоположных по смыслу слов? А все остальные слова расположить по этим координатам?

Возьмем, к примеру, пару хороший — плохой. Предмет или явление может быть или плохим, или хорошим. Однако в языке есть более тонкое деление: мы говорим — и оцениваем — явление или предмет как очень хорошее, очень плохое, не плохое и не хорошее (то, что называется ни рыба, ни мясо). Есть и, так сказать, средние оценки, те, что выражаются словами вроде неплохой, ничего себе и т. п.

Понятие «не плохой и не хороший» нейтрально, безразлично, и Осгуд предложил обозначить его через нуль. Понятие «немного хороший» будет тогда оценено в плюс единицу, а «немного плохой» — в минус единицу. «Вполне хороший» оценивается в плюс два, «вполне плохой» — в минус два. Наконец, крайние точки шкалы — «очень плохой» и «очень хороший» — обозначены Осгудом как плюс три и минус три. Таким образом, шкала значений хороший — плохой получила семь делений, семь возможных числовых оценок, от минус трех до плюс трех.

Точно так же на семь различных градаций разделено было расстояние и между другими парами противоположных по смыслу прилагательных: счастливый — печальный, быстрый — медленный, ласковый — жестокий, гладкий — шероховатый, сложный — простой, длинный— короткий… Записать эти пары прилагательных можно в виде таблицы. Разграфлена она будет на семь частей, семь оценок, которые может иметь то или иное слово, попадающее в смысловое пространство. А пространство это будет задаваться нашими прилагательными, всеми парами типа хороший — плохой, длинный — короткий.

Изобразим это наглядно. Вот перед нами таблица смыслового пространства, которое задается четырьмя прилагательными:
хороший+ 3 +2 + 10 – 1 —2 – 3плохой
счастливый+ 3 +2 + 10 – 1 —2 – 3печальный
твердый+ 3 +2 + 10 – 1 —2 – 3мягкий
медленный+ 3 +2 + 10 – 1 —2 – 3быстрый

Вы уже догадались, видимо: в таблице вместо чисел (как с плюсом, так и с минусом) проставляются слова, указывающие на убывание какого-то качества по направлению к нулю и на возрастание противоположного качества от нуля.

Вот по такой методике и оцениваются слова, обращаясь при этом к носителям значений, то есть к людям, говорящим на данном языке. Например, в какую клетку поместим мы значение слова змея? Вероятнее всего, на шкале хороший — плохой она получит оценку в минус три, ибо для многих слово змея ассоциируется с чем-то плохим, коварным, неприятным. А слово отец может получить оценку плюс три (очень хороший). Правда, любители змеиного племени могут оценить значение слова змея и в плюс три, а обиженные дети оценят отца в минус три как очень плохого.

Чтобы добиться объективных результатов, чтобы выявить, каково же значение того или иного слова в сознании носителей языка, надо опросить как можно больше людей, самых разных возрастов и профессий, также как поступают при составлении словарей ассоциаций. Только тогда, сопоставив сотни ответов, можно вывести среднюю величину значения интересующего нас слова.

Например, один испытуемый оценил значение слова отец как вполне хорошее (то есть дал ему оценку плюс два), немного счастливое (плюс один), вполне твердое (плюс два) и немного быстрое (минус единица). Другой дал оценки соответственно плюс три, плюс три, нуль, плюс один. Третий — новый вариант оценок. Чтобы данные были объективными, Осгуд и его сотрудники привлекли к участию в опытах по измерению значений сто человек. По результатам их опроса и выводилась средняя величина оценки того или иного слова.

Но почему, собственно говоря, взято только четыре пары прилагательных, а не сорок четыре или сто четыре? И почему взяты пары хороший — плохой, а не, скажем, честный — бесчестный? Сколько надо взять пар, что задают координаты значения слова? Все прилагательные, противоположные по смыслу друг другу? Или же многие пары дадут одинаковые результаты и их можно объединить (например, справедливый — несправедливый и честный — бесчестный)?

Каждую пару прилагательных можно сравнить с измерением. Тогда вопрос сформулируется так: «Сколько измерений нужно для значения слов, сколько измерений имеет смысловое пространство?»

На первом этапе Осгуд выделил все пары прилагательных английского языка, имеющие противоположный смысл. Таких пар оказалось очень много, около трех сотен. Вряд ли смысловое пространство имеет столько измерений. Да и человек, определяя значение слова на трехстах шкалах, естественно, устанет и будет давать неточные и неверные ответы. Вот почему для первого эксперимента выделено было пятьдесят пар. И сто испытуемых размещали значение того или иного слова уже не по четырем парам, как в нашем примере, а по пятидесяти. И не одно слово отец, а два десятка разных слов.

Сто испытуемых, двадцать слов, пятьдесят пар… Итого сто тысяч суждений. Этот своеобразный «куб данных» был подвергнут анализу с помощью электронной вычислительной машины: не находятся ли в прямой связи многие эти пары, нельзя ли свести полсотни пар всего лишь к нескольким?

Уже первые опыты показали, что шкалы хороший — плохой, справедливый — несправедливый, ласковый — жестокий, честный — бесчестный и т. п. связаны между собой и дают примерно одни и те же оценки. Зато они совершенно не зависят от таких шкал, как длинный — короткий, мокрый — сухой, медленный — быстрый и т. д.

Так сколько же подлинных измерений имеет смысловое пространство?

Математический анализ, проделанный ЭВМ, показал, что оно состоит всего-навсего из четырех измерений.

Первое — оценочное. Сюда входят такие пары, как хороший — плохой, ласковый — жестокий, красивый — безобразный, чистый — грязный и тому подобные оценочные пары прилагательных.

Второе измерение смыслового пространства — сила. Его образуют пары прилагательных большой — маленький, — тяжелый — легкий, сильный — слабый, толстый — тонкий и т. п. Правда, иногда это измерение бывает связано с оценочным. Например, в таких парах, как храбрый — трусливый, твердый — мягкий, громкий — тихий.

Третье измерение можно назвать ориентированной активностью. Его образуют пары прилагательных быстрый — медленный, жаркий — холодный, активный — пассивный и другие, им подобные. В редких случаях это измерение также может переплетаться с оценочным, например, в парах молодой — старый, бешеный — спокойный, напряженный — расслабленный.

Наконец около двух процентов результатов не подходили ни под измерение силы, ни под измерение оценки, ни под измерение активности. Они как бы выпадали из трехмерного пространства измерения значений, образуя четвертое измерение.

Может быть, если анализу подвергнуть не полсотни, а больше пар прилагательных, число этих измерений возрастет? Осгуд и его сотрудники увеличили число пар, доведя его до семидесяти шести. Однако это не увеличило число измерений смыслового пространства. А так как четвертое измерение малосущественно, то Осгуд решил оперировать с трехмерным пространством смысла, состоящим из оценки, силы и активности.

Правильность этого решения подтвердила заключительная серия экспериментов. Здесь методика была несколько иной. Сорока испытуемым предъявлялась сначала «основная» пара. Затем они были должны отметить в словах другой пары прилагательных то слово, которое кажется им более близким к этой «основной». Например, за основу бралась пара тупой — острый. К какому из слов ближе пара расслабленный — напряженный? В большинстве случаев к слову острый называлось слово напряженный, а к слову тупой — расслабленный. Такое же согласие было достигнуто и в парах прямой — кривой и благородный — скотский и т. п. Таким образом выявлялась зависимость пар друг от друга, они находились в одном и том же измерении смыслового пространства.

Зато при сопоставлении таких пар, как свежий — засохший и длинный — короткий одинаково часто к слову свежий назывались и слово длинный, и слово короткий. По всей видимости, эти пары находились в разных измерениях смыслового пространства.

Перебрав множество десятков пар, Осгуд пришел к выводу, что смысловое пространство состоит из трех измерений. Оценка, сила, активность — вот три кита, на которых стоит смысл слов.

<p>Координаты смысла

Итак, смысл любого слова может быть выражен точкой в смысловом пространстве. Значение слова будет выражаться в виде набора чисел, обозначающих ту или иную величину оценки, силы и активности этого слова. По этим трем шкалам и стали распределяться значения слов в экспериментах Осгуда. Система же оценок осталась прежняя, от плюс трех до минус трех баллов. И каковы бы ни были личные вкусы и субъективные оценки опрашиваемых, но если их достаточно много, то можно получить координаты смысла того или иного слова с достаточной точностью (так же как мы получаем достоверный набор ассоциаций, связанных со словом, опросив достаточно большое число лиц).

Осгуд измерял значение имен существительных. Работы его последователей показали, что таким же образом могут быть измерены значения глаголов, наречий и даже предлогов. Все эти части речи охватываются тремя измерениями смыслового пространства! Так, например, почти все испытуемые определяли глагол есть как нечто доброе, своевременное, вкусное, округлое, сильное, обычное, красивое.

Результаты измерения значений можно выразить в геометрической форме. Значение слова будет точкой, координаты которой заданы тремя смысловыми измерениями: силой, оценкой, активностью. В этом трехмерном пространстве можно будет разместить значения всех измеренных слов. А затем, используя элементарную формулу, подсчитывать расстояние между тем или иным словом, вернее, между смыслами слов.

Так, Осгуд определил, что расстояние между значением выражений бутоны белых роз и зыбучий песок равно 8,5; между словами герой и мужественность — 1,4, а между героем и бутонами белых роз — 8,5. Вполне понятно, что чем дальше значения слов, тем больше между ними будет расстояние в системе координат смысла. Значения слов герой и мужественность близки, в то время как бутоны белых роз одинаково далеко отстоят от значений слов герой и зыбучий песок.

Вычислив расстояние между всеми парами значений, можно построить некую карту смысла, небольшой кусочек, отражающий смысловую географию нашего языка, структуры значений его слов. В Соединенных Штатах был выпущен специальный «Атлас смысловых профилей» для значений трехсот шестидесяти различных слов. На его страницах приводились значения этих слов в виде своеобразных карт. Значение каждого слова на карте определялось точкой, координаты которой заданы двумя измерениями: оценкой (хороший — плохой) и силой (слабый — сильный).

Вполне понятно, что на страницах «Атласа» отражена была «география смысла» одного лишь английского языка. Ведь Осгуд работал с людьми, для которых этот язык был родным, и все его данные касались значений слов именно английского языка. Насколько близка «география смысла» в других языках мира? Отличается ли она от английской? Или же координаты смысла всеобщи, подобно нашему трехмерному пространству? И как на «карте смысла» располагаются значения слов различных языков мира — не так ли, как любая точка земной поверхности, имеющая свою определенную долготу и широту?

Прежде чем ответить на этот вопрос, необходимо решить другой, принципиальный. Достаточно ли в этом случае трех измерений смысла, то есть оценки, силы и активности? Да, для ряда языков мира, как показали опыты, хватает трех измерений смысла, чтобы дать координаты значений слов. Но далеко не для всех языков. Например, в греческом языке нет измерений силы и активности. Зато есть измерение, которого нет в английском.

Еще больше отличался от английского своими измерениями смысла язык одного из индейских племен Северной Америки — навахо. Правда, и в нем было одно из «английских» измерений — оценочное. И, как показали дальнейшие исследования, именно это оценочное измерение является всеобщим для всех языков, подвергшихся анализу: английского, финского, греческого, японского, навахо и многих других. Вполне вероятно, что оно есть во всех языках мира.

Но стоит только перейти к размещениям значений внутри этого всеобщего оценочного измерения, как картина меняется от языка к языку. Мы уже признали, что для европейца змея — это нечто опасное, отвратительное, враждебное. Естественно, что он оценит ее баллом минус три, как «очень плохое». Для аборигенов Австралии змея — это пища, дичь, мясо, и они скорее всего оценят значение этого слова баллом плюс три. Для европейцев собака — друг человека. Значение этого слова мы оценим положительным баллом. А вот на арабском Востоке собака считается нечистым и грязным животным. Наверняка значение этого слова получит отрицательный балл, и учебники арабского языка рекомендуют, говоря — собака, предварительно извиниться перед собеседником, как будто вы произносите нецензурное слово.

Даже в языках, где есть одинаковое число смысловых измерений и эти измерения совпадают, координаты смыслов отдельных слов различны. Например, расстояние между значениями слов гнев и сочувствие в норвежском языке меньше, чем в английском. С другой стороны, значения слов горе и вина в английском языке близки, но в норвежском не связаны друг с другом. А вот какие любопытные результаты показало сравнение значений слов, связанных с культурой и обществом.

«Прогресс есть нечто хорошее — сильное — активное для всех народов, кроме финнов, для которых это нечто пассивное; подобным же образом будущее есть нечто хорошее — сильное — активное для всех народов, кроме финнов, для которых оно хорошее, но слабое и пассивное; труд есть нечто хорошее — сильное — активное для всех народов, кроме фламандцев, для которых это нечто плохое — сильное — пассивное», — пишет Осгуд. И приводит еще несколько характерных примеров.

Друг и мужчина для американцев и японцев есть нечто хорошее — сильное — активное, однако пассивное для фламандцев и слабое для финнов. Только для американцев со значением слова полисмен связано нечто хорошее — сильное — активное. Для фламандцев оно плохое — сильное и пассивное, а для японцев — плохое — сильное — активное. Понятия поражение, бой, вор, преступление, опасность для американцев есть нечто плохое — сильное — активное, так же как для бельгийцев и финнов. Зато для японцев эти же слова нечто плохое — слабое — пассивное, а бой — нечто хорошее — слабое — активное!

Комментарии, как говорится, излишни. Методы измерения значений лишний раз подтверждают, что язык создан обществом и для общества. Разные коллективы, носители разных языков по-разному оценивают значения слов, связанных с определенными культурными и общественными реалиями.

<p>Сдвиг значения

Если значение отдельных слов можно измерить, то нельзя ли выражать в числах и сочетания слов, их смыслов? Ведь говорим мы не отдельными словами, а предложениями…

Казалось бы, на первый взгляд сделать это очень просто: надо суммировать значения отдельных слов, входящих в словосочетание. Однако такое элементарное сложение ничего не даст. Значения слов воздействуют друг на друга, они не являются некими кубиками, которые можно механически складывать и переставлять. Смысл сочетания слов исход и поиск будет противоположным, в зависимости от того, скажем ли мы исход поиска или же поиск исхода. А ведь слагаются эти выражения из одних и тех же смыслов слов!

Возьмем три сочетания с прилагательным жестокий: жестокая судьба, жестокий ум, жестокое окно. Очевидно, что во всех этих сочетаниях значения слов согласуются по-разному. Жестокая судьба — устойчивое сочетание слов, смыслы их прочно спаялись в нашем сознании. Жестокий ум звучит несколько необычно, но все-таки приемлемо, например по отношению к холодному рассудительному человеку, бесстрастному аналитику сердечных чувств и т. п. Выражение жестокое окно осмыслить можно с большой натяжкой, посчитав это окно тюремным, забранным решеткой, или окном, о которое мы порезали руку…

Во всех трех примерах значение слова жестокий меняется в зависимости от слова, с которым оно сочетается. Меняется в зависимости от слова жестокий и значение слов судьба, ум, окно.

Нельзя ли, зная координаты смысла каждого слова, взятого в отдельности, измерить меру и степень этих значений? И, что еще более важно, измерить значение всего словосочетания?

Когда два значения соединяются в одно, два слова — в словосочетание, то смыслы их как бы сдвигаются по направлению друг к другу. Степень такого сдвига будет зависеть от меры, от числа, которым выражено значение каждого отдельного слова, входящего в сочетание. Чем дальше друг от друга отстоят они, например по степени оценки, или силы, или активности, тем меньшим будет этот сдвиг.

Слово судьба в измерении оценки получило минус один балл (то есть плохое). Слово жестокий оценено как очень плохое (минус три балла). Лингвисты, занимающиеся измерением значений, предложили специальную формулу, по которой можно вычислить сдвиг значения слов, входящих в словосочетание. Так, в нашем примере значение слова жестокий сдвинулось с минус трех до минус двух с половиной — на полбалла. А значение слова судьба с минус единицы сдвинулось до минус двух с половиной, то есть на полтора балла.

Была предложена и формула, по которой можно вычислить значение всего словосочетания. Для примера с жестокой судьбой это значение будет равно минус двум с половиной баллам.

Проверку формулы провели на очень интересном опыте. Исследователи взяли восемь существительных и восемь прилагательных, а затем составили из них все возможные сочетания. Значения этих шестидесяти четырех сочетаний прилагательного с существительным были вычислены по формуле сдвига значения и по формуле, определяющей значение словосочетания. А затем была проведена проверка на людях — живых носителях значений. Результаты теоретические и практические удивительно близко совпали.

Правда, работы последних лет показали, что эти формулы скорее всего применимы лишь к парам «прилагательное— существительное». Сочетания же иных типов могут следовать другим законам сдвига значения.

Так, например, было доказано, что совсем иной характер носит сдвиг значения, если сочетаются наречие и прилагательное. Если при вычислении значения пары прилагательное плюс существительное мы применяем сложение, то для измерения смысла пары наречие плюс прилагательное нужно переходить к умножению. Тем самым, кстати сказать, объясняется тот факт, что мы воспринимаем как бессмысленные сочетания вроде немного средний, чрезвычайно обыкновенный и т. п. Прилагательные средний и обыкновенный оцениваются нулевым баллом. А умножение на нуль дает нуль: нулевой смысл прилагательного уничтожает смысл и наречия, которое входит с ним в сочетание.

<p>Океан трудностей, гора проблем

Мы рассказали об измерении значений, о тех интереснейших результатах, которые были получены. Теперь пора рассказать и обо всех стоящих перед исследователями трудностях, о спорном и нерешенном.

Первая трудность — строгий выбор числа измерений смыслового пространства. В английском их три (хотя и это число оспаривается многими лингвистами, некоторые исследователи вели анализ по восьми измерениям значений). А сколько измерений в других языках? Пять? Два? Десять? Никто не может назвать язык с наименьшим или наибольшим числом измерений смыслового пространства, никто не может точно расклассифицировать языки мира на двумерные, трехмерные, пятимерные и т. д.

Впрочем, и в английском языке, лучше всех изученном «измерителями значений», также много неясностей со смысловым пространством. Иногда трехмерное пространство смысла как будто теряет одно из своих измерений. Сила и активность прочно сливаются в одно общее измерение — динамизм. Порой же случается, что оно становится и вовсе одномерным, ибо сила и активность поглощаются оценочным измерением. Так что на сегодняшний день даже для английского языка можно с уверенностью назвать лишь одно надежное и выверенное измерение — оценочное.

Но не только в этом заключаются трудности. По самой идее измерения значений эта операция должна быть обратимой: по заданным числовым признакам мы должны всегда разыскать слово, которое эти признаки описывают. На практике это далеко не так. А точнее — почти всегда не так. Попробуйте-ка догадаться, какое понятие описывают признаки «счастливый плюс один», «быстрый плюс два», «твердый плюс один»… Оказывается, речь идет о понятии отец!

Или еще один пример. Слово имеет координаты смысла, выраженные в трех его измерениях числами + 1,09, —1,85 и +0,77… Что это за слово? Почти наверняка не догадаетесь: это слово миг. Между тем, если бы данные по шкалам не были так обобщены, мы могли бы догадаться. Ведь это слово оценивалось в опытах как очень короткое, очень маленькое, очень быстрое, хорошее, скорее простое и т. п. Но при сведении этих оценок в общую пропала их специфика.

Кстати, еще один недостаток измерения значений, который можно показать на примере слова миг. Значение слов момент и мгновение практически одно и то же, что и миг. Однако же, по данным «Атласа смысловых профилей», расстояние между ними равно 0,3 –0,7 —1,0. Между тем слова, значение которых различается, находятся порой удивительно близко: смысловое расстояние между словами год и век равно трем десятым (а синонимы столетие и век разделены одной и одной десятой).

Вот еще один характерный недостаток: одинаковые расстояния разделяют пары самых различных слов. Судите сами, какие разнообразнейшие пары оказались разделенными показателями единицы: час — век, год — сезон, сутки — апрель, июль — час, июль — прошлое, месяц — время, береза — время, воскресенье — завтра, воскресенье — неделя, утро — завтра и т. п. Интуитивно нам ясно, что на самом деле значения слов год и сезон гораздо ближе, чем береза и время. А ведь именно эта интуиция носителя языка — главное в измерении значений, все остальное имеет вспомогательный характер, все эти «кубы данных», формулы и т. д. Значит, ошибаются они, а не интуиция!

Возможно, что ряд ошибок вызван выбором пар прилагательных, через которые пропускалось слово, чье значение измерялось. «Когда на шкалах гладкий — шероховатый, высокий — низкий оцениваются понятия типа столб или гриб, шкалы применяются испытуемыми буквально; когда те же шкалы используются для измерения значений таких слов, как леди, грех, шкалы могут быть поняты только метафорически», — пишет Ю. Д. Апресян, давший вдумчивый и основательный разбор методики измерения значений, разработанной Осгудом. Получается, что приведенные выше пары прилагательных в различных словах измеряют разные значения, в одном случае прямое, буквальное, а во втором — образное, метафорическое. И примеры такого раздвоения значений можно увеличить: так, по-разному на шкале твердый — мягкий будут оцениваться слова камень и человек, дерево и характер.

Следует добавить, что слова в английском, как и в любом другом языке мира, очень часто имеют не одно, а несколько значений. В зависимости от того, на каком из этих значений остановится испытуемый, будет находиться и оценка. Например, слово Нге означает и огонь, и пожар. Очевидно, что оценка несущего тепло и свет огня будет резко отличаться от оценки губительного и опасного пожара.

И все-таки, несмотря на все эти существенные недостатки, работы Осгуда и его сотрудников имеют большое значение, открывая перспективы дальнейших поисков, новых исследований. Ибо, как остроумно заметил один из крупных зарубежных лингвистов У. Вайнрайх, хотя ученые в своих поисках значения и не открыли нового пути в Индию, приобретенный ими опыт навигации может оказаться весьма полезным.

Навигация в «страну значения» началась давно, и пионерами ее были специалисты по математической логике. Фраза «Венера — утренняя звезда» обозначает тот же объект, что и фраза «Венера — вечерняя звезда». Однако очевидно, что значение этих фраз различно… Что же это такое — значение? Этому вопросу посвящают десятки монографий и сотни трудов математические логики, специалисты по теории знаков, философы и математики. И с каждым годом становится все более ясным, что ключ к решению этой проблемы — анализ нашего обычного языка, во всей его внешней простоте и необыкновенной внутренней сложности.

К анализу значения, смысла слов пришла и современная лингвистика. Ибо этого требовала сама логика развития науки о языке. Этого требуют, как вы, вероятно убедились и сами, насущные проблемы машинного перевода, информатики, реферирования литературы с помощью ЭВМ. Словом, к поискам значения привели задачи теории и практики языкознания второй половины двадцатого столетия. И в этих поисках наука о языке идет рука об руку с другими дисциплинами. Лингвист, стремящийся найти путь к измерению значений, обращается к ассоциациям, которые изучает психолог, а математическая статистика делает его выводы достоверными. Анализ значения потребовал создания новых разделов математики вроде теории нечетких множеств и толерантных пространств.

Проблемой смысла занимаются в наши дни не только лингвисты, но и философы, психологи, логики, кибернетики, специалисты по теории знаков — семиотике. Слишком уж сложен и многомерен человеческий язык, главная задача которого — передача смысла.

Недаром же именуют его семантическим кодом.

<p>НАШ УДИВИТЕЛЬНЫЙ КОД

Математическая теория связи позволяет измерять информацию с помощью точных чисел. О том, как теория информации находит применение в изучении человеческого языка, о сложности этого изучения расскажет очерк

НАШ УДИВИТЕЛЬНЫЙ КОД

<p>Формула Шеннона

Для чего мы говорим? Что является целью всякого общения? Зачем в человеческом обществе существуют такие мощные и дальнобойные средства связи, как телевидение, радио, телеграф?

Очевидно, для передачи сведений. Или, говоря другими словами, для передачи информации. Слово информация имеет много значений. Но связистам, инженерам, техникам, математикам необходимо одно значение — точное и четкое. «Быстрое усовершенствование техники связи, рост потребностей в передаче информации, «кризис эфира», в котором «не умещается» информация, передаваемая в форме электромагнитных волн, — все это поставило очень остро проблему создания более экономных методов передачи информации», — пишет доктор физико-математических наук Р. Л. Добрушин в статье «Математические методы в лингвистике».

А прежде всего необходимо было ввести точную меру, единицу измерения информации. Еще в 1928 году американский инженер Хартли предложил оценивать количество информации логарифмом числа возможных событий.

Когда мы бросаем вверх монету, ясно, что она может упасть либо гербом, либо решеткой. Если мы бросаем игральный кубик, то неопределенность (или, как говорят математики, энтропия) исхода возрастает. Ведь с одинаковой вероятностью может выпасть любая из граней кубика, желанная шестерка столь же часта, как единица, двойка, тройка и т. д. Понятно, что сообщение о том, какой стороной упала монета, несет меньше информации, чем сообщение о том, сколько очков выпало при бросании кубика. Ибо информация — это то, что снимает неопределенность, то есть, попросту говоря, снимает незнание.

Общепринятой единицей измерения информации считается бит или «да — нет» единица. Слово бит происходит от сокращенных английских слов binary digest — двоичный разряд, так как для измерения информации в битах берутся не привычные нам со школьной скамьи десятичные логарифмы, а двоичные, основанием которых служит число 2.

Известие о том, что подброшенная в воздух монета упала гербом, принесет нам информацию ровно в один бит. Ведь log2 2 («орел» или «решка»?) равен 1, то есть одному биту. Известие о том, что выпала игральная карта трефовой, пиковой или другой из четырех мастей, принесет нам информацию в два бита, ибо log2 4 = 2. Сообщение об исходе ситуации, где были возможны (и равновероятны!) восемь вариантов, даст информацию в три бита (log2 8 = 3, или 2³ = 8, а число битов и есть показатель степени числа два).

Но эта мера удобна и верна лишь при условии, если все наши «выборы» равноправны, имеют одинаковую вероятность появления. И масть игральной карты, и любая грань кубика, и герб или решетка монеты выпадают с равной вероятностью. А как быть, если вероятности не равны?

Хартли понимал, что вероятности исходов влияют на количество информации, которое несет сообщение. Почти невероятному исходу нельзя придавать такое же значение, как и самому правдоподобному. Но он считал, что различия между этими исходами нельзя выразить в числах. Они определяются психологическими (если речь идет о людях), метеорологическими (если речь идет о погоде) или другими факторами, неподведомственными математике.

Однако в 1948 году американский математик и инженер Клод Шеннон показал, что эта точка зрения ошибочна. Любые факторы — психологические, метеорологические и т. д. — можно учесть, привлекая теорию вероятностей. Он предложил формулу, с помощью которой можно измерять количество информации о событиях, происходящих с разной вероятностью.

Вот эта формула Шеннона:

H1 = — (P1 log2 P1 + Р2 log2Р2 + … + Рn log2 Рn).

Н1 — эта величина неопределенности, которую снимает сообщение, и, значит, мера количества информации (ведь информация уничтожает неопределенность); n — число «выборов», а Р1, Р2 …, Рn — вероятности появления этих «выборов».

Благодаря этой формуле ученые получили возможность измерять информацию, содержащуюся в кодовых знаках самого различного содержания. Более того, благодаря тому, что мы избираем в качестве «меры» информации логарифмы, мы можем складывать информацию, содержащуюся в каждом кодовом знаке, составляющем сообщение, и таким образом измерить количество информации, содержащееся во всем сообщении.

Действительно, как учит теория вероятностей, вероятность появления двух событий равна произведению вероятностей этих событий. И сумма информации, которую несут кодовые знаки, равна информации всего текста, из этих знаков состоящего. Не будь логарифмов, нам пришлось бы умножать вероятности появления этих знаков. «Логарифмическая» формула Шеннона тем и удобна, что согласно ей информация двух страниц книги — это сумма информации первой страницы и информации второй страницы; информация всей книги — это сумма информации всех ее страниц.

Впрочем, здесь мы переходим уже не в область математики, а в область другой научной дисциплины — математической лингвистики.

<p>«Бандвагон» от науки?

После того, как Клод Шеннон заложил основы вероятностной теории информации, эта теория нашла отклик среди ученых различных специальностей: биологов, лингвистов, философов, генетиков, искусствоведов, психологов, экономистов, геологов, химиков, математиков. Кодом стали называть любую систему знаков, предназначенных для передачи сообщений. Термины теории информации получили широчайшее применение в самых разных публикациях.

Но вот выходит краткая статья самого создателя этой теории, Клода Шеннона, озаглавленная «Бандвагон». Этим словом в США называют политическую партию, добившуюся популярности и победившую на выборах, или просто группу лиц, программа которых находит у населения широкую поддержку. Родился этот термин, вероятно, потому, что обычно победивший на выборах кандидат проезжал по городу в открытой машине, сопровождаемый оркестром (английское band значит оркестр, джаз, а wagon — повозка, карета).

За последние годы теория информации превратилась в своего рода бандвагон от науки — так начинает свою статью Шеннон. Появившись на свет в качестве специального метода в теории связи, она заняла выдающееся место как в популярной, так и в научной литературе. А в результате «значение теории информации было, возможно, преувеличено и раздуто до пределов, превышающих ее реальные достижения».

Очень редко удается открыть одновременно несколько тайн природы одним и тем же ключом, предостерегает Шеннон. Здание нашего искусственно созданного благополучия слишком легко может рухнуть, если в один прекрасный день окажется, что при помощи нескольких магических слов вроде информация, энтропия, избыточность и т. п. нельзя решить всех нерешенных проблем.

«Что можно сделать, чтобы внести в сложившуюся ситуацию ноту умеренности?»— задается вопросом сам Шеннон. И отвечает так: прежде всего представителям различных наук нужно ясно понимать, что основные положения теории информации касаются очень специфического направления, что оно не обязательно должно оказаться плодотворным, скажем, в психологии или экономике. «Я лично полагаю, что многие положения теории информации могут оказаться очень полезными в других областях науки, — говорит Шеннон. — Действительно, уже достигнуты некоторые весьма значительные результаты. Однако поиск путей применения теории информации в других областях не сводится к тривиальному переносу терминов из одной области науки в другую. Этот поиск осуществляется в длительном процессе выдвижения новых гипотез и их экспериментальной проверке».

Эти олова основоположника теории информации прекрасно иллюстрируют ситуацию, что сложилась в языкознании, когда человеческую речь стали рассматривать в качестве своеобразного кода. Изучение языка как кода началось уже на заре теории информации. Но только сейчас, по мере того как растут наши знания, мы начинаем постигать, насколько сложен, специфичен, можно сказать, удивителен код — наш язык, с помощью которого мы общаемся.

<p>Биты и буквы

Сколько информации несет одна буква? Вопрос этот возник в первые же годы рождения теории информации. Простейший ответ на него найти легко. Надо взять число букв в том или ином алфавите мира, а затем выразить его в двоичных логарифмах. Ведь каждая буква — это один из возможных исходов, вроде выпадения герба или решетки монеты, одной из граней кубика и т. д. Число же этих исходов равно числу различных букв.

0|1|2|3|4|5|6|

Rambler's Top100  @Mail.ru HotLog informer pr cy http://ufoseti.org.ua