Машинный перевод (МП) и математическая лингвистика принадлежат к числу областей кибернетики, в становлении и развитии которых Алексей Андреевич Ляпунов активно участвовал и на которые оказывал большое влияние на протяжении многих лет.
Работы по МП начались в нашей стране в 1954 г. Это было время, когда кибернетика в нашей стране еще только зарождалась, причем ее первые шаги были очень непростыми. Об этом много говорится в других статьях данного сборника. В этот период личные качества А. А. Ляпунова, его энергия, умение увлекать людей новыми задачами и перспективами, его яркий ораторский талант сыграли как для кибернетики в целом, так и для МП в частности огромную положительную роль.
Только что появившиеся электронные вычислительные машины вызывали у тех, кто был связан с ними (математиков, инженеров) неумеренный оптимизм и множество радужных надежд относительно их возможностей и разнообразных применений. Однако у людей, далеких от ЭВМ, отношение было нередко скептическим и первоначально многие наши лингвисты отнеслись с большим недоверием к идее поручить перевод текстов с одних языков на другие вычислительным машинам. Алексей Андреевич очень много сделал для преодоления этого недоверия.
Для того, чтобы начались работы по МП, А. А. Ляпунов выступал с докладами, устраивал совещания математиков и лингвистов, проводил беседы с людьми разных специальностей. Ему удалось заинтересовать этой тематикой ряд лингвистов старшего поколения (П. С. Кузнецов, А. А. Реформатский, В. Ю. Розенцвейг, И. И. Ревзин) и привлечь к работе молодых лингвистов (И. А. Мельчук, Т. Н. Молошная). Осенью 1954 г. по инициативе А. А. Ляпунова у М. В. Келдыша прошло совещание, на котором из лингвистов присутствовали П. С. Кузнецов и А. А. Реформатский. После этого М. В. Келдыш дал “добро” на создание группы МП в своем институте — ныне Институт прикладной математики им. М. В. Келдыша РАН (ИПМ).
Следует сказать, что толчком к началу работ по МП в разных странах, в том числе и в нашей стране, явился известный в истории МП “Джорджтаунский эксперимент” — первый в мире публичный эксперимент по машинному переводу с одного языка на другой, проведенный в Джорджтаунском университете США в январе 1954 г. Он вызвал повсеместно огромный интерес к этой проблеме, и после него начался первый период бурного подъема в области МП, продлившийся несколько более десяти лет. В этот период коллективы, работающие в области МП, возникли во многих университетах США, в Англии, Франции, Италии, Германии, Японии. В бывшем СССР были созданы группы МП не только в Москве, но также в Ленинграде, Киеве, Ереване, Тбилиси.
В 1957 г. в Москве состоялось “Совещание по комплексу вопросов, связанных с разработкой и построением информационных машин с большой долговременной памятью”, собравшее 500 участников самых разных специальностей. На этом совещании А. А. Ляпунов сделал доклад “Об общих вопросах машинного перевода”.
В мае 1958 г. в Москве состоялась Первая Всесоюзная конференция по машинному переводу, на которой А. А. Ляпунов (совместно с автором) сделал доклад “О работах по машинному переводу Математического института АН СССР”. Программа этой первой конференции по МП включала 61 доклад: цифра, убедительно говорящая о размахе работ в самые первые годы существования МП.
Следует заметить, что активность первых шагов в области МП проявлялась не только в числе созданных коллективов. Первые переводы фраз на машинах были получены в нашей стране через полтора года после начала работ (напомним, от полного нуля!). Это были переводы с французского языка на русский, полученные группой, работающей под руководством А. А. Ляпунова, и переводы с английского языка на русский, полученные группой в ИТМиВТ АН СССР (И. К. Бельская, Д. Ю. Панов, Л. Н. Королев), созданной весной того же 1954 г.
В своих самых первых беседах с учениками о машинном переводе А. А. Ляпунов говорил о переводе путем извлечения смысла и его передачи на другом языке. Однако сразу же стало очевидным, что думать о создании переводческой системы, ведущей перевод через построение семантической структуры текста было преждевременно. Слишком много трудностей и неясностей было в том, как надо строить формализованные алгоритмы для работы с текстами, какие словари надо вводить в машину и с какой информацией, какого рода представления сведений о переводимом тексте нужно строить, какие лингвистические закономерности можно при этом использовать и каковы вообще эти закономерности и т. д. Выяснилось, что лингвистика совершенно не располагает ни фактическим материалом, ни идеями и представлениями, нужными для построения переводческих систем, которые использовали бы смысл переводимого текста. Короче, никто не знал ни то, какую информацию извлекает переводчик из переводимого текста, ни то, как именно он это делает. В неразработанном состоянии оказалась не только семантика, но и синтаксис: так, ни для одного языка не существовало перечня синтаксических конструкций, не были изучены условия их сочетаемости и взаимозаменяемости, не были разработаны правила построения более крупных структурных единиц из более мелких и т. д. В сущности, ни на один вопрос, поставленный в связи с построением переводческих систем, лингвистика не давала ответа.
Одним из следствий осознания этой ситуации явилось создание по распоряжению Президента АН СССР А. Н. Несмеянова специальной комиссии, подготовившей постановление “О развитии структурных и математических методов исследования языка” (от 6 мая 1960 г.). Из математиков в комиссию входили А. А. Ляпунов и В. А. Успенский. Во исполнение этого постановления в Институте языкознания АН СССР сектор прикладного языкознания был преобразован в сектор структурной и прикладной лингвистики с группой машинного перевода; в Институте русского языка АН СССР был создан сектор структурной лингвистики; в Ленинградском отделении Института языкознания — группа изучения языка математическими методами.
С этого же времени началась подготовка кадров для работы в области автоматической переработки текстов (перевод, информационный поиск и др.). С 1 сентября 1960 г. начало существовать отделение структурной и прикладной лингвистики на филологическом факультете МГУ, вскоре подобные отделения появились в Ленинградском и Новосибирском университетах; подготовка специалистов по МП началась также в МГПИИЯ.
Что касается группы МП в ИПМ, руководимой А. А. Ляпуновым, то, ввиду невозможности решить сразу все возникшие проблемы, она естественно пошла по пути постепенного преодоления трудностей. Первая система МП для перевода с французского языка на русский — система ФР-I — строилась эмпирически и была, конечно, весьма несовершенной. Однако она позволила накопить опыт, дала материал для дальнейшего продвижения. Следующая система — для перевода с английского на русский — уже имела более четкую логическую структуру (см. [17]). Система ФР-I принадлежала к числу систем, получивших впоследствии название систем первого поколения, или иначе — систем прямого перевода. В таких системах не строилось какое бы то ни было глубинное представление переводимого предложения (перевод текста велся отдельными предложениями, связи между которыми никак не учитывались). Использовался набор операций, который преобразовывал входное переводимое предложение в переводящее выходное. Со временем на смену таким системам пришли системы последующих поколений: так называемые Т-системы и И-системы. В Т-системах (Т — от слова “трансфер” — преобразование) переход от языка к языку совершался на уровне синтаксических структур: путем анализа входного предложения строилась его синтаксическая структура, она преобразовывалась в синтаксическую структуру выходного предложения, по которой это выходное предложение синтезировалось. В И-системах (И — от “интерлингва”) декларировалось получение некоторого единого, независимого от языков, представления, к которому приводил анализ входного предложения и от которого начинался синтез выходного. Построенная со временем в группе ИПМ система ФР-II была Т-системой. Описание систем ФР-I и ФР-II см. в [16].
Заметим, что появившиеся в 80-х годах первые коммерческие системы, вошедшие в практическое использование (в значительной мере благодаря появлению персональных ЭВМ), были системами прямого перевода, возможность работы которых базировалась на огромных словарях, а не на умении анализировать и синтезировать тексты.
В начале разработки системы ФР-I А. А. Ляпунов интересовался ходом работ буквально ежедневно, вникая в детали, охотно помогая в преодолении даже мелких трудностей. По мере того, как группа обретала опыт, он отходил от мелочей, но общее идейное руководство сохранялось за ним даже и после его переезда из Москвы в Новосибирск.
Однако интерес А. А. Ляпунова к МП не ограничивался теми работами, которые шли под его непосредственным руководством. В его поле зрения находились также другие коллективы, которые во второй половине 50-х годов начали работать над проблемами МП в Ленинграде, Киеве, Ереване, Тбилиси и других городах. Как и во многих других областях кибернетики, Алексея Андреевича занимало в первую очередь общее направление хода дел, общая стратегия в данной области, а также ее связи как с другими ветвями кибернетики, так и с лингвистикой. Эту общую линию А. А. Ляпунов ясно представлял и видел далеко вперед.
Нужно сказать, что проведение такой общей линии было делом далеко не простым, поскольку МП, как всякая новая область, возникшая на стыке сложившихся ранее научных областей, испытывал на себе разнообразные, нередко весьма противоречивые воздействия. Трудности возникали как со стороны лингвистов, так и со стороны математиков.
Что касается лингвистов, то даже у тех из них, кто хотел работать по-новому и готов был разрабатывать лингвистические проблемы в нужном для МП аспекте, не всегда был достаточно четко и правильно налаженный контакт с математиками, что приводило к отсутствию у лингвистов ясного понимания процессов и алгоритмов, для которых они должны были дать лингвистический материал. Отсюда возникала неясность в том, какие именно лингвистические данные и под каким углом зрения им надо собрать и в какую общую схему их следует уложить. В свою очередь, отсутствие общей картины и неразработанность слишком большого числа проблем приводили к тому, что иногда лингвисты начинали увлекаться решением частных вопросов, отходя на позиции, близкие к традиционно лингвистическим, забывая о целях МП и еще больше ослабляя контакт с математиками.
Что касается математиков, то и здесь не все обстояло просто, поскольку математики столкнулись с совершенно новым, чрезвычайно сложно организованным, трудно поддающимся осмыслению и формализации объектом. Работа с ним требовала создания новых математических подходов и методов, тогда как у некоторых математиков возникала тенденция перенести в эту новую сферу какой-либо привычный им математический аппарат, причем без достаточно глубокого проникновения в суть и специфику лингвистических феноменов.
Кроме вопроса взаимодействия математики и лингвистики на почве МП, другим пунктом противоречий было соотношение теоретического и практического подходов к проблеме МП. Здесь были свои крайности. С одной стороны — чрезмерное увлечение теорией, при котором МП рассматривался только как источник и стимул теоретических исследований сугубо академического стиля. С другой стороны — преждевременный практицизм, т. е. необоснованное стремление к поспешной реализации систем перевода, представляющих собой перечисление частных случаев и ситуаций, не объединенных общими идеями и понятиями, когда собственно алгоритм сводился к перебору частных случаев.
Именно в силу наличия этих противоречивых тенденций и увлечений так велика роль А. А. Ляпунова в становлении МП в нашей стране, поскольку он, как никто другой, заботился о том, чтобы МП развивался как единое, цельное, сбалансированное направление. О таком едином МП А. А. Ляпунов писал в своих печатных работах (здесь выделяются [12], [13]), говорил в устных выступлениях.
МП для А. А. Ляпунова был прежде всего составной частью кибернетики, некоторые из его высказываний на эту тему приводятся ниже.
Количество опубликованных работ А. А. Ляпунова, относящихся к МП и математической лингвистике, не очень велико (см. [1]–[14] в списке литературы). Но надо сказать, что его воздействие на развитие МП лишь в незначительной мере определялось его публикациями. Впрочем, это относится не только к МП, но и к кибернетике в целом. Непосредственное воздействие Алексея Андреевича на всех окружающих было неизмеримо сильнее того влияния, которое оказывали его напечатанные работы. Алексей Андреевич очень много времени проводил в активном общении с коллегами, учениками, с людьми самых разных специальностей. Так и в области МП свои идеи, соображения, замыслы А. А. Ляпунов излагал в докладах, лекциях, выступлениях на совещаниях, беседах с учениками, всевозможных обсуждениях, разговорах, отзывах, письмах или в виде записок, которые он часто начинал диктовать во время разговора, а иногда писал сам.
Ниже приводится ряд выдержек из таких материалов. Хочется обратить внимание читателя на следующее важное обстоятельство. Приводимые отрывки не готовились А. А. Ляпуновым для печати, не редактировались, не шлифовались им. Поэтому, с одной стороны, в приводимых материалах именно в силу обстоятельств их возникновения некоторые мысли выражены не всегда с исчерпывающей полнотой. Нередко в одном случае, в зависимости от контекста, А. А. Ляпунов делал акцент на одной стороне вопроса, а в другом случае, говоря о том же самом, сосредоточивал внимание на другой стороне. Подобные формулировки следует воспринимать как дополняющие друг друга. С другой стороны, в приводимых отрывках есть повторения, нередко приводимые выдержки повторяют то, что имеется в напечатанных работах. Однако эти повторы не убирались, так как хотелось сохранить стиль Алексеея Андреевича, а также потому, что нередко идеи, содержащиеся в опубликованных работах, сформулированы в приводимых отрывках в более решительной и яркой форме. Кроме выдержек из записок и писем, в данную публикацию включены также два отрывка из работы [12], наиболее тесно примыкающие по смыслу к выбранным материалам.
Для данной публикации отобраны те разделы, где говорится о проблематике МП, методологии МП, о связях МП с лингвистикой, о месте МП в кибернетике, о соотношении теоретических исследований и экспериментов. Такой выбор продиктован следующими соображениями. Эти высказывания А. А. Ляпунова еще долго будут оставаться актуальными. Эти вопросы чрезвычайно важны для определения “генеральной линии” и перспектив МП как научного направления, а именно очерчивание МП как научного направления и определение перспектив его развития составляет основной вклад А. А. Ляпунова в становление МП в нашей стране. Наконец, эти выдержки интересны тем, что многие идеи, высказанные в них, далеко выходят за рамки МП и относятся к кибернетике в целом.
Машинный перевод был для А. А. Ляпунова составной частью кибернетики. В одном из писем, написанном в январе 1968 г., он очертил содержание кибернетики и место МП в кибернетических исследованиях следующим образом.
I. Общие основы или принципы изучения управляющих систем и процессов управления (т. е. систем, перерабатывающих информацию — системы сигналов с целью выбора образа действий — см. основную схему управления).
II. Наблюдения процессов управления действительности.
III. Эксперимент с реальными управляющими системами с целью узнать их функционирование в тех или иных условиях или при том или ином изменении структуры.
IV. Моделирование или эксперименты с моделями — при наличии описания реальной управляющей системы и комплекса гипотез о ее работе — построение другой управляющей системы (аналоговые или цифровые машины) с целью сопоставления модели и действительности в сфере функционирования.
V. Формулировка задач общетеоретической природы с целью улучшения моделей или их приближения к действительности — точные классификации, количественный подход.
VI. Использование полученных результатов в конкретных областях при работе с управляющими системами.
Может быть, целесообразно в каждом из этих пунктов выделить свои подтипы, например, алгоритмизация — в пункте „эксперимент с моделями“, а также в пункте VI. Оптимальные решения в п. V. Кодирование информации в п. п. II–IV и его изучение в п. V.
Все эти пункты тесно связаны между собой. Возможны переходы от одних к другим. В конкретных задачах и областях, видимо, полезно прослеживать, что относится к каждому из пунктов. Интересно горизонтальное сопоставление того, что делается в разных областях. В частности, создание алгоритмов МП относится к разделу VI, а по дороге возникают задачи, вероятно, из всех остальных пунктов”.
Алексей Андреевич неоднократно подчеркивал необходимость рассмотрения с единых позиций разных разделов кибернетики. В одном из писем (январь 1968 г.) он писал:
“Задачи методологии современные и конкретные — сделать прогноз о том, какие подходы к той или иной области науки перспективны. Для этого нужно рассматривать по возможности много областей, в которых имеется родственная обстановка. Для МП таковыми могут быть: информационные системы, теория управляющих систем, „большие“ системы, кибернетические вопросы техники и биологии”.
В ноябре 1972 г. Алексей Андреевич во время беседы продиктовал следующие соображения о проблемах переработки информации.
“Речь идет о рассмотрении алгоритмов, служащих для переработки больших массивов сложно организованной информации, и о способах кодирования сложной и разветвленной информации.
Р о л ь и е р а р х и ч н о с т и.
Во всех случаях имеется такая структура.
1) Имеют место некоторые элементарные акты низшего уровня, которые непосредственно работают над исходной информацией (отдельные чисто локальные правила).
2) Следующий уровень правил использует результаты первичной обработки и т. д.
Правила иерархически классифицируются.
При этом на нижнем уровне число различных структурных типов сравнительно невелико, затем оно растет, потом снова сокращается, на самом верхнем их снова мало, иначе слишком большое число случаев реально не использовалось бы.
(Если говорить об эволюции — более высокие уровни обычно более стабильны.)
Это имеет место в синтезе контактных схем (локальное кодирование — три уровня), в структуре языка как такового и в структуре переводческих алгоритмов.
При изучении алгоритмов и способов кодирования информации целесообразно двигаться с двух сторон — сверху и снизу, где меньше переборов, часто не надо проходить все уровни (морфология — потом фраза, а комбинации по 4–5 слов не просматриваются).
Если присмотреться к локальному кодированию О. Б. Лупанова, то там некоторая группа элементов универсальна и она зависит от природы самих элементов (а не от того, что из этих элементов синтезируется), группа элементов приурочена к реализуемому классу функций, группа элементов приурочена к реализуемой индивидуальной функции.
Очень целесообразно внимательно сопоставить алгоритмы, возникающие в дискретной математике для переработки строго формализованной информации, и алгоритмы МП и вообще большие алгоритмы для переработки неформализованной информации.
Сам факт формализованности информации от особенностей алгоритма, который с ней работает, далек. Алгоритм использует структурные связи, как локальные, так и глобальные, заданные в кодировке информации, причем тоже несколько обобщенно и огрубленно. Вероятно, можно выделить несколько типов структур кодирования информации и информационных связей. Применительно к этим структурам надо установить алгоритмы, работающие с этой информацией. При этом характер иерархичности информационных связей имеет много большее значение, чем индивидуальные особенности кодировки. Можно подозревать, что это некоторым образом навязывает структуру анализирующих и синтезирующих алгоритмов, связанных с этой информацией.
Например, синтез контактных схем связан с тем, что схема характеризуется еще и топологией. Вопросы, связанные с кодированием ДНФ, связаны скорее с тем, что структура ДНФ определяется метрическими и комбинаторными соотношениями между гранями куба, где ДНФ = 1. Анализирующие и синтезирующие алгоритмы в МП сильно зависят от того, насколько язык синтетический или аналитический. Алгоритмы таких задач, как коммивояжера, назначение, расписание,— в значительной мере определяются соотношениями между локальными и глобальными связями.
Было бы очень интересно типизировать алгоритмы в зависимости от классов решаемых задач, в частности, порядок просмотра информации, характер неустранимых переборов, каким количеством исходных данных определяется промежуточный результат.
В каждом алгоритме окончательная информация получается из исходной с несколькими промежуточными этапами. Вопрос, сколько ступеней, на какое подмножество исходных данных опирается промежуточный результат. Конечно-разностные схемы, комбинаторные алгоритмы, лингвистические алгоритмы. Поиск эмпирических общих явлений, потом общие соображения, а может быть, аналогии, которые полезно использовать”.
“Алгоритмы МП — это частный, но очень важный случай алгоритмов перекодирования, которые встречаются в очень разнообразных задачах кибернетики. Избыточность кодирования языка дает возможность избегать переборов и получать относительно однозначные результаты, по возможности хорошие. Причем анализировать приходится тот материал, который дан, поэтому здесь необходим учет разнообразных возможностей. При синтезе целесообразно обыгрывать избыточность для получения таких фраз, которые конструируются возможно более единообразно и просто — при условии правильности. Поэтому, с моей точки зрения, многозначность анализа и многозначность синтеза в МП играют разную роль. Было бы целесообразно иметь некоторые формализованные языки для записи алгоритмов так, чтобы на этих языках можно было бы описывать как алгоритмы над модельными объектами, так и над реальными для того, чтобы родство строения алгоритмов сделать более явным”.
Следующий отрывок из работы [12], бесспорно, относится не только к работам по автоматизации перевода.
Изучение модельных объектов в теоретической кибернетике можно характеризовать следующим образом.
Рассматриваются некоторые классы управляющих систем (УС), т. е. агрегатов, работающих с информацией, строение и функционирование которых точно описано. Таким образом, эти классы УС являются строго определенными математическими объектами.
Изучаются алгорифмы переработки информации (АПИ), осуществляемые этими УС, соотношения между строением и функционированием этих УС, методы анализа или синтеза УС соответствующего класса. Характерной особенностью такого подхода является стремление к получению точных оценок, к выявлению оптимальных алгорифмов, установлению существования или несуществования определенных алгорифмов в некоторых строго описанных классах алгорифмов, к выяснению трудоемкости алгорифмов, решающих некоторые задачи, наконец, к построению алгорифмов в некотором смысле наилучших, полностью использующих данную информацию.
Изучение экспериментальных объектов можно характеризовать так.
Рассматривается некоторый класс УС или АПИ. Конструируются некоторые индивидуальные объекты рассматриваемого класса, и для этих объектов выясняются те или иные их функциональные возможности — или общие характеристики. Таким образом, с внешней или формальной стороны задачи близкие, хотя подходы к ним весьма различные. Однако возможность сопоставлений результатов этих двух направлений определяется отнюдь не их внутренними методами, а постановками задач и теми общими явлениями, которые выясняются в интегральной картине. Таким образом, начинать нужно с сопоставления тех общих явлений, которые обнаруживаются как в теоретических, так и в экспериментальных исследованиях. Заметим, что по мере продвижения в таких сопоставлениях оказывается, что глубина сопоставлений возрастает, и в некоторых случаях становится возможным сопоставлять не только структуру окончательных результатов, но и идейную сторону конструкций, используемых при доказательствах или экспериментах. Заметим, что модельные объекты, изучаемые в теории, выбирались так, чтобы, с одной стороны, они допускали отчетливое описание, с другой стороны, обладали многими характерными свойствами некоторых реальных объектов, с которыми приходится иметь дело либо в практических приложениях, либо в экспериментальных работах. Однако впоследствии изучение модельных объектов стало самоцелью и привело к весьма интересным теоретическим результатам. В то же время, сфера практических приложений кибернетических идей, а также область экспериментально-кибернетических исследований сильно расширилась. Первоначальная близость теоретических и экспериментальных исследований в значительной мере нарушилась, тогда как идейное родство этих областей по-прежнему имеет место, хотя даже специалисты-кибернетики его далеко не достаточно полно осознают. Целесообразно привлечь внимание к этой внутренней идейной близости теоретических и экспериментальных работ в области кибернетики”.
©1997-98 Лаборатория Конструирования и Оптимизации Программ
Институт Систем Информатики CO PAH
Web master webmst@pcosrv.iis.nsk.su