В. П. Чепига

ПРОБЛЕМА «РОМЕН ГАРИ - ЭМИЛЬ АЖАР»: АТРИБУЦИЯ РОМАНОВ, ОПУБЛИКОВАННЫХ ПОД ПСЕВДОНИМОМ ЭМИЛЬ АЖАР

Работа представлена кафедрой романской филологии Санкт-Петербургского государственного университета.

Научный руководитель - доктор филологических наук, профессор М. А. Марусенко

В статье рассматриваются результаты атрибуции трех романов, опубликованных под псевдонимом Эмиль Ажар, с помощью метода распознавания образов, который предусматривает применение многомерной классификации и описания индивидуального авторского стиля в синтаксическом аспекте. Впервые данный метод применяется на материале современного французского языка.

The article considers the results of attribution of the three novels published under the pseudonym Emile Aj ar by means of the method of pattern recognition. This method provides application of multivariate classification and description of the author’s individual style in the syntactic aspect. For the first time the method is applied by the material of the modern French language.

Ромен Гари (1914-1980), являясь одним из крупных французских писателей XX в., привлекает внимание как широкого круга читателей, как и исследователей прежде всего своей экспериментальной деятельностью в области художественной литературы.

Наибольший интерес вызывает проблема авторства романов, написанных под

псевдонимом Эмиль Ажар. В период с 1974 по 1980 г. литературными критиками и сотрудниками издательских домов «Галли-мар» и «Меркюр де Франс» не ставилась под сомнение непринадлежность четырех произведений Э. Ажара Ромену Гари, хотя они вычитывали и публиковали параллельно произведения как Р. Гари, так и Э. Ажара.

Романы, написанные Ажаром, считали творением Р. Кено, Л. Арагона и М. Тур-нье, Ж. Ланцмана, работой коллектива авторов. Затем - П. Павловича, племянника Р. Гари.

После выхода в свет романа П. Павловича «Человек, которому верили»1, а также посмертной публикации Р. Гари «Жизнь и смерть Эмиля Ажара»2 литературный мир потряс тот факт, что Р. Гари и Э. Ажар являются одним и тем же человеком, к тому же Р. Гари оказался единственным писателем, получившим два раза Гонкуровскую премию.

Работы по атрибуции псевдонимных романов Э. Ажара сводятся к одному диссертационному труду 1998 г., проведенному польским исследователем А. Павловски, который использовал модель временных рядов3. Результатом работы стала атрибуция четырех произведений Э. Ажара Ромену Гари. При этом исследователь не учитывал жанровое несоответствие романов Э. Ажара и привлек в качестве потенциальных авторов ряд современников Р. Гари, основываясь только на газетных заметках того времени, появившихся до установления того факта, что в данной литературной «мистификации» участвовал П. Павлович, исполнявший роль Э. Ажара.

Таким образом, по результатам истории вопроса и исследования архивных документов мы сталкиваемся с сосуществующими противоречащими точками зрения, разрешение которых должно быть достигнуто путем проверки различных гипотез. При этом нулевую гипотезу можно формулировать следующим образом: (Н() - все тексты романов Э. Ажара полностью принадлежат Р. Гари. Соответствено, альтернативные гипотезы будут выглядеть так: ( Н\ ) - тексты романов Э. Ажара являют-

ся произведением П. Павловича и ( И2а ) -тексты романов Э. Ажара являются совместным произведением Р. Гари и П. Павловича с определенной долей участия каждого из них. Естественно, что вопрос об атрибуции того или иного романа Э. Ажара решается в каждом случае индивидуально.

Для практической реализации этой процедуры необходимо располагать минимум двумя объектами, принадлежащими к двум разным классам, известным заранее4. В нашем исследовании такими классами являются классы Qj (Gary) и Q2 (Pavlowitch).

Исходя из требования соблюдения синхронии и жанрово-стилистической однородности текстов, корпус текстов, используемых для определения координат эталонов классов, имеет следующую структуру (табл. 1):

Таблица 1

Состав и объекты априорных классов

Класс Код Произведения Год издания Объем авторской речи (N»)

Ü1 (Gary) 1G Gary R. Au-delà de cette limite 1975 5233

votre ticket n'est plus valable.

2G Gary R. Clair de femme. 1977

3G Gary R. Les Cerfs-volants. 1980

0.2 (Pavlowitch) 1P Pavlowitch P. Un autre monde. 2004 5200

2P Pavlowitch P. Tom. 2005

Относительно сформированных апри- стов), написанных под псевдонимом

орных классов будет производиться клас- Эмиль Ажар, подлежащих распознаванию

сификация многомерных объектов (тек- (табл. 2):

Таблица 2

Атрибутируемые объекты

Код Наименование Год издания Объем авторской речи (N»)

1A Gros-Câ lin 1974 1449

2A La Vie devant soi 1975 2394

3A L'Angoisse du roi Salomon 1979 3078

Из текстов каждого автора, входящих в табл. 1, были сделаны случайные предварительные выборки объемом 200 предложений, для каждой из которых были определены значения 54 параметров из исходного набора5. В соответствии с использующейся процедурой атрибуции следующим этапом является выделение из априорного набора параметров, способных разделять априорные классы. Результаты проверки

существенности разности средних для двух априорных классов с помощью /-критерия Стьюдента (формула 1) приведены в табл. 3.

Х1 - х2

1/2

(1)

Таблица 3

Проверка статистической гипотезы существенности разности двух средних

п

п

1

2

Параметр Q(Gary)/ Q(Pavlowitch) Параметр Q(Gary)/ Q(Pavlowitch)

^набп. Ьабп.

X01 1,789 X28 3,262

X02 2,093 X29 2,336

X03 2,944 X30 3,753

X04 0,096 X31 6,160

X05 1,642 X32 0,080

X06 3,506 X33 1,930

X07 3,052 X34 1,372

X08 3,038 X35 1,016

X09 1,418 X36 0,936

X10 1,000 X37 1,076

X11 5,193 X38 0,161

X12 1,926 X39 0,453

X13 1,733 X40 0,980

X14 1,807 X41 0,112

X15 1,485 X42 0,814

X16 1,662 X43 0,902

X17 1,160 X44 1,306

Х18 0,535 Х45 1,893

Х19 6,971 Х46 1,517

Х20 4,382 Х47 1,260

Х21 4,816 Х48 0,000

Х22 1,555 Х49 0,539

Х23 4,292 Х50 0,372

Х24 2,842 Х51 1,669

Х25 3,386 Х52 1,556

Х26 1,740 Х53 1,477

Х27 0,537 Х54 1,867

Из табл. 3 видно, что статистически зна- Х20, Х21, Х23, Х24, Х25, Х28, Х29, Х30, Х31,

чимой является разность средних для пара- для которых наблюдаемые значения /-кри-

метров Х02, Х03, Х06, Х07, Х08, Х11, Х19, терия превышают критические (/005 = 1,96).

На втором этапе из подмножества шестнадцати параметров удалось выделить подмножество из трех параметров, удовлетворяющих требованиям сильной корреляции с другими параметрами совокупности и способности к разделению объектов на классы. Таким образом, рабочий словарь параметров распознающей системы по атрибуции романов Э. Ажара включает

3 диагностических параметра: Х23 - число предлогов; Х24 - число союзов; Х28 - число прямых дополнений.

Поскольку произведения, входящие в корпус текстов (табл. 1), значительны по объему и сплошное статистическое обследование не является целесообразным, следующим этапом процедуры определения координат эталонов классов является оп-ределение объема выборки6 (формула 2), результаты которого представлены в табл. 4-5.

п = ----, (2)

1 +

2

N

где V= — x

V

Vx= т-л/КА

Vn

5 - выборочное среднее квадратичное отклонение, /- доля отбора, х - выборочное среднее значение признака для совокупности; V - относительная стандартная ошибка, которая показывает, сколько процентов от истинного значения составляет стандартная ошибка оценки.

При V- =0,05 стандартная ошибка состав-

ляет только 5% величины оцениваемого параметра.

Анализ данных таблиц показывает, что в каждом классе необходимый объем выборки для различных параметров варьирует в широких пределах. Например, для объекта 1Р для параметра Х23 необходим минимальный объем выборки (п = 1023), а для определения значения параметра Х24 с V = 0,05 необходима выборка объемом в 1861 предложение. Произведя случайную выборку в 1861 предложение, мы с доста-

Таблица 4

Определение объема выборки для объектов класса Ц (Gary)

Код произведения Параметр Xi СТ/ n(Vx = 0,05)

1G Х23 2,970 2,588 688

Х24 1,090 1,443 1034

Х28 1,640 1,432 690

N=1680

2G Х23 1,930 1,833 589

Х24 0,810 0,961 695

Х28 1,430 1,328 578

N=1026

3G Х23 3,600 2,741 658

Х24 1,040 1,127 1053

Х28 1,720 1,386 715

N=2527

Таблица 5

Определение объема выборки для объектов класса П2 (Pavlowitch)

Код произведения Параметр xi i П(Ух=0,05)

1P X23 1,600 1,596 1023

X24 0,450 0,783 1861

X28 1,870 0,991 1214

N=3100

2P X23 2,340 2,903 1112

X24 0,530 0,822 1339

X28 0,870 0,960 989

N=2100

точной точностью определим значение параметра Х24, а значения остальных параметров будут измерены с заведомо избыточной точностью. Результаты обработки данных, полученных методом случайной выборки, представляющие собой коорди-наты эталонов классов на нулевой итерации, приведены в табл. 6.

Таблица 6

Координаты эталонов классов на 0-й итерации

Параметр Класс

О^гу) Q0(Pavlowitch)

-1 О i -1 О i

X23 2,281 2,350 1,525 1,712

X24 0,856 1,139 0,401 0,714

X28 1,431 1,284 0,779 0,898

N=2782 N=3200

Следующим этапом процедуры распознавания является определение координат распознаваемых объектов (трех романов Э. Ажара). Статистические характеристики распределений параметров для всех атрибутируемых объектов приведены в табл. 7.

Таблица 7 Координаты атрибутируемых объектов

Объект Параметр Х1 О i N

X23 3,090 3,198 2394

X24 1,250 1,520

X28 1,430 1,451

2A X23 2,160 1,873 1449

X24 1,710 1,578

X28 1,780 1,433

3A X23 2,150 2,492 3078

X24 1,160 1,376

X28 1,570 1,533

В соответствии с применяемым алгоритмом атрибуция производится в два этапа: при помощи детерминированного алгоритма распознавания, затем, после остановки последнего, при помощи вероятностного алгоритма распознавания. В описываемом эксперименте остановка детерминированного алгоритма распознавания произошла на 0-й итерации.

После остановки детерминированного алгоритма все три атрибутируемых объекта оказались не отнесенными ни к одному

априорному классу. Реализация вероятностного алгоритма распознавания предусматривает преобразование исходной матрицы данных в матрицу евклидовых расстояний между объектами, подлежащими распознаванию, и эталонами априорных классов (табл. 8).

Таблица 8

Матрица евклидовых расстояний между классами и ^атрибутированными объектами

а (х.., о,)

Объект

Класс 3A 4A

0,900 0,931 0,359

□2 1,986 1,766 1,262

Следующим этапом процедуры вероятностного распознавания является формирование решающего правила, при котором происходит приписывание вероятности или достоверности каждому решению, что делает возможным решать любую задачу отнесения объектов к априорным классам. Вероятность принадлежности _)-го объекта к 1-му классу (табл. 9) вычисляется на основе матрицы евклидовых расстояний между объектами и априорными классами по следующей формуле:

( \~1

Р.. =--------- л а..

1

(3)

У

где А - расстояние между _)-м объектом и ьм классом, . - расстояние между _)-м объектом и остальными классами классификации7.

Таблица 9 Матрица вероятностей принадлежности объектов априорным классам Р(Х, еП.)

Р(X, еП.)

Объект

Класс 2A 3A

0,678 0,655 0,778

^2 0,322 0,345 0,222

При наличии двух априорных классов решающее правило может быть сформулировано как:

X. ёП. , p[x. е Q2 )> | p{x. eQ2).

2 2 Таким образом,

n = 1

X . е Q . , Pi X . e Q . I> 0,5 ,

1 j V 1 j )

т. e. при данном решающем правиле пороговое значение вероятности принадлежности объекта к одному из априорных классов должно превышать 0,5. По данным табл. 9, классу Q (Gary) могут быть атрибутированы все три объекта: A1 (Gros-CBlin), A2 (La Vie devant soi) и A3 (L’Angoisse du roi Salomon).

Правильность и правомочность полученных результатов после проведения вероятностной атрибуции необходимо проверить, проведя оценку однородности априорного класса по сравнению с априорным классом. Критерием однородности служит средний квадрат расстояния между объектами d (Q^) . Построим матрицу

евклидовых расстояний между объектами априорного класса (табл. 10).

В качестве мер близости между объектами одного класса Q p = 1, 2, ..., m обычно используют величину, называемую среднеквадратичным разбросом объектов внутри класса Q :

S (ф =

kp kp _l k=1 ki =1

kp kp 2 ¿ ¿ d . ,ю,

pk, pi

(4)

Качество классификации считается тем выше, чем теснее расположены объекты внутри класса.

Таблица 10 Матрица евклидовых расстояний между объектами априорного класса fl1 (Gary)

Объект d ( Xi, Xj )

Объект

1G 2G 3G

1G Q,QQQ 1,379 Q,243

2G 1,379 Q,QQQ 1,541

3G Q,243 1,541 Q,QQQ

С помощью формулы 4 вычислим среднеквадратичный разброс для объектов класса Ц (Gary): S (^3) = 1,523.

Построим следующую матрицу данных, объединив исходные данные трех объектов, составляющих класс Q1 (Gary), и всех трех атрибутируемых Гари объектов по вероятностной атрибуции (табл. 11).

Таблица 11 Матрица евклидовых расстояний между объектами апостериорного класса ..

1 1 Gary, Ajar

Объект d ( Xi, Xj )

Объект

1G 2G 3G 1A 2A 3A

1G Q,QQQ 1,379 Q,243 Q,8Q1 1,385 1,QQ8

2G 1,379 Q,QQQ 1,541 1, 15Q 1,389 Q,914

3G Q,243 1,541 Q,QQQ 1,499 1,552 1,218

1A Q,8Q1 1,15Q 1,499 Q,QQQ Q,789 Q,318

2A 1,385 1,389 1,552 Q,789 Q,QQQ Q,95Q

3A 1,QQ8 Q,914 1,218 Q,318 Q,95Q Q,QQQ

С помощью формулы (4) вычислим среднеквадратичный разброс для объектов апостериорного класс^Ц^ АшгS (Ц5) = 1,148

Gary, Ajar '_*-

Поскольку S (^) > S (ßr

), МОЖ-

r

Ъ' ^ ' Ошгу, ААшг ‘

но сделать вывод о том, что полученная классификация объектов улучшилась и близка к естественной, что подтвердило результаты работы вероятностного алгоритма и принадлежность априорному классу трех атрибутируемых объектов.

Представим полученные данные в виде матрицы решений, где 0 - отказ от распознавания, 1 - положительное решение по детерминированному алгоритму атрибуции, 1 *

1 - положительное решение по вероятностному алгоритму атрибуции (табл. 12).

Таблица 12

Матрица решений

Код Наименование Ü1 (Gary) Ü2 (Pavlowitch)

1A Gros-Calin 1* Q

2A La Vie devant soi 1* Q

3A L'Angoisse du roi Salomon 1* Q

В результате проведенного исследования была подтверждена гипотеза (#0): тексты романов Э. Ажара полностью принадлежат Р. Гари. Таким образом, атрибутируемые объекты были приписаны априорному классу Qj (Gary) и был сформирован апостериорный класс QGary Ajar, показавший высокую степень однородности.

Были опровергнуты сформулированные во второй главе гипотезы ( H) и ( H а ), согласно которым тексты романов Э. Ажара являются произведением П. Павловича ( H1 ) или совместным произведением

Р. Гари и П. Павловича с определенной долей участия каждого из них ( H2 ).

Представляется возможным отойти от рассмотрения Р. Гари и Э. Ажара как одного человека, творившего под двумя разными псевдонимами, и разграничить такие термины, как «писатель» и «автор». Данное разграничение предложено французским литературоведом Ф. Вернье. Так, писателем она предлагает признать индивидуума, писательство для которого является профессиональной деятельностью. У такого человека есть личная, творческая, социальная история, к которой мы можем обратиться в литературоведческом исследо-

вании. Автора же можно рассматривать как личность, которая раскрывается путем исследования конкретного литературного наследия, стилистики, интенциональности его произведений8. Если принять данную точку зрения, то мы можем рассматривать Р. Гари и Э. Ажара как двух разных авторов, объединенных одним писателем - Роменом Гари.

Тот факт, что все результаты получены путем вероятностной атрибуции, может быть интерпретирован следующим образом: Р. Гари, скрывавший свое авторство, намеренно старался изменить стиль с тем, чтобы его мистификация не была сразу же разгадана. Именно этим может объясняться отсутствие результатов детерминированной атрибуции. Но поскольку писатель не может значительно изменять характеристики латентных синтаксических структур при создании больших объемов текста, то вероятностная атрибуция смогла однозначно указать на истинного автора.

Результаты исследования служат еще одним показателем того, что характеристики индивидуального авторского стиля носят объективный характер и не зависят от воли пишущего.

ПРИМЕЧАНИЯ

1 Pavlowitch P. L’Homme que l’on croyait. P.: Fayard, 1981.

2 Gary R. Vie et mort d’Emile Ajar. P.: Gallimard, 1981.

3 Pawiowski A. Srnies temporelles en linguistique avec application a l’attribution de textes: Romain Gary et Emile Ajar. P.: H. Champion, 1998.

4 Марусенко М. A. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов. Л.: Изд-во ЛГУ, 1990. С. 129.

5 Там же. С. 71-74.

6 В поисках потерянного автора: Этюды атрибуции / М. А. Марусенко, Б. Л. Бессонов, Л. М. Богданова и др.; Под ред. М. А. Марусенко. СПб.: Фил. фак-т СПбГУ, 2001. С. 14-15.

7 Терехина А. Ю. Анализ данных методами многомерного шкалирования. М.: Наука, 1986. С. 153.

8 Vernier F. L’ange de la throrie // Paragraphes. Montrnal: Presses universitaires de Montrnal, 2004. P. 120-122.