Научное исследование абстрактного искусства

Михаил Симкин

(Эта статья опубликована в апрельском (2007 г.) номере журнала Химия и жизнь. Английская версия опубликована в июньском (2007 г.) номере журнала Significance, издаваемого Королевским статистическим обществом.)

Он посоветовал играть в гольф,- но в конце концов согласился дать мне средство, которое  "не  могло не  подействовать";  и, подойдя к шкафу,  достал из него бутылку  с  лиловато-синими  капсулами,   опоясанными   с   одного   конца темно-фиолетовой  полоской.  Это было, по его словам, новое средство, только что выпущенное в продажу и предназначавшееся не для  невротиков,  которых можно  успокоить  и  должным образом прописанным стаканом воды, а только для великих бессонных художников, которым необходимо умереть на несколько  часов,  чтобы жить в веках.

--Владимир Набоков, Лолита

А сами-то бессонные художники действительно великие, или они просто  должным образом прописаны?

Что бы это проверить, я написал интернет-тест Шедевр или пародия? [1]. Он состоит из дюжины картин. Одни из них - это истинные шедевры абстрактного искусства, созданные бессмертными мастерами. Остальные же - это смехотворные пародии, нарисованные лично мной. Тестируемые должны определить, что есть что.

Помимо результатов теста, которые автоматически записывались, иногда я получал отклики. Один профессор из Корнельского университета  прислал такое замечание: «Я заметил, что картина №2 была похожа на Мондриана, но мне показалось, что в ней не было чувства равновесия, свойственного хорошим образцам современного искусства.» Очевидно, искусство Мондриана теряет равновесие, когда его разлучают с его тяжеловесным именем. Даже искусствоведы не уверены, что они могут отличить истинное искусство от мазни: «У меня 92%. Какое облегчение: я ведь пишу об искусстве.» При таких обстоятельствах не удивительно, что иногда тест вызывает злобную реакцию. Один нью-йоркский художник отозвался так: «Поди ты (непристойность), и возьми с собой свой  (непристойность) учёный тесссссссссссссссссст!» (Вольный перевод автора с такого оригинала: “Go [profanity] yourself and your [profanity] academic quizzzzzzzzzzzzzzzzzz.”) Как-будто в ответ на эту попытку меня запугать, один из моих читателей написал: «Уважаемый мистер Симкин, продолжайте это дело.» Я так и поступил.

Фигура 1. Гистограмма результаттов, полученных 56,020 тестированных. Средний результат - 7.91 из 12 или 65.9% правильных ответов. В базе данных было 71,456 результатов теста. Однако, многие тестирущиеся сделали несколько попыток.  Я очистил данные от вторичных попыток, сохранив только первый результат пришедший с каждого IP адреса. После этой чистки осталось 61,121 результатов. После этого я очистил данные от результатов, где один или более из вопросов были пропущены. После этого осталось 56,020 результатов.

Распределение результатов, полученных более пятьюдесятью тысячами тестированных, показано в Фигуре 1. Средний результат - 7.91 из 12, или 65.9% правильных ответов. Поскольку на каждый вопрос есть только два возможных ответа, то простое гадание дает, в среднем, 50%. Наши тестируемые выступили только немного лучше, чем если бы они  действовали методом тыка.

Наши тестируемые провалили тест, но, возможно, это произошло потому что они -  толпа мещан, интересующихся только материальными сторонами жизни и вульгарных во вкусе? Я с ними лично не знаком, поскольку тестирование проходило по интернету. Однако, тестирующая программа [2] записывает IP адреса тестируемых. По ним можно определить где находился компьютер, на котором выполняли тест. Это позволило мне отобрать результаты, полученные людьми из элитных мест. Для элитного анализа я выбрал Ivy League (группа из восьми старых и престижных университетов США) и Oxbridge (Оксфорд и Кэмбридж). Этот выбор обусловлен если и не  какой-либо другой причиной, то хотя бы тем, что я отбывал срок в этих местах. Гистограмма результатов, полученных 143-мя избранными, показана в Фигуре 2, а их распределение по элитным университетам дано в Таблице 1. Средний элитный результат - 8.5 из 12 или 71% правильных ответов. Сравнивая средние результаты и распределения результатов, показанные в Фигурах 1 и 2, мы видим, что особой разницы между толпой и элитой нет.

Фигура 2. Гистограмма результаттов, полученных 143-мя избранными.  Распределение избранных  по элитным университетам дано в Таблице 1. Средний результат - 8.5 из 12 или 71% правильных ответов.

Таблица 1. Распределение избранных  по элитным университетам.

Элитный университет

Число тестировавшихся

Результат

минимальный

максимальный

средний

Брауновский ( Brown )

5

7

11

8.8

Гарвардский ( Harvard )

22

5

11

8.8

Дартмуский ( Dartmouth )

6

7

9

8.0

Йельский ( Yale )

12

8

12

9.3

Колумбийский ( Columbia )

28

5

11

8.3

Корнельский  ( Cornell )

7

5

11

8.0

Кэмбриджский ( Cambridge )

24

3

12

8.4

Оксфордский ( Oxford )

24

3

10

8.2

Пенсильванский ( Penn )

8

7

10

8.5

Принстонский ( Princeton )

7

7

11

8.6

Все вместе

143

3

12

8.5

Хотя результаты наших тестированных и не высоки, они, все-таки, лучше случайного гадания. Последнее дало бы в среднем 6 из 12, или 50%, правильных ответов. Значит ли это что между абстрактными шедеврами и пародиями разница, хоть и маленькая, но всё-таки есть? Наверное нет. Из откликов я знаю, что многие люди, еще до прохода теста, видели шедевры, использованные в тесте, отмеченные как таковые. Например, я получил такой отклик: «Я дал этот тест моему старшему сыну, который преподаёт скульптуру в Финской академии искусств. К моей досаде он не только смог отличить искусство от мусора, но и назвал имена всех художников.» Другая успешная стратегия хорошо резюмирована в следующем отклике: «Я получил 100% по Вашему тесту. Почему? Потому что я мгновенно мог определить что было создано на компьютере, а что на холсте.»

Тот факт, что многие тестированные ранее видели часть шедевров, можно установить и с помощью статистического анализа результатов теста. Средний результат 65.9% означает, что средняя картина была правильно определена как шедевр (или как пародия) в 65.9% случаев. Интересно, что число правильных определений распределено неравномерно между шедеврами и пародиями. Шедевры были правильно определены, как таковые, в pш = 67.5% случаев, в то время как пародии были правильно определены, как таковые, в pп   = 64.3% случаев. Стандартная ошибка как в pш так и в pп равна примерно 0.1%, поэтому разность pш pп = = 3.2% статистически значима. Если тестируемый ранее видел картину в галерее или альбоме, то он, очевидно, выберет ее как шедевр. Если он не видел ее раньше, то он вынужден использовать другие критерии, как, например,  создана на компьютере, или на холсте. Очевидно, что никто из тестируемых не видел ранее ни одной из пародий. Логично предположить что вероятность правильного определения пародии равна вероятности правильного определения шедевра в случае если его ранее не видели. Отсюда можно определить часть,  f, шедевров, которую средний тестируемый видел перед тестом. Вероятность (pш) правильно определить шедевр можно разбить на два слагаемых. Если тестируемый его видел (что происходит с вероятностью f),  он его правильно определяет с вероятностью 1. Если тестируемый его не видел (что происходит с вероятностью 1 - f), он его правильно определяет с вероятностью pп. Следовательно: pш = f + (1 - f) pп, откуда получаем:  f = (pш pп) / (1 – pп) = 9%.

Хотя результаты теста и предвзяты в пользу шедевров, я возьму их как есть и постараюсь количественно  определить разницу в качестве между картинами, использованными в тесте. В Таблице 2 для каждой картины дана часть тестируемых, принявших ее за шедевр. Самая высоко-котирующаяся картина была признана шедевром восемьюдесятью процентами тестируемых, а самая низко-котирующаяся – только семнадцатью процентами. Что это говорит о разнице в качестве?

Таблица 2. Для каждой картины указана частота, с которой тестируемые принимали её за шедевр. Художественный вес картин определен подгонкой к данным Урбана.

Номер картины

Художник

Частота выбора шедевром

Художественный вес

(в художественных граммах)

9

Кандинский

0.79

103.4

2

Мондриан (Mondrian)

0.76

102.9

8

Роско (Rothko)

0.75

102.7

12

Альберс (Albers)

0.67

101.9

4

Малевич

0.61

101.2

6

пародия

0.58

100.8

1

Клее (Klee)

0.46

99.4

10

пародия

0.39

98.0

11

пародия

0.37

97.7

3

пародия

0.36

97.5

7

пародия

0.28

95.9

5

пародия

0.17

93.8

Сто лет назад психолог Ф.М. Урбан (F.M. Urban) провел классическое исследование  чуть-заметных разностей [3]. Он попросил участников своего эксперимента сравнить контрольный сто-граммовый груз с набором грузов разного веса. Когда веса грузов были близки, участники эксперемента судили очень неточно. Однако, статистически, легкий вес казался им тяжелее менее чем в половине случаев. Например,  92, 100, и 104 грамма казались тяжелее, чем 100 грамм в 10%, 50%, и 84% попыток соответственно. Я определил вес гипотетической картины, которая выбирается как шедевр  50% тестируемых, как 100 грам. Затем, интерполируя данные Урбана, я определил «веса» всех картин, использованных в тесте  (смотрите Фигуру 3). Они даны в правой колонке Таблицы 2.

Фигура 3. Маленькие чёрные ромбы – это данные Урбана о частоте суждений “тяжелее” для различных грузов (с контрольным грузом  100 грамм).  Линия – это интерполяция этих данных.  Крупные символы представляют картины, использованные в тесте.  “Вес” картин был подогнан, чтобы символы попали на интерполяционную линию.

Разность в весах между легчайшей (93.8 г.) и тяжелейшей (103.4 г.) картинами всего 10%. Для сравнения, в тяжелой атлетике люди, весящие между 94 и 105 килограммами, принадлежат к той-же весовой категориии [4]. Следовательно, все картины, использованные в тесте, находятся в одной весовой категории. Единственная разница между шедеврами и пародиями состоит в тяжеловесных именах, висящих на шедеврах.

Литература:

  1. Михаил Симкин,  True art or fake?  (опубликован 4 сентября 2003 г.).  Русский вариант теста, Шедевр или пародия? , был опубликован 24 февраля 2006 г.
  2. Я слегка изменил  Quiz-o-matic PHP script, который написал  Matt Hughes.
  3. Ф.М. Урбан, «Применение статистического метода к проблемам психофизики», Издательство психологической клиники, Филадельфия, 1908. (F.M. Urban, “The application of statistical method to problems of Psychophysics”, The Psychological Clinic Press, Philadelphia, 1908)
  4. «Весовые категории», Британская энциклопедия (Weight categories,  Encyclopædia Britannica)

The Chronicle of Higher Education: Weighing the beauty of fake art

Neue Zürcher Zeitung: Mein Statistiker hätte das malen können