» » «Мягкая» семантическая сегментация изображений. Программа и тезисы докладов Космология и оптика: к истории одного эксперимента

«Мягкая» семантическая сегментация изображений. Программа и тезисы докладов Космология и оптика: к истории одного эксперимента

В Сети появилось несколько вариантов салона обновленной Lada Vesta. Изображения в одном из своих видео показал блогер VsyakoRazno . По информации его подписчика, который и прислал рендеры, эскизы были сделаны в рамках питерской закрытой презентации для дилеров АвтоВАЗа. На мероприятии проходило обсуждение проекта Lada Vesta 2020 модельного года.

Ранее "РГ" салон обновленной Lada Vesta, но изображение не отличалось четкостью, теперь же рендеры стали доступны в более высоком качестве.

Появилась возможность рассмотреть в деталях сразу два варианта исполнения интерьера. Первый выполнен в черно-оранжевом стиле, второй - в черно-бежевом. Стоит отметить, что это возможные варианты нового салона, которые дают общее представление об изменениях в будущей модернизации.

Lada Vesta после фейслифта получит полностью новые переднюю панель, дверные карты и центральный тоннель пола. Особенностью салона станет огромный "парящий" планшет мультимедийной системы, который объединен с блоком климатической установки. В нижней части центральной консоли предусмотрена большая ниша для смартфона (будет доступна опция беспроводной зарядки).

Изменен дизайн рычага механической коробки, а возле закрытой секции с подстаканниками, как на автомобилях классом выше, можно заметить кнопку электронного ручника и, предположительно, шайбу-селектор выбора режима движения Lada Ride Select. Сиденья и подлокотник остались прежними, зато руль изменился по дизайну и стал меньшего диаметра, комбинация приборов теперь с двумя колодцами и большим дисплеем бортового компьютера. Изменилась также форма дефлекторов, ручек открывания дверей и декоративных элементов.

Фото: скриншот с www.youtube.com

Помимо абсолютно нового интерьера, по канонам фейслифта Lada Vesta 2020 получит свежий экстерьер - новые бампера и решетку радиатора, иной рисунок передней оптики и задних фонарей, а также диски с измененным дизайном.

Появление модернизированной Lada Vesta Facelift ожидается в 2020-ом году, а не в следующем году, как об этом сообщалось ранее.

Напомним, в конце 2019 года Lada Vesta получит вариатор Jatco JF015E японского производства. Известно, что АвтоВАЗ активно ведет работы по проекту Lada Vesta FL, а это значит, что новая коробка дебютирует уже на фейслифтинговой модели.

К 2020-му году моторная гамма Vesta будет представлена тремя силовыми агрегатами, и таким же количеством коробок. Вазовские 1,6 и 1,8-литровые двигатели мощностью 106 и 122 л.с. соответственно никуда не денутся, к ним добавится 114-сильный "ниссановский" мотор HR16 объемом 1,6-литра. На выбор будет доступна 5-ступенчатая "механика" (МТ), а также "робот" (АМТ) и вариатор (CVT).

Напомним, серийное производство Lada Vesta стартовало в сентябре 2015 года на заводе "Lada Ижевск". На сегодняшний день семейство состоит из седана Vesta, универсала Vesta SW, их "кросс" модификаций, а также битопливной Vesta CNG. Ожидается появление "заряженных" и . В гамму двигателей входят два вазовских атмосферника объемом 1,6 и 1,8 л, первый развивает 106 л.с., второй - 122 л.с. Двигатели агрегатируются с 5-ступенчатой механической коробкой передач или автоматизированной механической трансмиссией.

Задание 1. Определите, что это за принцип.

Задание 2. К какой группе вы бы отнесли каждое из следующих слов:
голый, живой, колонна, мертвый, остров, слепой, сфера, часовой ?

Задание 3. К какой группе вы бы отнесли слово месяц ?


Подсказка 1

Попробуйте приставить к этим словам слева некоторую общую часть.

Решение

На картинках в таблице схематически изображены разные соотношения «части и целого». Нагляднее всего картинка в первой строке, где закрашена ровно половина круга. Если связать это соображение с тем фактом, что в первой строке дано как раз слово круг , можно догадаться, что речь идёт о разных значениях форманта пол(у)- . Действительно, полукруг и полкило - это ровно половина круга и половина килограмма соответственно. Но не всегда всё так просто.

Полдень и полночь - не половина дня и половина ночи (эти значения выражаются словами полдня и полно чи ), а середина дня и ночи соответственно (сравним английские слова midday и midnight ). На картинке это значение изображено как центр окружности. Полуграмотными обычно называют не тех, кто выучил ровно половину алфавита, а малограмотных, тех, кто почти неграмотен; полуодетыми - тех, кто почти не одет. На соответствующей картинке закрашена лишь четверть круга. Наконец, полузабытый - это не забытый наполовину, а почти полностьюзабытый; полутьма бывает не в комнате, где горит лишь половина лампочек, а там, где почти ничего не видно. Поэтому и на картинке закрашено три четверти круга.

Задание 1. Соответствия картинок и значений пол(у) -:

Теперь попробуем распределить по группам слова из Задания 2.

Рассмотрим сначала существительные. Проще всего со словом полусфера - это действительно ровно половина сферы: . Полуколонна - это полукруглая колонна, выступающая из плоскости стены на половину диаметра: . С полуостровом чуть труднее. Ясно, что половину никакого острова так не называют. Поскольку остров - часть суши, со всех сторон окружённая водой, а полуостров омывается водой с трёх из четырёх сторон, логичнее всего считать, что здесь полу- означает ‘почти’: (хотя это всё-таки не совсем тот случай, что в словах полузабытый или полутьма ; см. чуть подробнее в Послесловии).

Теперь разберёмся с прилагательными. Как видим, в сочетании с ними полу- означает то ‘почти’, то ‘почти не’. Полуголый - это синоним слова полуодетый , то есть тот, кто почти гол, на ком надето существенно меньше, чем нужно: . Полуживой - тот, кто еле жив, почти мёртв: . Полумёртвый - синоним слова полуживой : . Полуслепой - тот, кто почти ничего не видит, почти слепой: . Осталось слово часовой. Заметим, что прилагательное получасовой имеет два значения. Первое означает ‘длящийся полчаса’: получасовой семинар в два раза короче часового. Но есть ещё одно, гораздо более редкое и специальное значение: ‘такой, который происходит в середине часа’. Так, например, на некоторых радиостанциях называют программу новостей, выходящую в 0:30, 1:30, 2:30 и т. д. Получается, что слово получасовой в зависимости от значения можно отнести к двум группам: и .

Сведём ответы в таблицу.

Задание 2.

Задание 3.

Слово полумесяц интересно тем, что оно синонимично слову месяц . Получается, что в этом слове полу- как будто ничего и не означает. На картинке это можно было бы обозначить как . Такие казусы в языке иногда встречаются: можно вспомнить пары синонимов истовый и неистовый , ценный и бесценный или украинские хай и нехай , которые оба обозначают ‘пусть’.

Послесловие

Когда занимаешься семантикой естественного языка, то часто с восхищением обнаруживаешь, насколько сложно устроены значения языковых единиц, внешне вроде бы вполне ясных и прозрачных. К таким единицам относится и словообразовательный формант полу -.

В современном русском языке слова на полу- весьма распространены. Только в словарях их несколько сотен (в Малом академическом словаре русского языка около двухсот), но в реальных текстах их значительно больше: даже в небольшом корпусе нашлось 1500 разных слов на полу- . Почти половина из них - прилагательные, около 40% - существительные, 7% - глаголы (например, полулежать, полуобнять ) и 5% - наречия (например, полувопросительно, полувсерьёз ). Список этих слов распадается на три неравные группы.

Во-первых, можно сказать (около ) полуведра , (не более) полугода и т п. Такие слова представляют интерес для грамматики (не вполне ясно, как у них выглядит форма именительного падежа и есть ли она вообще), но с точки зрения смысла в них нет ничего особенного: полу- здесь означает ‘половина’.

Чаще встречается «парное» полу- . Например: Полупечальное, полунасмешливое выражение промелькнуло у него на лице (И. С. Тургенев). Вспомним и эпиграмму Пушкина: Полу-милорд, полу-купец, / Полу-мудрец, полу-невежда, / Полу-подлец, но есть надежда, / Что будет полным наконец. Такое полу- имеет значение, сходное со значениями парных союзов то ли... то ли, не то... не то : В славянском языческом фольклоре был такой разряд мифологических существ: двоедушники. Полулюди-полунелюди. Полу-"нормальные" - полу-"другие" («Новый Мир»). Его можно присоединять к любым словам и даже к словосочетаниям.

Но самоеинтересное - это изолированные, непарные употребления слов на полу- ; они-то и встречаются чаще всего. Оказывается, такое полу- имеет несколько весьма несхожих и даже иногда противоположных значений.

Как ни странно, тривиальное значение ‘половина чего-либо’ для полу- очень нетипично. Оно обычно встречается в терминах - названиях фигур (полукруг, полуокружность, полукольцо ), единиц измерения (полуакр, полуаршин ), денежных единиц: полузолотник, полуимпериал, полупенсовик и т. п. В большинстве же случаев ситуация сложнее и интереснее.

Вспомним шутку про двух антрепренёров: оптимиста (который радуется, что его театр наполовину полон) и пессимиста (который сетует, что его театр наполовину пуст). Но означает ли слово полупустой ‘наполовину пустой’? Посмотрим примеры: Концертные залы провинциальных городов обычно полупустые, если только не ожидают столичной знаменитости. То же самое с провинциальными оперными театрами, где почти всегда на сцене гораздо больше народу, чем в зрительном зале (Г. Вишневская); В полупустой квартире (Клавка и Ривка умудрились вывезти из нее все что можно!) на кухне шла Большая Мужская Пьянка (В. Кунин); Привела его в маленькую полупустую комнату с голыми стенами, стояли там только обшарпанный канцелярский стол без тумбочек, покрытый зеленым, в чернильных пятнах листом бумаги, и три стула (А. Рыбаков). Хорошо видно, что прилагательное полупустой в этих примерах означает не ‘наполовину пустой’, а, скорее, ‘гораздо более пустой, чем полный’, ‘почти пустой’ (см. рис. 2). Такое значение у прилагательного полупустой выделяют и словари.

Оказывается, это отнюдь не случайность. Значение ‘почти’ полу- выражает в таких словах, как полубезумный, полудикий, полузабытый, полуистлевший, полунищенский, полуобвалившийся, полупьяный, полуразбитый и во многих других. Но не менее часто полу- имеет прямо противоположное значение!

Рассмотрим, скажем, пару прилагательных полуголый и полуодетый , которые встретились в задаче. Первое из них, как мы помним, означает ‘почти голый’: Потом мелькнули дощатые крыши раздевалок и открылся берег, на котором неподвижно лежали сотни полуголых тел (В. Пелевин). Казалось бы, по законам симметрии прилагательное полуодетый должно было бы означать ‘почти одетый’. Однако это совсем не так. Оказывается, что полуодетый всегда означает ‘одетый меньше нормы, почти не одетый’! Ср.: Почти в каждом окне, чередуясь с трехцветными полосами флагов, торчали полуодетые женщины, показывая голые плечи, груди, цинически перекликаясь из окна в окно (М. Горький).

Существуют и другие пары антонимов, которые в соединении с полу- образуют синонимы: полуживой и полумёртвый (оба означают ‘почти мёртвый’), полузаконный и полупреступный (‘почти преступный’), полулегальный и полуподпольный (‘почти нелегальный’), полуизвестный и полузабытый (‘почти забытый’) и т. п. Можно ещё привести такой пример - полулюди (‘почти не люди’) и полузвери (‘почти звери’): А вокруг него сброд тонкошеих вождей, Он играет услугами полулюдей (О. Мандельштам) и Полузвери, сумасшедшие дикари (А. и Б. Стругацкие).

Вот что при этом особенно интересно: синонимия в таких случаях достигается не за счет того, что оба слова указывают на середину некоторой шкалы, как в той шутке про антрепренёров, - а за счет того, что полу- в этих случаях имеет два противоположных значения - ‘почти’ и ‘почти не’. Получается, оба слова на такой шкале сдвинуты к одному полюсу (например, к полюсу «неодетости» в случае полуголый и полуодетый ).

Есть и «непарные» слова, где полу- имеет значение ‘почти не’: полуобразованный, полузнакомый, полупрофессиональный и т. п. Вот яркий пример, где слово полуграмотный означает ‘почти неграмотный’: Желая возродить науки, -- этот полуграмотный варвар (до конца дней своих он, несмотря на постоянные упражнения, так и не научился писать) объединил вокруг себя образованнейших людей того времени (Й. Хейзинга). Если человек (пусть даже это Карл Великий) не научился писать, считать, что он стал наполовину грамотным, было бы странно.

Почему же полу- означает то ‘почти’, то ‘почти не’? Это в значительной мере связано с оценкой , которая входит в значение исходного слова. Слова, в значении которых содержится отрицательная оценка, при сочетании с полу- тяготеют к первой группе (значение ‘почти’); слова же, в значении которых содержится положительная оценка, при сочетании с полу- тяготеют ко второй группе (значение ‘почти не’). И в самом деле: попробуйте приставить полу- к «отрицательным» словам безумный, бредовый, воровской, дикий, издевательский, мёртвый и к «положительным» словам грамотный, живой, законный, пристойный, образованный .

Есть у полу- и ещё значения. Вот, например: Какие-то тупые все, покорные, полубрёвна! Кроме Азовкина здесь, видимо, никто не страдает по-настоящему (А. Солженицын). Слово полубревно здесь не означает ни ‘половина бревна’, ни ‘почти бревно’, ни ‘почти не бревно’. Скорее оно означает ‘как бы бревно’, то есть полу- здесь имеет метафорическую функцию. Вспомним ещё Блистательна, полувоздушна, / Смычку волшебному послушна, / Толпою нимф окружена, / Стоит Истомина (А. С. Пушкин). Это значение близко к значению ‘почти’, но всё-таки иное: в первом случае полу- чаще сочетается с «градуируемыми» словами (описывающими измеримые величины), указывая на высокую степень признака, а во втором - с «неградуируемыми» (невозможно измерить степень «воздушности» или «бревноподобия»).

Особое значение полу- встречается в таких терминах, как полужёсткий, полумягкий, полужирный, полукустарник, полупроводник, полупроницаемый, полупустыня . В этих случаях полу - указывает на промежуточное положение в классификации или среднее значение некоторого признака. Примерно так же устроено и слово полуостров , встретившееся в задаче. Вот ещё любопытный пример: В известные часы все три барышни с m-lle Linon подъезжали в коляске к Тверскому бульвару в своих атласных шубках - Долли в длинной, Натали в полудлинной, а Кити в совершенно короткой (Л. Н. Толстой). Такое значение замечательно обыгрывает Гоголь в «Мёртвых душах»: Не бравшие, бравшие, кривившие душой, полукривившие и вовсе не кривившие - все не без волненья и беспокойства ожидали выхода генерала . А в записях русской разговорной речи (бесценный материал для лингвиста!) попался такой пример: Стоит стул, ну какие-то у нее принадлежности там туалета, причем она в такой полуночной рубашке . Здесь явно имелась в виду не полу"ночная рубашка , а полуночна"я рубашка (то есть предмет одежды, чем-то напоминающий ночную рубашку, а чем-то от неё отличающийся).

Кстати, в наименованиях одежды и сходных с ней предметов полу- имеет и ещё одно, очень редкое значение ‘более короткий , чем обозначаемый исходным словом’: полуботинки, полусапожки, полупальто, полуплащ, полумаска, полушубок (см. рис. 3, 4).

И, наконец, вспомним ещё раз то удивительное «пустое» значение, которое полу- , по-видимому, имеет в русском языке лишь в одном случае - в слове полумесяц , синонимичном исходному слову месяц . Так, конечно, было не всегда. Раньше словом месяц называли и полную луну: Светит месяц, светит ясный, светит полная луна. Но в современном русском языке обычно луна круглая, а месяц - серповидный.

Таким образом, значения полу- варьируются от «почти не Х » до «ровно то же самое, что X »:

‘Не X’ → ‘почти не X’ (полуграмотный ) → ‘половина X-а’ (полукруг ) → ‘почти X’ (полудикий ) → ‘X’ (полумесяц )

Литература:
1) А. В. Зеленин. Префикс пол- / полу- // Язык русской эмигрантской прессы (1919–1939) . Тампере, 200, с. 200–202.
2) Б. Л. Иомдин. Семантика русской приставки ПОЛУ- // Русистика на пороге XXI века: проблемы и перспективы. Материалы международной научной конференции (Москва, 8–10 июня 2002 г.) . М., ИРЯ РАН, 2003, с. 109–113.
3) Г. А. Качевская. К истории сложных существительных с ПОЛ- и ПОЛУ- в русском языке // Вопросы теории и истории языка. Сб. ст., посвященный памяти Б. А. Ларина. Л., 1969. С. 322–329.
4) И. А. Мельчук. О числительном ПОЛ 1 // Русский язык в модели «Смысл <=> Текст» . М.; Вена, 1995. С. 363–371.
5) О. Меркулова. Конфіксальні іменники з препозитивним елементом пол(ъ)-/полу- в українській мові XI-XVIII століть // Вісник Львів. ун-ту. Серія філол. 2004. Вип. 34. Ч. ІІ. С. 84–92.

Задача опубликована в статье:
Б. Л. Иомдин. Корпус текстов как лингвистический Клондайк. Разработка семантических приисков. Конспект семинаров // Лингвистика для всех. Летние лингвистические школы 2007-2008. М.: МЦНМО, 2009, c. 142-157.

Редактирование изображений и создание коллажей было бы весьма захватывающим процессом, если бы не приходилось тратить бо́льшую часть времени на кропотливую разметку объектов. Задача еще усложняется, когда границы объектов размыты или присутствует прозрачность. Инструменты “Photoshop”, такие как «магнитное лассо» и «волшебная палочка», не очень интеллектуальны, поскольку ориентируются лишь на низкоуровневые признаки изображения. Они возвращают жёсткие (Hard) границы, которые затем нужно исправлять вручную. Подход Semantic Soft Segmentation от исследователей Adobe помогают решить эту непростую задачу, разделяя изображение на слои, соответствующие семантически значимым областям, и добавляя плавные переходы на краях.

«Мягкая» сегментация

Группа исследователей из лаборатории CSAIL в MIT и швейцарского университета ETH Zürich, работающая под руководством Ягыза Аксоя, предложила подойти к этой проблеме, основываясь на спектральной сегментацией, добавив к ней современные достижения глубокого обучения. С помощью текстурной и цветовой информации, а также высокоуровневых семантических признаков, извлечённых , по изображению строится граф специального вида. Затем по этому графу строится матрица Кирхгофа (Laplacian matrix). Используя спектральное разложение этой матрицы, алгоритм генерирует мягкие контуры объектов. Полученное с помощью собственных векторов разбиение изображения на слои можно затем использовать для редактирования.

Обзор предложенного подхода

Описание модели

Рассмотрим метод создания семантически значимых слоёв пошагово:

1. Спектральная маска. Предложенный подход продолжает работу Левина и его коллег, которые впервые использовали матрицу Кирхгофа в задаче автоматического построения маски. Они строили матрицу L, которая задаёт попарное сходство между пикселями в некоторой локальной области. С помощью этой матрицы они минимизируют квадратичный функционал αᵀLα с заданными пользователем ограничениями, где α задаёт вектор значений прозрачности для всех пикселей данного слоя. Каждый мягкий контур является линейной комбинацией K собственных векторов, соответствующих наименьшим собственным значениям L, которая максимизирует так называемую разреженность маски.

2. Цветовая близость. Для вычисления признаков нелокальной цветовой близости исследователи генерируют 2500 суперпикселей и оценивают близость между каждым суперпикселем и всеми суперпикселями в окрестности радиусом 20% размера изображения. Использование нелокальной близости гарантирует, что области с очень похожими цветами останутся связными в сложных сценах, подобных изображённой ниже.

Нелокальная цветовая близость

3. Семантическая близость. Эта стадия позволяет выделять семантически связные области изображения. Семантическая близость поощряет объединение пикселей, которые принадлежат одному объекту сцены, и штрафует за объединение пикселей разных объектов. Здесь исследователи используют предыдущие достижения в области распознавания образов и вычисляют для каждого пикселя вектор признаков, коррелирующий с объектом, в который входит данный пиксель. Векторы признаков вычисляются с помощью нейросети, о чём мы поговорим далее более подробно. Семантическая близость, как и цветовая, определяется на суперпикселях. Однако, в отличие от цветовой близости, семантическая близость связывает только ближайшие суперпиксели, поощряя создание связных объектов. Сочетание нелокальной цветовой близости и локальной семантической близости позволяет создать слои, которые покрывают разъединённые в пространстве изображения фрагмента одного семантически связанного объекта (например, растительность, небо, другие типы фона).

Семантическая близость

4. Создание слоёв. На этом шаге с помощью вычисленных ранее близостей строится матрица L. Из этой матрицы извлекаются собственные векторы, соответствующие 100 наименьшим собственным значениям, а затем применяется алгоритм разреживания, который извлекает из них 40 векторов, по которым строятся слои. Затем количество слоёв ещё раз уменьшается с помощью алгоритма кластеризации k-means при k = 5. Это работает лучше, чем простое разреживание 100 собственных векторов до пяти, поскольку такое сильное сокращение размерности делает задачу переопределённой. Исследователи выбрали итоговое число контуров равным 5 и утверждают, что это разумное число для большинства изображений. Тем не менее, это число можно изменить вручную в зависимости от обрабатываемого изображения.


Мягкие контуры до и после группировки

5. Семантические векторы признаков. Для вычисления семантической близости использовались векторы признаков, посчитанные с помощью нейросети. Основой нейросети стала DeepLab-ResNet-101, обученная на задаче предсказания метрики. При обучении поощрялась максимизация L2-расстояния между признаками разных объектов. Таким образом, нейросеть минимизирует расстояние между признаками, соответствующими одному классу, и максимизирует расстояние в другом случае.

Качественное сравнение со схожими методами

Изображения, приведённые ниже, показывают результаты работы предложенного подхода (подписанные как «Our result») в сравнении с результатами наиболее близкого подхода мягкой сегментации - спектрального метода построения маски - и двумя state-of-the-art методами семантической сегментации: методом обработки сцен PSPNet и методом сегментации объектов Mask R-CNN.


Качественные сравнения мягкой семантической сегментации с другими подходами

Можно заменить, что PSPNet и Mask R-CNN склонны ошибаться на границах объектов, а мягкие контуры, построенные спектральным методом, часто заходят за границы объектов. При этом описанный метод полностью охватывает объект, не объединяя его с другими, и достигает высокой точности на краях, добавляя мягкие переходы, где это требуется. Однако стоит заметить, что семантические признаки, использованные в данном методе, не различают два разных объекта, принадлежащих к одному классу. В результате множественные объекты представлены на одном слое, что видно на примере изображений жирафов и коров.

Редактирование изображений с помощью мягких семантических контуров

Ниже приведено несколько примеров применения мягких контуров для редактирования изображений и создания коллажей. Мягкие контуры можно использовать для применения конкретных изменений к разным слоям: добавления размытия, изображающего движение поезда (2), раздельной цветовой коррекции для людей и для фона (5, 6), отдельной стилизации для воздушного шара, неба, ландшафта и человека (8). Конечно, то же самое можно сделать с помощью созданных вручную масок или классических алгоритмов выделения контура, но с автоматическим выделением семантически значимых объектов такое редактирование становится значительно проще.

Использование мягкой семантической сегментации для редактирования изображений

Заключение

Данный метод автоматически создаёт мягкие контуры, соответствующие семантически значимым областям изображения, используя смесь высокоуровневой информации от нейронной сети и низкоуровневых признаков. Однако у этого метода есть несколько ограничений. Во-первых, он относительно медленный: время обработки изображения с размерами 640 x 480–3–4 минуты. Во-вторых, этот метод не создаёт отдельные слои для разных объектов одного класса. И в-третьих, как показано ниже, этот метод может ошибиться на начальных этапах обработки в случаях, когда цвета объектов очень похожи (верхний пример), или во время объединения мягких контуров возле больших переходных областей (нижний пример).

Случаи ошибок алгоритма

Тем не менее, мягкие контуры, созданные с помощью описанного метода, дают удобное промежуточное представление изображения, позволяющее тратить меньше времени и сил при редактировании изображений.

принципы ПОСТРОЕНИя СЕМАНТИЧЕСКИХ АННОТАЦИЙ СОДЕРЖАНИЯ ИЗОБРАЖЕНИЙ

PRINCIPLES OF ANNOTATING THE IMAGE CONTENT

Е.Г. Соколова ([email protected])
Вычислительный центр Российской академии науким. А.А. Дородницына

М.В. Болдасов ([email protected])
Российский НИИ искусственного интеллекта

В статье обсуждаются принципы создания семантических аннотаций для описания содержания изображений сцен дискретных объектов, представленных фотографиями открытого пространства – городскими видами, пейзажами. Аннотации создаются на основе онтологии понятий данной предметной области в виде XML представлений. Аннотации описывают статическое содержание изображений, включая композицию изображения. Формализованные аннотации могут использоваться как для поиска информации, например, в библиотечных и музейных коллекциях изображений, так и для генерации естественно-языковых описаний изображений как общих, так и по запросу пользователя. В последние годы в интернет создаются информационные системы и каталоги для поиска информации в хранилищах, содержащих данные различной природы – тексты, изображения, звук.При этом поиск осуществляется по запросам на разных языках. Примером такой информационной системы является международная информационная сеть культурного наследия в Европе, созданная сообществом BRICKS (BRICKS, 2004). Система включает в себя поиск информации о музейных экспонатах, в том числе, о произведениях изобразительного искусства. Поиск информации об изображениях актуален также для музеев фотографий. Кроме поиска по библиографическим данным актуален поиск изображений по их визуальным параметрам и по содержанию изображения, т.е. по изображенным объектам.

Для описания содержания изображений в коллекциях используются три средства: текстовые аннотации на Естественном Языке (ЕЯ), ключевые слова и перечень объектов.

Текстовые аннотации имеют три недостатка: а) использование конкретного ЕЯ затрудняет межъязыковой поиск; б) выражения на ЕЯ часто неоднозначны; в) чтобы сравнить текст запроса на ЕЯ и поисковый образ требуются нетривиальные операции. Например, в (Emeljanov et al ., 2000) предлагается искать изображения по текстовым аннотациям, причем преодолевать вариативность анализа методом проведения эквивалентных трансформаций текста. Такой метод предполагает решение двух сложнейших задач – создание модулей синтаксического анализа и семантической интерпретации предложений произвольного текста, а также аппарата перифразирования предложений произвольного текста. Эти задачи пока остаются на стадии исследования.

Набор ключевых слов – наиболее простая и универсальная форма описания содержания документов, включая изображения. Такая форма используется повсеместно, в том числе и в BRICKS. Она позволяет преодолеть многоязыковость, задав соответствия между дескрипторами на разных языках. Обычно коллекция имеет свою, иногда частично структурированную, схему индексации (Hollink et al ., 2003). Однако ключевые слова задают только тематику документа, а не его содержание.

Перечень изображенных объектов используется в Государственной исторической библиотеке в Москве. Это более содержательное описание, чем ключевые слова, однако ононе позволяет искать группы объектов, находящихся в определенной связи друг с другом, например, двухэтажные загородные дома у реки, сидящий около стола человек в сюртуке и котелке и т.п. Расширение перечней объектов до связных семантических аннотаций содержания изображений позволило бы организовать поиск связанных объектов в массиве семантических аннотаций.

В статье представлены результаты исследования принципов построения формализованных семантических аннотаций для описания содержания изображений. Средствами описания являются понятия, обозначающиетипы объектов, отношения между объектами, а также свойства объектов и их значения. Понятия собраны в созданную авторами экспериментальную модель Онтологии понятий видимого мира.

Понятия онтологии являются элементами семантических аннотаций изображений, представленных в формализме XML. Материалом данного исследования послужили фотографии городской и сельской местности, природных ландшафтов, сделанные с земли или с небольшого возвышения – мост, гора, крыша дома и т.п., собранные разными людьми из разных источников - печать, интернет, домашний архив.

Семантика изображения

Изображения открытого пространства мы отнесем к классу изображений, который назовем «сцены дискретных объектов» (СДО). Этот класс характеризуется тем, что за изображением стоит структура изображенных объектов типа сетифреймов, организующая участвующие в нем объекты в некую рациональную сцену. Эта сцена может быть описана в терминах объектов и значений их свойств, а также пространственных отношений между объектами. Создавая семантическую аннотацию изображения мы пользуемся понятиями, которые используют люди, описывая изображение на ЕЯ. Т.е. обсуждаемые описания антропоцентричны

Опыт показывает, что разные люди, описывая картинку, обращают внимание на разные объекты, поэтому ЕЯ описания одной и той же фотографии разными людьми могут существенно различаться, т.е. описания картинок, составленные людьми, субъективны. Вот, например, два описания содержания фотографии, представленной на рис. 1:

(Описание 1) На картинке показан летний день после грозы.

На переднем плане – река. Судя по точке съемки, снимок сделан с лодки или с моста. Берега ровные, может быть, это не река, а канал. Гроза, скорее всего, или вот-вот начнется, или только что закончилась: в затянутом тучами небе видны просветы, трава подсвечена солнцем. На небе видна радуга.

Слева на берегу стоит большой трехэтажный дом с красной крышей.

(Описание 2) На картине изображен деревенский пейзаж: река, ее два берега, серое небо. На левом берегу реки стоит небольшой белый домик. Других домов не видно, домик одиноко стоит посреди зеленых деревьев. Около левого берега стоит лодка. Сквозь серые облака пробивается разноцветная радуга.

В Описании 1 дом назван «большим», видимо автор думал о загородных домах, для которых трехэтажный дом - большой. В Описании 2 этот же объект назван «небольшим домиком». Возможно автор горожанин и для него все загородные дома – небольшие. В Описании 2 среди изображенных объектов упоминается лодка у левого берега, в Описании 1 – нет. Оба описания, начав с представления картины, далее перечисляют объекты, начиная с реки, которая занимает центральное место на картине. Но дальше реализуются противоположные стратегии: в Описании 1 обсуждается небо и кончается домом, ав Описании 2 начинается с дома и кончается небом.

Задача создания максимально объективного описания в виде семантической аннотации предполагает перечисление по возможности всех изображенных объектов, потенциально интересных пользователю с опорой на объективные данные разных видов, в частности:

– реальный относительный размер объекта на изображении, например, часть площади изображения, занимаемая объектом по отношению к площади всего изображения или другого объекта;

Перспективу - уменьшение размера объектов при удалении от наблюдателя;

Знания об устройстве, относительных размерах (например, в сравнении с размером человека) и функциональности объектов.

Различия в описаниях, приведенных в предыдущем примере, связаны с выбором разных стратегий изложения и с тем, что разные люди опирались при описании картинки на разные знания о ее предметной области (ПО). Поэтому можно считать, что описания картинки объективноотносительно ее ПО. ПО «открытое пространство» мыпредставляем в Онтологии.

Онтология

В предлагаемой модели онтологии представлены понятия, используемые для описания объектов, составляющих изображения открытых пространств, с перечислением различаемых человеком типов и свойств объектов и отношений между ними. Понятия онтологии задаются ее статьями. Статья онтологии состоит из следующих разделов:

заголовок – сопоставление понятию онтологии слова-идентификатора, которое обозначает тип объектана изображении(например, понятия дом стена, человек, фотография );

неформальное определение – текстовое описание на ЕЯ содержания данного понятия ;

род – понятие данной онтологии, которое является родовым по отношению к данному;

вид – перечисление понятий данной онтологии, которые являются видовыми по отношению к данному;

значения атрибутов, которые фиксированы в статье онтологии для данного понятия,

онтологические отношения – представляют знания об устройстве и функциональности объектов, а также о типичном расположении объектов,(например, часть, место ) ;

устойчивые визуальные свойства самого изображения объекта, например, образ, текстура, форма, цветовая гамма, пока указываютсятолько иногда в виде неформальнго комментария. Увеличение интереса и попыток создания онтологии семантики изображения, например, (Hunter, 2001), (Beloozerov et al ., 2005), в будущем позволяют надеяться на развитие исследований по распознаванию объектов на изображении.

Онтология содержит иерархию понятий открытого пространства для построения аннотаций содержания изображений. Ее статьи полностью независимы от языковой семантики, поскольку содержат понятия, представленные образами. В корне онтологии три типа понятий: - изображение, отношение, атрибут. Изображение – это самое общее понятие, которое включает и саму картинку и ее части и типы объектов реального мира, изображенные на картине. Ниже приводится несколько статей онтологии.

Отношения включают онтологические и пространственные отношения . Пространственные отношения (например, справа, выше ), передают взаимное расположение объектов на изображении с точки зрения наблюдателя. Онииспользуются в описаниях сцен – семантических аннотациях изображений.

Атрибуты описывают свойства и состояния объектов. Информация о состоянии может быть получена в результате анализа зрительного образа, например, стоящий (человек), сидящий (кошка, птица) . Таким образом, типы атрибутов расширены по сравнению с тем набором, который обычно используется в семантических исследованиях. Кроме «классических» свойств или атрибутов, например, цвет, размер , к атрибутам отнесены понятия, обычно выражаемые глаголами, например, бегущий . В Онтологии они представлены как значения атрибута типа объекта поза .

Корневым объектом онтологии является понятие «изображение»:

(ИЗОБРАЖЕНИЕ

(ОПРЕДЕЛЕНИЕ («Изображение как единство носителя и содержания»))

(РОД (*))

(ВИД (ИЗОБРАЖЕНИЕ-НОСИТЕЛЬ ИЗОБРАЖАЕМОЕ)))

(ИЗОБРАЖЕНИЕ-НОСИТЕЛЬ

(ОПРЕДЕЛЕНИЕ ("Изображение как совокупность пикселей"))

(РОД (ИЗОБРАЖЕНИЕ))

(ВИД (ФОТОГРАФИЯ КАРТИНА))

(ЧАСТЬ (ГРАНИЦА-ИЗОБРАЖЕНИЯ ЧАСТЬ-ИЗОБРАЖЕНИЯ (центр, левый верхний угол и др.) ЛИНИЯ ФРАГМЕНТ-ИЗОБРАЖЕНИЯ))

(ИЗОБРАЖАЕМОЕ

(ОПРЕДЕЛЕНИЕ ("Воспринимаемое зрением изображение на плоской поверхности - картине, фотографии, как содержание – конфигурация представленных объектов."))

(РОД (ИЗОБРАЖЕНИЕ))

(ВИД (ОТКРЫТОЕ-ПРОСТРАНСТВО (пейзаж)

ЗАМКНУТОЕ-ПРОСТРАНСТВО (бытовая сцена)

ИЗОБРАЖЕНИЕ-ПРЕДМЕТА (натюрморт)

ИЗОБРАЖЕНИЕ-ЧЕЛОВЕКА (портрет) СПЕЦИАЛЬНОЕ-ИЗОБРАЖЕНИЕ (медицинский, например, цитологический, препарат, фотография поверхности Земли из космоса)))

(ЧАСТЬ (ГЕО-ОБЪЕКТ ОБЪЕКТ))

(ГЕО-ОБЪЕК Т

(ОПРЕДЕЛЕНИЕ "объекты планетарного масштаба, которые онтологически присутствуют на любом изображении открытого пространства")

(РОД (ИЗОБРАЖАЕМОЕ))

(ВИД (ПОВЕРХНОСТЬ-ЗЕМЛИ НЕБО ГОРИЗОНТ))

(ПОВЕРХНОСТЬ-ЗЕМЛИ

(ОПРЕДЕЛЕНИЕ ("Часть открытого пространства, на которой располагаются все ОБЪЕКТЫ))

(РОД (ГЕО-ОБЪЕКТ))

(ВИД (СУША ВОДА))

(ЦЕЛОЕ (ОТКРЫТОЕ-ПРОСТРАНСТВО))

Классификация объектов включает все, что может находиться на изображении – дома, водоемы, дороги, газоны, машины, растения, солнце, и т.д. В описаниях содержания картин использовалась общеязыковая онтология WordNet (WordNet), например, (Hollink et al .). В нашей онтологии меньше понятий, чем в общеязыковых онтологиях, например, нет абстрактных понятий типа идея, судьба, умный, и т.п., но могут быть абстрактные атрибуты типа возраст , поскольку они связаны с внешним видом объекта на изображении. В ней также отсутствуют глаголы, значения которых в небольшой степени покрываются значениями атрибута поза . Эти ограничения естественны – они накладываются визуальным способом восприятия мира человеком в естественных условиях.

В WordNet уже содержатся многие понятия, которые необходимо включить в онтологию открытого пространства. Однако описывающие их статьи не могут быть просто скопированы. WordNet следует философской традиции (Vossen , 2003), т.е. умозрительного, а не визуального созерцания мира. Они содержатмного лишней информации и не содержат некоторой нужной информации. Например, из семи значений существительного Earth (земля) в WordNet только два соответствуют нужным нам понятиям, это:

[ S: (n) earth, ground (the loose soft material that makes up a large part of the land surface) "they dug into the earth outside the church" ].

[ S: (n) land, dry land, earth, ground, solid ground, terra firma (the solid part of the earth"s surface) "the plane turned away from the sea and moved back over land"; "the earth shook for several minutes"; "he dropped the logs on the ground"]

Первое обозначает землю как материал, например, куча земли . Второе оказывается слишком размытым, в частности, приведенный в WordNet пример употребления:

“ has instance

S: (n) America (North America and South America and Central America) “

может относиться к ПО «съемки из космоса», но никак не с земли. Указанные непосредственные видовые понятия второго значения, включающие такие релевантные для ПО «открытое пространство, видимое с земли» понятия как:

S: (n) beachfront (a strip of land running along a beach) S: (n) coastal plain (a plain adjacent to a coast),

иопосредованно:

S: (n) forest, woodland, timberland, timber (land that is covered with trees and shrubs),

не включают многие релевантные понятия, например, дорога, газон и т.п. а также все водоемы (вода)– река, море, бассейн и т.п., которые тоже представляют видимую человеком поверхность Земли. Многие из этих понятий представлены в WordNet своим функциональным аспектом и,таким образом, не содержат указания на то, что это поверхность Земли, например, дорога:

S: (n) road , route (an open way (generally public) for travel or transportation)

S: (n) road (a way or means to achieve something) "the road to fame"

Наша онтология ближе к онтологиям, решающим задачи, связанные с представлением значений конкретного текста. К ним относятся, в частности, онтологии для машинного перевода, основанного на знаниях (Knowledge Based Machine Translation (KBMT)), например, (Nirenburg, Raskin, 2004). Отличительной чертой таких онтологий является наличие синтагматических семантических отношений – тех, которые передают взаимосвязи объектов в описаниях. Это актантные отношения типа Actor, Goal, отношения между объектами, например, Localisation и др. Наши описания представляют «до языковую» картину. Онине содержат предикатов и отношений с участниками, но содержат онтологические и пространственные отношения, например, часть, место, выше, справа .

В начальной версии Онтологии, составленной для 20 изображений, имеется до 20 атрибутов, 10 отношений и 100 объектов.

Описание сцены понятиями онтологии

В описании сцены понятиям онтологии сопоставляются их экземпляры – объекты, прототипы реальных участников сцены. Объекты связаны отношениями.

Использовать аппарат концептуальных (онтологических) отношений для описания содержания и, в частности, сцен, предложила Н.Н. Леонтьева (Леонтьева, 2006). Например, следующий набор из двух концептуальных отношений с заполненными слотами:

место (дорога, машина)

справа (машина, человек)

описывают сцену, которая может быть выражена на ЕЯ разными способами, например, «На дороге находится машина. Справа от нее находится человек», или «На дороге стоит человек. Слева от него - машина». Предикат «стоять» для описания данного представления могут быть получены на основе информации о позе человека.

Аннотация изображения антропоцентрична, т.е. ориентирована на те понятия, которыми пользуется человек для описания изображений. Человек воспринимает изображениесразу и целиком и понимает, как структурировано его содержание. Описание на ЕЯ обычно начинается с общей характеристики изображения, например, в (Описании 1) – «летний день после грозы», в (Описании 1) – «деревенский пейзаж». Такая общая характеристика является результатом мгновенного обобщения и оценки сцены человеком. Однако автоматической системой она может быть дана только после подробного анализа семантической аннотации. Наши аннотации включают по возможности все изображенные объекты, в которых может быть заинтересован пользователь, их атрибутов и отношений.

Описывая изображение, человек объединяет изображенные объекты в группы в соответствии с понятой им композицией. Для описания композициибудем использовать те понятия, которые использует человек. Типичным способом отражения композиции является использование планов(layer ) изображения.Планы – это группы объектов, находящиеся приблизительно на равных расстояниях от наблюдателя. Понятие планов используется практически во всех описаниях фотографий. Последний, самый удаленный от наблюдателя план является общим фоном (например, небо, стена или лес). Так, на фотографии, представленной на рис. 2 прозрачная надпись «Rosfoto Image collection» расположена на переднем плане, тротуар и на нем идущий человек находятся на втором плане, фоном является стена.

Планы незримо проводят горизонтальные линии на изображении, на которых располагаются группы приблизительно равноудаленных от наблюдателя объектов. Планы могут использоваться для оценки размеров объектов с учетом перспективы. Кроме планов для описания совокупностей объектов используются множественные объекты,такие как лес, и группы - объекты, подчиняющие себе в аннотации другие объекты, например, группалюдей (человек-1, человек-2, … человек-n), дом (крыша, окна, двери). Между корнем группы, например, дом и подчиненными ему объектами, например, крыша, могут существоватьонтологические отношения, в данном случае, часть . Пространственные отношения могут устанавливаться с отдельными объектами группы и с группой целиком.

Объекты играют разную роль в описании содержания изображения. Большие объекты (обычно гео-объекты), вытянутые в направлении взгляда наблюдателя, например, дорога, река (см. рис. 1), могут участвовать в формировании композиции изображения. Обычно такой объект расположен близко к центру изображения и делит его на три части – сам объект, объекты справа и слева от него. На рис. 1 это река (или канал), левый берег и правый берег. Групповые объекты могут также организовываться по планам, например, в описании содержания изображения на рис. 1 левый берег можно разделить на три плана: берег с крутизной 20%, поросший травой, на нем дом в три этажа с красной крышей, дерево слева от него (1 план);деревья (2 план);берег, покрытый песком с крутизной 5%, деревья на нем и лодка на воде у берега (3 план). Небо с радугой относится к фоновому плану всего изображения.

Цель аннотирования - не создание абсолютно полного описания, а представление тех объектов и отношений между ними, которые могут заинтересовать пользователя. В том случае, если описание оказалось недостаточно подробным, аннотация может уточняться. Это не потребует полной переделки аннотации. Например, могут добавляться атрибуты и зависимые объекты в групповой объект, что не затрагивает остальную часть изображения. В описание могут быть введены числовые характеристики, например оценки размера объекта, крутизны берега или скалы, как это сделано выше.Ниже приведено XML примерное представление содержания фотографии, представленной на рис. 1:

xml version="1.0" encoding="windows-1251" ?>

- < picture id =" picture1 ">

< v-object concept =" РЕКА " id =" river-1 " />

- < left-v-object concept =" БЕРЕГ " id =" shore-1 ">

- < layer id =" layer-1 ">

< property concept =" ПОКРЫТИЕ " meaning =" ТРАВА " />

< property concept =" КРУТИЗНА " meaning =" 20 " />

- < object concept =" ДОМ " id =" house-1 ">

< property concept =" ЦВЕТ " meaning =" белый " />

- < object concept =" КРЫША " id =" roof-1 ">

< property concept =" ЦВЕТ " meaning =" КРАСНЫЙ " />

object >

- < object concept =" РЯД - ОКОН " id =" floo-1 ">

< property concept =" КОЛИЧЕСТВО " meaning =" 3 " />

object >

< object concept =" дерево " id =" tree-1 " />

object >

layer >

- < layer id =" layer-2 ">

- < object concept =" ДЕРЕВО " id =" trees-1 ">

< property concept =" КОЛИЧЕСТВО " meaning =" SOME " />

object >

layer >

- < layer id =" layer-3 ">

< property concept =" ПОКРЫТИЕ " meaning =" ПЕСОК " />

< property concept =" КРУТИЗНА " meaning =" 5 " />

- < object concept =" ЛОДКА " id =" boat-1 ">

< property concept =" ЦВЕТ " meaning =" БЕЛЫЙ " />

object >

layer >

left-v-object >

- < right-v-object concept =" БЕРЕГ " id =" shore-2 ">

< property concept =" ПОКРЫТИЕ " meaning =" ЗАРОСЛИ " />

right-v-object >

- < layer-last id =" layer-last-1 ">

< object concept =" ЛЕС " id =" forest-1 " />

- < object concept =" НЕБО " id =" sky-1 ">

- < object concept =" ОБЛАКО " id =" cloud-1 ">

< property concept =" КОЛИЧЕСТВО " meaning =" SOME " />

object >

< object concept =" РАДУГА " id =" rainbow-1 " />

object >

layer-last >

- < relations >

< relation type =" слева " domain =" house-1 " range =" tree-1 " />

< relation type =" контакт " domain =" shore-1 " range =" boat-1 " />

relations >

picture >

Заключение

В статье сформулированы принципы создания семантических аннотаций содержания изображений. Показано, что следуя антропоцентрическому принципу можно создать семантическую аннотацию содержания изображения на основе онтологии понятий данной ПО. Средствами описания являются также группирование объектов, установление между ними пространственных отношений и использование атрибутов, представляющих, в частности, некоторые физические свойства объекта на изображении, например, крутизна (берега, скалы). Аннотация позволяет уточнять свойства и состав объектов, добавляя свойства и объекты – члены группы объектов или части объекта. Аннотации могут использоваться для информационного поиска и для поиска новой информации в массивах изображений , а также для автоматической генерации описаний изображений на ЕЯ. Онтология предусматривает возможность сопоставления понятиям устойчивых визуальных свойств изображенных объектов. Это позволило бы в последствии исследовать возможности распознавания объектов на изображениях и предложить формализацию правил для построения семантических аннотаций содержания изображений.

Работа выполнена при частичной поддержке Российского гуманитарного научного фонда, грант 04-04-00185а и Российского фонда фундаментальных исследований, грант 04-07-90187в.

Список литературы:

1. Леонтьева Н.Н. Автоматическое понимание текста: системы, модели, ресурсы. М.: «Академия», 2006 .

2. Beloozerov N.V., Murashov D.M., Trusova Yu.O., Yanchenko D.A . Searching for solutions in the image analysis and processing knowledge base // Pattern recognition and image analysis: Advances in mathematical theory and application. – MAIK “Nauka/Interperiodica”, 2005. – Vol. 15, No.2. –P. 361-364.

3. BRICKS Project. Building resources for Integrated Cultural Knowledge Services © 2004. // European Commission Sixth Framework Programme(http://www.brickscommunity.org/)

4. Emeljanov G.V., Krechetova T.V., KurashovaE.P. Tree grammars in the problems of searching for images by their verbal descriptions // Pattern recognition and image analysis. – 2000. Vol. 10, N4. P.520-526.

5. Hollink L., Shreiber G., Wielemaker J., Wielinga B . Semantic annotation of image collections // S. Handschuh, M. Koivunen, R. Dieng, and S. Staab, editors, Knowledge Capture 2003.Proceedings Knowledge Markup and Semantic Annotation Workshop , Florida , USA , October 2003. P. 41-48. Также доступна в интенет:

6. http://www.cs.vu.nl/~guus/papers/Hollink03b.pdf

7. Hunter J . Adding multimedia to the semantic Web – building an MPEG-7 ontology // Proceedings of International Semantic Web Working Symposium (SWWS), Stanford, July 30 - August 1, 2001

8. ( http://archive.dstc.edu.au/RDU/staff/jane-hunter/semweb/paper.html) .

9. Miller G. WordNet: a lexical database for English. Communications of the ACM, 38(11):39-41. WordNet: (http://wordnet.princeton.edu/)

10. Nirenburg, S., Raskin, V . Ontological Semantics // Language, Speech, and Communication. -MIT Press, 2004.

11. Vossen P. Ontologies // The oxford handbook of computational linguistics. Ed. by R. Mitkov, Oxford univ. Press. 2003. p. 464-482.

Как свидетельствует практика и экспериментальные исследования, пространство рисунка семантически неоднородно. Оно связано с эмоциональной окраской переживаний и временным периодом: настоящим, прошлым, будущим. Связано оно также с действительностью или идеально-мыслительным планом работы психики. Пространство, расположенное сзади и слева от субъекта, связано с прошлым периодом и бездеятельностью (отсутствием активной связи между мыслью-представлением, планированием и его осуществлением). Пространство впереди и справа связаны с будущим периодом и действенностью, активностью. Лист бумаги является двумерной проекцией этого пространства.

На листе (модели пространства) левая сторона и низ рисунка связаны с отрицательно окрашенными и депрессивными эмоциями, с неуверенностью и пассивностью. Правая сторона (соответствующая доминантной правой руке) и верх - с положительно окрашенными эмоциями, энергией, активностью, конкретностью действий.

Положение рисунка на листе. В норме рисунок расположен по средней линии (или несколько левее) и чуть выше середины вертикально поставленного листа бумаги. Положение рисунка ближе к верхнему краю листа (чем ближе, тем более выражено) трактуется как высокая самооценка, неудовлетворенность собственным положением в социуме, недостаточное признание со стороны окружающих, как претензия на продвижение и признание, тенденция к самоутверждению. Повышение положения рисунка на листе бумаги коррелирует со стремлением соответствовать высокому социальному стандарту, стремлением к эмоциональному принятию со стороны окружения. Повышение рисунка также связано с уменьшением фиксации на препятствиях к достижению ситуативных потребностей.

Положение рисунка в нижней части листа - обратная тенденция: неуверенность в себе, низкая самооценка, подавленность, нере­шительность, незаинтересованность в своем положении в социуме, в признании, отсутствие тенденции к самоутверждению, склонность к фиксации на препятствиях к достижению ситуативных потребностей.

Правая и левая полуплоскость листа имеют противоположную коннотацию по оппозициям «пассивность – деятельность», «внутреннее – внешнее», «прошлое – будущее». Соответственно расценивается местоположение рисунка вправо и влево от средней линии листа, а также ориентация головы и тела животного вправо, влево, в фас.

Местоположение скорее символизирует готовые к реализации состояния и реакции на момент рисования, в то время как ориентация головы и тела символизирует общую направленность в сторону достижения тех или иных состояний в рамках указанных оппозиций.

Ориентация головы и тела.

Голова повернута вправо - устойчивая тенденция к деятель­ности, действенности: почти все, что обдумывается, планируется - осуществляется или, по крайней мере, начинает осуществляться (даже если и не доводится до конца). Испытуемый настроен на реализацию своих тенденций, установок и намерений.

Голова повернута влево - тенденция к рефлексии, к размыш­лениям. Это не человек действия: лишь незначительная часть за­мыслов реализуется или хотя бы начинает реализоваться. Нередко это также боязнь перед активным действием и нерешительность. (Ва­риант: отсутствие тенденции к действию или боязнь активности - следует решить дополнительно.) Это также может быть связано с отсутствием притязаний на самоутверждение в сфере внешне-преобразовательной деятельности, отсутствием склонности к доминированию, с фиксацией на какой-либо ситуации в прошлом.

Положение "анфас" (т.е. голова направлена на рисовавшего), может трактоваться как эгоцентризм. Такое положение часто бывает сходно по значению в отношении описанных параметров уровня притязаний с поворотом влево. Иногда оно трактуется как прямота, бескомпромиссность, сформировавшиеся как реакция на глубинное чувство незащищенности.

Сдвиг вправо рисунка может свидетельствовать об акцентировании будущего, мужских черт характера, стремлении к контролю над ситуацией, ориентации на окружающих, экстраверсии.

Сильный сдвиг вправо наблюдается достаточно редко и может быть связан с «бунтарством», неподчинением.

Сдвиг рисунка влево имеет противоположное значение. Это акцентирование прошлого, нежелание участвовать в ситуации, склонность к принятию вины и ответственности на себя, застенчивость, интроверсия. Преобладают интропунитивные реакции, снижается уровень внешне-направленной агрессивности и реактивности.

Двух (и более) головные животные и «тяни-толкай» рассматриваются как выражение противоречивых тенденций, рассматриваются как выражение противоречивых тенденций.

Необходимо также осторожно подходить к интерпретации рисунков, занимающих более 2/3 площади листа бумаги, а также к рисункам, выходящим за срез листа: они могут не подчиняться указанным семантическим закономерностям. Особую категорию составляют маленькие рисунки, расположенные в левом верхнем углу листа. Этот тип локализации часто свидетельствует о высокой тревожности, склонности к регрессивному поведению и эскапизму (желание выйти из ситуации, уход в прошлое, либо в фантазию), избеганию новых переживаний. Возможна выраженная дисгармония между самооценкой и уровнем притязаний (актуальным и идеальным образом «Я»). Эти рисунки также могут не подчиняться общим семантическим закономерностям.

Обобщая, можно сказать, что проективное пространство рисунка является символом всех возможных пространств, с помощью которых могут быть метафорически охарактеризованы личность и характер индивида. Чаще всего оно символизирует социальную среду в различных ее аспектах (ценностном, объектном, коммуникативном, временном, эмоциональном и т.д.). В плане интерпретации эти аспекты играют роль контекстных рамок, ограничивающих многозначность образа.

К ряду интерпретационных приемов работы с пространством относится обращение внимания на ощущения, вызванные рисунком (например: шаткость – устойчивость, что относится к ориентации в социуме, самооценке и пр.). Можно попытаться представить, куда двинется животное, если его «открепить» от плоскости (вправо, влево, вверх, вниз), или оно останется на месте. Попытаться определить, насколько однозначен или противоречив рисунок движения животного (например, одна часть фигуры движется в одном направлении, а другая – этому препятствует, либо движется в противоположном направлении).

Б. Графологические аспекты интерпретации.

Здесь можно выделить два аспекта анализа:

    Уровень наличных технических средств воплощения образа в графике (анализ характеристик идеомоторного акта).

    Пространственно-символический аспект.

Анализ линии относится к первому выделенному аспекту.

Для нормы характерна уверенная линия со средним равномерным нажимом и четкими соединениями.

Колеблющаяся, прерывающаяся линия, «островки» перекрывающих друг друга линий, несоединенные углы, «запачканные» рисунки говорят о легкой напряженности, повышенном уровне тревожности, что свойственно невротикам. Контуры рисунка здесь могут быть размытыми, «волосатыми», во всем исполнении может чувствоваться неуверенность, неловкость. (Рисункам невротиков также бывает свойственно отклонение от вертикали, «касающиеся рисунки», недорисованные конечности, незаконченность или непомерное увеличение кистей и стоп.)

Характер линии служит одним из индикаторов общей энергии. Слабая паутинообразная линия ("возит каран­дашом по бумаге", не нажимая на него) является признаком экономии энергии, астенизации, снижения общего тонуса. (При пониженном фоне настроения встречается достаточно редко и сочетается с экономией линий и деталей.)

Обратный же характер линий (жирная с нажимом) не является полярным: это не энергия, а следствие увеличения тонуса мускулатуры в связи с тревожностью. Сле­дует обратить внимание на резко продавленные линии, видимые даже на обратной стороне листа (судорожный, высокий тонус мышц рисующей руки) – резкая генерализованная тревожность. Обратить внимание также на то, какая деталь, какой символ выполнен с увеличением нажима, т.е. к чему привязана тревога (например, верхний «шип»). О повышении тревожности также говорит наличие штриховки внутри контура фигуры и различных деталей.

Направление линии и характер контура анализируются во втором аспекте.

«Падающие линии» и преимущественное направление сверху вниз влево свидетельствует о быстро истощаемом усилии, низком тонусе, возможной депрессии. «Поднимающиеся линии», преобладание движения снизу вверх направо – хорошее энергетическое обеспечение движения, склонность к трате энергии, агрессивности.

Контур фигуры традиционно трактуется как граница Я и социума, символизируемого окружающим пространством. Фигура круга, особенно ничем не заполненного, символизирует тенденцию к сокрытию, замкнутость, закрытость своего внутреннего мира, нежелание сообщать о себе сведения окружающим, нежелание подвергаться тестированию. Такие рисунки дают ограниченное количество информации о себе.

Контур фигуры анализируется по наличию или отсутствию выступов типа шипов, панцирей, игл, прорисовки и затемнения линии контура. Это – защита от окружающих: агрессия, если она выполнена в острых углах; страх и тревога, если имеет место затемнение, "запачкивание" контурной линии; опасение и подозрительность, если поставлены щиты, "засло­ны", линия удвоена. Направленность такой защиты - соот­ветственно пространственному расположению.

Верхний контур фи­гуры - против вышестоящих, против лиц, имеющих возможность на­ложить запрет, ограничение, осуществить принуждение, т.е. про­тив старших по возрасту, родителей, учителей, начальников, ру­ководителей. Нижний контур - защита против насмешек, непризна­ния, отсутствия авторитета, т.е. против нижестоящих, подчиненных, младших, боязнь осуждения.

Боковые контуры - недифференцированная опасливость и готовность к самозащите любого порядка и в раз­ных ситуациях; то же самое - элементы "защиты", расположенные не по контуру, а внутри контура, на самом корпусе животного. Справа - больше в процессе деятельности (реальной), слева - больше защита своих мнений, убеждений, вкусов.

Степень агрессивности выражена количеством, расположением и характером острых углов в рисунке, независимо от их связи с той или иной деталью изображения. Особенно весомы в этом отношении прямые символы агрессии - когти, зубы, клювы.

Контур может также рассматриваться как «оболочка», символ контроля со стороны Я за собственной аффективностью, ее проявлением вовне. Укрупненные рисунки могут свидетельствовать о повышении аффекта, эгоцентризме, придавании большого значения собственной персоне. При этом следует учитывать, что дети рисуют крупнее взрослых, девочки – крупнее мальчиков. Мелкие рисунки – наличие депрессии, подавленность, угнетенность, повышенный самоконтроль.

Уверенные, хорошо стыкующиеся линии, упругая пластичность контура является показателем хорошего контроля аффективности. В случае повышенной возбудимости, плохой контролируемости аффективных проявлений по интенсивности появляются рисунки с плохо пристыкованными, имеющими перерывы, но энергичными линиями контура, создающими впечатление «разрывания» оболочки изнутри наружу. Ощущение ригидности, хрупкости оболочки при отсутствии теплоты в общем впечатлении от рисунка может являться признаком длительно подавляемой эмоциональности, либо нивелирования, уплощения эмоциональной сферы.