Автореферат
квалификационной работы магистра
«Разработка специализированной
компьютерной системы определения
темперамента по физиогномическим характеристикам лица»
Введение
В настоящее время существуют различные и существенно отличающиеся варианты классификации мимики [1]. Причем, несмотря на множество работ на эту тему, до сих пор отсутствует общепринятое определение эмоции или эмоционального состояния. Данная работа посвящена технологиям, рассматривающим эмоциональное состояние человека с физической точки зрения и оперирующими физическими величинами и математическими вычислениями для характеристики эмоционального состояния. Известны физиологические и технические модели характеристики эмоционального состояния разработанные ранее [4, 5]. Определенной проблемой существующих моделей и алгоритмов определения эмоций является отсутствие взаимосвязи между общими подходами к характеристике эмоционального состояния и частными вариантами вычисления отдельных эмоций. Также известно множество работ, позволяющих оценивать эмоциональное состояние человека по локальной лицевой мимике с помощью обработки видеоинформации [6, 7], однако, эти биометрические технологии идентификации основаны не на общей теории эмоций, а, скорее, на независимо проведенных исследованиях и экспериментах.
Актуальность
Актуальность моей работы состоит в том, что оценивая качества личности, можно выявить склонности и способности человека к профессии. Нет необходимости говорить, что работник выполняет свое дело несравнимо лучше и более удовлетворен своим трудом, если он увлечен своей профессией и имеет определенные способности и навыки. Действия специалиста по отбору персонала направлены на достижение вполне конкретной цели - обеспечение нормального функционирования фирмы или отдела учреждения, создание профессиональной атмосферы в коллективе, нормализация межличностных отношений. Т.о. сотрудники отдела кадров должны так сказать видеть в человеке личность, а значит быть превосходным психологом способным с первого взгляда понять каким этот человек является на самом деле. Согласитесь не каждый сотрудник обладает такими качествами, поэтому я считаю целесообразным создание системы способной распознать темперамент человека и тем самым помочь сотрудникам кадровых агентств и отделов сделать правильный выбор в предоставляемой профессии. Т.о. целью моей работы является определение темперамента а соответственно и склонности в работе по лицу человека.
Цели и задачи системы
Разрабатываемая СКС создается для обеспечения:
- определения темперамента новоприбывшего сотрудника;
- выявления склонностей к тому или иному виду работ;
- возможности принятия решения о предоставлении работы данному потенциальному сотруднику;
- быстрого доступа к любому сотруднику с отображением полной информации о нем;
- отбора сотрудников по внешним данным (по росту, полу, цвету волос, глаз);
- ускорения и улучшения работы офис-менеджера.
Специализированная компьютерная система должна автоматизировать:
- сбор информации о сотрудниках;
- поиск сотрудника по задаваемым критериям;
- создание отчетов по выполненной работе;
Предполагаемая научная новизна
Разрабатываемая специализированная компьютерная система будет принципиально отличатся от созданных ранее т.к. будет:
- анализировать изображение лица человека, принимая решение о типе темперамента по морфологии типов, предложенной И. Куликовым [8];
- сопоставлять темперамент полученный по изображению с результатами психологического теста для определения темперамента;
- давать рекомендации о виде работ, подходящему по темпераменту данному сотруднику.
Практическая ценность
Разрабатываемый программный продукт автоматизирует процесс определения темперамента у новоприбывшего сотрудника кадрового агентства, анализируя фотоснимок его лица, выявит склонности к типу выполняемой работы, обеспечит быстрый доступ к любому сотруднику, уменьшит затраты времени и труда офис-менеджера, тем самым повысив его работоспособность.
Анализ существующих разработок
На данный момент в Институте психологии при Академии наук Украина идет процесс создания компьютерной экспертной системы, которая предназначена выполнять экспертные функции определения эмоциональных состояний предъявленного изображения лица. Изображение вводится в компьютер как цифровой фотопортрет, под которым подразумевается фотография лица одного человека в фас. На первом этапе подсистема должна уметь различать экспрессию лица, а на втором, используя ее исходные данные, другая подсистема определяет эмоциональное состояние человека. Разработка подсистемы базируется на создании экспертной системы, движимой знаниями и имеет модульную структуру.
Для построения базы знаний системы - ядра экспертной системы, описывающей экспрессии лица и позволяющей определять эмоциональные состояния за мимикой, был использован метод подачи знаний, основанный на фреймах. Каждой эмоции соответствует отдельный фрейм, и все они имеют схожую структуру. Эти фреймы содержат следующие слоты:
- слот с названием эмоции;
- слот с ссылкой на соответствующий узел гипертекста с разъяснением;
- слоты с правилами, по которым можно определить соответствующую эмоцию.
Второй слот связан с фактическими знаниями, а слоты с правилами - с процедурными, с их помощью система может выполнять экспертные функции. Для выработки правил, по которым можно определять какие угодно эмоции, была выбрана система описания экспрессии лица, созданная П.Экманом и У.Фризеном FACS (Fасiа1 Асtion Соding Sуstem) [6].
Рисунок 1 - Эмоциональные состояния человека (анимация, количество кадров (6), количеств циклов повторения (5),объем в килобайтах (96 кБ))
Основными единицами измерения FАСS при описании экспрессии лица являются дискретные, едва заметные, видимые изменения тонуса лицевых мышц. Эксперт должен заметить эти минимальные изменения, зная при этом все возможные варианты движения мускулов с точки зрения функциональной анатомии лица. Единицы действия мышц лица (АUs - Асtiоn Units) описываются в динамических и статических показателях мышечной активности. Эксперт, применяет методику кодирования, должен учесть все возможные особенности изменения тонуса мышц в зависимости от структуры кожного покрова, постоянных морщин, складок, жировых прослоек т.д. FАСS использует вполне нейтральный цифровой код для обозначения единиц действия (АUs), так как описательные термины, наводят на отвлекающие ассоциации: "сердитые брови", "грустные глаза" и т.п. Например, единица действия Аu-1 означает поднятие вверх внутренней части бровей и обеспечивается следующими мышечными средствами: Frontalis, Раrs Меdialis. Таким путем FАСS обеспечивает отделение описания от заключения, что дает возможность не использовать оценочные признаки при описании выражения лица, которые субъективно заполняли до целостного образа неопределенность воспринимаемой экспрессии. В разрабатываемую систему вошли фреймы, соответствующих таким эмоциональным состояниям: радость, удивление, гнев, отвращение, презрение, страх, печаль. Каждый из них содержит уникальный набор правил, записанных как коды FACS. Каждому правилу соответствует коэффициент "уверенность", определяющий, насколько точно это правило соответствует данной эмоции. Каждой эмоции и отдельным единицам действия FACS соответствует булева переменная, которая показывает, присутствует в данном правиле это действие или нет. Тогда, например, определению гнева отвечает запись вида:
(1)
Эта запись соответствует продукционные форме подачи знаний и может быть прочитана так: если "действуют только 10A и 17с и 23 и 24B или действуют только ... или действуют только 4 и 7Е и 10B и 50, или действуют только ...", то "гнев". Подобным образом можно описать все эмоции или любые другие психические состояния.
Трудность заключается в преобразовании изображения фотопортрета на код FACS. Наиболее интересный, удобный и перспективный способ введения - введение непосредственно фото человека, эта довольно сложная задача относится к классу задач автоматического распознавания визуальных изображений, в частности лица человека. В нашем случае основная сложность заключается в том, что необходимо распознать экспрессию лица с изображениями разных людей независимо от смены ракурса, масштаба и условий освещения в момент съемки, а также от различных изменений, связанных с возрастом, прической и т.д.
Для решения этой задачи был использован синергетический подход. В отличие от специальных наук, синергетика исследует общие закономерности развития систем различной природы. Изображение в компьютере описываются массивом так называемых точек, которые хранят коды цветов соответствующей точки экрана монитора. Каждому пикселю приписывается какое-то определенное значение серости vj. Таким образом изображение представляет собой вектор
(2)
с совокупностью значений серого. Множество изображений составляет множество векторов Vk, при этом по каждому соответствует индекс k = 1, ... ... M.
Это те образы, которые мы собираемся распознавать. Синергетический подход обосновывает связь между распознаванием образов и формированием структур, которыми руководят так называемые параметры порядка. Распознавание изображения есть не что иное, как формирование образа прототипа. Формирование для запоминания образа прототипа приводит к появлению нового параметра порядка, впоследствии несет ответственность за узнавание-проявление этого образа, то есть за образование структуры. Вместо большого количества факторов (компоненты вектора изображения), от которых зависят различные состояния системы (исходные значения), синергетика рассматривает немногочисленные параметры порядка, от которых зависят компоненты вектора состояния системы и которые, в свою очередь, влияют на параметры порядка. Переход от рассмотрения компонентов вектора состояния системы к меньшему числу параметров упорядоченного состояния системы определяет один из основных принципов синергетики - принцип подчинения (подчинения компонентов вектора состояния параметрам порядка).
В синергетическом компьютере используют формулу:
, (3)
где - параметр порядка, принадлежащего прототипа Vk, w(t)- остаточный член, впоследствии приближается к нулю.Таким образом, распознавание сводится к конкуренции мод, в результате которой все моды, кроме некоторой k-й, стремятся к нулевому значению, а предлагаемый образ q(0) при стремится к Vk0. Vk0 является откликом системы на предъявленное изображение.
Как видно из вышеизложенного, обучение-настройки системы сводится к формированию и запоминание образов-прототипов Vk или V+k.. Это можно осуществить если воспользоваться потенциальной функцией вида:
(4)
Как видим, из такого представления потенциальная функция зависит только от параметров порядка. Для распознавания потенциал W должен быть минимизирован динамикой градиента вектора q, а векторы-прототипы при этом считаются фиксированными. (подробнее о методе см. Использование системы кодировки лицевых экспрессий в задачах распознавания темперамента человека по изображению лица)
Апробация
Система находится на стадии разработки и еще не была протестирована.
Заключение
Вернемся к психологическому аспекту: В.И.Куликовым разработана современная морфология типов темперамента, которая может быть использована в визуальной психодиагностике [8]. Т.о. для определения типа темперамента, а в дальнейшем и склонности к выполняемой работе необходимо проанализировать изображения лица человека и выделить основные объекты:
1. Брови;
2. Глаза;
3. Нос;
4. Щеки;
5. Губы;
6. Подбородок.
и с их помощью определить принадлежность к типу темперамента.
Несмотря на известную условность взаимосвязи особенностей темперамента и некоторых морфологических признаков внешнего облика человека, современные исследования все же подтверждают возможность «узнавания» тех или иных темпераментов по чертам лица их обладателей. Система FACS является инновационной и гибкой, следовательно могут быть выработаны правила и созданы фреймы, способные распознать темперамент как стационарное проявление мимики. При написании данной работы был проведен обзор литературы по теме магистерской работы «Разработка СКС определения темперамента по физиогномическим характеристикам лица», а именно были рассмотрены методы распознавания изображений, выделения объектов на лице человека; изучены принципы построения существующих систем (синергетический компьютер, экспертные системы, нейронные сети); были углублены знания по психофизиологии, физиогномике и темпераменте человека. Проведена и установлена связь между «анатомией лица» - физиогномикой и темпераментом; темпераментом и профессией.
Список литературы
- Изард И. Эмоции человека – Москва, 1980. – 189 с.
- Анохин П. К. Психология эмоций – Москва, 1984. – 220 с.
- П. В. Симонов. Мозг: эмоции, потребности, поведение.// Избранные труды, том 1. Изд. Наука, 2004. – 340 с.
- Н. А. Бернштейн. Физиология движений и активность. М.: Наука, 1990. – 140 с.
- Чарльз Дарвин. О выражении эмоций у человека и животных. Изд. Питер, 2001. – 120 с.
- Пол Экман. Психология лжи. Изд. Питер, 2003. – 175 с.
- Irfan A. Essa and Alex P. Pentland. Facial Expression Recognition using a Dynamic Model and Motion Energy. M.I.T Media Laboratory Perceptual Computing Section Technical Report No. 307, International Conference on Computer Vision ’95, Cambridge, MA, June 20-23, 1995.
- Г.В.Щекин Визуальная психодиагностика: познание людей по их внешнему облику. М., 1992.
- Ekman P., Friesen W. A new pan-cultural facial expression of emotion. Motivation & Emotion. 1986. Jun. V10 (n2): 159–168.
- Распознавание человека по изображению лица и нейросетевые методы [Електронний ресурс] / Д. Брилюк, В. Старовойтов - Режим доступа к статье: http://www.masters.donntu.ru/2008/kita/baglikov/library/4.htm
- Хакен Г. Принципы работы головного мозга: Синергетический подход к активности мозга, поведению и когнитивной деятельности. – М.: ПЕР СЭ, 2001. – 351 с.
Важное замечание
При написании данного автореферата магистерская работа еще не завершена. Окончательное завершение: 1 декабря 2011 г. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.