Информационные системы и технологии в технике и бизнесе
ФИО | Лютый Владислав Алексеевич |
Дата рождения | 29.08.1995 г. |
Место рождения | г. Донецк, Украина |
Школа | 2002–2013 гг.: Донецкая общеобразовательная школа I-III ступеней № 14 |
ВУЗ |
Донецкий национальный технический университет, факультет компьютерных наук и технологий: 2014–2018 гг.: бакалавриат по направлению подготовки Информационные системы и технологии 2018–2020 гг.: магистратура по специальности Информационные системы и технологии в технике и бизнесе |
Средний балл в бакалавриате | 95 |
Владение языками | русский (родной), украинский (родной), английский (upper-intermediate) |
Личные достижения | 2018 г. — диплом бакалавра по специальности Информационные управляющие системы и технологии |
Увлечения | Тоновая и цветовая коррекции фотографий, создание постеров, изображение и Web-дизайн в Adobe Photoshop Создание векторных рисунков и иконок в Adobe Illustrator |
Личные качества | Креативность, самостоятельность, умение работать в команде, мобильность, стрессоустойчивость |
Профессиональная специализация и владение компьютером |
Операционные системы: Windows, Ubuntu Языки программирования: PHP, JavaScript, Java, Python Фреймворки: Yii2 (PHP), Laravel (PHP), Spring MVC (Java) СУБД: MySQL, MongoDB Языки моделирования и описания: UML Системы контроля версий: Git DevOps технологии: Apache, Nginx, Docker, Cron, Jenkins; Backend технологии: Memcached, RabbitMQ, MVC, OOP, Patterns, SOLID, DRY, GRASP Frontend технологии: HTML 5, CSS 3, Pug/Twig, LESS/SASS/Stylus, PostCSS, Gulp, Webpack Графические редакторы: Adobe Photoshop, Adobe Illustrator, Figma |
Дополнительные курсы | Онлайн курсы по сетевому администрированию — CCNA Routing and Switching |
Планы на будущее | Совершенствование знаний в области глубокого обучения и больших данных |
Контактная информация | e-mail: vlad112263@gmail.com |
Я, Лютый Владислав Алексеевич, родился 29 августа 1995 года в замечательном городе Донецк, Украина.
С раннего детства я очень любил книги, т.к. дома находилась большая библиотека с различной литературой, начиная от классики до мировых бестселлеров. Благодаря этому я очень быстро научился читать еще в детском саду. По большой части, как и любой ребенок, я в хорошую солнечную погоду любил проводить время на улице со своими друзьями, где мы находили массу развлечений и игр, благодаря чему никогда не скучали.
В 2002 году я отправился учиться в Донецкую общеобразовательную школу №64, т.к. она была очень близко к дому. Учебу в школе я не находил занятным и интересным делом, но страх ремня и своего отца, чья фамилия идеально подходила ему, внушал стимул получать отличные оценки. После 5-го класса я был зачислен в ДОШ №14, т.к. мой близкий друг уже учился там и завербовал меня пойти туда. Однако после 9-го класса я снова по своей инициативе перевелся в другое образовательное учреждение, а именно Донецкий лицей Коллеж
. В 2013 году я закончил обучение в лицее и возник вопрос о будущей профессии, а также о выборе образовательного учреждения, где получать знания для нее.
Изначально я не собирался поступать на программиста и IT сфера меня мало интересовала. Уроки информатики были очень нудные в школе, а также по сложившейся иронии мы редко занимались за компьютерами на них. На мое конечное решение повлиял одноклассник в лицее, который собирался поступать как раз на факультет компьютерных наук в ДонНТУ. Он рассказал мне больше о всех перспективах работы в области программирования и моделирования, искусственном интеллекте и что-то про Скайнет.
Я стал усердно готовился к сдаче внешнего независимого оценивания и, в итоге, поступил на факультет компьютерных наук и технологий, став в 2013-ом году студентом группы КН 13-А. Однако радость на этом и закончилась. Обучение проходило для меня очень тяжело, особенно программирование и математический анализ. В итоге из-за моих длительных пропусков пар и накопившихся долгов я был отчислен с первого курса.
После отчисления остался осадочек и я решил, что многое потеряю, если опущу руки и не попробую снова. Поэтому подал документы заного на первый курс той же специальности 09.03.02 и в 2014 году стал студентом группы КН 14-А. В этот раз в ожидании нового учебного года я читал достаточно много компьютерной и математической литературы, которая сильно помогла мне с легкостью начать новый учебный год и в итоге закончить бакалавриат с красным дипломом. Более всего мне импонировали предметы из серии ничего не понятно, но очень интересно
, а именно напрямую связанные дисциплины с нейронными сетями, машинным и глубоким обучениями, анализом данных и искусственным интеллектом. К отличному преподовательскому составу моей родной кафедры (да и ко всем кафедрам) у меня остались только теплые эмоции и впечатления.
Защитив бакалаврскую работу на тему Компьютеризированная подсистема учета тендерных закупок
под руководством Привалова Максима Владимировича, я решил продолжить обучение в родном университете, поступив в магистратуру на специальность Информационные системы и технологии в технике и бизнесе
09.04.02. Группа в магистратуре осталась с бакалавриата почти неизменной, что сразу давало чувство легкого и быстрого старта учебы. Тема моей магистерской работы: Экспертная система определения достоверности информации по мимике человека на основе видеопотока
. Руководителем магистерской работы мной был выбран доцент, к.т.н. и заведующий кафедры АСУ Секирин Александр Иванович, т.к. он обладает широким спектром знаний в области искусственого интеллекта и не только.
После скорого окончания магистратуры я планирую остаться в своем ВУЗе в качестве преподавателя, но и параллельно продолжить работать в сфере IT, т.к. на данный момент я уже работаю по специальности больше года и мне более-менее нравится. Однако точно я в этом не уверен, т.к. будущее непредсказуемое и не знаешь, что будет завтра...
С феноменом под названием ложь
сталкивался в жизни каждый из нас. Ложью называют намеренную передачу неправдивой информации, для того чтобы вызвать в другом человеке убеждение, которое сам передающий считает не соответствующей истине. Обманчивыми могут быть различного рода факты и сведения. Ложь приобретает особое значение, когда речь касается политики, СМИ, судебной процессии, медицины, рабочего процесса и другие области повседневной жизни современного человека. Вечная проблема человеческой искренности, обмана и лжи не раз становилась предметом обсуждения в художественной литературе, философии, социологии и психологии. Обман влияет в нашей жизни важную роль, но необходимо отличать ложь во спасение или ложь для лжи.
В 2006 году институт статистики в Оклахоме проанализировал точность суждений по распознаванию лживой информации среди 6 651 сообщений в 206 документах различной подачи информации (видео, текст, аудио) от 24 483 людей, среди которых было 2 842 эксперта в области психоанализа. В результате они получили следующие результаты: в созданных условиях люди вынесли в среднем 54% правильных суждений, правильно классифицируя 47% лжи как обманчивые и 61% правдивых как обманчивые [1].
Для проведения анализа мимики человека на оценку достоверности информации эксперты пользуются правилами и мимическими картами, полученных с помощью психофизиологических исследований в области психологии человека и криминалистике, что является недостатком применения его в разных сферах деятельности, т.к. специализирующих экспертов в данной области не так много.
Первым техническим конкурентом стал всем известный полиграф. Использование полиграфа имеет свою достаточно длительную историю. Родоначальником полиграфа являются США, где проблеме его применения уделялось значительное внимание на различных уровнях (федеральном, региональном) и различными инстанциями, вплоть до конгресса США, президента, Верховного суда США и др. Статистика результатов работы полиграфа поражает: фактическая оценка работы (95%) превышает заявленную теоретическую (80%). То есть лишь 5-7 человек из ста способны пройти полиграф так, что результат будет непонятным
[1].
Однако при всех достоинствах использования полиграфа, у него есть ряд недостатков и самые значительные из них — дорогостоящее оборудование (порядка 200 тыс. рублей), невозможность использования без осведомления субъекта допроса, необходим сертифицированный эксперт, который анализирует показания устройства. В конце можно сказать, что на ровне с развитием компьютерной техники, роста вычислительных мощностей и методов обучения искусственного интеллекта и полиграф нельзя назвать технологией XXI века.
С учетом вышесказанного можно сделать вывод, что самый лучший и перспективный вариант — использовать современный математический аппарат и технологический процесс для машинного обучения систем компьютерного зрения для анализа произвольного видеоряда для использования в задачах настоящего исследования для будущей магистерской диссертации.
Целью исследования является повышение эффективности систем компьютерного зрения по распознаванию мимики лица с целью выявления признаков обмана по видео-кадрам. Данное исследование позволит в будущем расширить сферу применения искусственного интеллекта в области судебной области, политологии, социологии и других областях, где человеческий фактор, а именно ложь, может принести ущерб процессам или окружающим.
Для достижения поставленной цели необходимо решить следующие задачи:
В ходе анализа предметной области был выделен объект моделирования и дальнейшей алгоритмизации — мимика лица. Под понятием мимика
понимается движение мускулатуры в координированных комплексах, отражающие разнообразные психические состояния человека. Сложность распознавания мимики как объекта выявлена в силу следующих факторов:
Проблемой достижения скорейших и максимально достоверных результатов поставленной цели исследования заключается прежде всего в:
Из особенностей визуальных методов распознавания мимики выделяют следующее: cложность визуальных методик требует значительных временных затрат на обучение. Эксперт, как правило, выбирает для изучения только одну методику. Пользователь не может произвести самостоятельно классификацию правдивости информации по оценке мимики [2]. Сравнительный анализ методов распознавания мимики представлен в таблицe 1.
Метод | Тип действия | Интенсивность действия | Время действия |
---|---|---|---|
Ekman & Friesen (1976, 1978) | Измерение всех мышечных движений; 44 единиц движений | Четыре действия по три контрольных точки интенсивности | Старт-стоп (начало, максимум, смещение) |
Frois-Wittmann (1930) | 28 описаний | Не описывает | Не описывает |
Fulcher (1942) | Отсутствие/наличие 16 мышечных движений | Рейтинг по объему движений в каждой области лица | Не описывает |
Ermiane & Gergerian (1978 | Измерение всех видимых движений; 27 мышечных движений | Каждое действие оценивается по трех-бальной шкале | Не описывает |
Landis (1924) | 22 описания | Каждое действие измеряется по четырех-бальной шкале | Не описывает |
Более наглядно процесс визуального анализа мимики изображен на рисунке ниже:
Интенсивность движения мышц определяется следующим образом: к номеру единицы из СКЛД добавляются буквы с А по Е в зависимости от интенсивности движения (от минимальной к максимальной) [4].
Значения:
Двигательные единицы относительно воображаемой вертикальной оси лица могут быть: двусторонние, симметричные, односторонние, левые, правые.
Список основных двигательных единиц представлен в таблице 2:
Номер единицы действия | Название в СКЛД | Мышечные основы |
---|---|---|
0 | Нейтральное лицо | - |
1 | Поднять внутреннюю часть брови | Лобная (медиальная часть) |
2 | Поднять наружную часть брови | Лобная (медиальная часть) |
4 | Опустить брови | мышца, опускающая надпереносье, мышца, опускающая бровь, мышца, сдвигающая брови |
5 | Поднять верхнее веко | мышца глазницы, поднимающая верхнее веко |
6 | Поднять щёки/щёку | круговая мышца глаза |
7 | Натянуть веко/веки | круговая мышца глаза — мимическая мышца ,закрывающая глазную щель и расширяющая слезный мешок |
9 | Поднять крылья носа | мышца, поднимающая верхнюю губу и крыло носа |
10 | Поднять верхнюю губу | мышца, поднимающая верхнюю губу |
11 | Углубить носогубную складку | мимическая мышца, углубляющая носогубную складку |
12 | Поднять уголки губ | большая скуловая мышца |
13 | Более отточено поднять уголки губ | |
14 | Появление ямочек около губ | щечная мышца — мышца щечной области лица,оттягивающая угол рта в стороны, прижимающая щеку к зубам, сжимающая щеки |
15 | Опустить уголки рта | мышца, опускающая угол рта, — мимическая мышца ,опускающая угол рта |
16 | Опустить нижнюю губу | мышца, опускающая нижнюю губу, мимическая мышца, оттягивающая нижнюю губу |
17 | Сморщить кожу подбородка | подбородочные ветви; начало: n. mentalis;иннервируют кожу области подбородка |
18 | Сморщить губы | квадратная мышца нижней губы и квадратная мышца верхней губы |
19 | Показать язык | - |
20 | Оттянуть губы | мышца смеха — мимическая мышца, оттягивающая угол рта кнаружи и углубляющая носогубную складку |
Определение интенсивности движения лицевых мышц, а также знание основных мимических проявлений на лице человека является неотъемлемой частью при разработке интеллектуальной системы. Разработчику необходимо описать каждое кодированное мимическое проявление в геометрическом и математическом представлении. Данный шаг является самым сложным, так как требует обработки большого количества информации и достаточного количества знаний в выбранной области.
Алгоритмы обнаружения лиц на изображении можно разделить на четыре категории:
Эмпирический подход основан на знаниях сверху-вниз
и предполагает реализацию алгоритма с правилами, отвечающими фрагменту изображения на котором найдено человеческое лицо. Набор правил – это формализация эмпирического знания о представлении лица на изображении и признаки, которыми руководствуется человек при принятии решения: лицо он видит или нет. Правила:
Метод уменьшения изображения для исключения возможных помех, а также для уменьшения вычислительных операций предварительно подвергает изображение сильному изменению размер (рис.2). На таком изображении необходимо определить область равномерного распределения яркости (предполагаемая область лица), а затем проверить наличие резко отличающихся по яркости областей внутри: именно такие зоны можно с разным процентом вероятности отнести к лицу
.
Метод гистограмм для определения областей изображения с «лицом» строит вертикальную и горизонтальную гистограммы. В «подозрительных» зонах происходит поиск черт лица (рис.3). Данный подход использовался в период развития машинного т.к. предполагал малых требований к вычислительной мощности процессора для обработки изображения.
Метод обнаружения сложных
лиц основан на поиске правильных геометрически расположенных черт лица. Для этого используется гауссовский фильтр с множеством различных масштабов и ориентаций. После этого производится поиск соответствий найденных черт и их расположения путем перебора [7].
Метод группировки признаков редполагает применение второй производной гауссовского фильтра для поиска интересующих областей изображения. После этого, края группируются вокруг каждой такой зоны, используя пороговый фильтр. Далее применяется оценка байесовской сети для сочетания выявленных признаков и определяется выборка черт лица (рис.4).
Метод распределения контрольных точек – статистическая модель, представляющая инциденты, форма которых может деформироваться. Большое преимущество данного метода заключается в выделении переменных объектов в рамках набора для обучения с малым количеством параметров. Такой подход применяется в системах классификации признаков.
Метод распознавания с использованием шаблонов прост в реализации и эффективен при работе с изображениями с простым задним фоном. Недостатком метода является калибровка шаблона вблизи изображении лица.
Метод нейронных сетей является наиболее популярным способом решении задач распознавания образов. При решении задач используется метод опорных векторов, необходимый для снижения размерности пространства признаков. При этом метод опорных векторов не приводит к потере информативности отобранных тренировочных объектов, а также позволяет перейти перейти к базису пространства, где дисперсия будет направлена вдоль главных осей базиса.
Натянутое на полученные таким образом главные оси подпространство является оптимальным среди всех пространств в том смысле, что наилучшим образом описывает тренировочный набор (рис.5):
Данные алгоритмы схожи с обучением вида «обучение с учителем» и применяются для задач классификации и регрессионного анализа. Метод опорных векторов основан на том, что ищется линейное разделение классов.
Главной целью тренировки многих классификаторов является минимизация ошибки классификации на тренировочном наборе (или эмпирический риск).
Метод Виолы Джонса на сегодняшний день является самым перспективным методом распознавания образов в силу высокой производительности и высоким процентом обнаружения лиц. Признаки, используемые алгоритмом, используют суммирование пикселей из прямоугольных регионов
Мимические реакции каждого человека имеют определенный набор стандартных параметров проявления и делятся на две категории: геометрические и поведенческие.
Для описания количественных и качественных параметров лица (произвольных и непроизвольных) используют систему кодирования лицевых движений. В данном случае количественным параметром является интенсивность движения от А до Е.
Видеопоток данных представляет собой последовательный набор кадров. Целью распознавания является объединение лиц на изображениях в непересекающиеся классы. Задача по распознаванию лиц формулируется следующим образом: требуется построить распознающую функцию $$ F(w)=(F_{1}(w), F_{2}(w),\dots,F_{k}(w)) $$, выход который определяет класс изображения w, представленного вектором признаков $$ \left(x_{1}(w),\dots,x_{n}(w)\right) $$. В данном случае классом является одна из шести базовых эмоций человека
$$ F_{k}(w)=\begin{cases} 1,\ если w ∊\Omega_{k} \\ 0,\ если w ∉\Omega_{k} \\ \Delta,\ если\ неизвестно\ w ∊\Omega_{k}\ или\ w ∉\Omega_{k} \end{cases} $$
Поиск решения осуществляется с использованием искусственных нейронных сетей.
Инвариант — это свойство некоторого класса (множества) математических объектов, остающееся неизменным при преобразованиях определённого типа [12].
Инвариантные моменты представляют собой характерные признаки, которые могут встречаться на каждом снимке. Чаще всего лица на видеокадрах подвергаются различным деформациям , свойственным мимике человека. В таких условиях необходимо сказать о псевдо-инвариантах
[24].
Центральные моменты цифрового изображения лица определяются по формуле:
$$ m_{pq}=\sum_{x}\sum_{y}(x-\bar{x})^{p}(y-\bar{y})^{q}f(x,y)\ ,$$
где $$ \bar{x},\bar{y} $$ — значения, которые являются центром тяжести, $$ m_{pq}$$ — центральные моменты порядка не выше чем (p+q)=3, f(x,y) — функция яркости. Целесообразно выполнить перевод цветных изображений в полутоновый вид. После предварительной обработки и нормализации образец представляет собой матрицу пикселей, каждый из которых имеет значение яркости в диапазоне [0,1].
Для решения задачи определения принадлежности w к классу $$ \Omega_{p} $$ применим свертку в виде евклидовой меры [6]:
$$ d\left(w, \Omega_{p}\right) = \sqrt{\sum_{i=1}^{7}\left(M_{i}^{w}-M_{i}^{\Omega_{p}}\right)^{2}} $$
где $$ M_{i}^{\Omega_{p}}=\left(\sum_{l=1}^{m}M_{i,l}^{\Omega_{p}}\right)/m_{i} $$ $$ \Omega_{p} $$
Метрику можно использовать для измерения расстояний между изображением w (представленным вектором признаков x) и классом $$ \Omega_{p} $$
где $$ S_{p} $$ — матрица ковариации класса р, $$ \bar{y} $$ - центр класса [11].
Решение задачи распознавания эмоций относится к задаче классификации, т.е. нейронная сеть должна отнести полученный набор данных к эмоций, отвечающей заданному набору параметров. Рассмотрим математическое описание задачи распознавания:
Пусть дано множество М изображений лиц (эмоция, например удивление) $$ {w_{1},\dots,w_{n}} $$, каждое из которых имеет вектор значений признаков (мимические признаки) $$ X_{i}=(x_{i,l},\dots,x_{im}),\ i=1,\dots,m,x_{j},j=\bar{1,n} $$, где n – количество признаков. Вектора признаков отнесены экспертами к некоторым классам $$ \Omega_{l},l=1,\dots,k.\ M=U_{l=1}^{k}\Omega_{l} $$ следующим образом: $$ \Omega_{1}={w_{1},\dots,w_{m_{1}},\Omega_{2}={w_{m_{1}+1}},\dots,w{m_{1}+m_{2}}},\dots,\Omega_{k}={w_{m_{k}-1},\dots,w_{m}},\ где\ m_{1}+m_{2}+\dots+m_{k}=m,\ m=|M| $$.
Вся выборка подразделена на два непересекающихся подмножества: обучающее и тестовое. После обучения искусственной нейронной сети проверяется качество ее обучения на тесовом множестве.. Предлагается искусственная нейронная сеть прямого распространения с сигмоидальной функцией активации $$ \sigma(x)=\frac{1}{1+e^{-x}} $$ нейронов скрытого слоя и линейной функцией активации выходного слоя [44]
Нейронная сеть должна быть настроена так, чтобы при подаче вектора признпков $$ X_{i} $$ на вход, отнесенного к классу $$ \Omega_{i} $$ на выходе с номером i сеть выдавала значение «1», а на всех остальных выходах «0». Это достигается настройкой сети методом обратного распространения ошибки.
С учетом особенностей формирования классов для распознавания лиц представляет интерес вероятностная нейронная сеть. В ней образцы классифицируются на основе оценок их близости к классам с учетом особенностей вероятностного распределения значений признаков. Для каждого класса на основе учебных данных определяется функция плотности распределения признака, которая характеризуется математическим ожиданием и дисперсией [].
Функция активации нейрона, который соответствует j-му классу имеет вид:
$$ f_{i}=exp\left(-\sum_{i=1}^{n}\left(w_{ij}-x_{i}\right)^{2}\right)/\sigma_{ij} $$
Где $$ \sigma_{ij} $$ — средне квадратическое отклонение i-го признака j-го класса, $$ w_{ij} $$ — математическое ожидание i-го признака j-го класса. В случае, если на вход вектора признаков был подан неизвестный образец, то выбирается класс, которому соответствует максимальное выходное значение.
Каждая эмоции имеет прототип выражения, например, формула удивления:
$$ 1+2+5B+26 $$
В данной формуле двигательные единицы выражены числами, каждое из чисел характеризует мимическое проявление, которое задействует небольшую часть мышц лица.
Латинская В
обозначает интенсивность движения. Нейросетевая модель обучается на большом количестве изображений или непрерывном видеопотоке в режиме реального времени.
Следует отметить, что некоторые из кодов интенсивности действия являются труднорегистрируемыми, например коды А и В имеют незначительную разницу во внешнем проявлении в мимики.
Двигательные единицы лица (далее ДЕ) можно условно разделить на три группы:
На лице человека можно выделить до 80 значащих областей на лице. Как правило это границы глаз, рта и бровей. Скуловые мышцы не являются важным признаком выражения той или иной эмоции.
Система ключевых метрик для распознавания:
Метрики под номерами 3, 4, 7–10 являются несимметричными и рассчитываются для левой и правой половины отдельно. Нормирование показателей осуществляется по расстоянию между зрачками. Оно минимально различается у разных людей и хорошо стандартизирует обучающую выборку.
Пример метрического представления указан на рисунке 7:
Значения выделенных метрик:
Разложение изображения на составляющие, каждое из которых имеет определенный вес представлено на рисунке 8:
Разложение изображения на составляющие необходимо для формирования входных данных для нейронной сети.
Если представить два входных вектора персептрона на координатной плоскости (рисунок 9, 10), то его работа будет заключаться в том, чтобы определить, по какую сторону разделительной прямой лежит представленный для распознавания вектор:
Персептрон может классифицировать только образы, которые разделены при помощи гиперплоскости. Сформулируем алгоритм обратного распространения ошибки:
На данном этапе выполнения магистерской работы был проведён анализ психологического феномена ложь
и его взаимосвязь с микро-выражениями и эмоциями. Помимо этого, были проанализированы основные алгоритмы распознавания и классификации частей лица на предмет нахождения ключевых точек а также представлен алгоритм распознавания эмоционального микро-выражения с применением нейронной сети.
В статье приведено описание современных методов обработки видеоинформации для определения и распознавания факта лжи человека по его мимике. Произведен сравнительный анализ существующих методов, для решения поставленной задачи, а также выявлены основные проблемы, возникающие при обработке видеоданных для подобного рода задач.
Материалы студенческой секции X Международной научно-технической конференции Информатика, управляющие системы, математическое и компьютерное моделирование
(ИУСМКМ–2019). – Донецк: ДОННТУ, 2019. – С.189 [Ссылка]
В статье рассматривается методика обнаружения аномального состояния человека путем анализа его эмоционального состояния и уровня напряженности. Приведен обзор и классификация методов автоматического распознавания эмоций.
ИНФОРМАТИКА И КИБЕРНЕТИКА. – Д.: ДонНТУ, – 2017. – №3 (9). – С.128. [Ссылка]
В статье рассматриваются некоторые методы распознавания объектов на изображении, основанные на детекторах границ и каскадных классификаторах.
Журнал Молодой ученый
— Методы определения объектов на изображении / Я. Э. Живрин, Нафе Башар Алкзир. — Текст : непосредственный // Молодой ученый. — 2018. — №7 (193). — С.8-19. [Ссылка]
В статье представлено описание шаблонов для распознавания эмоций, которые представляют собой наборы контрольных точек для определения эмоций детей дошкольного возраста по системе кодирования лицевых движений Пола Экмана с учетом особенностей выражения эмоций через мимику в детском возрасте.
Батенькина Оксана Васильевна, Иноземцева Ксения Викторовна Метод распознавания эмоций детей дошкольного возраста с использованием мимических выражений // ОНВ. 2017. №6 (156). [Ссылка]
В статье рассматриваются методы, используемые в процессе локализации ключевых точек лица человека.
Журнал Молодой ученый
— Асташенкова, Л. К. Распознавание ключевых точек лица на изображении человека / Л. К. Асташенкова, С. Н. Рощупкина, К. В. Кудринская. — Текст : непосредственный // Молодой ученый. — 2019. — №26 (264). — С.23-25. [Ссылка]
Статья посвящена анализу эмоционального интеллекта у лиц, совершивших сексуальные ООД. Описаны результаты исследования эмпатических характеристик и уровня эмоционального интеллекта больных.
Журнал Психология и право
www.psyandlaw.ru / ISSN-online: 2222-5196 / E-mail: info@psyandlaw.ru [Ссылка]
В статье предложен метод распознавания эмоций человека по изображению его лица. В основе метода лежит разработанная статистическая модель эмоций, а также вероятностный алгоритм, основанный на наивном байесовском классификаторе.
Метод распознавания эмоций на основе модели распределения ключевых расстояний // Доклады БГУИР. 2014. №1 (79). [Ссылка]
В статье предлагаются усовершенствованные алгоритмы выделения граничных линий, их аппроксимации прямолинейными отрезками и кривыми Безье, а также распознавания объектов.
Костюк Юрий Леонидович, Кон Алексей Борисович, Новиков Юрий Леонидович. Алгоритмы векторизации цветных растровых изображений на основе триангуляции и их реализация // Вестн. Том. гос. ун-та. 2003. №280. [Ссылка]
В статье описан вариант реализации системы распознавания эмоционального состояния человека для поддержки речевого общения с сервисными антропоморфными роботами.
Бобе А.С., Конышев Д.В., Воротников С.А. Система распознавания базовых эмоций на основе анализа двигательных единиц лица. Инженерный журнал: наука и инновации, 2016, вып. 9. [Ссылка]
В статье предложен целостный подход для моделирования и распознавания мимических проявлений эмоций на лице человека.
Ефимов Г.М. Таврический государственный агротехнологический университет, Украина [Ссылка]
Язык оригинала: украинский
В статье авторы представляют автоматизированную систему скрытого автоматического обнаружения обмана по информации в видео.
The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI-18) [Ссылка]
Язык оригинала: английский
Персональный сайт на портале магистров ДонНТУ, 2018 г.
к.т.н., проф. Федяев О.И.
Персональный сайт на портале магистров ДонНТУ, 2018 г.
к.т.н., доц. Секирин А.И.
Персональный сайт на портале магистров ДонНТУ, 2018 г.
к.т.н., доц. Мартыненко Т.В.
Персональный сайт на портале магистров ДонНТУ, 2015 г.
к.т.н., доц. Секирин А.И.
Персональный сайт на портале магистров ДонНТУ, 2015 г.
доц., к.ф.-м.н. Ручкин К.А.
Персональный сайт на портале магистров ДонНТУ, 2013 г.
к.т.н., доц. Пчелкин В.Н.
Персональный сайт на портале магистров ДонНТУ, 2012 г.
к.т.н., доц. Федяев О.И.
Статья блога содержит информацию и графисеские примеры микро-выражений и их кодовое представление по системе классификации Пола Экмана.
Перечень кодов двигательных единиц и их классификация.
Статья посвящена проблематике описания лицевых эспрессий с точки зрения моделирования эмоций как объекта исследования.
Статья посвящена обзору проблемы обнаружения лица и решение ее через реализацию алгоримов на Python.
Данная статья посвящена задаче распознавания людей по лицу в видеопоследовательности. В работе предложена нейросетевая модель, которая для входного набора изображений лица человека строит компактное признаковое представление фиксированной размерности.
Статья описывает популярные методы векторизации ключевых точек лица для представления последнего в виде массива координат.
В статье приведено применение теории нечетких множеств и нейронных сетей для задачи распознавания образов.
В статье приведен перечень существующих методов по распознаванию лица, а также их сравнение.
В данной статье рассмотрены основные алгоритмы сегментации изображения для различных случаев.
В статье показана реализация на языке программирования Python о задаче детектирования и сопровождения точек глаз на лице человека.
В статье автором предложено решение проблемы классификации эмоций с анализом и описанием всех используемых методов.
В статье авторами приведены результаты работы обученного классиикатора на основе сверточных сетей по задаче распознавания эмоций человека.
Статья содержит базовую терминологию и понятия в области нейронных сетей. Рассматриваются различные архитектуры нейронных сетей, дается краткий обзор фреймворков и библиотек для работы с нейронными сетями..
Рассматриваются основные понятия о сверточных нейронных сетях. Применение CNN в области компьютерного зрения. Дается краткий обзор архитектуре сверточной сети.
В статье рассматривается применение нейронных сетей в задачах компьютерного зрения, с примерами архитектур и современными задачами.
В статье рассматриваются основные задачи компьютерного зрения, а именно детектирование, трекинг, сегментация, оценка позы, распознавание действий и многое другое.
В статье приведен обзор одной из самых популярных библиотек для глубокого обучения — TensorFlow.
Официальная документация от Google по библиотеке TensorFlow.
В статье привеодится описание метода Виола-Джонса для распознавание образов.
Грокаем глубокое обучение
научит конструировать нейронные сети с нуля! Эндрю Траск знакомит со всеми деталями и тонкостями этой нелегкой задачи. Python и библиотека NumPy способны научить ваши нейронные сети видеть и распознавать изображения, переводить любые тексты на все языки мира и даже писать не хуже Шекспира!
Настоящее издание является результатом значительной переработки книги "Цифровая обработка изображений" (Гонсалес и Уинтц, 1977 г. и 1978 г.; Гонсалес и Вудс, 1992 г. и 2002 г.). Одна из важнейших причин популярности книги, которая уже более 30 лет является мировым лидером в своей области - высокая степень внимания авторов к изменению образовательных потребностей читателя. Нынешнее издание базируется на самом обширном из когда-либо проводившихся исследований читательского мнения. Как и прежде, основные цели книги - служить введением в основные понятия и методы цифровой обработки изображений, а также создать основу для последующего изучения и проведения самостоятельных исследований в этой области. Все разделы сопровождаются большим количеством примеров и иллюстраций.
Эта книга — ценнейшее учебное пособие для изучающих психологию невербального поведения, социальную психологию, менеджмент. Кроме того, это прекрасное практическое руководство для всех, кто не хочет становиться жертвой обмана и психологических манипуляций в профессиональной и личной жизни.
В книге описываются приемы глубокого обучения, применяемые на практике, в том числе глубокие сети прямого распространения, регуляризация, алгоритмы оптимизации, сверточные сети, моделирование последовательностей и др.
Учебное пособие, в виде лекции по компьютерному зрению. Содержит основные положения о глубоком обучении, сверточных нейронных сетях, детектировании объектов и т.д.
В данном материале рассматривается коммерческое применение видеоаналитики, научные исследования в области видеоаналитики, системы видеонаблюдения и т.д.
Приводится пример реализации извлечения признаков с изображения какскадами Хаара с использованием библиотеки OpenCV.
Интерактивный учебник языка Python, дает теорию в удобной форме, и позволяет решать задачи прямо на сайте.
Глубокое обучение — Deep learning — это набор алгоритмов машинного обучения, которые моделируют высокоуровневые абстракции в данных, используя архитектуры, состоящие из множества нелинейных преобразований. Согласитесь, эта фраза звучит угрожающе. Но всё не так страшно, если о глубоком обучении рассказывает Франсуа Шолле, который создал Keras — самую мощную библиотеку для работы с нейронными сетями.
Изучение всех возможностей Python — сложная задача, а с этой книгой вы сможете сосредоточиться на практических навыках, которые действительно важны. Раскопайте скрытое золото
в стандартной библиотеке Python и начните писать чистый код уже сегодня.
Блог программиста и разработчика в области компьютерного зрения – Adrian Rosebrock. Andrian знакомит в практических примерах Python и OpenCV с основами компьютерного зрения и OpenCV, переходя к более сложным темам, таким как обнаружение лиц, отслеживание объектов в видео и распознавание рукописного ввода.
База данных выражений лица Co-Kanade AU-Coded предоставляет тестовую площадку для исследований в области автоматического анализа изображений лица
Kaggle — является крупнейшим в мире сообществом по науке о данных, обладающим мощными инструментами и ресурсами, которые помогут вам достичь поставленных целей в области науки о данных.
Коллекция изображений, которые обычно используются для обучения алгоритмов машинного обучения и компьютерного зрения. Это один из наиболее широко используемых наборов данных для исследования машинного обучения.
КиберЛенинка
Это научная электронная библиотека, построенная на парадигме открытой науки (Open Science), основными задачами которой является популяризация науки и научной деятельности, общественный контроль качества научных публикаций, развитие междисциплинарных исследований, современного института научной рецензии, повышение цитируемости российской науки и построение инфраструктуры знаний.
Молодой Ученый
Ежемесячный свободный электронный журнал, который публикует статьи по различным отраслям науки. Журнал входит в международный каталог периодических изданий Ulruch’s Periodicals Directory, а все статьи журнала индексируются системой Google Scholar (Академия Google
).
Сайт посвящен работе компьтерного зрения с помощью библиотеки OpenCV, рассматриваются особенности графического интерфейса в OpenCV, основные операции, обработка изображений с помощью OpenCV, анализ видео, машинное обучение, обнаружение объекта и многое другое.
Блог предназначен для программистов, которые заинтересованы в компьютерном зрении и машинном обучении. Автором является Satya Mallick, Satya защитил докторскую диссертацию в Калифорнийском университете, где работал над различными проблемами компьютерного зрения и регулярно публиковался в ведущих конференциях и журналах.
ITVDN.com — это удобный и качественный ресурс учебного CyberBionic Systematics в вопросах обучения разработчиков новейшим технологиям.
Коллективный блог, посвещенный публикации статей в области обработки изображений, компьютерного зрения, машинного обучения.
Негосударственное образовательное частное учреждение дополнительного профессионального образования «Национальный Открытый Университет «ИНТУИТ» — это образовательный проект, главными целями которого являются свободное распространение знаний во Всемирной Сети и предоставление услуг дистанционного обучения.
Форум, содержащий описание решений часто встречающихся практических проблем, возникающих в процессе программирования.
Крупный и популярный IT-ресурс. Хабрахабр
одинаково интересен программистам и разработчикам, администраторам и тестировщикам, дизайнерам и верстальщикам, аналитикам и копирайтерам.
Свободный репозиторий для программных проектов, удобные средства для командной разработки. Полезен для поиска готовых проетов.
Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.
Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 12 запросов, имеющих отношение к магистерской работе. Из них три запроса соответствует названию магистерской работы на трех языках, три запроса с ФИО руководителя, а также шесть запросов с ключевыми понятиями по теме магистерской работы.
Ниже приведены две таблицы с отчетами о поиске, которые разделяет временной промежуток в четыре месяца, а также диаграмма, которая позволяет сравнить основные изменения, произошедшие за этот период.
Строка поиска | Поисковая система | |||
---|---|---|---|---|
На русском языке | ||||
Система определения достоверности информации по мимике человека на основе видеопотока | 4 320 | ≈ 2 млн | 7 | 2 390 |
Секирин Александр Иванович, ДонНТУ | 292 | ≈ 18 млн | 11 | 243 |
Система распознавания лжи по лицу | 669 000 | ≈ 11 млн | 18 900 | 454 000 |
Определение достоверности информации по мимике | 323 000 | ≈ 3 млн | 9 460 | 244 000 |
На украинском языке | ||||
Система визначення достовірності інформації по міміці людини на основі відеопотоку | 336 | ≈ 12 млн | 0 | 144 |
Секірін Олександр Іванович, ДонНТУ | 5 500 | ≈ 17 млн | 4 | 230 |
Система розпізнавання брехні по обличчю | 17 200 | ≈ 6 млн | 44 | 11 300 |
Визначення достовірності інформації по міміці | 36 500 | ≈ 364 тыс | 302 | 23 800 |
На английском языке | ||||
The system for determining the reliability of information on human facial expressions based on the video stream | 19 800 000 | ≈ 13 млн | 251 200 | 11 200 000 |
Sekirin Alexander, DonNTU | 84 | ≈ 13 млн | 6 | 553 |
Deception detection system | 4 700 000 | ≈ 5 млн | 692 000 | 2 880 000 |
Determining the accuracy of information on facial expressions | 170 000 000 | ≈ 1 млн | 67 000 | 94 000 000 |
Строка поиска | Поисковая система | |||
---|---|---|---|---|
На русском языке | ||||
Система определения достоверности информации по мимике человека на основе видеопотока | 4 370 | ≈ 17 млн | 8 | 2 630 |
Секирин Александр Иванович, ДонНТУ | 4 160 | ≈ 28 млн | 13 | 221 |
Система распознавания лжи по лицу | 701 000 | ≈ 13 млн | 18 400 | 408 000 |
Определение достоверности информации по мимике | 334 000 | ≈ 9 млн | 8 890 | 225 000 |
На украинском языке | ||||
Система визначення достовірності інформації по міміці людини на основі відеопотоку | 937 | ≈ 16 млн | 0 | 212 |
Секірін Олександр Іванович, ДонНТУ | 4 170 | ≈ 23 млн | 5 | 245 |
Система розпізнавання брехні по обличчю | 20 800 | ≈ 8 млн | 40 | 21 400 |
Визначення достовірності інформації по міміці | 37 800 | ≈ 1 млн | 274 | 26 400 |
На английском языке | ||||
The system for determining the reliability of information on human facial expressions based on the video stream | 68 800 000 | ≈ 24 млн | 459 000 | 49 600 000 |
Sekirin Alexander, DonNTU | 918 | ≈ 5 млн | 5 | 519 |
Deception detection system | 4 160 000 | ≈ 9 млн | 641 000 | 4 010 000 |
Determining the accuracy of information on facial expressions | 302 000 000 | ≈ 4 млн | 65 300 | 161 000 000 |
При анализе полученных результатов по четырем поисковым системам, можно заметить, что наилучшие результаты показали системы Google и Yandex. Во всех поисковых запросах было найдено достаточное количество документов на всех теститруемых языках (русский, украинский и английский).
Заметим, что поисковая система Yandex при большом числе найденных страниц не дает возможности зафиксировать их точное количество. Поэтому в таблице в соответствующей колонке результатов от Yandex приведены приблизительные значения, которые она.
Среди всех поисковых систем для анализа был явный аутсайдер — система Bing, разработанная компанией Microsoft, предоставив наименьшее число результатов на запросы русского и украинского происхождения. Это связано с их главным ориентиром на американский рынок, где ведущим языком является английский язык (в котором система показала большие результаты), а лишь потом на остальной мир.
По результатам поиска ключевых фраз на разных языках можно сказать, что запросы на украинском языке дают результаты намного меньше, чем аналогичные на русском и английском языках.
Для большей информативности и наглядности, были составлены диаграммы (рис.1 - рис.3), показывающие процент изменения количества запросов за период (от 12.09.2019 и 12.01.2020).
Анализ диаграммы показал, что произошло падение результатов выдачи запросов на русском языке только в одной поисковой системе — Meta. Значительный прирост количества результатов замечено в системе Google по запросу Секирин Александр Иванович, ДонНТУ
на 132%. Система Yandex показала также большие приросты показателей почти по всем запросам. Результат запросов поисковой системы Bing был почти в стабильном состоянии, наблюдаются незначительные приросты в 10-20%.
Украинский язык, не смотря на самые низкие результаты среди других языков, показал в большей части положительную динамику роста запросов. Значительные увеличения в количестве результатов показала система Meta, что не удивительно, т.к. она является украинским порталом. Наибольший прирост был замечен по запросу Система розпізнавання брехні по обличчю
на 89%. Отрицательные результаты показали две системы: Google (-24,2% на запрос о руководителе) и Bing (-9,1% и -9,3% на первый и второй запросы соответственно).
Глядя на диаграмму видно, что на английском языке произошел значительный подъем по всем запросам выдачи. Для запроса Analysis of the distribution of customer flows количество найденных страниц увеличилось с 2 до 8 млн, это может быть связано с популярностью темы за рубежом, где ведутся основные разработки в этой области.
Подводя итоги, можно отметить измения результатов поиск преимущественно в сторону прироста, что является хорошим показателем актуальности темы. Особенно это заметно по запросам на английском языке. Также необходимо отметить, что часть результатов изменилась лишь незначительно, в пределах 5-10% в обе стороны, что скорее всего является результатом каких-то мелких корректировок поисковых алгоритмов.
В данном разделе я хочу написать про искусство, которое я хочу воплотить на себе уже 5 лет — искусство татуировки. Как для любого человека, жаждущего татуировку, я столкнулся только с единственной проблемой: выбор эскиза.
Впервые татуировка была упомянута европейцами, когда капитан Кук, который в 1771 году возвращался из путешествия, привез туземца, который был полностью покрыт нательным рисунком. Данное обстоятельство тут же было запремечено моряками и постепенно вся Европа увлеклась нательными украшениями. В переводе с таитянского слово «тату» несет в себе смысл рисунка или знака. Однаок это не самое ранее воспоминание о тату. Они были популярны у большинства племен, так же у египтян. Самому искусству татуировки около 6 тысяч лет. Развивалось оно по всему миру. У славян татуировки обозначали магические знаки, для красоты их никто не наносил. Но после принятия христианства значимость тату пропала и можно было лишь посмотреть примеры на моряках с Европы. Но это был не конец «моды» на тату, надо было всего лишь подождать.
За всю историю тату отношение к ним менялось на абсолютно противоположное огромное количество раз. Они никогда не были признаком одних только моряков, девушек легкого поведения, заключенных или байкеров. Татуировка на протяжении своего существования использовалась моделями, художниками, актрисами. На сегодняшний день, когда в искусстве все переворачивается с ног на голову и наоборот, тату занимает почетное место.
Искусство искусством, но тату, прежде всего, рисунок. Здесь сложностью является то, что татуировщики должны учитывать личность человека, потому что эскиз как таковой татуировкой еще не является. Это интересный симбиоз художества и выявления характера человека, потому что только полный идиот будет бить что попало, лишь бы было. Талант художника состоит не в том, чтобы нарисовать что-то очень красивое и нанести первому захотевшему, а в знакомстве и изучении человека, его особенностей. Искусство предполагает чувства за творчеством, если этого нет, под искусством понятие татуировки не значится.
Сейчас татуировки делает огромное количество людей, они стали еще более разнообразными. Особенно это разнообразие развилось с появлением интернета. Если раньше тату ограничивалось конкретными историческими мотивами, то сейчас люди обмениваются информацией, идеями, перевоплощением. Это привлекает к искусству татуировки все больше дизайнеров, художников. Люди начинают развивать свой потенциал в новой сфере.
Что же в данной сфере является искусством – сам рисунок художника или подача человеком этой работы? Мне кажется, что главное – совместимость человека с работой, гармоничность, когда татуировка дополняет и украшает человека, а человек – данную работу.
На сегодняшнее время татуировка считается искусством, так как искусство не стоит на месте, постепенно расширяет границы и вбирает в себя все больше и больше интересных вещей. Вместе с татуировкой в понятии искусство уже есть граффити и компьютерный дизайн. Людям нравится выражение своего характера, своих чувств.