УДК 681.3

Широчин В.П., докт. техн. наук, проф., 

Кулик А.В., асп., 

Марченко В.В., студ. 

 

ДИНАМИЧЕСКАЯ АУТЕНТИФИКАЦИЯ НА ОСНОВЕ АНАЛИЗА КЛАВИАТУРНОГО ПОЧЕРКА

В статье описана разработка адаптивной системы аутентификации на базе клавиатурного почерка. Проанализированы наиболее распространенные на сегодняшний день модели и алгоритмы распознавания пользователей по биометрическим характеристикам, их достоинства и недостатки.

Показано, что классические мультипликативные и аддитивные подходы распознавания пользователей по клавиатурному почерку обладают существенными недостатками, которые заключаются в том, что ни один из известных подходов не обеспечивает достоверного распознавания пользователей в любое время суток.

Предложен новый мультипликативно-аддитивный подход к распознаванию пользователей по клавиатурному почерку, обеспечивающий приемлемые показатели распознавания в любое время суток, на основе включения в систему аутентификации механизмов самообучения, обеспечивающих периодическую коррекцию эталонных характеристик пользователей в соответствии с собранной статистикой.

The article deals with the adoption system of authentic of treatment based on keyboard handwriting. Analysis was being made most broadcast models and algorithms perception users in biometrics characteristics today and dignity and deficiency them.

The article shows that the classical multiplication and the addition manner perception users of keyboard handwriting possess essential deficiency. No one reputed approache provide reliable perception users in any time 24 hours par daytime.

Propose new multiplication-addition manner perception users of keyboard handwriting securing serinder index perception in any time 24 hours for daytime as result to include the self-educated in authentic system mechanisms that securing periodical correct ideal characteristics users suitable with collecting the statistics.

Основной задачей обеспечения безопасности информационных компьютерных систем является задача ограничения круга лиц, имеющих доступ к конкретной информации и защита ее от несанкционированного доступа. Отождествление пользователя ЭВМ - задача, решение которой позволяет организовать весь процесс управления правами доступа, а также реализовать ряд других вспомогательных задач, имеющих самостоятельное прикладное значение. Принципы, лежащие в основе применяемых методов идентификации и аутентификации, можно разделить на четыре группы [1]: традиционные парольные защиты, проверка физических параметров человека (отпечатки пальцев, сетчатка глаза, и т. п.), классификация психофизических параметров, классификация круга информационных интересов пользователя и динамика их изменения.

На сегодня можно выделить два типа биометрических систем аутентификации, анализирующие [1]:

статический образ пользователя: лицо, радужную оболочку глаза, рисунок кожи пальцев и ладони;

динамические образы, создаваемые пользователем при выполнении им заранее заданных действий.

Биометрические системы аутентификации, анализирующие динамические образы, в свою очередь построенные на основе анализа следующих параметров: динамики воспроизведения подписи или иного ключевого слова, особенности голоса, клавиатурного почерка.

Биометрические методы, соответственно, подразделяют на физиологические и поведенческие [2].

Физиологические методы основаны на анатомической уникальности каждого человека. К ним относятся: снятие отпечатков пальцев, сканирование радужной оболочки глаз, сканирование сетчатки глаз, геометрия кисти руки, распознавание черт лица.

Поведенческие методы оценивают действия человека. Данные методы используют: подпись мышкой, тембр голоса, клавиатурный почерк.

В области разработок биометрических систем на базе клавиатурного почерка наибольший интерес на сегодняшний день представляют системы биометрической аутентификации. В целом можно выделить два основных направления применений биометрических систем на базе клавиатурного почерка, это [3]: биометрическая идентификация и биометрическая аутентификация.

Отметим, что системы биометрической идентификации - это, по сути, дополнение к стандартной парольной идентификации (при входе пользователя в систему). Однако в будущем прогнозируется снижение процента парольной идентификации к общему числу систем идентификации и увеличение удельного веса систем биометрической аутентификации.

На сегодняшний день наиболее известны две системы биометрической аутентификации: система “ID – 007”, разработанная американской фирмой “Enigma Logic” и система “Кобра”, разработчиком которой выступает Академия ФСБ России.

Системы такого типа реализуют три основных функции: 1) сбор информации; 2) обработка информации (механизмы сравнений с эталонными значениями); 3) принятие решений по результатам аутентификации.

Первая и третья функции в системах “ID – 007” и “Кобра” реализуются алгоритмически одинаково (различие составляют некоторые коэффициенты), а вот вторая функция — обработка информации или механизмы сравнений с эталонными значениями — принципиально отличаются. Сравнение вновь полученных значений времен удержаний клавиш с эталонными значениями в обеих системах производятся по аддитивной характеристике. Сравнение межсимвольных интервалов с эталонными значениями в системе “ID – 007” выполняется по принципу аддитивного соотношения, а в системе “Кобра” – по принципу мультипликативного соотношения.

Для исследований биометрических характеристик пользователей проведен эксперимент по исследованию клавиатурного ввода информации и создана модель, которая анализирует такие информационные структуры, как: вектор времен удержаний клавиш и матрицу временных интервалов между нажатиями клавиш.

Эксперимент состоит в вводе с клавиатуры специально подобранного количества слов и словосочетаний с регистрацией времен удержания клавишей для покрытия всего вектора времен удержаний клавиш, а также с регистрацией времен межсимвольных интервалов, которые фиксируются в соответствующей матрице. Данный набор слов каждый пользователь набирает в различное время суток: утром, днем и вечером.

Для наглядности анализируются две наиболее типичных биометрических характеристики пяти пользователей, которые в целом отражают основные особенности работы пользователей в различное время суток. Динамика изменения среднего времени удержания клавиш пользователями 1-5 в разное время суток представлена на рис. 1, а динамика изменения средних интервалов времени между нажатиями клавишей пользователями 1-5 в разное время суток – на рис. 2.

Приведенные характеристики говорят также о ритме работы каждого пользователя с клавиатурой. Однако, кроме этого, можно выявить и еще одну немаловажную особенность. Наиболее быстро абстрактный пользователь (т. е. некоторый образ усредненного пользователя) работает в середине рабочего дня (символическое название “День”), чуть медленнее утром, и гораздо медленнее – вечером. Это уже общее отличительное свойство в работе пользователей утром, днем и вечером.

В процессе исследований рассмотрены две модели биометрической аутентификации пользователей:

с мультипликативным способом сравнения биометрических характеристик;

с аддитивным способом сравнения биометрических характеристик.

Построение первой модели биометрической аутентификации заключается в анализе отношений вновь образованных биометрических характеристик к соответствующим эталонным значениям, то есть, времен удержаний клавиш к своим эталонам, и времен - интервалов между нажатиями клавиш к соответствующим своим эталонным значениям.

Архитектура модели с мультипликативным способом сравнения характеристик показана на рис. 3. После получения результатов мультипликативной характеристики, все отклонения, которые лежат в пределах допустимых значений отклонений обнуляются, а те отклонения, которые остались за допустимыми пределами – остаются без изменений и выступают в качестве так называемых пиков мультипликативной характеристики. Такая процедура обработки данных называется мультипликативным фильтром.

Процесс исследования временных характеристик удержания клавишей описывается следующими математическими соотношениями.

Пусть:

i = 1…35 - количество исследуемых клавишей (“а”, “б”, … , “я”, “;”, “пропуск”, “.”);

tуд.i - экспериментальное значение времени удержания i–ой клавиши;

Tуд.i - эталонное значение времени удержания i–ой клавиши.

Анализ отношения вновь образованной биометрической характеристики, времени удержания i–ой клавиши, к соответствующему эталонному значению происходит путем соблюдения следующего условия, которое выполняется с помощью мультипликативного фильтра:

mmini < mi < mmaxi (1)

где: mi - результат отношения вновь образованной биометрической характеристики - времени удержания i–ой клавиши, к соответствующему эталонному значению, то есть:

mi = tуд.i / Tуд.i (2)

mmini - отрицательный порог мультипликативного фильтра результатов отношения mi; mmaxi - положительный порог мультипликативного фильтра результатов отношения mi.

После этого общее количество удержаний i-ой клавиши, сравнительные характеристики времен, которой стали пиковыми, то есть не вошли в пределы неравенства (1), суммируется и проверяется согласно следующему условию:

Mmini < (Kуд.i / Nуд.i) * 100% < Mmaxi (3)

где: Kуд.i-количество удержаний i-ой клавиши, сравнительные характеристики времен, которой стали пиковыми, то есть не вошли в пределы неравенства (1); Nуд.i - общее количество удержаний i-ой клавиши в процессе создания сравнительных характеристик; Mmini - минимальное допустимое процентное содержание пиков для i-ой клавиши; Mmaxi - максимальное допустимое процентное содержание пиков для i-ой клавиши.

Для исследования временных интервалов между нажатиями клавишей используются следующие математические выражения.

Пусть:

n = 1…1225 – количество всех возможных комбинаций из двух клавишей (“а”, “б”, … , “я”, “;”, “пропуск”, “.”);

tинт.n – экспериментальный временной интервал между нажатиями клавишей n–ой комбинации;

Tинт.n – эталонный временной интервал между нажатиями клавишей n–ой комбинации.

Анализ отношения вновь образованной биометрической характеристики, временного интервала между нажатиями клавишей, к соответствующему эталонному значению происходит путем соблюдения следующего условия, которое выполняется с помощью мультипликативного фильтра:

mminn < mn < mmaxn (4)

где: m n - результат отношения вновь образованной биометрической характеристики, временного интервала между нажатиями клавишей n–ой комбинации, к соответствующему эталонному значению, то есть:

mn = tинт.n / Тинт.n (5)

mminn - отрицательный порог мультипликативного фильтра результатов отношения m n; mmaxn - положительный порог мультипликативного фильтра результатов отношения m n.

Далее приведены выборочные гистограммы, иллюстрирующие наличие пиковых сравнительных характеристик, то есть значений, которые не вошли в пределы неравенства (1) (рис.4) и неравенства (4) (рис.5).

Общее количество временных интервалов между нажатиями клавишей n-ой комбинации, сравнительные характеристики, которых стали пиковыми, то есть не вошли в пределы неравенства (4), суммируется и проверяется согласно следующему условию:

Mminn < (Kинт.n / Nинт.n) * 100% < Mmaxn (6)

где: Kинт.n - количество временных интервалов между нажатиями клавишей n-ой комбинации, сравнительные характеристики, которых стали пиковыми, то есть не вошли в пределы неравенства (4); Nинт.n - общее количество временных интервалов между нажатиями клавишей n-ой комбинации в процессе создания сравнительных характеристик; Mminn - минимальное допустимое процентное содержание пиков для n-ой комбинации клавишей; Mmaxn - максимальное допустимое процентное содержание пиков для n-ой комбинации клавишей.

Результаты работы фильтра мультипликативных соотношений для всех возможных экспериментальных значений приведены на рис.6 и рис.7. Как можно увидеть из результатов исследования фильтра мультипликативных соотношений времен удержаний клавиш (рис.6), концепция мультипликативного подхода хорошо соотносится с действительным характером изменений времен удержаний в течение всего рабочего дня. Процентное содержание пиков не превышает 10%, в то время как в результатах отношений межсимвольных интервалов (рис.7), только в промежутке утро-день процентное содержание пиков не превышает 20%. Объяснить такое состояние дел можно тем, что дисперсия отклонений времен удержаний клавиш ничтожно мала по отношению к дисперсии отклонений межсимвольных интервалов.

Недостаток мультипликативного подхода заключается в том, что уверенное распознавание пользователя происходит в промежутке утро-день, а при соотношении утренних и вечерних характеристик одного и того же пользователя мультипликативный подход является мало пригодным.

Биометрическая аутентификация на основе аддитивной модели сравнения биометрических характеристик пользователей заключается в следующем.

Механизм аддитивного сравнения характеристик, как было описано выше, заключается в том, что из интервалов между нажатиями клавиш одной матрицы вычитаются соответствующие эталонные значения другой матрицы. Если значение - результат меньше нуля, то сравниваемое время меньше условно-эталонного, а если больше – то больше. Отклонение от эталонного значения будет приниматься в процентах, причем отклонение является положительным, если отношение больше нуля и отрицательным в противном случае.

После получения результатов аддитивной характеристики, все отклонения, которые лежат в пределах допустимых значений отклонений обнуляются, а те отклонения, которые остались за допустимыми пределами – остаются без изменений и выступают в качестве так называемых пиков аддитивной характеристики. Эта процедура называется аддитивным фильтром.

Архитектура модели с аддитивным способом сравнения характеристик в данном случае не показана, так как она идентична архитектуре модели с мультипликативным способом сравнения, за исключением замены мультипликативных фильтров - аддитивными.

Процесс аддитивного сравнения временных характеристик удержаний клавишей описывается следующими математическими выражениями.

Сравнение вновь образованной биометрической характеристики времени удержания i–ой клавиши и соответствующего ей эталонного значения происходит путем соблюдения следующего условия, которое выполняется с помощью аддитивного фильтра:

amini < ai < amaxi (7)

После этого общее количество удержаний i-ой клавиши, сравнительные характеристики времен, которой стали пиковыми, то есть не вошли в пределы неравенства (7), суммируется и проверяется согласно следующему условию:

Аmini < (Kуд.i / Nуд.i) * 100% < Аmaxi (8)

Для исследования временных интервалов между нажатиями клавишей математические выражения будут аналогичны предыдущим.

Сравнения вновь образованной биометрической характеристики, временного интервала между нажатиями клавишей и соответствующего ему эталонного значения происходит путем соблюдения следующего условия, которое выполняется с помощью аддитивного фильтра:

aminn < an < amaxn (9)

После этого общее количество временных интервалов между нажатиями клавишей n-ой комбинации, сравнительные характеристики, которых стали пиковыми, то есть не вошли в пределы неравенства (9), суммируется и проверяется согласно следующему условию:

Аminn < (Kинт.n / Nинт.n) * 100% < Аmaxn (10)

Результаты работы фильтра аддитивных соотношений для приведенных ранее экспериментальных значений показаны на рис.8 и рис.9.

Как для соотношений времен удержаний клавишей, так и соотношений интервалов между нажатиями клавишей прослеживается тенденция увеличения пиков и соответственно более уверенного распознавания пользователя. Процентное содержание пиков при использовании таких соотношений составляет не менее 40%. Это делает аддитивный подход приемлемым для распознавания пользователя.

Недостаток аддитивной фильтрации заключается в том, что уверенное распознавание пользователя происходит лишь при сопоставлении утренних и вечерних характеристик, а при сопоставлении утренних и дневных характеристик одного и того же пользователя аддитивный подход оказывается мало пригодным.

Для разработки нового более эффективного подхода к построению подсистемы сравнения биометрических характеристик пользователей, возникает потребность построить и подвергнуть статистическим исследованиям комбинированную модель биометрической аутентификации.

Если попытаться соединить положительные качества системы мультипликативного сопоставления характеристик и системы аддитивного сопоставления характеристик, то можно получить модель, которая не содержит явных недостатков, и которую, в принципе, можно использовать как базовую в системах динамической аутентификации пользователей на основе клавиатурного почерка.

Идея объединения мультипликативного и аддитивного подходов сводится к созданию некоторого мультипликативно - аддитивного механизма сравнения биометрических характеристик пользователей. Причем механизм мультипликативно - аддитивного сравнения характеристик необходим только для сравнений характеристик временных интервалов между нажатиями клавиш, так как аутентификация пользователей по характеристикам времен удержаний клавиш является приемлемой и в мультипликативном, и в аддитивном механизме сравнений.

Просмотрев характеристики средних времен удержаний клавиш, можно сделать вывод, что их изменение происходит практически случайным образом, а внимательно проанализировав результаты сравнений характеристик одного и того же пользователя аддитивного и мультипликативного механизма сравнений, можно сделать вывод, что аддитивный механизм сравнения дает лучшие результаты.

Предлагается при сравнении характеристик времен удержаний клавиш использовать аддитивный механизм сравнения, тем более что такой механизм используется как в модели “Кобра”, так и в модели “ID – 007”, а при сравнении характеристик интервалов между нажатиями клавиш —использовать мультипликативно - аддитивный подход. Архитектура модели адаптивной системы динамической аутентификации пользователей с новыми, разработанными механизмами сравнений характеристик пользователей представлена на рис.10.

На рис.10 показано, что сбор биометрической информации о работе пользователя происходит при помощи замеров интервалов между нажатиями клавиш и времен удержаний клавиш, после чего полученные результаты формируются в матрицу межсимволных интервалов и вектор времен удержаний клавиш. После сбора биометрической информации, полученные данные сравниваются со своими эталонными значениями в блоке мультипликативно-аддитивного соотношения, а затем происходит фильтрация полученных результатов. Принятие решения по результатам аутентификации заключается в том, что аутентификация считается положительной, если процентное содержание неподавленных результатов соотношений характеристик меньше определенного порога, в противном случае результат аутентификации считается отрицательным.

При отрицательном результате аутентификации выдается сообщение на подтверждение подлинности работающего пользователя. Если процентное содержание пиков превышает предельно-допустимое значение, то результат аутентификации считается отрицательным. В этом случае система предлагает пользователю перерегистрироваться или же происходит простое отключение пользователя от сервера базы данных и ограничение доступа ко всем ресурсам системы. При положительном результате аутентификации пользователь продолжает работу над прикладной задачей, и процесс аутентификации остается незаметным.

Проектируемые программные средства в этом случае должны обеспечивать надежный механизм реализации разработанной системы аутентификации пользователей по клавиатурному почерку, осуществлять согласованное взаимодействие с операционной системой, иметь удобный интерфейс с пользователями и минимальные требования к системным ресурсам.

Аппаратная часть будет представлять собой специализированную ЭВМ, в которой на аппаратном уровне будут реализованы основные алгоритмические участки программной реализации системы, требующие наибольших временных ресурсов. К таким участкам можно отнести, прежде всего, алгоритм сбора биометрических характеристик, выбор эталонных матриц пользователей из оперативной памяти, алгоритм сравнения эталонных характеристик с полученными характеристиками и механизм формирования управляющих сигналов по результату аутентификации.

Разработанная аппаратная реализация алгоритма аутентификации состоит из: генератора тактовых импульсов, делителя тактовых импульсов, часов реального времени, контролера прерываний от клавиатуры, сумматора импульсов, ОЗУ накопления статистики, ОЗУ эталонов, буфера для хранения промежуточных данных, матричного процессора, буфера накопления результатов, модуля формирования управляющих импульсов, интерфейса взаимодействия с управляющей ЭВМ.

Важным фактором, влияющим на качество аутентификации, является использование нестандартных средств ввода информации, например, способа ввода символьной информации в ЭВМ [4] с помощью шестиклавишной клавиатуры [5], изображенной на рис.11 (где а) - клавиатура для левой руки, б) клавиатура для правой руки). Данные средства разрешают зафиксировать пальцы кистей рук на информационных клавишах и исключить их межклавишные перемещения, что способствует акцентированию внимания на более “тонких” биометрических параметрах человека во время динамического процесса ввода информации в ЭВМ.

Динамические возможности человеческой руки на стандартной клавиатуре довольно широкие – это связано с тем, что для нажатия клавишей нужно перемещать пальцы кистей рук на межклавишные расстояния величиной до 40мм., а предлагаемый способ ввода символьной информации в шестиэлементном коде на основе правой и левой круговой развертки ограничивает эти возможности, предъявляя более жесткие требования к работе пользователя с клавиатурой. Предлагаемый метод повышения эффективности аутентификации реализован в разработанном устройстве для ввода символьной информации [5].

 

Клавиатура устройства, показанная на рис.11, состоит из клавиш 1-6, которые установленные на панели 7 и радиально расходятся по ее окружности, причем величина клавиш неодинаковая в зависимости от величины соответствующих пальцев и конгруэнтной ладонной стороны кисти на уровне запястья.

Нужно отметить, что при использовании предложенного устройства и метода появляется возможность не только подтвердить подлинность, но и проанализировать состояние пользователя.

Описанный подход к защите от несанкционированного доступа позволяет:

контролировать физическое состояние сотрудников;

покончить с практикой нарушения правил безопасности при работе с паролями;

обеспечить более простой и такой же надежный метод входа в сеть.

С точки зрения использования скрытого мониторинга компьютерных систем безопасности, представляет интерес классификация психофизических параметров пользователя, к которым относятся: клавиатурный почерк, подпись мышью, реакция на события, происходящие на экране.

Отождествление клавиатурного почерка состоит в выборе соответствующего эталона из списка хранимых в памяти ЭВМ эталонов, на основе оценки степени близости этому эталону параметров почерка одного из операторов, имеющих право на работу с данной ЭВМ. Задача отождествления пользователя сводится к решению задачи распознавания образов. Классический статистический подход в распознавании пользователя по клавиатурному почерку при наборе ключевых слов выявил ряд интересных особенностей: существенная зависимость почерка от буквенных сочетаний в слове; существование глубоких связей между набором отдельных символов; наличие “задержек” при вводе символов.

Полученные результаты позволяют сделать вывод о целесообразности и эффективности применения данного метода для идентификации и аутентификации пользователя по клавиатурному почерку.

Если компьютер уже оснащен средствами анализа биометрических характеристик, стоимость систем биометрической аутентификации будет целиком определяться стоимостью программного обеспечения, которая, в свою очередь, зависит от тиража и должна существенно снизиться в будущем. Одной из предпосылок для этого является возможность разработки подобного программного обеспечения мелкими и средними фирмами, способными создавать конкуренцию в этом секторе рынка.

Список использованной литература:

  1. Горелик А. Л., Скрипкин В. А. Методы распознавания. М.: Высшая школа, 1984.
  2. Фор А. Восприятие и распознавание образов. М.: Машиностроение, 1989.
  3. Трушина Е.А. Идентификация пользователя ЭВМ по клавиатурному почерку, как метод защиты от несанкционированного доступа. 1997. http://www.securityclub.ru/
  4. Широчин В.П., Мухін В.Є., Кулик А.В. “Спосіб введення символьної інформації в ЕОМ”. Рішення № 99063332 від 15.06.1999р. по заявці на винахід (корисну модель). К.: Національний державний центр патентної експертизи, 1999.
  5. Широчин В.П., Мухін В.Є., Кулик А.В. “Пристрій для введення символьної інформації в ЕОМ”. Рішення № 99063546 від 23.06.1999р. по заявці на винахід (корисну модель). К.: Національний державний центр патентної експертизи, 1999.
  6. Фор А., Корман А., Денни-Папен М. Современная математика. М.: Мир, 1986.
  7. Бекман Д. Аутентификация пользователей при подключении к сети. 1997. http://www.koi.mpei.ac.ru/
  8. Ладыженский Г.М. Биометрическая технология. 1997. http://www.icsti.su/
  9. Иванов А.И. Оценка систем биометрической аутентификации. 1998. http://www.confident.ru/
  10. Кобиелус Джеймс. Информационная безопасность: идентификация и аутентификация. 1997. http://www.old.jet.msk.su/