Система обнаружения и предотвращения утечки данных
Автор: Aishwarya Jadhav, Pramila M. Chawan
Перевод: Потреба Е.Ю.
Источник: Aishwarya Jadhav, Pramila M. Chawan, A System for Detection and Prevention of Data Leak
Аннотация
В последние годы технологии развиваются экспоненциально, и большинство организаций хранят свои данные в цифровом формате. С быстрым развитием технологий возникает необходимость в обеспечении безопасности данных. Это чрезвычайно важно, так как потеря данных может иметь огромное влияние на организацию.
Предотвращение утечки данных стало одной из самых больших проблем для организаций. В целях безопасности организации внедрили несколько методов, таких как внедрение политик, брандмауэров, VPN и т. д. Однако с усовершенствованием методов кражи данных эти меры безопасности больше не являются надежными. Следовательно, возникла потребность в системе, способной предотвратить утечку данных. Кроме того, поскольку сотрудники имеют доступ к конфиденциальной информации компании, они могут утечь информацию либо по небрежности, либо намеренно.
Следовательно, защита данных стала большой проблемой для организаций. В этой статье мы предлагаем систему, которая позволит достичь целей информационной безопасности организации и будет способна обнаруживать утечку данных в любых состояниях. Предлагаемая система в основном ориентирована на предотвращение утечки данных.
Ключевые слова: предотвращение утечки данных, конфиденциальные данные, утечка, данные.
1. Введение
Безопасность стала важным фактором в нашей жизни. Безопасность требуется во всех отраслях промышленности. Злоумышленник имеет различные способы доступа к конфиденциальной информации любой организации. Следовательно, предотвращение доступа таких злоумышленников к информации является основной целью информационной безопасности. Нам необходимо реализовать различные стратегии для защиты информации.
Утечка данных происходит, когда неавторизованные пользователи могут получить доступ к конфиденциальным или конфиденциальным данным. Утечка данных может произойти намеренно через сотрудников организации или злоумышленников. Это также может быть непреднамеренная утечка сотрудниками. В любом случае данные передаются за пределы организации. Утечка данных обычно происходит через электронную почту. Это также может происходить через устройства хранения данных, такие как ноутбуки.
Данные — один из самых ценных активов любой организации. Поэтому предотвращение утечки данных является важнейшей задачей любой организации. Даже с такими мерами безопасности, как брандмауэры, утечка данных все еще происходит.
В любой организации сотрудники имеют доступ к конфиденциальным данным. Следовательно, существует вероятность того, что утечка данных произойдет через сотрудников, а не через злоумышленников.
1.1 Типы данных
Любая организация должна иметь дело с тремя типами данных, чтобы предотвратить утечку данных:
- Данные в движении. Это относится к данным, которые перемещаются из сети во внешний мир через Интернет.
- Данные в состоянии покоя. Это относится к данным, которые хранятся в файловых системах, базах данных и других методах хранения.
- Данные в конечной точке.
Это относится к данным, присутствующим на конечных точках в сети.
Большинство организаций сканируют электронные письма, полученные изза пределов организации, на наличие вредоносных программ. Но они не проверяют электронные письма, отправляемые за пределы организации, что позволяет отправлять конфиденциальную информацию за пределы организации.
Наиболее распространенными причинами утечки данных являются:
- Взлом.
- Вредоносное ПО.
- Непреднамеренное раскрытие.
- Вирус.
- Черви.
- Внутренняя утечка.
- Потеря данных.
1.2 Причины потери данных
Ниже приведены распространенные причины утечки данных:
- Потеря данных из-за стихийного бедствия. Стихийные бедствия, такие как наводнения, могут разрушить жесткие диски, что приведет к потере данных. В этом случае восстановление данных возможно через резервные копии.
- Потеря данных из-за неправильного обращения. Диск может быть случайно поврежден из-за неправильного обращения с ним. Это приведет к потере данных. В этом случае восстановление данных возможно через резервные копии.
- Потеря данных из-за случайного форматирования диска. Во многих случаях люди случайно форматируют свои диски, что приводит к потере данных. В этом случае восстановление данных все еще возможно.
- Потеря данных из-за случайного удаления данных. Во многих случаях люди могут случайно удалить данные с жесткого диска. Здесь данные удаляются непреднамеренно. Чтобы предотвратить это, пользователи должны тщательно подумать, прежде чем удалять данные.
- Потеря данных из-за преднамеренного удаления данных. Иногда пользователи могут намеренно удалить данные с жесткого диска, а позже они потребуют их. Данные по-прежнему можно восстановить из корзины. Если корзина была очищена, можно использовать программное обеспечение для восстановления удаленных файлов корзины.
- Потеря данных из-за повреждения системы. Поврежденная файловая система или база данных неизбежно приведет к потере данных. В этом случае возможно восстановление данных.
- Потеря данных из-за сбоя питания. Если произойдет сбой питания и пользователь не сохранил свой файл, данные будут потеряны. Чтобы предотвратить это, пользователи должны сохранять файлы во время работы.
- Потеря данных из-за программного сбоя. Во многих случаях программное обеспечение внезапно дает сбой или зависает во время работы. В результате программа закрывается и вся несохраненная работа теряется.
1.3 Причины утечки данных
Вирусная атака. Если компьютер заражен вирусами и червями, шпионским ПО, рекламным ПО и т. д., это может привести к повреждению и потере данных. Для предотвращения этого следует использовать антивирус.
Вредоносная атака. Злоумышленные и злонамеренные злоумышленники могут взломать систему и украсть, изменить или удалить ценную информацию. Это приведет к утечке данных. Предотвращение утечки данных (DLP) — это практика обнаружения и предотвращения утечек данных и уничтожения конфиденциальных данных. Это набор инструментов и процессов, используемых для предотвращения доступа, удаления или изменения конфиденциальных данных неавторизованными пользователями. Программное обеспечение DLP классифицирует данные по различным категориям и проверяет наличие нарушений политик, определенных организациями. При нарушении этих политик DLP выдает предупреждения и принимает другие меры защиты, чтобы предотвратить случайный или злонамеренный обмен конфиденциальной информацией конечными пользователями.
2. Обзор литературы
В этом разделе делается обобщение существующей исследовательской работы. Новая Система обнаружения и предотвращения утечек данных будет создана на базе существующей работы с дополнительными функциями.
В [ 1 ] предлагаемая система использует различные методы, такие как регулярные выражения на основе правил, отпечатки пальцев базы данных, точное сопоставление файлов, частичное сопоставление документов, статистический.
анализ, концептуальный/лексикон, которые используются для защиты конфиденциальных данных организации.В [ 2 ] предлагаемая система решает, разрешен ли доступ к определенному фрагменту данных или нет. Он использует алгоритм предотвращения утечки данных с отметкой времени. Отметка времени используется для предоставления разрешения на доступ к определенным данным, поскольку в определенный период времени данные являются конфиденциальными, а после отметки времени те же данные могут стать неконфиденциальными.
В [ 3 ] предлагаемая система основана на драйвере минифильтра файловой системы, который будет блокировать нежелательные операции с файловой системой, такие как копирование конфиденциального файла на съемное запоминающее устройство. Система позволяет перехватывать и блокировать запросы ввода-вывода, исходящие от API CopyFile или ReadFile. Он также блокирует внешние устройства, такие как SD-карты, USB-накопители или внешние жесткие диски.
В [ 4 ] представлена модель предотвращения утечки данных для классификации данных на основе семантики. Он использует статистический анализ данных для обнаружения эволюционировавших конфиденциальных данных. Он использует функцию информационного поиска Term Frequency-Inverse Document Frequency (TF-IDF) для классификации документов по разным темам. Матрица Singular Value Decomposition (SVD) также использовалась для визуализации результатов классификации.
В [ 5 ] предлагается метод предотвращения утечки данных для проверки утечек данных в электронной переписке организации. Метод использует комбинацию контекстного и контент-анализа, что обеспечивает лучшее понимание потока конфиденциальных данных в организации. Контекстный анализ используется для измерения RAI. Это достигается путем вычисления пяти компонентов контекста в сообщении электронной почты. Утечки конфиденциальных данных пользователям с высоким RAI обнаруживаются с помощью анализа семантики контента. Результаты показывают возможности утечки конфиденциальных данных среди выбранных испытуемых.
3. Предлагаемая методология
3.1 Постановка задачи
Разработать систему обнаружения и предотвращения утечки данных.
3.2 Разработка проблемы
В этой системе данные будут защищены с помощью DLP. DLP — это метод предотвращения отправки пользователями конфиденциальных данных за пределы организации. Система используется для проверки любых действий по передаче данных, которые могут привести к утечке данных. Система будет контролировать и отслеживать действия конечной точки. Он также будет отслеживать данные в облаке для защиты данных в состоянии покоя, в движении и при использовании. Он также будет генерировать отчеты и выявлять слабые места в системе для повышения безопасности.
3.3 Методология

Рисунок 1 – Модель предотвращения утечки данных
Утечку данных можно предотвратить с помощью DLP. Это можно реализовать с помощью следующих мер:
- Внедрите централизованную DLP, которая заботится обо всех состояниях данных.
- Привлечение квалифицированных специалистов с соответствующей организационной моделью.
- Классификация данных на два типа: конфиденциальные и нечувствительные
- Процесс внедрения должен быть поэтапным
- Внедрение DLP не должно влиять на рабочий процесс бизнес-процесса
- Отчеты должны быть более эффективными
- Перед внедрением DLP необходимо принять достаточные меры безопасности.
4. Вывод
Утечка данных является серьезной проблемой для многих организаций. Утечка данных может иметь катастрофические последствия для любой организации. Следовательно, предотвращение утечки данных очень важно. В этой статье предлагается система обнаружения и предотвращения утечки данных, которая позволит достичь целей безопасности организации. Предлагаемый метод прост в реализации и может быть полезен для многих организаций.
Список источников
- S. Czerwinski, R. Fromm, and T. Hodes, “Digital Music Distribution and Audio Watermarking” 256 58, 2007. NCAICN-2013, PRMITR, Bandera 399.
- Y. Li, V. Swarup, and S. Jajodia, “Fingerprinting Relational Databases: Schemes and Specialties,” IEEE Trans. Dependable and Secure Computing, vol. 2, no. 1, pp. 34-45, Jan.-Mar. 2015.
- Y. Cui and J. Widom, “Lineage Tracing for General Data Warehouse Transformations,” The VLDB J., vol. 12, pp. 41-58, 2014.
- Panagiotis Papadimitriou and Hector Garcia-Molina, “Data Leakage Detection,” IEEE Trans, Knowledge and Data Engineering, vol. 23, no. 1, January 2013.
- P. Bonatti, S.D.C. di Vimercati, and P. Samarati, “An Algebra for Composing Access Control Policies,” ACM Trans. Information and System Security, vol. 5, no. 1, pp.1-35, 2011.