Введення
Розвиток інформаційних технологій і IT індустрії в цілому спричинило виникнення ряду
проблем пов'язаних з наданням та обробкою інформації. Однією з найактуальніших на
сьогоднішній день є проблема захисту інформації. Комп'ютери використовуються в банківських
системах, в аеропортах, медицині, наукових дослідженнях, засобах масової інформації,
тому інформація впливає майже на всі сфери діяльності будь-якої компанії, від її достовірності
і правдивості залежать результати роботи, безпеку виробництва і навіть безпеку людей.
Усередині будь-якої організації інформація, яка обробляється її співробітниками, не може виходити
за її межі. Більше того будь-яка інформація, яка була отримана і оброблена членами компанії,
є її власністю і не може бути використана або змінена іншими сторонніми компаніями.
Для забезпечення захисту інформації при передачі її між співробітниками чи відділами
використовуються стеганографічні алгоритми. Стеганографія – це наука про приховану передачу
інформації шляхом збереження в таємниці самого факту передачі [
2]. Зараз популярність набирає
так звана лінгвістична стеганографія – приховує повідомлення, змінюючи параметри елементів
з яких складається носій або створюючи новий носій таким чином, щоб він містив
передане повідомлення. Іншими словами, метою лінгвістичної стеганографії є приховування
факту передачі інформації а також її шифрування [
1].
У ДонНТУ утаєнням інформації за допомогою лінгвістичних ресурсів займалася К. Є. Ларіонова, тема її магістерської
роботи: „Методи кодування довільної інформації в комп'ютерних текстах на основі лінгвістичних ресурсів“ [
7].
Так само даною проблемою займалася І. В. Соколенко, тема магістерської роботи: „Система приховування інформації на основі лінгвістичних ресурсів“ [
8 ].
1 Цілі і завдання дослідження, плановані результати
Для реалізації магістерської роботи були поставлені наступні цілі та завдання:
- – дослідити існуючі методи лінгвістичної стеганографії;
- – визначити переваги і недоліки досліджених методів;
- – розробити власний метод лінгвістичної стеганографії на основі існуючих;
- – розробити програму, яка буде реалізовувати розроблений метод.
Таким чином, в результаті виконання роботи, планується отримати власний метод
лінгвістичної стеганографії та програмне забезпечення, яке буде його реалізовувати.
2 Огляд методів лінгвістичної стеганографії
2.1 Семаграма
Семаграма – приховування інформації за допомогою знаків або символів.
Наприклад, знак рукою, головою, певна послідовність чисел
або слів, все це семаграми. Такі знаки не кидаються в очі,
і не помітні для стороннього людини. Іноді використання візуальних
семаграмм – єдиний спосіб зв'язку з друзями та колегами.
Однак необхідно заздалегідь визначити необхідні знаки, для використання при спілкуванні.
Рисунок 2.1 — Схема семаграми
Текстові семаграми – це послання, приховані всередині тексту.
Заголовні букви, підкреслення, особливості почерку, прогалини між
буквами і словами – всі вони можуть бути використані для передачі
будь-якого повідомлення [3].
Переваги:
- – непомітно для сторонніх осіб;
- – простота реалізації.
Єдиним недоліком є простота реалізації, через яку досить легко можна отримати приховану інформацію.
2.2 Фонетика
Даний спосіб можна застосувати, якщо точно знати на яку мову запрограмований
фільтр, який „відловлює“ слова на тій мові, яка переважно використовують
жителі країни. Іноді (на додачу) і на тій мові, яка сильно поширений або
використовується на веб–сайтах (англійська, французька). Звичайно, не можна з упевненістю
сказати, як в точності запрограмований фільтр. Але щоб наблизитися до розуміння,
можна використовувати фонетично схожі слова. Цей спосіб найбільш підходить, якщо
ви використовуєте алфавіт, відмінний від прийнятого в вашій країні
(наприклад, латинський замість української) [
3]. Приклад: політв'язень politvyazen.
Єдина перевага цього методу – простота реалізації.
Недоліки:
- – легко отримати приховану інформацію;
- – фактично інформація не приховується.
2.3 Жаргон
У будь-якій мові існує поняття жаргон. Жаргон – социолект;
відрізняється від загальнорозмовного мови специфічною лексикою і фразеологією,
експресивністю зворотів і особливим використанням словотворчих засобів,
але не володіє власною фонетичної і граматичної системою. Жаргонні
слова або виразу називають „жаргонізмами“ [
4]. Використання жаргонів в тексті
може спантеличити стороннього читача. Більше того жаргонні слова можуть бути
придумані членами листування. Для реалізації даного методу створюється база даних
слів і відповідних жаргонів, при приховуванні слова замінюються. Одержувач, повинен
обов'язково знати використані жаргонізми що б зрозуміти текст повідомлення. Краще
вибирати такі слова, які збережуть текст – „носій“ в зрозумілому вигляді,
навіть якщо сприймати жаргонізми „як є“ [
3].
Рисунок 2.2 — Схема методу жаргонів
Переваги:
- – простота реалізації;
-
– якщо зберігати текст в читається вигляді, не виникне підозр про наявність прихованої інформації.
Недоліки:
- – перелік слів обмежений учасниками листування;
- – одержувач повинен знати жаргони;
-
– при невдалому використанні жаргонів, зловмисник може здогадатися і зрозуміти прихований зміст повідомлення
2.4 Приховане кодування
Окремий випадок лінгвістичної стеганографії, найбільш складний в
реалізації, однак забезпечує високу скритність інформації.
У даному методі використовується спеціальна функція, яка шифрує
і дешифрує повідомлення для передачі. Найбільш простим способом є
„перша буква“. Сенс у тому, що кожна буква приховуваного повідомлення
стає першою буквою слова нового повідомлення – шифру, який передається одержувачу.
Приклад такого методу знаходиться за посиланням [
3].
Ще один тип прихованого коду полягає у використанні спеціальної
формули для виділення прихованого повідомлення з „повідомлення – контейнера“ [3].
Рисунок 2.3 — Повідомлення – шифр
Якщо ввести дане повідомлення на сайті, на який можна перейти за посиланням [5], то ми отримаємо вельми цікавий результат.
Рисунок 2.4 — Вихідне повідомлення
Рисунок 2.5 — Приховане повідомлення
Загальна схема методу прихованого кодування представлена на рис.2.6.
Рисунок 2.6 — Загальна схема приховування інформації
(Файл gif з анімацією був створений в програмі Easy GIF Animator.
Анімація містить 7 кадрів, інтервал перемикання між ними 1сек,
7 циклів повторення, розмір становить 85.4 КБ.)
Переваги:
- – при наявності програми шифрування дешифрування, одержувачу не обов'язково знати алгоритм приховування інформації;
- – міцна стійкість до дешіфорванію;
-
– важко зрозуміти, що повідомлення – шифр має прихований підтекст.
Недоліки:
- – складність реалізації;
-
– при генерації тексту „повідомлення – контейнера“ важко отримати читається вигляд переданого повідомлення
Таблиця 1 – Порівняльна таблиця методів стеганографії
Наявність гідності / недоліку
|
Семаграмма
|
Фонетика
|
Жаргон
|
Приховане кодування
|
Складність реалізації |
– |
– |
– |
+ |
Легкість визначення наявності зашифрованого повідомлення |
– |
+ |
– |
– |
Легкість дешифрування повідомлення |
+ |
+ |
+ |
– |
Штучні обмеження (наприклад: запас слів у відправника і
одержувача, або інші умовності між ними) |
+ |
+ |
+ |
– |
Аналізуючи таблицю 1, можна зробити висновок, що найбільш якісним методом
стеганографії є приховане кодування. Даний метод гарантує повне
приховування самого факту передачі повідомлення, не має обмежень, проте він же
є найскладнішим в реалізації.
Висновки
Були розглянуті основні методи лінгвістичної стеганографії, які використовуються для приховування інформації при передачі. Встановлено переваги і недоліки кожного методу.
Таким чином, в попередніх досліджень було з'ясовано, що найбільш стійким методом лінгвістичної стеганографії, є приховано кодування. Даний метод має складну реалізацію, яка пов'язана з генерування слів за допомогою певної функції, однак саме даний метод маскує сам факт передачі прихованого повідомлення і отримати це повідомлення без певного ключа (функції) практично неможливо. Тому власний метод, який буде розроблений в процесі виконання магістерської роботи, буде ґрунтуватися на способі прихованого кодування.
На момент написання даного реферату, магістерська робота ще не завершена, проте завдяки проведеному дослідженню обрано напрямок для подальшого дослідження та вивчення поставленої мети, а саме розробки власного алгоритму лінгвістичної стеганографії.
Список джерел