КОМБИНИРОВАННАЯ ПЕРЕДАЧА СООБЩЕНИЙ

Жога А.В.


Источник: «Современные проблемы радиотехники и телекоммуникаций»/ Материалы 6-й международной молодежной научно-технической конференции. — Севастополь, СевНТУ — 2010, с. 519.


КОМБИНИРОВАННАЯ ПЕРЕДАЧА СООБЩЕНИЙ
Жога А.В.
Научный руководитель: канд. техн. наук, доц. Турупалов В.В.
Донецкий национальный технический университет,
Кафедра автоматики и телекоммуникаций
ул. Артема 58, г. Донецк, 83001,  Донецкая обл., Украина
e-mail: ******


Abstract — arising problems at code conversion of messages are described  in this article.
1. Введение
При обмене сообщениями возникает проблемой с передачей информации в различные сети, например между пользователем сети Интернет или пользователем факсимильного аппарата или телеграфной сетью. Но при этом всем могут возникнуть проблемы при преобразовании кодировок, так как у пользователей могут быть разные почтовые клиенты. В докладе рассмотрены возможные ситуации искажения информации.
2. Основная часть
В Интернете сложился фактический стандарт электронной переписки в виде своего рода формулы он выражается так: "plain text, KOI8-R, 8bit body, 8bit header", стало также желательно "MIME".To есть фиксируется что передается - чистый текст, язык и кодировка - KOI8-R и как - транспортная кодировка тела сообщения отсутствует (8bit body), в заголовках разрешаются 8-битные символы, и они тоже не кодируются (8bit header). Следует оформлять письмо по стандарту MIME. Возникла задача внедрения KOI8-R в Windows, появились koi8-шрифты и koi8-раскладки клавиатуры, что было не вполне удобно, не решало проблему корректного MIME-оформления, но хотя бы решало проблему с кодировкой и читаемостью. Провайдеров взяли на себя часть проблем адаптации пользователей IP-доступа к стандартам и появились перекодирующие серверы, которые позволяли ограничиться в Windows обычной поддержкой русского языка: передаваемая русская почта перекодировалась из СР1251 в KOI8-R, а принимаемая - из KOI8-R в CP1251. При этом технология накладывала жесткие ограничения на форматы и язык письма, к тому же не укладывается в интернетовские стандарты. Как правило, письма перекодируются независимо от значения charset в заголовке, что позволяет без ограничений посылать письма только на русском или английском языке и не позволяет менять кодировку русского письма даже при необходимости. А еще через какое-то время распространились общедоступные программы, которые более или менее корректно сами умели работать с различными кодировками, в первую очередь Microsoft Internet Explorer, и наличие перекодирующих входов у провайдеров в сочетании с этими программами стало приводить к порче электронных писем. В то же время появились методы вставить в почтовые программы поддержку KOI8-R. Тем самым полезность перекодирующих серверов у провайдеров все более снижается, а их роль как дополнительного источника проблем все растет. Основным преимуществом KOI8-R является только то, что она представляет собой фактический стандарт и что наличие стандарта лучше, чем его отсутствие. Одно из реальных преимуществ Windows-кодировки именно в почте - пригодность для большинства языков с кириллицей, что не обеспечивается KOI8-R и привело к появлению украинских и белорусских клонов КОИ-8 (в частности, KOI8-U). На WWW-страничках сейчас Windows-кодировка явно оттеснила KOI8-R. Преимущества KOI8-R как почтовой кодировки - это полная совместимость и наличие взаимно однозначного соответствия с русской DOS-кодировкой (одним из вариантов СР866), включая псевдографику. Тем самым обеспечиваются удобства для досовских пакетов UUPC. Оказалось также, что встроить более или менее нормальную работу с KOI8-R в программы под Windows проще, чем сделать это для DOS-кодировки, к тому же в KOI8-R и СР1251 русские буквы занимают одну и ту же область, поэтому всевозможные, даже многократные перекодировки друг в друга - в этой области - оказываются взаимно однозначными, так что большинство испорченных сообщений в принципе можно прочесть. КO18-U уже не подходят под стандартную перекодировку KOI8-R в DOS, в них отсутствует часть псевдографики, и это не на пользу КОИ-8. Обнадеживающим свойством искаженных кодировок является возможность восстановления испорченного письма - перекодировка между СР1251 и KOI8-R стандартна и взаимно однозначна в области 32 русских букв, занимающих в них одну и ту же область. И на практике все сообщения, за крайне редкими исключениями, оказываются в одной из четырех кодировок: KOI8-R, Windows (CP1251), win-to-koi или koi-to-win. Ситуация сильно осложняется, если лишним перекодировкам подвергаются другие варианты.

3. Заключение

Таким образом, если же у адресата уже есть некоторая почтовая система, которую он не хочет менять, то остается выяснять путем экспериментов, какие именно сообщения он способен принимать и декодировать и выбрать в итоге взаимоприемлемый способ. Таким способом вполне может стать использование DOS-кодировки, последующее UU-кодирование текста и отправка его в теле сообщения. Большинство программ, однако, воспринимает UU-кодированный фрагмент как приложение, так что теряется возможность его просмотра "в теле" и автоматического квотирования при ответе.

 

 

ВЕРНУТЬСЯ НАЗАД