Назад в библиотеку

Программная система для перевода текста с помощью камеры мобильного устройства

Автор: Власюк Д.А., Коломойцева И.А.
Источник: Материалы студенческой секции VІІI Международной научно-технической конференции «Информатика, управляющие системы, математическое и компьютерное моделирование» (ИУСМКМ-2017). – Донецк: ДонНТУ, 2017. – С.150-156.

Аннотация

Власюк Д.А., Коломойцева И.А. Приложение для перевода текста с помощью камеры мобильного устройства «VlasiukTranslate» В работе сформированы итоговые требования к разрабатываемой системе, приведено описание основных алгоритмов, функциональных возможностей, интерфейса приложения и дальнейшее планирование при выполнении дипломного проекта.

Введение

Данная статья посвящена описанию собственного приложения, использующего камеру мобильного устройства для перевода текста с одного языка на другой. В [1] выполнен сравнительный анализ аналогов и определены их достоинства и недостатки, представленные в виде таблицы. Необходимо отметить, что качество работы приложения зависит от многих воздействующих факторов, например, от камеры мобильного устройства, освещения, в котором выполняется снимок и т. д. Полный список данных факторов представлен в [1].

В результате анализа аналогичных программ, представленного в [1], наиболее успешным признано приложение GoogleTranslate, которое имеет высокий процент распознавания символов, быструю скорость перевода, и поддерживает большое количество языков. Также неплохие результаты показали CameraTranslate и CamTraslator, которые немного уступают предыдущему приложению, однако являются достойными представителями данной области.

К недостаткам существующих систем, относится использование большого объема памяти, необходимого для скачивания обновлений, а также пакетов словарей. Отсутствие офлайн перевода ограничивает пользователя в возможностях работы с приложением без наличия Интернета, что является минусом некоторых существующих приложений. Также страдает скорость работы, стабильность распознавания и возможность получения перевода как больших объемов текста, так и маленьких. Еще одним недостатком некоторых готовых приложений было отсутствие русифицированной версии, однако данное замечание касается только определенного региона проживания. Такое приложение как CamTranslatorPro оптимизировано только под iOS и не имеет версии для Android, несмотря на значимость этой платформы и количество пользователей [1]. Получив все необходимы сведения, об аналогах, сформировалось виденье разрабатываемого программного продукта, который должен соответствовать необходимым требованиям и не уступать уже существующим приложениям.

Целями написания статьи являются:

Требования к разрабатываемой программной системе

После изучения и анализа существующих приложений, использующих камеру мобильных устройств для ввода исходной информации, а также после прочтения отзывов пользователей к данным продуктам, были сформированы требования к функционалу будущего приложения.

Приложение должно обладать следующими характеристиками:

Система должна включать в себя модуль распознавания символов из изображения, а также модуль перевода полученного текста на необходимый язык и, собственно, интерфейс приложения. Данная программа должна быть разработана с помощью среды AndroidStudioи средств языка Java.

Описание программной системы

Работа с данными является основой разрабатываемого приложения. В качестве исходных данных выступает изображение с текстом, который необходимо распознать. Также для обеспечения возможности успешного распознавания, используются специальные словари, по которым и происходит получение связанных слов и предложений из набора символов.

Для начала работы пользователю необходимо выбрать высококачественное изображение из галереи, или же сделать моментальный снимок интересующего текста. После чего, система проверит, если ли на мобильном устройстве необходимые словари для выполнения распознавания. В случае их отсутствия, произойдет создание каталога и копирование необходимых файлов на телефон или планшет. Далее, программа проанализирует выбранный файл и попытается выдать распознанный текст. Диаграмма состояний для работы модуля распознавания символов представлена на рисунке 1.

Диаграмма состояний для модуля распознавания текста

Рисунок 1 – Диаграмма состояний для модуля распознавания текста

Перевод – деятельность по интерпретации смысла текста на одном языке и созданию нового эквивалентного ему текста на другом языке [2]. Перевод будет осуществляться с использованием трех языков: русский, английский и немецкий. Для получения переведенного текста необходимо реализовать базу данных, в которой и будут содержаться необходимые слова. При переводе будет производиться проверка наличия слова в базе, и в случае отсутствия нужного слова, оно будет найдено с помощью Интернета. После чего будет производится сохранение полученной информации.

На рисунке 2 представлена диаграмма прецедентов программной системы, основными актерами которой являются пользователь, камера и файловая система.

Диаграмма прецедентов

Рисунок 2 – Диаграмма прецедентов

Диаграмма прецедентов (диаграмма вариантов использования) – диаграмма, отражающая отношения между актерами и прецедентами и являющаяся составной частью модели, позволяющей описать систему на концептуальном уровне [3].

Интерфейс и экранные формы приложения

Интерфейс программы – это то, с чем непосредственно имеет дело пользователь, он взаимодействует с приложением именно благодаря интерфейсу. Поэтому пользовательский интерфейс приложения должен быть удобным и простым для понимания [4]. Данное приложение содержит два экрана, на рисунке 3 показаны экранные формы программной системы.

На главном экране расположены два выпадающих списка, с помощью которых пользователь может выбрать язык, с которого и на который нужно выполнить перевод. Также здесь расположены кнопки для выбора существующих файлов из галереи, и для создания моментального снимка, а также кнопка для перехода к второму экрану на котором и будет отображаться переведенный и исходный тексты.

Экранные формы приложения

Рисунок 3 – Экранные формы приложения

На втором экране присутствуют поля для распознанного и для переведенного текста. Поле для исходного текста позволяет редактировать полученные с изображения данные. Это необходимо для того, чтобы пользователь смог исправить возможные ошибки и получить более качественный перевод.Помимо этого на экране находится кнопка для повторного перевода отредактированного текста и кнопка возврата на главную форму.

Все возможности приложения должны быть интуитивно понятны для обычного пользователя. Однако, справа в верхнем углу находится специальное меню. На вкладке «О программе» описаны основные сведения о приложении, версия, автор и прочая дополнительная информация. Пункт «Справка» предназначен для справки по работе приложения, его функционалу и возможностях для пользователя. Также здесь находится кнопка для завершения приложения.

Выводы

В ходе выполнения данной работы сформированы окончательные требования к разработке программной системы для перевода текста с использованием камеры мобильного устройства. Также представлено описание данной системы, показан алгоритм работы отдельного модуля и интерфейс программы.

В ходе дальнейшей разработки необходимо обеспечить быстрый и качественный перевод полученного текста, после чего приложением можно свободно пользоваться в различных областях, например, в путешествиях или же при прочтении книг на иностранном языке.

Список использованной литературы

  1. Коломойцева И.А., Власюк Д.А «Приложение для перевода текста с помощью камеры мобильного устройства «VlasiukTranslate»» //Программная инженерия: методы и технологии разработки информационно – вычислительных систем (ПИИВС-2016): сборник научных трудов I научно – практической конференции (студенческая секция). – Донецк, ГОУ ВПО «Донецкий национальный технический университет», 2016 – 34-38 с.
  2. Перевод. [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Перевод
  3. Диаграмма прецедентов. [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Диаграмма_прецедентов
  4. Требования к дизайну пользовательского интерфейса. [Электронный ресурс]. – Режим доступа:http://www.okd.mdk.ksue.edu.ua/index.php?option=com_content&view=ar ticle&id=174&Itemid=90