Концепция идеи:
Полуавтоматическая система приёма рефератов, докладов, тезисов для преподавателей ДонНТУ со встроенной системой проверки на плагиат, уникальность и наличие заимствований как из общедоступных сетевых источников так и из лично накапливаемой базы данных работ.
Актуальность
В наше время поток информации настолько велик, что переварить его в одиночку становится всё тяжелее, а в некоторых случаях, уже вообще является неподъёмной задачей. К таким задачам относится приём рефератов, докладов и тезисов. Для перечитывания огромного количества работ может просто не хватить времени, поэтому необходим простой помощник, который будет на первичном этапе производить грязное отсеивание работ по признакам плагиата и неуникальности. Так же необходима единая, удобная система хранения и рецензирования сдаваемых материалов. Всем этим требованиям как нельзя лучше отвечает предложенная концепция web-портала, призванная облегчить, ускорить и повысить продуктивность образования как с качественной, так и с количественной стороны.
Назначение
Портал предназначен для приёма на проверку рефератов, тезисов, докладов; рецензирования работ; отсеивания копий, плагиата и неуникальных работ.
Возможности:
Автоматический проверка поступающих материалов по поисковым системам (Google, Yandex, Yahoo!, MSN, etc) как по ключевым словам, так и по частями текста, для отслеживания заимствования.
Указание конкретных сайтов (к примеру сайтов с рефератами) либо локальных директорий, в которых хранятся работы прошлых лет, по которым будет производится принудительный поиск плагиата.
Первичный приём работ на проверку средствам электронной почты, который лишает необходимости не только транспортировать большое количество бумажных материалов, но и экономит время и деньги, создавая единую базу работ.
Рецензирование материалов и оповещение исполнителя о проверенной работе средствами электронной почты.
Проверка списка литературы на адекватность и существование источников, использую, к примеру, базу данных библиотеки ДонНТУ.
Всё это приправлено интуитивно понятным web-интерфейсом.
Возможные пути достижения
Движок web-интерфейса можно быстро развернуть с использованием вэб-фреймворка Django и яыка программирования Python.
Процесс поиска плагиата и неидентичности можно построить на алгоритме поиска нечетких дубликатов под названием «Алгоритм Шинглов». Данный алгоритм используется в таких поисковых системах как Google и Yandex для ранжирования и валидации документов. Поиск нечетких дубликатов позволяет исключить из выдачи клоны или частично похожие страницы (добавление предложений в абзац; замена некоторых слов, без изменения всего предложения).
Ссылки на похожие по сервисы
http://www.antiplagiat.ru — сервис антиплагиата, однако в соответствии с проведенными тестами показал очень плохие результаты. Куски рефератов не были найденны, хотя простой поиск по поисковой системе Google предоставил далеко не один найденный результат результат.
http://www.web-content.com.ua/antiplagiat.html — простой сервис проверки текста на уникальность.