Биография
Реферат
Библиотека
Ссылки
Отчет о поиске
Индивидуальное задание





Ссылки:
ДонНТУ
Портал магистров ДонНТУ

Поисковик плагиата

Автор:

Таран Антон Валентинович


          Мотивом для разработки данной системы поиска плагиата стала, в первую очередь, актуальность проблемы использования студентами материалов других авторов без указания надлежащих ссылок на автора. Тема довольно актуальна и не только в сфере образования, но и в целом в сети интернет.

          Поставленная задача: программно отсылать запрос поисковику и вынимать из результата число с количеством найденных результатов, на основании которого можно сделать вывод о том, был ли текст, включающий данную фразу, "позаимствован" из других источников.

          Также данная тематика заинтересовала меня возможностью изучения способов программной работы с поисковыми системами. Мною были изучены и опробованы различные методы программного доступа к поисковым системам, среди которых:

  • Google AJAX Search API - на javaScript, главный метод GwebSearch(). Не подошел для решения поставленной задачи из-за ограничение на количество возвращаемых результатов.
  • Yandex.XML - возвращает xml-файл с результатами поиска. Может быть использован в данной задаче, но несколько сложнее в реализации, чем выбранное решение, и дает доступ только к поиску в Yandex.

          Для решения проблемы был выбран наиболее универсальный метод - посылка обычного запроса на поиск различным системам поиска (каждой в соответствии с её форматом), получение страниц результатов в виде строки при помощи PHP-функции file_get_contents() и вынимание из неё цифры с результатом при помощи функции preg_match() (для каждой системы поиска нужны различные условия вырезания, так как страницы результатов у них отличаются).

          Плюсы данного подхода - универсальность работы (можно легко адаптировать к любой поисковой системе) и простота реализации. К минусам можно отнести необходимость следить за тем, чтобы любая из использованных поисковых систем не поменяла формат вывода строки с указанием результата, в случае чего необходимо подправлять условия вырезания в скрипте.

Внешний вид:

Поисковик плагиата

Реализация:


[ Биография]     [ Реферат]     [ Библиотека]     [ Ссылки]     [ Отчет о поиске]