ДонНТУ > Портал магистров ДонНТУ
Биография
Реферат
Библиотека
Ссылки
Отчет о поиске
Автоматизация сбора и обработки статистических данных

При заполнении статистических данных о магистре приходится заполнять шаблонный текстовый файл. Что является не совсем удобным методом сбора статистики, потому что потом этот же файл приходится разбивать машинным методом, и достаточно одной буквы различия, чтобы данные были распознаны как абсолютно разные.

Решение данной проблемы возможно несколькими методами. Они построены на абсолютно разных принципах хранения данных и методов их записи и обработки

Далее идет разбиение на различные ветви дерева решений.

Методы хранения данных

  1. База данных

    Плюсы - полная функциональность(возможны множества таблиц с заранее известными вариантами ввода), жестка структура, наиболее пригодная для сбора и анализа статистики.
    Минусы - требует сервер(если имеет мультидоступ), специальные программные средства для обработки.

    Системы обработки

    1. Локальное исполняемое приложение

      Плюсы - не требует подсоединения к сети, быстро работает.
      Минусы - доступ только с одной машины.
    2. Сетевое исполняемое приложение

      Плюсы - Быстро работает, собирает информацию со многих машин.
      Минусы - Неоправданно большая емкость разработки.
    3. Интернет приложение

      Плюсы - Собирает информацию со всех машин, не требует установки, быстро разрабатывается.
      Минусы - Требует сервер.

    Файлы в формате XML

    Плюсы - Более удобная структура для смежной машинно-ручной обработки, относительно понятна как человеку так и машине. Возможна корректировка без дополнительных программных средств.
    Минусы - Громоздка, множество файлов усложняет процесс машинной обработки, требует обучения синтаксису всех, кто должен работать с файлом.

    Системы обработки

    1. Локальное исполняемое приложение

      Плюсы - Быстро работает
      Минусы - Необходимость собирать файлы в одном месте и вручную запускать процесс обработки.
    2. Сетевое исполняемое приложение

      Не имеет смысла.
    3. Интернет приложение, которое обрабатывает фалы XML

      Плюсы - Собирает информацию со всех машин, не требует установки, быстро разрабатывается.
      Минусы - Усложнен процесс обработки из-за необходимости вручную копировать файлы в заданные координаты на сервере, который при таком подходе выполняет те же действия, что и локальное исполняемое приложение, но на другой платформе.
    4. Интернет приложение, которое создает фалы XML

      Плюсы - Собирает информацию со всех машин, не требует установки, быстро разрабатывается.
      Минусы - Практически не имеет, исключая не логичный для данных целей и возможностей формат представления данных

Из всех различных вариаций исполнения я получил задание написать систему для сбора информации о магистрах основанной на базе данных с заполнением при помощи интернет приложения

Из шаблонного файла были выбраны все заполняемые данные, определен их тип, возможные размеры. Написан скрипт н языке PHP, генерирующий страницу с полями и полными их характеристиками и пояснениями к заполнению.

Вот страница сгенерированная скрипом. На первый взгляд она кажется более громоздкой, но на самом деле полностью отражает шаблонный файл.

Номер Зачетки
Имя - ru(Фамилия Имя Отчество)
Имя - ua(Фамилия Имя Отчество)
Имя - en(имя фамилия))
Качество работы на компьютере(целое число от 1 до 5)
Время полезной работы (в тыс.час)
Время поиска (в тыс.час)

Рабочее место в университете

Время заяняти (День недели, пара)
Аудитория(корпус.аудитория)
Номер компьютера(число)
Процессор(Производитель модель частота(в GHz))
Оперативная память(в МБ)
Диск C всего (в ГБ)
Диск C свободно(в ГБ)
Диск D всего(в ГБ)
Диск D свободно(в ГБ)
USB входы(Количество)
Разрешение экрана(пример 1024х768)
Доступ в интернет (Канал(Kbps) Поставщик)
Операционная система(Производитель версия)
Версия InternetExplorer
Версия Chrome
Версия Mozilla fierfox
Версия Opera
Версия Safari
Графический редактор (Наименование версия)
HTML редактор (Наименование версия)
Текстовый редактор (Наименование версия)
GIF редактор (Наименование версия)
Антивирус (Наименование версия)

Домашнее рабочее место

Тип (Ноутбук, Десктоп)
Процессор(Производитель модель частота(в GHz))
Оперативная память(в МБ)
Диск C всего (в ГБ)
Диск C свободно(в ГБ)
Диск D всего(в ГБ)
Диск D свободно(в ГБ)
USB входы(Количество)
Разрешение экрана(пример 1024х768)
Доступ в интернет (Канал(Kbps) Поставщик)
Операционная система(Производитель версия)
Версия InternetExplorer
Версия Chrome
Версия Mozilla fierfox
Версия Opera
Версия Safari
Графический редактор (Наименование версия)
HTML редактор (Наименование версия)
Текстовый редактор (Наименование версия)
GIF редактор (Наименование версия)
Антивирус (Наименование версия)

Основной внешний носитель памяти

Тип(Flash, HDD, HDD(USB), Diskette, CD-R/RW, DVD-R/RW, Telephone)
Емкость (в МБ(МегаБайты))

Также скрипт предусматривает подсказку, без прочтения которой невозможно начать заполнение.

Идея была взята с портала bash.org.ru

Заключается она в поиске слов в тексте, таким образом чтобы текст был обязательно прочитан, а не просто пролистан. На данном этапе задается простой вопрос, но к моменту выхода система будет содержать сложное, аналитическое предложение

К примеру в данном вопросе нужно найти все слова, начинающиеся на букву а, и выписать их а поле.

Прочитать и переписать все слова начинающиеся на букву `а` для продолжения работы:
  1. Везде, где указанны единицы измерения в поле их не указывать и придерживаться их.
  2. Единицы измерения заданы после предлога `в` в скобках пример - (в МБ), аналогично - (в тыс.час)
  3. Везде, где характеристики указаны с пробелами - заполнять через пробелы.
  4. Везде, где характеристики указаны с запятыми - выбрать одно из значений.
  5. Везде, где характеристики указаны с запятыми и пробелами - выбирать одно из значений через запятые и писать их через пробелы.
  6. Везде, где характеристики указаны через точку - Писать их через точку.
  7. Все характеристики писать в заданном порядке.
  8. Если у вас чего-либо нет из представленного в списке пишите `0`, если значение числовое, и `none`, если буквенное.
  9. Если не знаете характеристику - пишите `none`(Номер зачетки обязателен, если его нет - результаты заполнения не сохраняются).