ДонНТУ | Портал магистров ДонНТУ | | | |
Индивидуальный раздел«Сбор семантической информации из сетевого источника – портала магистров ДонНТУ»Выполнил: Сероштан Сергей Юрьевич |
Автобиография | Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальное раздел |
Портал магистров ДонНТУ функционирует с 2000-го года. В настоящее время количество персональных страниц магистров насчитывает более 2700. Ежегодно магистры разрабатывают свои персональные странички, которые несут в себе полезную информацию для потенциальных работодателей, а именно:
Для удобства использование портала, для каждого выпуска готовится галерея магистров. Раз в несколько лет структура галереи изменялась, вследствие чего сформировалось несколько разнородных типов галерей. Это и стало предпосылкой формирования данного индивидуального задания. Целью которого, является программный анализ различных структур галерей, извлечения из них полезной информации и сохранение ее в переносимом формате (в качестве переносимого формата был выбран XML). В дальнейшем предполагается написание программного обеспечения, позволяющего генерировать шаблонные странички на основе XML файлов. В данной работе используется сбор семантической информации из двух файлов галереи 2008 года:
Схематично задачу, выполняемую разрабатываемым программным обеспечением (далее - конвертер), можно отобразить на следующей диаграмме (рис. 1).
Рисунок 1 – Назначение конвертера Основное окно программы содержит следующие элементы управления (рис. 2):
Рисунок 2 – Основное окно конвертора При нажатии на кнопку открытия файла, открывается стандартное окно выбора файла (рис. 3), где отображаются только HTML-файлы (*.htm, *.html).
Рисунок 3 – Стандартное окно открытия файла При нажатии на кнопку выбора файла назначения, открывается стандартное окно сохранения файла (рис. 4), где отображаются только файлы XML (*.xml).
Рисунок 4 – Стандартное окно сохранения файла При нажатии на кнопку конвертирования, происходит выделение полезной информации из HTML-файла и сохранения ее в XML-файл. После чего появляется сообщение о завершении преобразования (рис. 5).
Рисунок 5 – Окно сообщения о завершении конвертирования Входной HTML-файл галереи магистров 2008 года можно посмотреть здесь. Выходной XML-файл галереи магистров 2008 года можно посмотреть здесь. Входной HTML-файл с темами выпускных работ магистров 2008 года можно посмотреть здесь. Выходной XML-файл с темами выпускных работ магистров 2008 года можно посмотреть здесь. Copyright © 2009, ДонНТУ, Сероштан Сергей Юрьевич |
Автобиография | Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальный раздел |