Магистр ДонНТУ Алтынпара Евгений Олегович

Алтынпара Евгений Олегович
Факультет: Вычислительной техники и информатики
Специальность: Программное обеспечение автоматизированных систем
Тема выпускной работы: Решение задач большой размерности на кластере
Руководитель: доцент, к.т.н. Ладыженский Юрий Валентинович

Отчет о результатах поиска по теме выпускной работы
Пояснения к отчету и таблицам:

Поиск проводился в феврале и мае 2009г. Использовались поисковые системы: Google, Yandex, Rambler, Yahoo, Meta, MSN. При этом получены две таблицы с результатами по запросам: «Решение задач большой размерности на кластере»,"Meeting the challenges of large-scale on the cluster", «Рішення задач великої розмірності на кластері »,«кластер»,"high-performance computing",«оптимізація обчислень на кластері»,«параллельное программирование»,"mpi", «програмування на кластері»,«высокопроизводительный компьютерный кластер»,"mpi applications",«високопродуктивні паралельні обчислення».

Отчет о поиске за 24.02.2009:
Поисковый запрос Google (EN) Google (UA) Yandex Rambler Yahoo Meta MSN
«Решение задач большой размерности на кластере» 3100 3100 11000 1185 435 367 1260
"Meeting the challenges of large-scale on the cluster" 1010000 121000 110000 505 2650000 328 603000
«Рішення задач великої розмірності на кластері» 77 76 136 56 4 50 8
«кластер» 962000 962000 4000000 1000000 1140000 43300 284000
"high-performance computing" 20600000 52600000 718000 205000 97600000 19100 17000000
«оптимізація обчислень на кластері» 428 427 528 134 176 25
«параллельное программирование» 159000 167000 1000000 896000 186000 20800 834000
"mpi" 11400000 11400000 944000 416000 29900000 18900 3270000
«програмування на кластері» 2780 2760 1582 1527 94 134 219
«высокопроизводительный компьютерный кластер» 8260 8100 117000 27000 679 1200 14500
"mpi applications" 2250000 2250000 158000 17000 4410000 567 1090000
«високопродуктивні паралельні обчислення» 378 376 643 177 33 233 22
Отчет о поиске за 24.05.2009:
Поисковый запрос Google (EN) Google (UA) Yandex Rambler Yahoo Meta MSN
«Решение задач большой размерности на кластере» 3410 3380 14000 1263 296 1600 2280
"Meeting the challenges of large-scale on the cluster"  173000 448000 199000 149 2040000 406 653000
«Рішення задач великої розмірності на кластері» 128 149 167 19 1 52 10
«кластер» 850000 852000 5000000 84000 1160000 72100 219000
"high-performance computing" 30200000 98600000 4000000 220000 82300000 17400 15000000
«оптимізація обчислень на кластері» 601 601 599 140 186 23
«параллельное программирование» 153000 158000 1000000 1000000 142000 29700 735000
"mpi" 11500000 11700000 1000000 458000 24300000 41900 3100000
«програмування на кластері» 3670 3660 1732 363 50 559 217
«высокопроизводительный компьютерный кластер» 74100 72400 107000 24000 699 1600 14900
"mpi applications" 2640000 2540000 180000 18000 3610000 678 1050000
«високопродуктивні паралельні обчислення» 431 433 443 220 22 265 16
Анализ результатов поиска:

Для проведения анализа по произведенному поиску необходимо охарактеризовать работу каждой поисковой системы по отдельности, далее дать характеристику результату выдачи поисковой системы в зависимости от языка сформированного запроса, далее дать характеристику исходя из гео положения. На основе этой характеристики можно будет сделать заключение об информационной ситуации по теме выпускной работы за исследуемый период.

Google.com и google.com.ua – оценивая результаты этой поисковой системы можно сделать вывод о увеличении общей массы ссылок на интернет ресурсы содержащие информацию по распределенным системам, кластерным и высокопроизводительным вычислениям. О чем можно судить по этим данным:

  • Данная тема является приоритетной в данное время, ведется исследовательская работа, выпускаются системы для организации распределенных вычислений.
  • Компания Google является лидером де-факто по оптимизации результатов выдачи результатов – компания ежемесячно вкладывает огромные средства в развитие алгоритмов поиска информации, качеству фильтрации (к примеру, ресурсы содержащие плагиат или совершенно не обновляемые, созданные для привлечения посетителей для заработка на рекламе – сегодня успешно обнаруживаются и удаляются из результирующей раздачи)
  • Рост результатов свидетельствует об увеличении количества ресурсов по теме магистерской работы, как информационных, так и исследовательских.
  • Следует сказать о  роли поисковой системы Google - она в некой степени интеллектуальна, то есть в связи с тем, что она является ведущей при поиске у пользователей Internet  - она находит большее количество информации по данной тематике.
  • Увеличение числа результатов выдачи у google.com.ua по сравнению с google.com свидетельствует о возрастающем проявлении интереса пользователями интернет именно в нашем государстве. Об этом подробнее при характеристике гео положения.

Yandex.ru – данная система является второй в странах СНГ по использованию в качестве поисковой системы. За исследуемый период произошло увеличение количества ссылок в связи с развитием параллельных исследований, а также в связи с улучшением качества поиска самой системы. Следует сказать, что результирующими при  выдаче в системе Яндекс является индекс цитируемости, то есть количество ссылок на ресурс. Мы видим картину, что количество ссылок по англоязычным запросам большее (много русскоязычных ресурсов ссылается на англоязычную документацию). По русскоязычным ресурсам результатов больше чем у Google, связанно с распространенности Яндекс  на территории стран бывшего СНГ.

Rambler.ru из исследуемых поисковых систем занимает 3 место по русскоязычным запросам и 4 по англоязычным запросам. За последний год мы наблюдаем значительное расширение поисковой составляющей Rambler – это связано с тем, что приоритетным направлением в развитие свой компании Организаторы поставили именно развитие поисковой системы. За время исследования также увеличил общую массу ссылок, примерно на 4-10 процентов.

Yahoo.com – данная поисковая система заняла 3 место по англоязычным запросам, это связанно с тем, что большинство пользователей данного сервсиса является представителями западных стран, а русская и украинская часть  пользователей весьма мала, можно сделать предположение о том что оптимизационная работа поисковой системы направленная в первую очередь на большую интеграцию с западными информационными ресурсами.

Meta.ua - украинская поисковая система, по результатам поиска можно сказать, что была значительно расширенна база ссылок, качество выдачи результатов находиться на хорошем уровне. Результаты свидетельствует как о развитии исследований по тематике магистерской работы, так и развитие самой поисковой системы. По сравнению с лидерами поисковых систем количество ссылок не велико, но исходя из новизны сервиса и качества подборки можно сделать вывод о хорошем развитии данной системы.

MSN – поисковая система компании Microsoft пользуется спросом у разработчиков программного обеспечения. По результатам выдачи – количество ссылок увеличилось.

То, на каком языке были составлены поисковые запросы - сильно повлияло на количество ссылок в выдаче. Это связанно с тем, что:

  • Распространенностью английского языка среди исследователей и разработчиков программного обеспечения.
  • С нашей стране тема параллельных вычислений тоже получила свое развитие, но большее количество информационных материалов – идет на русском языке, чем на украинском.
  • В общем можно сказать о росте количества информационных ресурсов по трем языкам, с учетом того для каких целей используется каждый язык и о количестве населения использующего конкретный язык – участвующих в исследованиях.

На основе результатов поиска можно сделать заключение гео расположении центров по исследованиям. В основном это научные университеты либо исследовательские центры. По расположению можно сказать следующее большинство исследований – это запад, далее Россия, потом Украина. Следует сказать, что по уровню исследований во всех странах достаточно высокий уровень изучения и исследований направления распределенных вычислений.

Исходя из всего вышесказанного, можно сделать вывод, что количество исследований и соответственно информации в области параллельного программирования увеличивается с каждым месяцем, и является одним из наиболее приоритетных направлений в области разработки программного обеспечения и информационных систем.