Порфиров Павел Александрович

Факультет компьютерных наук и технологий

Кафедра компьютерной инженерии

Специальность: Инженерия программного обеспечения

Тема магистерской работы: Повышение производительности синтеза стерео-изображений трёхмерных сцен методом трассировки лучей на параллельных графических процессорах

Научный руководитель: к.т.н., доц. Зори Сергей Анатольевич

Отчёт об информационном поиске

Представленный отчёт позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск выполнен с использованием четырёх поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 18 запросов, имеющих отношение к магистерской работе. Из них 3 запроса соответствует названию магистерской работы на трёх языках, 3 запроса с ФИО руководителя, а также 9 запросов с ключевыми понятиями по теме магистерской работы.

Ниже приведены таблицы с отчётами о поиске, а также сравнительный анализ результатов поиска в разные периоды времени.

Отчёт о поиске за 27.02.2014

Поисковый запрос http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua
На русском языке
Повышение производительности синтеза стерео-изображений трехмерных сцен методом трассировки лучей на параллельных графических процессорах ≈ 670 62 000 19 ≈ 5
Зори Сергей Анатольевич, ДонНТУ ≈ 246 67 000 53 ≈ 61
Интерактивная трассировка лучей ≈ 6 970 103 000 1 290 ≈ 1 820
Параллельный графический процессор ≈ 210 000 481 000 29 700 ≈ 55 000
CUDA, трассировка лучей ≈ 24 200 134 000 1 840 ≈ 1 020
Трассировка лучей, ускоряющие структуры ≈ 5 380 116 000 56 119
На украинском языке
Підвищення продуктивності синтезу стерео-зображень тривимірних сцен методом трасування променів на паралельних графічних процесорах 3 7 000 3 0
Зорі Сергій Анатолійович, ДонНТУ ≈ 668 22 000 21 ≈ 37
Інтерактивне трасування променів ≈ 1 060 15 000 10 ≈ 41
Паралельний графічний процесор ≈ 107 000 57 000 4 020 ≈ 3 910
CUDA, трасування променів ≈ 727 3 000 22 ≈ 7
Трасування променів, прискорюючі структури 5 26 000 2 ≈ 2
На английском языке
Enhancing performance of stereo-image ray tracing synthesis using parallel graphics processors ≈ 19 200 369 000 30 500 ≈ 2 210
Sergey Zori, DonNTU ≈ 181 18 000 5 ≈ 105
Interactive ray tracing ≈ 809 000 2 000 000 2 580 000 ≈ 833 000
Graphics processor unit ≈ 3 740 000 4 000 000 7 540 000 ≈ 9 620 000
CUDA, ray tracing ≈ 213 000 288 000 88 100 ≈ 19 800
Ray tracing, acceleration structures ≈ 287 000 1 000 000 31 600 ≈ 1 080 000

Отчёт о поиске за 05.04.2014

Поисковый запрос http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua
На русском языке
Повышение производительности синтеза стерео-изображений трехмерных сцен методом трассировки лучей на параллельных графических процессорах ≈ 757 90 000 17 ≈ 7
Зори Сергей Анатольевич, ДонНТУ ≈ 302 69 000 236 ≈ 58
Интерактивная трассировка лучей ≈ 6 580 102 000 1 260 ≈ 1650
Параллельный графический процессор ≈ 3 730 000 372 000 30 100 53 400
CUDA, трассировка лучей ≈ 3 030 78 000 7 290 ≈ 1160
Трассировка лучей, ускоряющие структуры ≈ 1 060 117 000 55 ≈ 115
На украинском языке
Підвищення продуктивності синтезу стерео-зображень тривимірних сцен методом трасування променів на паралельних графічних процесорах 3 20 000 3 0
Зорі Сергій Анатолійович, ДонНТУ ≈ 704 11 000 21 ≈ 26
Інтерактивне трасування променів ≈ 1 210 4 000 10 ≈ 36
Паралельний графічний процесор ≈ 114 000 59 000 3 890 ≈ 3 870
CUDA, трасування променів ≈ 498 2 000 21 ≈ 7
Трасування променів, прискорюючі структури 5 25 000 2 ≈ 2
На английском языке
Enhancing performance of stereo-image ray tracing synthesis using parallel graphics processors ≈ 12 400 383 000 30 300 ≈ 2 090
Sergey Zori, DonNTU ≈ 118 20 000 4 ≈ 107
Interactive ray tracing ≈ 1 890 000 2 000 000 419 000 ≈ 1 040 000
Graphics processor unit ≈ 15 500 000 4 000 000 6 620 000 ≈ 10 100 000
CUDA, ray tracing ≈ 168 000 284 000 46 400 ≈ 20 100
Ray tracing, acceleration structures ≈ 774 000 1 000 000 30 600 ≈ 998 000

Отчёт о поиске за 06.05.2014

Поисковый запрос http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua

На русском языке

Повышение производительности синтеза стерео-изображений трехмерных сцен методом трассировки лучей на параллельных графических процессорах ≈ 662 62 000 18 ≈ 6
Зори Сергей Анатольевич, ДонНТУ ≈ 834 81 000 231 ≈ 109
Интерактивная трассировка лучей ≈ 6 400 97 000 1 200 ≈ 1 640
Параллельный графический процессор ≈ 403 000 767 000 30 000 ≈ 54 600
CUDA, трассировка лучей ≈ 30 200 131 000 1 830 ≈ 1 050
Трассировка лучей, ускоряющие структуры ≈ 3 770 130 000 53 ≈ 126
На украинском языке
Підвищення продуктивності синтезу стерео-зображень тривимірних сцен методом трасування променів на паралельних графічних процесорах 3 7 000 3 1
Зорі Сергій Анатолійович, ДонНТУ ≈ 786 26 000 20 ≈ 38
Інтерактивне трасування променів ≈ 1 080 15 000 6 ≈ 319
Паралельний графічний процесор ≈ 133 000 63 000 4 020 ≈ 7 830
CUDA, трасування променів ≈ 2 130 3 000 15 ≈ 862
Трасування променів, прискорюючі структури 5 26 000 2 ≈ 2
На английском языке
Enhancing performance of stereo-image ray tracing synthesis using parallel graphics processors ≈ 12 700 393 000 30 000 ≈ 2 120
Sergey Zori, DonNTU ≈ 65 21 000 4 ≈ 514
Interactive ray tracing ≈ 460 000 2 000 000 366 000 ≈ 77 500
Graphics processor unit ≈ 3 360 000 4 000 000 5 810 000 ≈ 10 500 000
CUDA, ray tracing ≈ 141 000 286 000 43 400 ≈ 18 500
Ray tracing, acceleration structures ≈ 175 000 1 000 000 30 500 ≈ 235 000

Анализ результатов поиска

Следующие диаграммы демонстрируют динамику изменения обобщённых характеристик результатов поиска, вычисленных на основе всей совокупности данных о запросах на разных языках для соответствующего отчётного периода.

На первой диаграмме изображено суммарное количество ресурсов, найденное поисковыми системами в ответ на множество запросов на каждом языке. Можно заметить резкое возрастание количества результатов, предоставленных системой Google пятого апреля. На фоне снижения данного показателя у систем Yandex и Bing, а также сравнительно незначительного повышения у системы Meta, данный скачок следует расценивать как аномалию. Часть дальнейшего исследования будет посвящена объяснению показаний Google.

Вторая и третья диаграммы отражают среднее количество результатов и радиус разброса (стандартное отклонение) количества результатов. Последняя диаграмма позволяет сделать вывод, что количество результатов, выдаваемое системой Yandex для различных запросов, распределено наиболее равномерно, так как степень разброса за все отчётные периоды практически не изменилась и осталась минимальной среди всех поисковых систем, кроме Google. Что касается Google, то на обеих диаграммах можно заметить вышеуказанную аномалию. Интересно также отметить высокую степень разброса количества результатов в данном отчётном периоде (3.69 млн. результатов), которая значительно превышает среднее количество результатов (1.23 млн. результатов), из чего следует, что на отдельные запросы было получено существенно больше результатов, чем на другие, причём, максимальное количество результатов должно было быть не менее 4.92 млн.

Динамика изменения общего количества ресурсов, найденных поисковыми системами

Динамика изменения общего количества ресурсов, найденных поисковыми системами

Динамика изменения среднего количества ресурсов, наденных поисковыми системами

Динамика изменения среднего количества ресурсов, наденных поисковыми системами

Динамика изменения разброса количества найденных поисковыми системами ресурсов относительно их среднего количества

Динамика изменения разброса количества найденных поисковыми системами ресурсов относительно их среднего количества

В дальнейшем исследовании учитываются отдельные языковые группы запросов, а также конкретные запросы каждой языковой группы. Для сокращения содержания таблиц и легенд, отображаемых на диаграммах, обозначим запросы их порядковыми номерами в пределах языковой группы. Таким образом, вне зависимости от того, в базисе какого языка построена диаграмма, запросы (или группы одинаковых запросов на разных языках) всегда будут обозначены цифрами 1-6.

Прежде всего, интересно выяснить запросы каждой языковой группы, в ответ на которые разные поисковые системы вывели максимальное и минимальное количество результатов. Значения в таблице, приведённой ниже, отсортированы по возрастанию количества найденных ресурсов, позволяя таким образом косвенно судить о степени популярности того или иного запроса в поисковых системах. Наиболее популярные запросы выделены красным цветом, запросы с наименьшим количеством найденных результатов — голубым. Далее будет приведён анализ запросов, получивших граничные оценки популярности, а сейчас можно отметить, что на втором месте, вне зависимости от языка запроса и даты его выполнения, всегда стоят запросы с порядковыми номерами 3, 5, 6.

Распределение степени популярности между запросами в разные отчётные периоды (выше расположены наименее популярные запросы, ниже — запросы с большей популярностью). Щёлкните по заголовку группы запросов, чтобы развернуть её.

27.02.2014
http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua
05.04.2014
http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua
06.05.2014
http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua

Следует отметить, что без учёта алгоритмов работы поисковых систем, приведённые показатели можно воспринимать лишь в качестве косвенных оценок популярности. Например, все поисковые системы выполняют фильтрацию результатов, выводя лишь наиболее релевантные запросу. Для определения степени релевантности, используются разные алгоритмы. Разные алгоритмы используются и для последующей фильтрации результатов с неприемлемым содержимым, для определения принадлежности результатов тому или иному региону (для чего обычно анализируется не только домен, на котором расположен сайт, но и его содержимое). Можно заметить, к примеру, что часто система Meta выдавала для запросов именно на английском языке существенно большее количество результатов, чем системы Bing и Google, хотя данная система ориентирована именно на поиск по украинским ресурсам (о чём можно судить, исходя хотя бы из того, что кнопка поиска на главной странице имеет подпись Найти в Украине, а также согласно Википедии).

Интересно изучить наиболее и наименее популярных запросы, а также их изменение за время отчётных периодов. На следующей диаграмме отражены граничные данные о наиболее и наименее популярных запросах, приведённые в предыдущей таблице. Можно заметить, что максимальное количество результатов каждая поисковая система всегда выдавала на запрос 4, вне зависимости от языка запроса. Цифрой 4, в соответствии с выбранными правилами нумерации, обозначены запросы Параллельный графический процессор, Паралельний графічний процесор и Graphics processor unit. Неизменен также и наименее популярный запрос для всех отчётных периодов в группе запросов на английском языке. Запрос 2, Sergey Zori, DonNTU оказался наименее популярным запросом во всех поисковых системах во все отчётные периоды.

Тенденция изменения наиболее и наименее популярных запросов для различных поисковых систем в разные отчётные периоды

На гистограмме отражена тенденция изменения наиболее и наименее популярных запросов для различных поисковых систем в разные отчётные периоды

Остальные запросы распределены неравномерно по отчётным периодам. В следующей таблице приведено значение моды, вычисленной по строкам вышеприведённой таблицы (для граничных строк), что позволяет определить наиболее и наименее популярных запросы среди всех поисковых систем. Вообще говоря, с учётом небольшого количества анализируемых значений, данные показатели можно легко определить, исходя из диаграммы, изображённой на рисунке 2. Из таблицы видно, что для всех поисковых систем среди всех запросов на украинском языке наименее популярным оказался запрос, включающий текст темы магистерской работы. Для группы русскоязычных запросов в число наименее популярных вновь попали запросы 1 и 2.

Рассчитанные значения моды для групп наиболее и наименее популярных запросов для разных поисковых систем

Язык запросов 27.02.14 05.04.14 06.05.14
Русский 1 4 2 4 1 4
Украинский 1 4 1 4 1 4
Английский 2 4 2 4 2 4

Для того чтобы объяснить причины низкой или высокой популярности тех или иных запросов, необходимо знать алгоритм анализа запросов поисковыми системами. Не зная алгоритмов, можно лишь делать предположения об истинных подоплёках полученных показателей.

Вероятнее всего запрос 4 оказался неоспоримым лидером среди всех остальных запросов, так как он, касается лишь одной тематики (все другие запросы захватывают несколько тематик одновременно, например, CUDA, ray tracing), причём довольно популярной и широкой. Таким образом, изначальная формулировка текста запроса оказалась недостаточно конкретизированной.

Интересно, что наиболее низкая популярность запроса, содержащего текст темы дипломной работы, наблюдается именно в его украино- и русскоязычной формулировках. На английском языке данный запрос по популярности (по количеству найденных ресурсов) обогнал запрос 2. Это можно объяснить тем, что запрос 1 содержит ключевые слова, наиболее популярные в англоязычном пространстве (stereo image, ray tracing), в то время как элементы запроса 2 в нём не настолько распространены. Здесь нужно отметить, что, несмотря на достаточно высокие показатели по запросу 2 в таблицах с отчётами, поисковые системы обычно находили не более 10 ресурсов, действительно связанных с ДонНТУ или Зори С. А. Проведённый дополнительно поиск по запросу Sergey Zori выдавал не более 3 действительно релевантных результатов (большинство из них ссылались на публикацию на английском языке). Ситуация с запросами 1 и 2 на русском и украинском языках противоположна.

Возвращаясь к вопросу об аномальном поведении поисковой системы Google пятого апреля, вначале рассмотрим распределение количества результатов, найденных в ответ на различные запросы. Из диаграммы, приведённой ниже, видно, что максимальное количество результатов было получено в результате выполнения запроса 4 на английском языке, что соответствует запросу Graphics processor unit.

Распределение количества результатов, найденных системой Google 05.04.2014 по соответствующим запросам, выполненным на различных языках

Распределение количества результатов, найденных системой Google 05.04.2014 по соответствующим запросам, выполненным на различных языках

Исходя из полученной информации, можно сделать предположение о причине резкого повышения количества найденных результатов по данному запросу. В марте текущего года Imagination Technologies Group анонсировала семейство мобильных GPU, PowerVR Wizard, предоставляющих аппаратное ускорение трассировки лучей. Вероятнее всего, данный анонс стал основной причиной увеличения количества ресурсов, найденных системой Google.