Исследование производительности видеокарты Asus Geforce GTS 450 в современных игровых приложениях и влияния производительности процессора на скорость работы видеоадаптера
Введение
Видеокарта - это один из тех компонентов современного ПК, который подвергается апгрейду чаще всего. Такие ключевые игроки рынка графических адаптеров, как AMD и NVIDIA постоянно обновляют линейки своих продуктов, поэтому видеокарта морально устаревает в течение 1-2 лет. Конечно, хочется поддерживать свое железо в актуальном состоянии, но не все могут позволить себе купить дорогие, производительные решения для своей системы. А зачастую и "мейнстрим" решения имеют недоступные цены. К тому же большинство пользователей не имеют мониторов, поддерживающих высокие разрешения. Основная масса людей имеют мониторы с диагональю 22 дюйма и работают на разрешениях 1680x1050 и ниже. 24-дюймовые мониторы пока не стали массовыми, так как большинство не может себе позволить видеокарту, которая обеспечит комфортный fps в играх при выводе изображения на такие мониторы (разрешение 1920х1200). В данной работе мною будет исследована произволительность видеокарты GeForce GTS 450 от фирмы Asus в современных игровых приложениях.
Архитектура Geforce GTS 450
Видеокарта Geforce GTS 450 основанна на чипе с кодовым именем GF106, который основанн на вычислительной архитектуре «Fermi». Данная архитектура поддерживает все технологии современного DirectX 11 API, такие как аппаратная тесселяция и вычислительные возможности DirectCompute и отличается от старших GPU на чипе GF104 в основном количеством вычислительных блоков.
GF106 очень похож на GF104, и, глядя на их сравнительные характеристики, поначалу кажется, что это ровно половинка от GF104. На деле отличий больше, и в GF106 скорее 0.6 или даже 0.7 от GF104. В новом GPU содержится ровно вдвое меньше потоковые мультипроцессоров (Streaming Multiprocessor), а соответственно и вычислительных процессоров, но количество каналов памяти, а вместе с этим и блоков ROP и L2 кэша, отличается менее чем в два раза.
Известно, что наиболее важным отличием текущей архитектуры NVIDIA является значительная переработка геометрического конвейера. Чтобы соответствовать новым возможностям DirectX 11, в современных GPU от NVIDIA была значительно увеличена пиковая производительность обработки геометрии. Новая архитектура геометрической обработки использует несколько полиморфных движков (PolyMorph Engines) и блоков растеризации (Raster Engines), работающих параллельно.
Аналогично предыдущим чипам линейки, в основе GF106 лежит кластер графической обработки (Graphics Processing Cluster), в данном случае он один и содержит четыре потоковых мультипроцессора (Streaming Multiprocessors), которые, в свою очередь, имеют в своём составе по 48 потоковых процессоров, как и у GF104. Общие сведенья о характеристиках графического ускорителя GeForce GTS 450 представлены ниже.
Графический ускоритель GeForce GTS 450
- Кодовое имя чипа GF106;
- Технология производства 40 нм;
- 1.17 миллиарда транзисторов;
- Унифицированная архитектура с массивом процессоров для потоковой обработки различных видов данных: вершин, пикселей и др.;
- Аппаратная поддержка DirectX 11 API, в том числе шейдерной модели Shader Model 5.0, геометрических (geometry) и вычислительных (compute) шейдеров, а также тесселяции;
- 192-битная шина памяти, три независимых контроллера шириной по 64 бита каждый, с поддержкой GDDR5 памяти;
- Частота ядра 783 МГц (для GTS 450);
- Удвоенная частота ALU 1566 МГц (для GTS 450);
- 4 потоковых мультипроцессора, включающих 192 скалярных ALU для расчётов с плавающей точкой (поддержка вычислений в целочисленном формате, с плавающей запятой, с FP32 и FP64 точностью в рамках стандарта IEEE 754-2008);
- 1 блок растеризации с четырьмя движками PolyMorph;
- 32 блока текстурной адресации и фильтрации с поддержкой FP16 и FP32 компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
- 3 широких блока ROP (24 пикселя) с поддержкой режимов антиалиасинга до 32 выборок на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг;
- Запись результатов до 8 буферов кадра одновременно (MRT);
- Интегрированная поддержка RAMDAC, двух портов Dual Link DVI, а также HDMI и DisplayPort.
Перейдем непосредственно к тестированию.
Тестирование видеоадаптера
Для моделирования нагрузки в современных играх мною использованны такие тестовые пакеты как: 3D MARK 2006, 3D MARK VANTAGE, 3D MARK 2011, UNIGINE HEAVEN. Тестовый стенд включает следующее оборудование:
- Процессор AMD Phenom II x3 710;
- Видеокарта Asus ENGTS450 DICU 1Gb DDR5 128 bit;
- Материнская плата Asus M4A77T;
- ОЗУ 2 гб;
- Жеткий диск Seagate Barracuda 7200.12 500 Gb;
- Блок питания FSP 500 W;
- Монитор LG W2042T;
- Операционная система Windows 7 x86.
Номинальная частота работы процессора Phenom II x3 равна 2600 МГц. Процессор удалось разогнать с номинальной частоты 2600 МГц до 3500 при напряжении 1.425 V. Ведеоадаптер с номинальных частот 783 МГц и 3600 МГц ядра и памяти соответсвенно в разгоне достиг частот 950 МГц по ядру и 3800 МГц по памяти. Скорость работы куллера видеокарты была установленна в ручном режиме на 50% от максимальной. Уровень шума издаваемого от системы охлаждения умеренный.
Все настройки в тестовых приложениях установлены на уровне Perfomance при разрешении экрана 1280 на 720. Результаты при стандартных частотах видеокарты и разогнанного процессора приведены в таблице 1.
3D MARK 2006 | 14561 |
SM2.0 | 6217 |
SM3.0 | 6582 |
CPU | 3859 |
3D MARK VANTAGE | 10124 |
GT1 | 26,38 |
GT2 | 25,19 |
CPU1 | 1108,52 |
CPU2 | 124,54 |
Graphics score | 8805 |
CPU score | 31744 |
3D MARK 2011 | 2205 |
GT1 | 10,35 |
GT2 | 10,16 |
GT3 | 12,87 |
GT4 | 6,06 |
PC | 9,47 |
CT | 10,06 |
Heaven Benchmark | 830,00 |
FPS | 33,00 |
Min FPS | 20,10 |
Max FPS | 71,90 |
Как видно из таблицы 1 на средних настройках графики в играх 2011 года видеокарта Geforce GTS 450 будет не способна обеспечить комфортный уровень производительности. В данных играх прийдется существенно снижать настройки качества или разрешение экрана. В играх 2008 года можно играть на средних и даже более настройках качества. Результаты тестирования при разогнанной видеокарте приведены в таблице 2.
3D MARK 2006 | 16015 | 9,986% |
SM2.0 | 6699 | 7,753% |
SM3.0 | 7425 | 12,808% |
CPU | 3875 | 0,415% |
3D MARK VANTAGE | 12596 | 24,417% |
GT1 | 30,99 | 17,475% |
GT2 | 29,54 | 17,269% |
CPU1 | 1133,59 | 2,262% |
CPU2 | 147,36 | 18,323% |
Graphics score | 10339 | 17,422% |
CPU score | 36630 | 15,392% |
3D MARK 2011 | 2620,00 | 18,821% |
GT1 | 12,54 | 21,159% |
GT2 | 12,31 | 21,161% |
GT3 | 15,66 | 21,678% |
GT4 | 7,34 | 21,122% |
PC | 9,92 | 4,752% |
CT | 11,88 | 18,091% |
Heaven Benchmark | 942,00 | 13,494% |
FPS | 37,40 | 13,333% |
Min FPS | 20,10 | 0,000% |
Max FPS | 81,00 | 12,656% |
Разогнанная видеокарта в среднем обеспечивает 14% уровень прироста производительности. Найбольший же уровень прироста до 24% можно будет заметить в играх 2008 года.
Исследование влияния скорости процессора на производительность видеоадаптера
Каждый 3D-объект задается некоторой моделью, состоящей из элементарных геометрических объектов – полигонов. В процессе формирования каждого кадра центральный процессор (CPU) рассчитывает количество объектов, их расположение в пространстве, источники освещения и т.д., то есть – формирует кадр в «каркасном» представлении. Далее, этот «каркас» вместе с информацией о том, как его надо «раскрашивать», передается видеоадаптеру. И, наконец, после того, как видеоадаптер наложит на каркас все необходимые текстуры, освещение, тени – мы получаем финальное изображение, которое и видим на экране дисплея.
Когда производительность видеоподсистемы (скорость «закраски») более чем достаточна, количество получаемых кадров в секунду ограничивается количеством «каркасов», которые может создать центральный процессор, то есть – пропорционально его производительности. Конечно, приведенный пример весьма условен и характер распределения нагрузки между центральным процессором и видеокартой гораздо более сложен. В общем процесс рендеринга 3D сцены приведен на рисунке 1.
Зависимость производительности в играх от частоты процессора можно проследить по таблице 3. Тестирование производилось на стандартных частотах процессора.
3D MARK 2006 | 12649 | -21,018% |
SM2.0 | 5211 | -22,212% |
SM3.0 | 6499 | -12,471% |
CPU | 2859 | -26,219% |
3D MARK VANTAGE | 12270 | -2,588% |
GT1 | 30,65 | -1,097% |
GT2 | 29,26 | -0,948% |
CPU1 | 840,7 | -25,837% |
CPU2 | 125,43 | -14,882% |
Graphics score | 10230 | -1,054% |
CPU score | 30530 | -16,653% |
3D MARK 2011 | 2452,00 | -6,412% |
GT1 | 12,47 | -0,558% |
GT2 | 12,28 | -0,244% |
GT3 | 15,55 | -0,702% |
GT4 | 7,34 | 0,000% |
PC | 7,55 | -23,891% |
CT | 9,43 | -20,623% |
Heaven Benchmark | 890,00 | -5,520% |
FPS | 36,00 | -3,743% |
Min FPS | 20,10 | 0,000% |
Max FPS | 79,90 | -1,358% |
Как видно из таблицы 3 практически во всех тестовых пакетах разница в снижении производительности в среднем сотсавляет 5-6%. Исключением является 3D MARK 2006, что не удивительно игры 2006 года не в состоянии полностью нагрузить видеоадаптер Geforce GTS 450 и узким местом тут как раз и становится производительность процессора.
Выводы
В итоге проведенных тестов можно сделать выводы, что видеокарта Nvidia Geforce GTS 450 способна обеспечить комфортный игровой процесс при максимальных настройках графики лишь в играх 2-3 х летней давности. В современных игровых приложениях прийдется либо понижать разрешение, либо качество графики. Также было установлено, что скорость работы процессора в современных игровых приложениях для данной видеокарты не имеет особого значения, так как она ограничивается производительностью видеокарты.
Использованные источники
1) Сайт корпорации Nvidia [Электронный ресурс]. – Режим доступа: http://www.nvidia.com/
2) Сайт корпорации Asus [Электронный ресурс]. – Режим доступа: http://www.asus.com/