Воспользовавшись достоинствами микроархитектуры графических ускорителей последнего поколения, инженеры nVidia разработали "персональный суперкомпьютер".
Двадцатого июня 2007 года компания nVidia представила свою новейшую разработку, которая, как помпезно заявляют представители этой фирмы, позволит дать в руки каждому учёному и инженеру вычислительные возможности, ранее доступные только в суперкомпьютерах. Разумеется, столь фантастические утверждения вызывают здоровый скептицизм не только у специалистов, однако в действительности новинка nVidia вполне заслуживает самого пристального внимания, хотя при ближайшем рассмотрении она и не является столь революционной, как её хотят представить.
В последнее время всё чаще обсуждается возможность применения мощных графических процессоров в качестве процессоров общего назначения. Эволюция архитектуры графических чипов в сторону универсальных модульных процессоров с программируемыми вычислительными модулями и высокой степенью параллелизм делает их чрезвычайно привлекательными для научных вычислений и всякого рода моделирования.
Подобный проект развивает компания AMD, активизировавшая деятельность в этой области после поглощения канадского производителя графических ускорителей ATI Technologies. Процессор под названием Fusion будет представлять собой многоядерный чип, состоящий из вычислительных ядер различного типа, включая специализированные. Модульная архитектура Fusion позволяет варьировать "ядерный" состав процессора, оптимизируя его под те или иные приложения. Подробнее об этом чипе можно прочитать здесь.
Разработка nVidia построена на несколько иных принципах: инженеры этой компании решили воспользоваться всеми преимуществами именно графических процессоров. Новинка основана на так называемой "полностью унифицированной архитектуре" или CUDA ("complete unified device architecture"), которая уже довольно широко применяется в потребительских графических ускорителях серии G80 и в профессиональных моделях Quadro FX 4600 и 5600.
В nVidia представили сразу три продукта, объединённых в семейство Tesla, названное, по-видимому, в честь эксцентричного американского изобретателя сербского происхождения Николы Теслы.
Прежде всего, в семейство входит nVidia Tesla GPU Computing Processor (Tesla C870) - специальная плата с интерфейсом PCI Express x16, устанавливаемая внутрь системного блока настольного компьютера. Эта плата представляет собой видеокарту на чипе серии G80, состоящем из 128 параллельных процессоров, и не имеет привычных видеовыходов: всю планку занимают вентиляционные отверстия системы охлаждения. "На борту" - полтора гигабайта видеопамяти GDDR3. Память подключена к процессору через 384-битный интерфейс, пропускная способность - до 76,8 Гб/с.
Плата требует дополнительного питания, для чего на ней установлены два разъёма. Максимальное энергопотребление платы - 170 Вт. В nVidia утверждают, что производительность этой платы достигает 518 гигафлопс (миллиардов операций с плавающей запятой в секунду).
nVIDIA Tesla Deskside Supercomputer (Tesla D870) - более мощное решение, выполненное в отдельном корпусе и фактически являющееся сервером, способным подключаться к обычному ПК или рабочей станции через внешний интерфейс PCI Express или через внутреннюю карточку-адаптер. В этом устройстве установлены уже два процессора серии G80 и три гигабайта памяти, благодаря чему производительность вырастает до впечатляющего одного терафлопса (триллиона операций с плавающей запятой в секунду), а энергопотребление - до не менее вызывающих 550 Вт.
Наконец, топовое решение, nVidia Tesla GPU Computing Server (Tesla S870) - это тонкий 19-дюймовый рэковый сервер 1U, предназначенный для установки в стойку. В этом устройстве применяются четыре процессора G80, а также шесть гигабайт видеопамяти - по полтора гигабайта на каждый ГП. Производительность этого сервера достигает двух терафлопс при энергопотреблении до 800 Вт.
По утверждению представителей nVidia, подключив к рабочей станции несколько внешних модулей семейства Tesla, можно добиться производительности до восьми терафлопс. Для сравнения, самый мощный суперкомпьютер стран СНГ МВС-15000BM, установленный в Межведомственном суперкомпьютерном центре Российской академии наук, по версии рейтинга Топ-50 на конец 2006 года, способен выполнять до 6,68 триллиона операций с плавающей запятой в секунду, а пиковая производительность этой системы - 10,1 терафлопс.
Впрочем, лидеру СНГ очень далеко до лидера мирового - суперкомпьютера IBM Blue Gene, расположенного в Ливерморской национальной лаборатории имени Лоуренса, производительность которого составляет до 280,6 терафлопс.
Сравнение Tesla с мощными серверами на базе современных специализированных серверных процессоров вообще потрясает: четырёхпроцессорная система на базе двуядерных чипов Intel Itanium 2 (Montecito) обеспечивает производительность всего порядка 45 гигафлопс!
При этом стоимость устройств семейства Tesla относительно невелика: карточка Tesla С870 обойдётся всего в 1499 долларов США, настольная система Tesla D870 - в 7500 долларов, а рэковый сервер Tesla S870 - в 12000 долларов. Для компактных систем со столь высокими показателями производительности - это просто смешные суммы - в сравнимые суммы сегодня обходятся традиционные двух- или четырёхпроцессорные серверы, рассчитанные на небольшие компании. Ожидается, что массовые поставки новинок начнутся уже в августе текущего года.
Поскольку графические процессоры ориентированы на параллельные, а не последовательные вычисления, решения семейства Tesla лучше всего проявят себя в кластерах для обработки данных, графической информации, в медицинских, биологических, геологических, физических и прочих научных исследованиях. А всё перечисленное можно назвать типичными задачами для серверов и рабочих станций.
Производители программного обеспечения смогут воспользоваться средой разработки nVidia CUDA C, включающей в себя компилятор C, отладчик, драйверы и набор стандартных библиотек. Уже предлагаются варианты этой среды разработки для операционных систем Windows XP и Linux.
Похоже, что идея "персонального суперкомпьютера" действительно весьма последовательно воплощена в nVidia Tesla - и за вполне разумные деньги. При поддержке со стороны научной общественности, которую nVidia уже получила, Tesla может стать одной из самых популярных платформ для инженерных и научных расчётов.
К сожалению, суперкомпьютер не сможет заменить обычный универсальный персональный компьютер, поскольку графические процессоры плохо справляются с последовательными вычислениями. В свою очередь, в последовательных вычислениях нет равных традиционным центральным процессорам. А разработкой центральных процессоров, по заявлению руководства nVidia, в этой компании заниматься не собираются. Поэтому у AMD есть все шансы занять нишу гибридных модульных процессоров со своим микрочипом Fusion, который, судя по всему, гораздо лучше приспособлен к использованию как в персональных компьютерах, так и во всевозможной бытовой электронике и встраиваемой технике.