Многоядерная бомба


Тема магистерской работы: "Системы дистанционного обучения по курсу Микропроцессорные системы"


Источник
http://www.npk.ru/articles/article.html?io=1&id=134

Ускорение прогресса


Год назад в статье, посвященной подведению итогов 2005 года, мы отмечали, что рынок начали постепенно завоевывать процессоры с двумя ядрами. Тогда мы не могли даже представить, насколько активно двухъядерная архитектура будет распространяться в 2006 г. Сегодня уже более половины всех процессоров имеют два ядра. И это подтверждение того факта, что инфраструктура оказалась готова к внедрению многоядерных ЦП.

Результаты продаж и желание изготовителей процессоров увеличивать свои прибыли, выводя на рынок все более дорогие продукты, позволили начать разработку процессоров более чем с двумя ядрами. Сейчас наряду с одноядерными и двухъядерными такие процессоры уже присутствуют на рынке. Иными словами, через полтора года после начала массовых поставок двухъядерных ЦП изготовителям удалось анонсировать четырехъядерные. Это свидетельствует о значительном ускорении прогресса в области процессоров после довольно длительного периода застоя.

Стремление повысить производительность современных ЦП путем увеличения числа процессорных ядер обусловлено вескими причинами. Дело в том, что, как показала практика, старые методы наращивания быстродействия сейчас не дают желаемых результатов. Пострадала от этого открытия, в первую очередь, компания Intel, чья микроархитектура NetBurst бесславно заканчивает свое существование в продуктах младшей ценовой категории, поскольку не смогла оправдать ожиданий. Микроархитектуры, предназначенные для работы на высоких тактовых частотах (при длинном исполнительном конвейере), оказались неспособны справиться с возложенными на них задачами. Причин несколько, и большинство из них производственного характера: полупроводниковая промышленность не смогла создать серийные транзисторы с приемлемыми показателями скорости и тепловыделения. Поэтому, в частности, так и не появились процессоры семейства Pentium 4, работающие на частоте 4 ГГц и выше - их энергопотребление и тепловыделение выходили бы за все разумные рамки.

В сложной ситуации оказалась не только компания Intel. AMD, основной ее конкурент, также столкнулась с определенными проблемами в развитии своей серии процессоров. Несмотря на то что микроархитектура К8, используемая в современных процессорах семейства Athlon 64, не имеет длинного исполнительного конвейера и рассчитана на работу на более низких, чем у Pentium 4, тактовых частотах, AMD также достигла предела в "разгоне" своих ядер, обусловленного свойствами применяемого ею технологического процесса. Правда, компания успела вовремя отказаться от разработки собственного высокочастотного ЦП, который должен был стать основой следующего поколения процессоров, а потому возникшие проблемы не столь очевидны.

Тем не менее, AMD и Intel примерно в одно и то же время (в середине 2005 г.) пришли к выводу, что увеличение тактовых частот - не лучший способ наращивания быстродействия процессоров. Это заставило специалистов компаний искать новые методы решения стоящих перед ними задач, и наиболее простым из них на современном этапе стало создание многоядерных ЦП. Действительно, ведь добавление в процессор второго вычислительного ядра теоретически позволяет в два раза ускорить обработку данных благодаря удвоению числа инструкций, исполняемых процессором за один такт. Конечно, для успешной работы многоядерных процессоров требуется поддержка параллельных вычислений со стороны приложений, но это не должно стать большой проблемой для выполнения целого ряда задач. Именно поэтому и AMD, и Intel взялись за продвижение на рынок двухъядерных процессоров с большим воодушевлением.

Впрочем, на сегодня изготовители ЦП приблизились к частотному пределу уже и для двухъядерных процессоров. Естественно, что вполне логичным выходом в такой ситуации стало дальнейшее увеличение числа ядер - теперь до четырех. И все бы хорошо, но в данном случае перед разработчиками возникают новые проблемы, о которых ранее им беспокоиться не приходилось. Во-первых, если число программ, работа которых ускоряется в системах с двухъядерными ЦП, можно назвать значительным, то лишь немногие из них могут создавать четыре вычислительных потока одновременно. Во-вторых, физическое размещение четырех ядер в одном процессорном корпусе может оказаться непростой задачей по чисто геометрическим соображениям. В-третьих, вновь могут появиться проблемы энергопотребления и тепловыделения. В-четвертых, в многоядерных процессорах острее чем прежде встает вопрос организации быстрого обмена данными между ядрами.

Intel не испугалась возможных проблем и в начале ноября первой анонсировала четырехъядерные процессоры, известные как Kentsfield. AMD, которая пока не смогла решить некоторые из упомянутых задач, нашла другой ответ на инициативу Intel - представила двухпроцессорную платформу для настольных компьютеров Quad FX, способную обрабатывать четыре потока одновременно. В результате в 2006 г. началась эра четырехъядерных процессоров для ПК.

Intel Kentsfield


Еще год назад мы говорили, что технологическое лидерство на процессорном рынке принадлежит компании AMD. Именно она первой вывела на рынок двухъядерные процессоры. Но за 2006 г. ситуация во многом изменилась, и первым четырехъядерным процессором для настольных компьютеров стал продукт компании Intel с кодовым именем Kentsfield. Он появился во многом благодаря выпуску новой микроархитектуры Core, которая не только дала возможность компании Intel вернуть лидерство во всех секторах процессорного рынка, но и открыла широкие перспективы для дальнейшего развития продуктов, ориентированных как на настольные компьютеры, так и на серверы и ноутбуки. Еще одним важным обстоятельством, позволившим Intel опередить AMD в выпуске на рынок ЦП с четырьмя ядрами, стало освоение 65-нм технологии, позволившей уменьшить геометрические размеры ядер. Напомним, что компания AMD собирается переходить на 65-нм производство только в конце 2006 г. - начале 2007 г., в то время как Intel использует такой техпроцесс уже год.

Получив технологическую возможность для производства многоядерных процессоров, а также разработав планы совершенствования производства, Intel сформулировала своего рода программу-минимум: к 2008 г. выпустить процессоры, на порядок превосходящие по производительности средние модели Pentium 4. И, надо сказать, в эти планы трудно не поверить. 65-нм технология уже позволила разместить в одном корпусе четыре процессорных ядра, а это привело к солидному скачку в теоретической пиковой скорости современных процессоров. Уже в следующем году Intel планирует начать переход на 45-нм технологический процесс, который даст возможность увеличить число транзисторов в ядре примерно вдвое. Эти транзисторы будут использоваться в первую очередь для увеличения объема кэшпамяти, что также повлечет за собой некоторое увеличение быстродействия. К 2008 г. Intel намерена представить микроархитектуру, не только добавляющую в процессоры новые возможности, но и увеличивающую производительность с одновременным снижением энергопотребления.

Надо понимать, что, представив четырехъядерные процессоры, Intel не переводит популярные двухъядерные ЦП Core 2 Duo в разряд устаревших. Объясняется это тем, что на данный момент преимущества ЦП, способных исполнять четыре потока одновременно, могут задействовать далеко не все приложения. И пока такая ситуация будет сохраняться, четырехъядерные процессоры будут выпускаться наряду с двухъядерными, как одна из возможных альтернатив. В частности, по предварительным прогнозам, доля процессоров Kentsfield в следующем году не превысит 3%, в то время как прогнозируемая доля двухъядерных ЦП составит 75%. Это будет подкрепляться и ценами: появление четырехъядерных продуктов ценой менее 500 долл. ожидается только в 2008 г.

Теперь познакомимся со строением Kentsfield подробнее. Хочется отметить, что для создания четырехъядерного процессора инженеры Intel избрали самый простой путь из возможных. Дело в том, что Kentsfield - это фактически объединение двух кристаллов Conroe (двухъядерных процессоров с микроархитектурой Core) в одном процессорном корпусе; в этом отношении он продолжает традиции Presler.

Такой подход имеет много плюсов, и главный из них - простота реализации. Кроме того, отказ от монолитной конструкции ядра позволяет получить некоторую экономию (10-15%) в суммарной площади кристаллов. Но следует помнить, что такое строение многоядерного процессора иногда может вызвать определенные проблемы с быстродействием. Так как независимые ядра (составные части Kentsfield) никак не связаны между собой воедино внутри процессора, обмен данными между ними идет через системную память, создавая таким образом "паразитную" нагрузку на процессорную шину и шину памяти. К счастью, микроархитектура Core содержит частичное решение этой проблемы в рамках двухъядерных процессоров Conroe: эти ЦП, имеющие монолитную конструкцию, обладают общим на два ядра кэшем второго уровня, параллельно выполняющим функции своего рода "обменника" для данных. При установке двух ядер Conroe в процессор Kentsfield нагрузка на внешние шины невысока, поскольку при их помощи выполняется лишь обмен данными между парами ядер, находящимися в разных кристаллах.

К сказанному хочется добавить, что проблему организации эффективного обмена данными между ядрами не стоит недооценивать. Задержка с выпуском четырехъядерных процессоров AMD вызвана отчасти и этим обстоятельством. Существующая микроархитектура К8 не обладает, в отличие от Core, необходимыми средствами для решения данной проблемы, поэтому инженеры компании в настоящее время занимаются разработкой усовершенствованной микроархитектуры следующего поколения, предполагающей устранение этого недостатка.

Есть еще одна проблема, не позволяющая пока AMD выпустить четырехъядерный процессор, - довольно большая площадь ядра у их двухъядерных ЦП, составляющая минимум 183 мм2. Очевидно, что два таких ядра едва ли могут быть помещены в корпус стандартного размера. У Kentsfield же таких проблем не возникает, так как у двухъядерного Conroe площадь ядра почти на 30% меньше.

Что же касается характеристик Kentsfield, то их очень легко угадать, зная возможности ядер Conroe, применяемых в процессорах семейства Core 2 Duo. Четырехъядерные процессоры Kentsfield обладают кэш-памятью второго уровня суммарной емкостью 8 Мбайт (две части по 4 Мбайт), предназначаются для работы в системах LGA775 и используют 1066-МГц шину. Максимальная тактовая частота Kentsfield достигает сейчас 2,66 ГГц, что на 266 МГц ниже частоты старшего процессора на ядре Conroe. В четырехъядерных процессорах Intel реализованы все технологиями энергосбережения, перекочевавшие в них из двухъядерных Conroe. Они совместимы с технологиями Enhanced Halt State и Enhanced SpeedStep. Следует отметить, что при этом Intel не стала заниматься реализацией возможности отключения неиспользуемых ядер, что могло бы еще повысить экономичность Kentsfield. Впрочем, не следует забывать, что в Conroe уже предусмотрено динамическое отключение неиспользуемых процессорных блоков, так что перерасход энергии от простаивающих в Kentsfield ядер вряд ли следует считать значительным.

Простая конструкция четырехъядерных процессоров, предполагающая объединение пары двухъядерных кристаллов в одном корпусе, решает и еще одну задачу, а именно проблему совместимости. Kentsfield полностью совместим с существующей инфраструктурой, после обновления BIOS он способен работать во всех системных платах, поддерживающих Core 2 Duo.

Не должны вызывать опасений и возможные проблемы с высоким тепловыделением Kentsfield. Типичное тепловыделение процессоров Core 2 Duo с частотой 2,66 Гц не превышает 65 Вт, а типичное тепловыделение старшей модели Kentsfield - не более 130 Вт, что вполне приемлемо для современных платформ. Подобное тепловыделение было обычной характеристикой для ЦП семейства Pentium 4, поэтому для современных систем LGA775 отвод тепла от Kentsfield не является большой проблемой.

Кроме того, использование в составе четырехъядерных процессоров обычных ядер Conroe дает возможность Intel отбирать для них наиболее экономичные экземпляры полупроводниковых кристаллов. Благодаря этому на практике процессоры Kentsfield демонстрируют гораздо более низкое тепловыделение, чем старшие модели Pentium 4 и Pentium D, а также чем двухъядерные процессоры конкурента.

На данный момент Intel предлагает единственную модель процессора Kentsfild с частотой 2,66 ГГц. Этот процессор называется Core 2 Extreme QX6700, его цена 999 долл. В начале 2007 г. в семействе Kentsfield появится и вторая модель, Core 2 Quad Q6600, с частотой 2,4 ГГц и более демократичной ценой. Однако даже до конца следующего года четырехъядерные процессоры останутся нишевым продуктом, рассчитывать на высокие продажи которого не приходится.

Большую популярность на рынке, по всей видимости, завоюют процессоры Yorkfield, построенные из двух двухъядерных ЦП Wolfdale (дальнейшее развитие Conroe), изготавливаемых по 45-нм технологии. Появление этих процессоров ожидается во второй половине 2007 г., они будут иметь кэш-память второго уровня с суммарной емкостью до 12 Мбайт и частоту системной шины до 1333 МГц. Кроме того, эти процессоры будут работать с новым набором инструкций SSE4, а их тактовые частоты превысят 3 ГГц.

Платформа AMD Quad FX


После представления компанией Intel новой микроархитектуры Core, обеспечившей существенное повышение производительности выпускаемых ею ЦП, AMD пришлось уступить конкуренту место лидера процессорного рынка. Однако это не означает, что AMD сегодня поставляет ЦП лишь низших ценовых категорий. До выхода обновленной микроархитектуры под кодовым именем K8L компания продолжит борьбу с Intel во всех секторах рынка. Отчасти это будет возможно благодаря ценовой политике, но немалую роль играют и оригинальные инженерные решения.

Именно к их числу следует отнести платформу AMD Quad FX (старое название 4x4), которую компания AMD предложила в качестве ответа на появление четырехъядерных процессоров Intel Kentsfield. К сожалению, пока AMD не готова представить полноценные процессоры с числом ядер больше двух. Этому препятствуют причины и архитектурного характера (использование системной памяти для обмена данными между ядрами), и технологического (отсутствие пригодного для массового производства современного технологического процесса). Поэтому пока не завершится разработка следующей микроархитектуры, способной организовать взаимодействие процессорных ядер без использования шины памяти, и не будет применяться 65-нм технологический процесс, который позволит уменьшить площадь ядра процессоров, AMD для конкуренции с Kentsfield приходится изыскивать иные методы.

Фактически AMD Quad FX представляет собой платформу с двумя ЦП, ориентированную на настольные высокопроизводительные системы. Она предназначена для установки в одну систему пары двухъядерных процессоров, что дает возможность одновременного исполнения четырех вычислительных потоков, т. е. AMD Quad FX можно, с этой точки зрения, называть альтернативой Kentsfield (особенно если рассматривать систему как "черный ящик"). Кроме того, AMD собирается установить такие цены на составляющие своей платформы, чтобы AMD Quad FX находилась в одном ценовом диапазоне с платформами, основанными на четырехъядерных процессорах компании Intel.

Отметим, что платформа AMD Quad FX не выглядит как всесторонне продуманный продукт, и вот почему. Микроархитектура К8 позволяет довольно легко собирать многопроцессорные конфигурации. Для этого, в частности, предназначаются шины HyperTransport, которых в процессорах AMD три. Тем не менее, существующая инфраструктура Socket AM2 к такому повороту событий оказалась не готова. У этого 940-контактного разъема имеются выводы только для подключения одной шины HyperTransport, а этого недостаточно для создания двухпроцессорной конфигурации. Поэтому всегда через полгода после появления "настольных" процессоров в исполнении Socket AM2 компании AMD приходится продвигать на рынок новое гнездо для настольных систем.

В качестве этого гнезда используется 1207-контактный Socket F в LGA-исполнении. Впрочем, говорить, что это процессорное гнездо принципиально ново, было бы не совсем справедливо. Аналогичные гнезда используются в современных серверных системах на процессора AMD Opteron, совместимых с модулями памяти DDK SDRAM. Однако платформа AMD Quad FX несовместима и с серверными процессорами Opteron. Проблема различной используемой памяти: процессоры Opteror работают с регистровой буферизованной DDR2 SDRAM а новая платформа Quad FX ориентирована на "обычную" небуферизованную DDR2-пaмять.

Именно поэтому специально для платформы Quad FX компания AMD создала несколько новых двухъядерных ЦП, формально отнесенных к семейству Athlon 64 FX. Они, как и современные Athlon 64 FX в исполнении Socket AM2, выполнены на 90-нм процессорном ядре Windsor, но имеют два активных HyperTransport-контроллера, один из которых отводится для связи процессоров между собой. Отметим, что поскольку AMD Quad FX - двухпроцессорная система, она получает два двухканальных контроллера DDR2 SDRAM, что позволяет удвоить пропускную способность шины памяти по сравнению с обычными настольными платформами, а это отчасти решает проблемы с загрузкой шины памяти при пересылках данных между ядрами.

Что же касается собственно процессоров, используемых в платформе Quad FX, то AMD на сегодня предлагает три модели двухъядерных процессоров: Athlon 64 FX-70 с тактовой частотой 2,6 ГГц, Athlon 64 FX-72 с частотой 2,8 ГГц и Athlon 64 FX-74, рассчитанный на частоту 3 ГГц. Во II квартале 2007 г. AMD собирается представить еще один, более скоростной процессор Athlon 64 FX-76 с тактовой частотой 3,2 ГГц. У всех процессоров имеется кэш-память второго уровня общей емкостью 2 Мбайт. Отметим, что перечисленные процессоры продаются только парами, что делает невозможной покупку системы с одним двухъядерным ЦП с расчетом на последующие обновления. При этом цена таких пар составляет от 600 до 1200 долл. в зависимости от тактовой частоты.

Как мы видим, AMD пытается искусственно создать аналогии между своей платформой Quad FX и четырехъядерным ЦП конкурента. Однако в отношении совместимости новая платформа AMD сильно проигрывает Kentsfield: она не совместима ни с какими другими платформами и требует применения специализированных двухъядерных процессоров, тогда как пользователям систем на ЦП Intel не надо менять вычислительную систему целиком - они могут заменить ЦП с ядром Conroe на Kentsfield.

Впрочем, AMD пытается представить данное обстоятельство в выгодном для себя свете. Утверждается, что платформа Quad FX не станет неким временным продуктом, компенсирующим отсутствие у нее четырехъядерных ЦП. AMD прочит новой платформе долгую жизнь. Более того, завершив разработку четырехъядерных процессоров с кодовым именем Agena (бывший Altair), она и их приспособит для платформы Quad FX. Иными словами, AMD пытается представить Quad FX как новую платформу для пользователей-энтузиастов, стремящихся к достижению максимальной производительности любой ценой. Сегодня эта платформа позволяет одновременно исполнять четыре вычислительных потока, но во второй половине 2007 г. она может быть усовершенствована для параллельного исполнения восьми потоков.

Благодаря установлению "специальных" цен на комплекты процессоров, предназначенных для системы Quad FX, компании удалось добиться того, что системы на базе этой платформы незначительно отличаются по стоимости от систем на процессорах Intel Kentsfield. Превосходство же старших Athlon 64 FX для Socket F над Kentsfield по тактовой частоте позволяет платформе AMD показывать сравнимое с платформами на Core 2 Extreme QX6700 быстродействие. Однако, если говорить о показателе "производительность на ватт", картина совершенно иная. У создаваемых по 90-нм проектным нормам процессоров Athlon 64 FX для Quad FX типичное тепловыделение - 125 Вт, следовательно, энергопотребление конгломерата из двух таких ЦП будет в два раза превышать этот показатель для четырехъядерного ЦП компании Intel. Иными словами, по эффективности платформа AMD Quad FX проигрывает конкурирующей платформе Intel.

В заключение рассказа о новой платформе AMD, предназначенной для энтузиастов, хотелось бы сказать несколько слов о наборе микросхем системной логики, который будет применяться для построения Quad FX. Исключительно для этой платформы компания NVIDIA разработала специализированный НМС nForce 680a SLI, состоящий из двух одинаковых микросхем МСР55РХЕ, которые уже некоторое время применяются в НМС nForce 680i SLI или nForce 570 SLI. Обе микросхемы связаны с одним из процессоров Athlon 64 FX, что теоретически должно обеспечивать и возможность эксплуатации платформы AMD Quad FX с одним ЦП. Поскольку nForce 680a SLI фактически объединяет два НМС в одном, его возможности кажутся просто фантастическими. Так, этот набор микросхем поддерживает две графические шины PCI Express x16, которые могут использоваться с графическими адаптерами NVIDIA, работающими в режиме SLI, и две шины PCI Express х8, которые в будущем могут оказаться полезны для установки физического ускорителя. Кроме того, в ассортимент доступных шин входит несколько портов PCI и линий PCI Express x1. В NVIDIA nForce 680a SLI реализовано 12 портов Serial ATA 3Gb/s, три Gigabit Ethernet и 20 портов USB 2.0.

Единственная системная плата для платформы AMD Quad FX, существующая в настоящее время в виде конечного продукта, поставляется на рынок компанией ASUSTeK Computer. Это LIN64-SLI DELUXE. Других изготовителей плат технология Quad FX, очевидно, пока не привлекает.

AMD K8L - архитектура следующего поколения


В перспективе Quad FX будет не единственным ответом AMD на появление четырехъядерных процессоров конкурента. Инженеры компании в настоящее время работают над созданием микроархитектуры следующего поколения - основой будущих четырехъядерных процессоров. К сожалению, компания опоздала с началом разработки этой микроархитектуры, которая должна появиться лишь в III квартале 2007 г. Однако процессоры на этой архитектуре будут серьезно усовершенствованы. Это позволяет спрогнозировать новый виток конкурентной борьбы между AMD и Intel.

Особенностью архитектуры K8L следует считать то, что она разрабатывается специально для четырехъядерных ЦП, занимающих один кремниевый кристалл, а не просто скомпонованных по принципу объединения ядер в одном корпусе. В этом подход AMD в корне отличается от взглядов Intel, которая собирается продолжать создавать четырехъядерные процессоры, совмещая в едином корпусе два двухъядерных кристалла.

Создание монолитных четырехъядерных процессоров станет возможным благодаря внедрению (хотя и запоздалому) компанией AMD 65-нм технологического процесса. Первые ЦП, выпущенные по этой технологии, ожидаются уже в конце этого - начале следующего года, поэтому к III кварталу 2007 г. процесс должен стать достаточно зрелым для производства больших кристаллов четырехъядерных процессоров.

Новый технологический процесс поможет AMD решить и проблемы тепловыделения четырехъядерных ЦП. Кроме того, инженеры AMD намерены переработать схему управления питанием, что позволит улучшить показатели экономичности перспективных процессоров. Здесь главное - возможность управлять рабочим напряжением и тактовой частотой каждого из ядер отдельно. Это означает, что технология Cool`n`Quiet сможет работать на каждом ядре независимо, и при неполной или неравномерной нагрузке на вычислительные мощности ЦП малоиспользуемые процессорные ядра значительно уменьшат свое энергопотребление и тепловыделение.

В новой микроархитектуре будет решен вопрос и с взаимодействием процессорных ядер между собой. K8L не предполагает использование шины памяти для пересылки данных между ядрами. Для этой цели инженеры AMD собираются ввести в четырехъядерные ЦП общий кэш третьего уровня, который будет использоваться всеми четырьмя ядрами. Именно это и позволяет считать микроархитектуру K8L истинно четырехъядерной - процессор изначально проектируется с учетом всех особенностей многоядерной конструкции. Впрочем, кэш-память первого и второго уровней в K8L все-таки останется индивидуальной для каждого ядра.

Помимо перечисленных серьезных изменений в процессоры на микроархитектуре K8L будут внесены изменения, направленные на увеличение скорости каждого ядра в отдельности, т. е. на увеличение числа инструкций, обрабатываемых процессором за такт. Для этой цели в ЦП с перспективной микроархитектурой будут реализованы улучшенные благодаря увеличению емкости соответствующих буферов механизмы внеочередного исполнения инструкций и предсказания переходов. Специалисты AMD планируют также значительно ускорить работу с FP- и SSE-инструкциями, для чего ширина исполнительных устройств FADD и FMUL увеличится до 128 бит. Шины чтения данных из кэша также станут вдвое шире, что позволит процессору выполнять две 128-бит загрузки данных из кэша первого уровня за такт.

А чтобы "узким местом" микроархитектуры не стал этап декодирования, емкость буфера, в который осуществляется выборка инструкций для декодирования из кэша L1, будет увеличена до 32 байт. Впрочем, число декодеров при этом не изменится - их по прежнему останется три.

В будущих процессорах с микроархитектурой K8L, первое поколение которых сегодня имеет кодовое имя Agena, будет расширен и набор SSE-команд: его приведут в соответствие с набором команд SSE3, реализованным в процессорах Intel Conroe. По некоторым оценкам, благодаря описанным нововведениям быстродействие процессоров AMD следующего поколения может повыситься на 40% по сравнению с существующими ЦП К8. Пожалуй, этого как раз и не хватает AMD для успешной конкуренции с процессорами Intel на основе микроархитектуры Core.

В будущих ЦП Agena на микроархитектуре K8L будет использована усовершенствованная шина HyperTransport 3.0 с увеличенной пропускной способностью, которая благодаря повышению частоты составит 16,8 Гбайт/с и более. При этом важно и то, что сохранится совместимость с применяющимся сегодня вариантом шины HyperTransport.

Несколько позднее четырехъядерные процессоры приобретут и обновленный контроллер памяти, совместимый со скоростными типами памяти, такими, как DDR2 SDRAM и DDR3 SDRAM. Следует отметить, что описанные изменения внешних интерфейсов неизбежно повлекут за собой необходимость смены процессорных разъемов. Однако AMD попытается сделать этот переход максимально безболезненным для пользователей. Так, будущие четырехъядерные процессоры Agena появятся в III квартале следующего года в двух конструктивных исполнениях: под Socket AM2+ и под Socket F+. "Плюс" в названии процессорного гнезда означает, что реализация более скоростной шины HyperTransport 3.0 потребует смены платформы. Однако при этом ЦП сохранят обратную совместимость и с существующими Socket AM2 и платформами Socket F, в которых шина HyperTransport попросту будет работать медленнее. При установке новых ЦП в старых системных платах возникнут некоторые ограничения в использовании технологий энергосбережения. Во второй половине 2008 г. процессоры с микроархитектурой K8L будут переведены на платформу Socket АМ3, которая позволит применять память типа DDR3 SDRAM. Однако при этом процессоры под Socket АМ3 можно будет использовать в системах Socket AM2+ и Socket AM2 с памятью DDR2.

Возвращаясь к более близким перспективам, следует сказать, что первые четырехъядерные процессоры Agena с микроархитектурой K8L пополнят сразу два семейства: Athlon 64 FX для платформы Quad FX и Athlon 64 Х4 для систем Socket AM2+. Основные характеристики этих ЦП, судя по всему, различаться не будут. Каждое из ядер Agena будет иметь 512-Кбайт кэш второго уровня, а объем общего кэша третьего уровня составит 2 Мбайт, т. е., учитывая эксклюзивное строение кэш-памяти в процессорах AMD, общая емкость кэша будущих четырехъядерных процессоров Agena достигнет 4 Мбайт.

Типичное тепловыделение процессоров из серии Agena, как предполагается, будет ограничено 125 Вт для обоих семейств. Таким образом, по экономичности они не должны уступать современным ЦП семейства Intel Kentsfield. Частота 65-нм ядер Agena, как ожидается, составит от 2,7 до 2,9 ГГц.

Четырехъядерные процессоры и современные программы


В заключение нашего рассказа о современных и будущих процессорах с четырьмя ядрами коснемся вопроса о том, насколько своевременным оказался их выпуск. Дело в том, что готовность индустрии программного обеспечения к захвату рынка процессорами с возможностью исполнения четырех потоков одновременно вызывает некоторые сомнения.

Действительно, еще только полтора года назад, когда на рынке появились первые двухъядерные процессоры, мы отмечали, что число приложений, способных эффективно использовать их возможности, ограниченно. А ведь первые ЦП, способные "переваривать" двухпоточную нагрузку, появились задолго до этого. В частности, Pentium 4 с технологией Hyper-Threading был анонсирован еще в 2002 г. Тем не менее, разработчики программного обеспечения продемонстрировали значительную инерционность и не стали спешить переписывать свои алгоритмы под двухпоточность. Положение не спасает даже то, что операционные системы семейств Windows XP и Windows Vista полностью совместимы с многоядерными архитектурами.

Однако появление и стремительный рост популярности двухъядерных процессоров заставил разработчиков программ задуматься о необходимости полноценной поддержки этой архитектуры. Пятилетние усилия изготовителей процессоров по продвижению многопоточности наконец-то увенчались определенным успехом. Количество приложений с поддержкой двухъядерных ЦП на сегодня уже более чем достаточно. В выигрыше от использования процессоров с двумя ядрами в первую очередь могут оказаться профессиональные программы обработки звука, изображений и видео. Кроме того, были оптимизированы и многие программные продукты, для которых важен уровень производительности центрального процессора.

Фактически единственной сферой, где оптимизация под двухъядерные ЦП пока задерживается, остаются компьютерные игры. Впрочем, происходит это не из-за неприятия многоядерных архитектур разработчиками игр. Дело в том, что большинство игровых "движков", используемых современными играми, разрабатывалось в то время, когда о столь стремительном росте популярности многопоточности никто еще не думал. Тем не менее несколько довольно свежих игр уже способны получать выигрыш в быстродействии на системах, оснащенных двухъядерными ЦП. Это Ghost Recon Advance War Fighter, Black & White 2, Quake 4, Call of Duty 2, F.E.A.R и City of Villains. Очевидно, что в дальнейшем список будет расти.

Процессоры же с четырьмя ядрами только что появились на рынке. И естественно, с их программной поддержкой ситуация обстоит несколько хуже. Но заметим, что многие разработчики программ позаботились о возможности использования многоядерных ЦП заранее, одновременно с оптимизацией под двухъядерные ЦП. Поэтому список ресурсоемких приложений, которые работают на четырехъядерных процессорах быстрее, чем на двухъядерных, оказался не столь скуден. В частности, в нем немало программ для создания и обработки цифрового контента: программы трехмерного рендеринга, кодирования видео, обработки изображений и звука, а также видеомонтажа.

Что же касается игровой индустрии, то пока поддержка четырехъядерных процессоров отсутствует здесь практически полностью. В то же время, проводя аналогии с рынком игровых приставок, можно ожидать, что многоядерные архитектуры будут все-таки востребованы в будущих играх. Например, совершенно достоверно известно, что в 2007 г. будет выпущено несколько игр, способных показывать наивысшую производительность именно в системах с многоядерными процессорами. К ним относятся HQ Supreme Commander, Remedy Alan Wake, Valve Half-Life 2: Episode 2, Epic Unreal 3 и Ubisoft Splinter Cell: Double Agent. Однако для игроков на сегодня двухъядерные или даже одноядерные процессоры остаются более привлекательными.

Иными словами, при несомненной перспективности четырехъядерных процессоров на данный момент говорить о их безусловном превосходстве по производительности преждевременно. ПО развивается с некоторой задержкой относительно аппаратуры, в результате покупателям приходится выбирать архитектуру процессоров с оглядкой на те задачи, которые предполагается решать с его помощью в настоящий момент. Если в профессиональных применениях и для обработки медиаданных четырехъядерные процессоры предлагают наилучшие возможности, то для домашнего и игрового применения лучшим выбором на сегодня остаются двухъядерные или даже одноядерные ЦП.


© St@VRoS, 2007. All rights reserved.