AMD Quad FX | Введение


Процессор Core 2 Duo, вышедший 14 июля, ознаменовал поворотный момент в мире CPU. В этот день AMD потеряла своё превосходство над Intel на рынке настольных ПК, длившееся почти три года. Процессоры Core 2 Duo оказались быстрее и эффективнее по энергопотреблению, чем линейка Athlon 64. Хотя, конечно, энергопотребление надо измерять у всей системы, а не только у процессора. Тем не менее, AMD продолжает ценовую конкуренцию. Но, в любом случае, AMD пришлось заняться разработкой новых решений, которые смогли бы достойно ответить на атаку Intel. И вот перед нами один из первых ответных ударов AMD: платформа 4x4 Quad FX, с двумя процессорными сокетами и архитектурой Direct Connect, нацеленной на энтузиастов и хардкорных геймеров.

Вряд ли для кого-то окажется секретом, что Intel обладает отрывом не менее чем в девять месяцев по технологии производства. Все чипы Core 2 Duo, последние Xeon и многие процессоры Pentium D изготавливаются по топовому техпроцессу 65 нм. Уменьшение размера транзистора приводит к снижению энергопотребления, возможности добавлять на кристалл больше функций (скажем, кэш большего размера) или размещать на одном кристалле два или больше ядер. Именно по этой причине Intel смогла выпустить четырёхядерный процессор (из двух кристаллов Core 2 Duo), для которого аналогов у AMD попросту нет. И то, что текущий 90-нм техпроцесс у AMD более совершенен благодаря технологии "кремний на диэлектрике" (SOI), уже не помогает: 90-нм четырёхядерный чип будет слишком большим и дорогим.

AMD должна представить первое поколение 65-нм чипов 5 декабря, что даёт возможность получить в обозримом будущем и четырёхядерные процессоры AMD. Первые 65-нм процессоры пойдут на недорогой и массовый рынки, и придётся подождать ещё несколько месяцев, прежде чем на прилавках магазинов появятся high-end 65-нм процессоры AMD. 65-нм четырёхядерный процессор Agena FX, с выделенным кэшем L2 и объединённым кэшем L2, появится не раньше лета 2007. А пока компания представила решение, которое должно сохранить высокий уровень конкуренции с Intel и продемонстрировать технологические достижения AMD. Не стоит забывать, что первые 45-нм процессоры Intel должны появиться весьма скоро, в конце 2007 года.

Quad FX - это ответ AMD на четырёхядерный процессор, но что подразумевается под новым термином? AMD решила угодить энтузиастам и хардкорным геймерам, представив двухпроцессорную платформу для так называемого "мегазадачного окружения". То есть все свои задачи вы сможете выполнять одновременно. Технология платформы была удобно взята из мира Opteron: Quad FX состоит из материнской платы с двумя разъёмами Socket 1207, усиленного чипсета nVidia nForce 680a и пары процессоров Athlon 64 FX-70. Но, в отличие от мира Opteron, процессоры Athlon 64 FX под Socket 1207 используют не регистровую память, а обычную DDR2-800, по два DIMM на процессор. А чтобы всё было ещё более привлекательным, AMD предлагает комплекты FX-70, которые состоят из двух процессоров FX-70, FX-72 или FX-74 (им соответствуют частоты от 2,6 до 3,0 ГГц).

Но стоит ли овчинка выделки? Мы решили протестировать одну из первых систем на Athlon 64 Quad FX-74. И, как обнаружили, ответить на этот вопрос не так-то легко.

AMD Quad FX | Кому нужны два процессора и четыре ядра?

AMD нацелилась на самых ярых энтузиастов и реальных пользователей. Нет, не просто реальных, а, как считает AMD, самых реальных из реальных. Для новой платформы был придуман и новый термин "мегазадачность" (megatasking), который AMD описывает следующим образом:
  • одновременный запуск множества приложений - и многопоточных, и сильно нагружающих процессор;
  • запуск приложений цифрового мультимедиа;
  • запуск грядущих игр с поддержкой многоядерности.

AMD Quad FX | Преимущества платформы

С большинством задач, описанных выше, вполне нормально справится мощный современный двуядерный процессор, но в будущем ситуация может измениться. Правило для многопоточного окружения простое: чем больше ядер, тем лучше. Но четыре ядра и больше создадут немалую нагрузку на интерфейс процессора. Ему придётся загружать из памяти и записывать в память огромные массивы данных, причём делать это нужно как можно быстрее. Если процессорное ядро не будет получать данные своевременно, оно будет простаивать. И толку от такого решения уже не будет.

В начале следующего года с чипсетом Bearlake (X38 для энтузиастов и P35 для верхнего ценового сегмента массового рынка) Intel перейдёт с 266-МГц FSB (FSB1066 с учётом учетверённой передачи данных) на 333-МГц FSB (FSB1333). В результате дву- и четырёхядерные процессоры получат более скоростной интерфейс для связи с чипсетом/оперативной памятью и друг с другом (если в упаковке два кристалла, как у Core 2 Quad).

Но у AMD давно есть преимущество по эффективной работе с памятью, ведь каждый процессор Athlon 64 оснащён встроенным высокоскоростным контроллером памяти с низкими задержками. Первые процессоры Athlon 64 поддерживали DDR400 с одним (Socket 754) или двумя (Socket 939) каналами. Текущее поколение процессоров - Athlon 64 и Athlon 64 X2 для Socket AM2 - работает с памятью DDR2-800 в двухканальном режиме. Ядро процессора получает доступ к памяти напрямую, в отличие от ситуации, когда данным приходится проходить через отдельный от CPU контроллер памяти, встроенный в чипсет.

Это важно. Но почему эффект так слабо заметен? Главная причина кроется в преимуществе 65-нм техпроцесса Intel, который позволяет встраивать в процессор кэш L2 большего объёма. Ёмкий и эффективный кэш для каждого ядра обеспечивает высокую производительность, поскольку он компенсирует недостатки подсистемы памяти. Кроме того, эффективный и общий кэш, который одновременно используют два или больше ядер, также нивелирует задержки памяти.

Ситуация должна несколько измениться с появлением Microsoft Vista. Windows XP не может отличать физические процессоры от логических или ядра от процессоров, поэтому она раздаёт потоки на все доступные CPU. Ей не важно, находятся ядра на одном, двух или нескольких CPU, что приводит к переключению потоков между процессорами. А этого следует избегать, поскольку вместе с потоком необходимо перемещать и контекст, то есть данные потока. Как вам нравится новое "узкое место"?

Потоки, которые работают на одном физическом ядре, в следующий раз могут просчитываться другим ядром. А теперь учтите, что четырёхядерная система Intel создана комбинацией двух двуядерных кристаллов в одной упаковке, связь между которыми идёт через FSB. Та же самая FSB отвечает ещё и за отправку/приём данных в память (через контроллер чипсета).

В Windows XP, в худшем случае, процессорное ядро A CPU1 будет ждать, пока ядро B CPU1 не завершит операцию с памятью. Затем ядро A CPU1 запросит данные у подсистемы памяти, которые будут записаны в кэш L2 для обработки. Но если Windows вдруг пожелает привязать поток к процессору CPU2, то придётся переносить данные из кэша L2 блока A CPU1, что приведёт к появлению дополнительного трафика по FSB. По причинам когерентности кэшей и производительности данные в таком случае нельзя снова считывать из памяти, поскольку они уже обрабатываются. В общем, вот такая получается не очень хорошая ситуация.

Windows Vista Ultimate Edition сможет отличать процессоры или узлы от процессорных ядер. В результате она сможет привязывать потоки более эффективно. Первая большая задача может выполняться только на CPU1, а другая большая задача - только на CPU2. И проблема переключения задач между процессорами будет решена в связи с тем, что Vista Ultimate будет более тонко распознавать процессоры. В результате и зависимость производительности от количества процессоров должна масштабироваться лучше.

Теперь вернёмся к началу: почему это важно? Помните, что процессоры Athlon 64 оснащены встроенными контроллерами памяти, поэтому они обладают высокой пропускной способностью памяти на ядро. Если привязка потоков будет осуществляться более разумно, то платформа AMD Quad FX сможет хорошо "поиграть мускулами", что в текущей операционной системе невозможно. Опять же, помните, что мы говорим о серьёзных рабочих нагрузках, которые превышают задачи, выполняемые на ПК средним пользователем.

AMD Quad FX | Покупаем FX-70 только парами


В целом, концепция Quad FX понятна: "если мы не можем выпустить четырёхядерный процессор прямо сейчас, давайте соберём что-то достойное из того, что есть". В результате мы получили три новых процессора, которые используют существующие технологии. Если вы купите набор Athlon 64 FX-70 ($599), FX-72 ($799) или FX-74 ($999), то получите два физических процессора на частоте 2,6 ГГц, 2,8 ГГц или 3,0 ГГц, соответственно. Socket AM2 не поддерживает конфигурации с несколькими процессорами, поэтому AMD пришлось взять Socket 1207 из мира Opteron для Quad FX. Пока для новой линейки FX-70 доступна только одна модель материнской платы, но перед тем, как мы к ней перейдём, позвольте ещё немного поговорить о платформе Quad FX в целом.

AMD Quad FX | Старое доброе 90-нм ядро Windsor/Egypt


Что касается процессоров, то новостей здесь мало: AMD использовала существующие дизайны и изменила наименование/рейтинги Quad FX. Двуядерные процессоры Athlon 64 X2 и Athlon 64 FX с 90-нм техпроцессом и 1 Мбайт кэша L2 на ядро построены на ядре Windsor. Egypt - аналог этого ядра для Opteron, но у него добавлено ещё два канала HyperTransport, а контроллер требует регистровую память DDR2. Во всём остальном ядра одинаковы.

AMD решила добавить к уже существующей технологии "кремний на диэлектрике" (SOI) новую технологию "двойного напряжения" (dual stress liner, DSL). Технология DSL позволяет чипу работать на более высоких тактовых частотах, а слои диэлектрика препятствуют миграции электронов, которая приводит к появлению токов утечки и повышению температуры кристалла. С помощью DSL и SOI AMD смогла достичь отметки в 3 ГГц. Но пока потенциала для дальнейшего роста нет: когда мы подняли частоту чуть выше 3,1 ГГц, система "вылетела".

AMD Quad FX | Модели AMD FX-70: до 3 ГГц


Некоторые пользователи не ожидали, что AMD выпустит Athlon 64 FX-62 на 2,8 ГГц до весны, но AMD вновь доказала, что проработанный 90-нм техпроцесс позволяет получить и более высокие тактовые частоты. FX-74 работает на частоте 3,0 ГГц и на данный момент является самым быстрым процессором AMD.