Архитектура AMD K8L: собираем все слухи воедино
Архитектура AMD K8L: собираем все слухи воедино
Всего каких-то 10 лет обратно на компьютерном рынке всё было предельно просто. Intel производила самые быстрые и популярные процессоры для потребительского рынка, то и занятие превосходя свои собственные достижения. У её конкурентов не было достойного аналога. Поэтому никакого усложнения не происходило: для трёх сегментов рынка (бюджетного, потребительского и серверного) выпускалось по одному семейству процессоров.
Выход процессора AMD Athlon перекувырнул всё с ног на голову. У Intel не было достойного ответа на миг анонса Athlon. С тех пор AMD хоть и осталась в отстающих, но её стали принимать всерьёз. Представление в 2003 году архитектуры AMD64 подтвердило серьёзные намерения второго производителя ЦП отвоевать как позволительно большую долю рынка.
Как раз в то час началось то самое усложнение. Вместе с Athlon 64 был выпущен начальный Athlon 64 FX, тот, что на самом деле был переименованным Opteron серии 100. Intel в реакция выпускает Pentium 4 Extreme Edition, оснащённый кэшем третьего уровня. По сути, это была разогнанная версия Xeon MP, выпускаемая в те времена.
Далее события стали рскручиваться по нарастающей: Pentium 4 5xx, Pentium 4 6xx, Pentium D, Core 2 Duo - все эти процессоры производятся до сих пор, и все они предназначаются только для настольного сегмента. Но на основе одних разрешается составлять больше дешёвые компьютеры, а на основе других - более дорогие.
У AMD обстановка не лучше. Сегодня в настольном сегменте у неё самое малое четыре процессора: Athlon 64 Sempron, Athlon 64, Athlon 64 X2 и Athlon 64 FX. Все они существуют в четырёх (!) исполнениях: Socket 754, Socket 939, Socket 940 и Socket AM2. Но в последнее пора AMD встала на дорога унификации процессорного разъёма, за что честь ей и хвала. Вскоре все настольные чипы перейдут "под крыло" Socket AM2, а экстремальные (как в плане быстродействия, так и в плане стоимости) Athlon 64 FX сызнова станут походить на серверные Opteron, но уже серии 2ххх, что выпускаются под Socket F.
Однако следующие два года готовят нам встречу с тремя новыми процессорными разъёмами AMD: Socket AM2+, Socket AM3 и Socket F+. С ними будут выпускаться чипы, основанные на архитектуре, условно названной K8L. Что это такое, какие процессоры будут представлены на её базе, а кроме того смогут ли они вручить достойный отклик производительным Intel Core 2 Duo - в этом мы и попробуем разобраться.
Архитектурные изменения
Главная специфика обновлённой архитектуры K8 содержится во внесении изменений в алгоритмы вычисления. Эти так называемые архитектурные изменения должны будут вывести производительность процессоров AMD хотя бы на сравнимый с Core 2 Duo уровень. Конечно, при работе на одинаковых тактовых частотах.
|
Примерные улучшения, "грозящие" процессору K8L |
Все процессоры K8 производят выборку команд из L1-кэша блоками по 16 байт. Такой темп позволяет умещать в единственный блок до четырёх команд длиной по 4 байт или до трёх длиной по 5 байт. Однако длина может быть и больше. Таким образом, эффективность может попасть ниже заявленной. Процессор Core 2 Duo ещё делает выборку по 16 байт. Но у него есть особый буфер, кэширующий циклы размером до 64 байт. Отчасти это позволяет объехать ограничение 16-байтной выборки. В K8L AMD планирует повысить выборку команд до 32 байт.
Помимо этого, будет улучшена технология работы с SSE-командами. Как известно, их разрядность составляет 128 бит. Но из-за 64-битных регистров процессора их приходится обрабатывать по частям: поначалу одну половину, а затем вторую. В K8L разрядность блоков, работающих с SSE, будет увеличена до 128 бит. Таким образом, AMD избавится от ещё одного узкого места.
Одним из самых узких мест в архитектуре K7 и K8 была разрядность шины, объединяющей кэши первого и второго уровней. Если в K7 с этим было совершенно погано (её ширина составляла 64 бит, тогда как уже в Pentium III на ядре Coppermain она была 256 бит), то в K8 AMD немного улучшила ситуацию. Она добавила второй 64-битный канал. Однако всякий из них применяется для передачи данных только в одну сторону. То есть шина кэша как бы равна 128 бит, но на самом деле более 64 бит данных в одну сторону не передашь. Выходит, что двукратная эффективность достигалась вдалеке не во всех случаях.
Насчёт изменения этой ситуации в K8L покуда известно только то, что процессор в то же время сможет вырабатывать либо две операции чтения, либо одно читка и одну запись. Но этого также может угодить недостаточно, если ширина каналов, связывающих кэши L1 и L2, не возрастёт.
Продолжая тему кэша, необходимо упомянуть и кэш третьего уровня. По вышеприведённому слайду ясно видно, что процессор будет выполнен по "настоящему" четырёхъядерному дизайну. Судя по всему, это означает существование общего для всех ядер L3-кэша. Это нововведение должно приподнять эффективность обмена данными между ядрами. Сегодня обмен производится с использованием шины памяти, что, согласитесь, вовсе малоэффективно из-за высокой латентности такого способа.
В Core 2 Duo эта задача решается благодаря использованию общего кэша второго уровня. Но в своих первых четырёхъядерных процессорах Intel собирается отступиться от эдакий схемы. В ЦП Kentsfield (версия для производительных настольных компьютеров) и Clovertown (серверная версия) она банально объединит в одном корпусе два кристалла Conroe и Woodcrest соответственно. Получится, что четыре ядра будут располагать попарно корпоративный L2-кэш, но для обмена информацией с иной парой придётся прибегать к системной шине, что ещё менее эффективно, чем в случае с процессорами AMD64, где контроллер памяти встроен прямо в процессор. Так что будет крайне интересно, что же окажется быстрее: K8L или новые четырёхъядерники Intel.
Процессорные разъёмы, свежий тип памяти и HyperTransport 3.0
AMD постоянно гордилась тем, что после этого очередного обновления линейки процессоров не приходится трансформировать материнскую плату для их использования. Формально без малого каждый чип Socket A разрешено определить в любую плату, причём так, чтобы это всё заработало (конечно, не без шаманства с бубном и танцами, но всё же). Однако перенос контроллера памяти на кристалл изменил эту ситуацию.
При смене типа памяти или добавлении ещё одного канала сейчас приходится изменять и процессорный разъём. Это случилось уже два раза: при переходе от Socket 754 к Socket 939 (был добавлен второй канал памяти) и от Socket 939 к Socket AM2 (внедрена помощь DDR2). В будущем нас ждёт как самое меньшее ещё один тип памяти: DDR3. Неудивительно, что многие потенциальные покупатели систем Socket AM2 насторожились, - его может хватить снова на год-два, а потом этого для замены процессора придётся докупать новую плату и память.
И действительно, так и есть, но только отчасти. К 2008 году нынешний Socket AM2 вначале сменится на Socket AM2+, а после этого на Socket AM3. Сведём все свойства этих разъёмов в одну таблицу:
|
Разъём |
Socket AM2 |
Socket AM2+ |
Socket AM3 |
|
Поддержка памяти |
DDR2 |
DDR2 |
DDR2, DDR3 |
|
Версия HyperTransport |
1.0 |
3.0 |
3.0 |
|
Поддержка процессоров |
Rev F/G (K8)
|
Rev F/G (K8)
|
Будущие 45 нм ЦП |
|
Частота HyperTransport |
2,0 ГГц |
Больше 4,0 ГГц |
Больше 4,0 ГГц |
|
Тип соединения |
Параллельный |
Параллельный |
Последовательный |
|
Мониторинг температуры |
Диод |
Диод и FSI |
FSI |
|
Размер BIOS |
4 Мбит |
8 Мбит |
8 Мбит |
|
Размер кэша |
2x1 Мбайт |
2x1 Мбайт |
2x1 Мбайт |
|
Дата выхода |
Май 2006-го |
3-й кв. 2007-го |
2-й кв. 2008-го |
Первое, что бросается в глаза, - обратная совместимость процессоров под Socket AM2+ и Socket AM3 с Socket AM2. Да, да - более того внедрение поддержки DDR3 никак не отразится на совместимости современных плат с будущими ЦП. AMD смогла достичь этого достаточно просто: свежеиспеченный контроллер памяти сможет действовать как с DDR2, так и с DDR3. Нечто подобное мы могли следить при переходе на DDR2: первая серия чипсетов Intel 915 могла вкалывать как с DDR, так и с DDR2. Конечно, не одновременно. То же самое произойдёт и при переходе на DDR3. В следующем году Intel представит чипсеты серии Bearlake, которые смогут трудиться с двумя типами памяти - DDR2 и DDR3.
Вместе с тем в серверном сегменте наблюдается несколько иная ситуация. С выходом Xeon на ядре Woodcrest Intel выпустила новоиспеченный чипсет, поддерживающий FB-DIMM. Главное превосходство этих модулей заключается в здоровущий ёмкости. Но вкупе с тем мы получили шибко большие задержки (а, как известно, как раз из-за них AMD в своё момент не торопилась с переходом на DDR2) и тепловыделение.
|
Высокое тепловыделение модулей FB-DIMM сводит на нет все преимущества низкого TDP новых Xeon |
С тепловыделением вообще отдельная история. На недавно проведённой презентации в Москве AMD открыто говорила о высокой тепловой эффективности новых чипов Xeon. Но из-за здорово греющихся чипсетов и модулей памяти энергопотребление всей системы в целом оказывается выше, чем у основанной на базе Opteron. Неудивительно, что AMD изначально относилась к FB-DIMM скептически. И, судя по всему, даже Intel начинает признавать очередное своё упущение в вопросе памяти (заметим, неблизко не первое упущение такого рода).
Сегодня второй производитель процессоров принимает активное участие в разработке нового типа памяти DDR3. Новые модули позволят вознести пропускную способность в два раза в сравнении с DDR2. Кроме того, новый тип позволит давать планки ёмкостью от 512 Мбайт до 32 Гбайт, что уже как минимум сравнимо с современными FB-DIMM. Кстати, если FB-DIMM каким-то макаром всё же выживет и получит широкое распространение, AMD внедрит и его поддержку. Так что в этом месте всё зависит от "as market requires".
Вернёмся к нашим процессорным разъёмам. Единственным серьёзным отличием Socket AM2 от Socket AM2+ станет внедрение поддержки новой шины HyperTransport 3.0. Она должна будет поднять пропускную способность на участке "процессор-чипсет", а также "процессор-процессор" в случае Opteron и будущих Athlon 64 FX. Что интересно, прыть новой шины будет зависеть от частоты процессора. Эту подневольность ладно отражает следующая таблица:
|
Частота процессора |
Частота тактового генератора |
Пропускная способность HyperTransport |
|
2,0 ГГц |
1,5 ГГц |
12,0 Гбайт/с |
|
2,1 ГГц |
1,5 ГГц |
12,0 Гбайт/с |
|
2,2 ГГц |
1,6 ГГц |
12,8 Гбайт/с |
|
2,3 ГГц |
1,7 ГГц |
13,6 Гбайт/с |
|
2,4 ГГц |
1,8 ГГц |
14,4 Гбайт/с |
|
2,5 ГГц |
1,8 ГГц |
14,4 Гбайт/с |
|
2,6 ГГц |
1,9 ГГц |
15,2 Гбайт/с |
|
2,7 ГГц |
2,0 ГГц |
16,0 Гбайт/с |
|
2,8 ГГц |
2,0 ГГц |
16,8 Гбайт/с |
|
2,9 ГГц |
2,1 ГГц |
16,8 Гбайт/с |
|
3,0 ГГц |
2,2 ГГц |
17,6 Гбайт/с |
|
3,1 ГГц |
2,3 ГГц |
18,4 Гбайт/с |
|
3,2 ГГц |
2,3 ГГц |
19,2 Гбайт/с |
|
3,3 ГГц |
2,4 ГГц |
19,2 Гбайт/с |
|
3,4 ГГц |
2,5 ГГц |
20,0 Гбайт/с |
|
3,5 ГГц |
2,6 ГГц |
20,8 Гбайт/с |
В сравнении с HyperTransport, что применяется в современных чипах AMD, пропускная способность возрастёт минимум в два раза (сегодня она составляет 6,4 Гбайт/с). А для самых быстрых представителей новых процессоров, частота которых достигнет в ближайшие год-два 2,9-3,0 ГГц, тот самый показатель возрастёт в три раза.
Кроме того, нам гарантируется обратная совместимость со старой шиной. Конечно, если установить ЦП с поддержкой HT 3.0 в Socket AM2, он будет обмениваться данными с чипсетом на сниженной скорости. Но благодаря тому, что контроллер памяти встроен в процессор, это вряд ли приведёт к серьёзному падению производительности. Исключением могут сделаться четырёхъядерные процессоры - там повышенная пропускная способность HT 3.0 может очутиться более востребованной.
Все остальные изменения, ожидаемые при переходе на Socket AM2+ и Socket AM3, не настолько значительны. Они касаются нового типа BIOS, а также изменённого мониторинга рабочего состояния процессора (температуры, напряжения). Что касается сроков появления новых разъёмов на рынке, то Socket AM2+ мы сможем "потрогать" уже сквозь год, а Socket AM3 выйдет не раньше второго квартала 2008 года. Но, вновь же, это неофициальная информация, и она может измениться.
По материалам: http://ferra.ru/online/processors/s26658/
Опубликовано: 05 апреля 2008