Переосмысление основ
Над чем же так долго работали инженеры AMD? Если взглянуть на схему,
иллюстрирующую устройство нового графического ядра Cayman, может
показаться, что они просто валяли дурака: прошлогодние Barts и Cypress в
разрезе выглядят почти так же. Однако это лишь первое впечатление. На
самом деле различия существенны, просто сокрыты они очень глубоко. Дело
в том, что AMD отказалась от архитектуры VLIW5, которую использовала
еще со времен создания двухтысячной серии Radeon, и заменила ее новой —
VLIW4.
Чтобы вам было легче понять суть изменений, проведем небольшой
ликбез по структуре графических чипов AMD. За основные вычисления в
этих GPU отвечают так называемые SIMD-ядра, каждое из которых привязано к
своему собственному набору текстурных блоков. Сами ядра состоят из
шестнадцати шейдерных процессоров, занимающихся параллельной обработкой
информации. Шейдерные процессоры, в свою очередь, образованы
несколькими вычислительными блоками, которые принято называть
потоковыми процессорами. Во всех последних картах AMD этих блоков
предусмотрено по пять штук на каждый шейдерный процессор: четыре из них
занимаются простыми действиями вроде сложения и умножения, а пятый,
t-unit, берет на себя более сложные операции, вроде извлечения корня,
вычисления синуса, логарифма и т.п. Собственно, цифра 4 или 5 в
названии архитектуры как раз указывает на число блоков.
Несложно догадаться, что в Cayman, использующем архитектуру VLIW4,
шейдерные процессоры лишились одного из вычислительных блоков.
Конкретно — того, что отвечал за продвинутые арифметические действия. По
мнению AMD, он сейчас используется не так интенсивно, как
предполагалось когда-то, и его обязанности можно переложить на плечи
стандартных блоков.
Таким образом, с приходом новой архитектуры производительность
каждого SIMD-ядра снизилась, однако уменьшились и его размеры, в
результате чего возросла плотность размещения внутри GPU. Так, в Cayman
удалось вместить двадцать четыре SIMD-ядра, в то время как у Cypress их
только двадцать. Однако потоковых процессоров у Cayman все равно
меньше — 1536 против 1600 у Cypress. При этом однородность
вычислительных блоков Cayman подразумевает, что он все равно окажется
быстрее Cypress при обилии простых операций — хотя, столкнувшись со
сложными вычислениями, быстро растеряет свой задор.
Перфекционизм
Впрочем, в рассматриваемом чипе хватает и других, не столь
радикальных нововведений. Например, AMD продолжает совершенствовать
движок тесселяции. Вернее, теперь это уже не «движок», а «движки» — в
Cayman находятся сразу два модуля, объединяющих тесселятор,
растеризатор, а также вершинный и геометрический компиляторы. Таким
образом, этот графический процессор справляется с обработкой геометрии
гораздо лучше, чем у Cypress, а скорость расчета тесселяции, по словам
разработчиков, может увеличиваться в два-три раза.
Количество блоков растеризации осталось прежним (32 штуки), но AMD
заявляет о существенном увеличении их производительности — новые ROP
эффективнее используют шину памяти, да и скорость обработки 16-битных и
32-битных операций значительно возросла. К каждому SIMD-ядру
по-прежнему привязано по четыре текстурных блока, так что на Cayman
размещено 96 TMU.
AMD продолжает работать и над совершенствованием алгоритмов сглаживания: Cayman не только обзавелся Morphological Anti-Aliasing, представленным несколько месяцев назад в видеокартах Radeon HD 68хх, но и изучил еще один режим сглаживания — Enhanced Quality Anti-Aliasing (EQAA). К сожалению, это всего лишь аналог Coverage Sampling Anti-Aliasing
(CSAA), который появился в графических платах GeForce много лет назад,
однако он действительно полезен: картинку сглаживает хорошо, ресурсов
отъедает немного и учитывает геометрию сцены.
Технические характеристики |
Характеристика |
AMD Radeon HD 6970 |
NVIDIA GeForce GTX 580 |
NVIDIA GeForce GTX 480 |
AMD Radeon HD 5870 |
AMD Radeon HD 5970 |
Ядро |
Cayman XT |
GF110 |
GF100 |
Cypress |
Hemlock |
Количество транзисторов |
2,64 млрд |
3 млрд |
3 млрд |
2,15 млрд |
4,3 млрд |
Техпроцесс |
40-нм |
40-нм |
40-нм |
40-нм |
40-нм |
Количество потоковых процессоров |
1536 |
512 |
480 |
1600 |
2х 1600 |
Частота графического ядра |
880 МГц |
772 МГц |
700 МГц |
850 МГц |
725 МГц |
Частота потоковых процессоров |
880 МГц |
1544 МГц |
1401 МГц |
850 МГц |
725 МГц |
Тип, объем памяти |
GDDR5, 2 ГБ |
GDDR5, 1536 МБ |
GDDR5, 1536 МБ |
GDDR5, 1 ГБ |
GDDR5, 2 ГБ |
Частота памяти |
5500 МГц |
4008 МГц |
3696 МГц |
4800 МГц |
4000 МГц |
Шина данных |
256 бит |
384 бит |
384 бит |
256 бит |
256 бит |
Количество текстурных блоков |
96 |
64 |
60 |
80 |
2х 80 |
Количество блоков растеризации |
32 |
48 |
48 |
32 |
2х 32 |
Энергопотребление |
250 Вт |
244 Вт |
250 Вт |
188 Вт |
294 Вт |
Интерфейс |
PCIe 2.0 x16 |
PCIe 2.0 x16 |
PCIe 2.0 x16 |
PCIe 2.0 x16 |
PCIe 2.0 x16 |
Цена на февраль 2011 года |
13000 рублей |
16000 рублей |
12500 рублей |
10300 рублей |
19000 рублей |
На текстолите
Эталонная версия Radeon HD 6970 внешне схожа с другими
представителями шеститысячной серии — та же расцветка, та же рубленая
форма. Однако в «раздетой» HD 6970 узнается HD 5870 — ключевые
компоненты расположены на плате идентичным образом.
Внимания заслуживают два элемента. Первый — подсистема питания. Как и
в предшественнице, в HD 6970 используется стабилизатор, выполненный по
схеме «6+2». Но к новой видеокарте питание подводится с помощью
разъемов 6-pin и 8-pin, в то время как HD 5870 довольствовалась двумя
6-контактными розетками. Подобная метаморфоза связана с возросшим
энергопотреблением (о нем ниже).
Вторая любопытная деталь — крохотный переключатель, расположенный
возле разъемов для CrossFire-мостов. Он позволяет выбрать, с какой из
двух микросхем видеокарта будет считывать BIOS. Это нововведение должно
прийтись по душе всем, кто захочет перепрошить свой графический
адаптер, — даже если что-то пойдет не так, устройство всегда можно будет
«завести» с основной микросхемы BIOS, содержимое которой не поддается
перезаписи.
Что касается рабочих частот, то они выставлены на отметках 880 МГц и
5500 МГц для ядра и памяти соответственно. Восемь чипов GDDR5,
распаянных на печатной плате, предоставляют в распоряжение графического
процессора аж 2 ГБ для складирования обрабатываемых данных. Обмен
информацией между GPU и памятью осуществляется посредством 256-битной
шины памяти.
Укрощение строптивой
Высокое энергопотребление и тепловыделение — неизменные спутники
производительных видеокарт. Разработчики борются с этими напастями как
могут, но у них не всегда это хорошо выходит. В свое время GeForce GTX 480 получила много негативных отзывов за свой горячий нрав, и у Radeon HD 6970
есть все шансы повторить судьбу конкурента: дело в том, что
максимальное энергопотребление у обеих видеокарт — 250 Вт.
Тепловыделение, соответственно, тоже зашкаливает.
NVIDIA боролась с нагревом, используя очень мощный кулер с
большим числом тепловых трубок, AMD же отдала предпочтение
испарительной камере — она у новинки даже больше, чем у GeForce GTX 580.
Фактически этот элемент занимает всю нижнюю часть радиатора,
контактируя не только с GPU, но и с чипами памяти. Было бы совсем
замечательно, если бы камера накрывала еще и подсистему питания, но
этому препятствует вентилятор, поэтому силовые элементы прикрыты лишь
простеньким радиатором с низким оребрением — спорное решение, учитывая
пиковую мощность видеокарты.
С прожорливостью своего творения AMD борется довольно радикальными методами: инженеры компании разработали технологию PowerTune,
которая гибко изменяет частоту процессора в зависимости от выполняемых
в данный момент задач. Если нагрузка на графический чип начинает
превышать разумные пределы, то новая система попросту снижает частоту
GPU, дабы последний не вышел из строя, — в процессорах подобные схемы
используются уже давно. Заметим, что работает технология на аппаратном
уровне и программно можно лишь немного подкорректировать агрессивность
PowerTune: специальный ползунок в настройках Catalyst Control Center позволяет изменять порог срабатывания механизма защиты.
Синтетические тесты |
3DMark Vantage |
Модель видеокарты |
GPU |
CPU |
Overall |
Соотношение производи- тельности |
AMD Radeon HD 6970 |
19098 |
17175 |
18578 |
100% |
NVIDIA GeForce GTX 580 |
22468 |
48353 |
25940 |
140% |
NVIDIA GeForce GTX 480 |
16526 |
47711 |
19796 |
107% |
AMD Radeon HD 5870 |
17402 |
17326 |
17383 |
94% |
AMD Radeon HD 5970 |
21848 |
17347 |
20517 |
110% |
Unigine Heaven Benchmark 2.0 |
Модель видеокарты |
FPS |
Overall |
Соотношение производи- тельности |
AMD Radeon HD 6970 |
24,8 |
626 |
100% |
NVIDIA GeForce GTX 580 |
31,6 |
796 |
127% |
NVIDIA GeForce GTX 480 |
24,6 |
617 |
99% |
AMD Radeon HD 5870 |
11,4 |
288 |
46% |
AMD Radeon HD 5970 |
19,9 |
502 |
80% |
С опозданием
Долгое время Cayman оставался темной лошадкой, которую с упоением
нахваливала AMD: мол, после выхода Radeon HD 69хх NVIDIA потеряет
статус производителя самых быстрых одночиповых видеокарт. Окажись AMD
расторопнее, так бы оно и было, но сегодня зеленые уже вовсю продают
GeForce GTX 580, воевать с которой изначально не предполагалось.
Поэтому на слайдах AMD новенькая Radeon HD 6970 располагается аккурат
между GTX 580 и GTX 570, а за звание абсолютного чемпиона по-прежнему
борется двуглавая Radeon HD 5970.
К сожалению, GeForce GTX 570 еще не успела добраться до нашей
лаборатории, поэтому в соперники Radeon HD 6970 мы выбрали следующие
четыре видеокарты. Первая — GeForce GTX 480, поскольку именно ее
AMD планировала низвергнуть, выпустив HD 6970. Вторая — Radeon HD
5870, коей новинка пришла на замену, — необходимо выяснить, насколько
Cayman шустрее Cypress. Наконец, третья и четвертая карты — это
нынешние короли 3D-графики, то есть GeForce GTX 580 и Radeon HD 5970. Вам ведь интересно, насколько сильно новинка отстает от лидеров?
Трезвая оценка
Первыми, по традиции, были пройдены синтетические бенчмарки. В графическом тесте 3DMark Vantage
новое творение AMD набрало более 19000 очков, оставив позади как HD
5870, так и GTX 480. Однако старая Radeon HD 5870 отстала от новичка
всего на шесть процентов, и преимущество HD 6970 оказалось не таким
весомым, как хотелось бы.
Результаты Unigine Heaven Benchmark 2.0 нас обнадежили:
тесселяция в Cayman действительно доведена до ума. Подопытная Radeon HD
6970 обогнала всех своих собратьев, включая HD 5970, и даже смогла
встать вровень с GeForce GTX 480, которая в этом тесте традиционно
очень сильна. Можно констатировать, что тесселяционные движки перестали
быть слабым звеном AMD, и это должно самым благотворным образом
сказаться на производительности в DX11-играх. Наконец, в обоих
бенчмарках первое место заняла GTX 580, причем со впечатляющим отрывом.
В играх под DirectX 10 расстановка сил в целом соответствовала позиционированию видеокарт. Так, в Devil May Cry 4
повторилась та же ситуация, что и в Vantage: новинка обошла HD 5870 и
GTX 480, но сильно отстала от GTX 580 и HD 5970. А вот тестовая сцена Resident Evil 5 была пройдена всеми видеокартами одинаково хорошо — во всех режимах RE5 выдавала чуть больше ста кадров в секунду.
Что касается DX11-игр, то HD 6970 оказалась сильна в Aliens vs. Predator и, напротив, слаба в Lost Planet 2,
которую платы Radeon несколько недолюбливают. Но с учетом усредненных
значений местоположение Radeon HD 6970 в итоговом зачете особо не
изменилось — в обоих случаях видеокарта выдала больше сорока кадров в
секунду, то есть ее производительности вполне хватит для комфортной
игры.
Игровые тесты (кадров в секунду) |
Настройки |
AMD Radeon HD 6970 |
NVIDIA GeForce GTX 580 |
NVIDIA GeForce GTX 480 |
AMD Radeon HD 5870 |
AMD Radeon HD 5970 |
Resident Evil 5 (DX10) |
High, 1680x1050, AF 16x, AA 8x |
110,1 |
113,8 |
105,2 |
105,8 |
112,7 |
High, 1920x1080, AF 16x, AA 8x |
108,5 |
108,1 |
106 |
99,4 |
106,7 |
High, 1680x1050, AF 16x, AA 16x |
114,5 |
108,8 |
106 |
108,5 |
109,8 |
High, 1920x1080, AF 16x, AA 16x |
108,7 |
106,1 |
103,7 |
104,5 |
105,7 |
Соотношение производительности |
100% |
99% |
95% |
95% |
99% |
Devil May Cry 4 (SC2, DX10) |
SuperHigh, 1680x1050, AF 16x, AA 8x |
— |
242,5 |
147,5 |
— |
— |
SuperHigh, 1920x1080, AF 16x, AA 8x |
157,9 |
240,8 |
138,2 |
131,5 |
218,7 |
SuperHigh, 1680x1050, AF 16x, AA 16x |
— |
222,6 |
148,7 |
— |
— |
SuperHigh, 1920x1080, AF 16x, AA 16x |
144,7 |
217,6 |
136,7 |
163,2 |
211,8 |
Соотношение производительности |
100% |
151% |
91% |
97% |
142% |
Aliens vs. Predator (Demo, DX11) |
VeryHigh, 1680x1050, AF 16x, AA 2x |
53,9 |
62,3 |
42,4 |
48,7 |
74,7 |
VeryHigh, 1920x1080, AF 16x, AA 2x |
48,3 |
34 |
39,2 |
43,5 |
61,7 |
VeryHigh, 1680x1050, AF 16x, AA 4x |
46,9 |
55,7 |
38 |
39,4 |
66,8 |
VeryHigh, 1920x1080, AF 16x, AA 4x |
42,1 |
47,4 |
35,1 |
35,2 |
55,1 |
Соотношение производительности |
100% |
104% |
81% |
87% |
135% |
Lost Planet 2 (DX11, Test A, SC2) |
High, 1680x1050, AF 16x, AA 8x |
41,2 |
71,5 |
47,5 |
32,7 |
47,5 |
High, 1680x1050, AF 16x, AA 16x |
40,1 |
75,5 |
48,2 |
34,3 |
49,7 |
Соотношение производительности |
100% |
180% |
118% |
82% |
120% |
Соотношение цены |
100% |
130% |
96% |
79% |
146% |
Соотношение производительности |
100% |
134% |
96% |
90% |
124% |
Новое творение AMD оставило у нас не самое лучшее впечатление.
Прирост быстродействия относительно видеокарт предыдущего поколения у
Radeon HD 6970 невысок, а потребительские качества далеки от идеальных:
несмотря ни на что, карта греется и шумит. Впрочем, в большинстве
испытаний новинка все же смогла одолеть GeForce GTX 480, с которой
изначально и должна была бороться. Радует и тот факт, что видеокарты
Radeon наконец-то научились рассчитывать тесселяцию с достаточно
высокой скоростью, что можно считать хорошим заделом на будущее.
|