Новый калиф на час

Когда та или иная вещь начинает считаться морально устаревшей? Мне кажется, тогда, когда при взгляде на тех, кто продолжает ею пользо ваться, на лицах людей появляется то неповторимое надменно-сочув ствующее выражение, с которым владелец новенькой иномарки смо трит на водителя, тщетно пытающегося завести свою прогнившую «Ладу», а обладатель «Айфона» - на того, кто украдкой, чтобы никто невидел, достает из кармана старинный мобильник с монохромным дисплеем и затертым до дыр корпусом.

 

Все вышесказанное справедливо и для мира компьютеров, только там сроки устаревания устройств существенно короче. Фраза «Да, у меня мощный игровой комп! Я его только три года назад купил!» способна вызвать у продвинутого айтишника приступ гомерического хохота, переходящего в истерику, - а все потому, что за это время машина, предназначенная для «тяжелых» игр, устаревает безнадежно.
И. М.: Вернее, так было до недавнего времени. Но как раз в последние три-четыре года в сфере производства комплектующих для топовых геймерских компьютеров наметился некоторый застой. Процессоров это касается в меньшей степени (хотя все равно анонс серии камней Core ix от Intel не вызвал и половины того ажиотажа, который возник при появлении Core 2, да и AMD со времен выпуска Athlon XP не «выстреливала»), а вот к видеокартам относится целиком и полностью, особенно к тем, что украшены зеленым логотипом. Настоящей революцией стало появление в 2006 году «восьмитысячной» серии графических адаптеров от NVIDIA: радикально новая архитектура, новая конструкция СО и компоновка платы, и самое главное - высочайшая производительность. Лишь спустя полтора года в ATI / AMD разработали серию Radeon HD 4хх0, представители которой смогли стать достойными соперниками новым «жирафам». Но, выйдя на рынок со столь удачными видеоускорителями, калифорнийцы (а именно в этом штате расположен головной офис NVIDIA) невольно сами создали конкуренцию своим
последующим продуктам: все они явля­лись прямыми  потомками архитектуры G80 и не очень-то опережали «родите­лей» по производительности. Даже бо­лее-менее серьезное обновление удач­ной серии, произошедшее в 2008 году (когда был разработан чип GT 200), не перевело 8800 GTS, GTX и Ultra в разряд древних и почти бесполезных артефак­тов вроде Voodoo2: карты продолжали «жарить» и во многих тестах уступали свежайшим аналогам лишь 30-50% На первый взгляд, это довольно серьезное отставание, но нега­тивное впечатление от него полностью  нивелируется     тем фактом, что новую     видюху еще надо ку-    пить, причем за не­маленькие день­ги, а старая у вас уже есть.

Ну и потом, отсут­ствие поддержки новейших API (DirectX 10.1 и 11) тоже, прямо скажем, не великое горе. Далеко не во всех играх есть эф­фекты, реализация которых невозмож­на без совместимости с этими технологи­ями, да и в игрушках с подобными фишка­ми кардинально на качество картинки они не влияют. Вон возьмите хотя бы Batman: Arkham Asylum: современная, интересная и красивая игра, а написана полностью под DirectX 9.

Я не просто так привел в пример именно эту игру. Она, как известно, в первую очередь предназначена не для ПК, а для приставок. И вот здесь-то, по мнению некоторых, и кроется корень -не скажу, что именно зла, но чего-то близкого: большая часть популярных игр для компа разрабатывается в том числе и в версии под консоли, а последние ап­грейду основной вычислительной части в домашних условиях не подлежат, да и производителями модернизируются мед­ленно и несущественно. Внутри ХЬох 360 стоит чип Xenos, архитектурно являю­щийся предшественником ATI R600, а в PlayStation 3 - кристалл RSX (модифици­рованная версия NVIDIA G70). Эти GPU были разработаны по меркам игровой индустрии очень давно. Таким образом, цепочка получается следующей: новые игры пишутся с прицелом на старые платформы - их графическая составля­ющая подстраивается под ограничения этих платформ - игрушки хорошо рабо­тают и на не слишком новых видеокар­тах - у покупателя нет резона покупать


более мощные графические адаптеры -такие адаптеры разрабатываются долго, и в целом индустрия крайне вяло про­двигается вперед.

Я не полностью разделяю эту идею, но здравое зерно в ней определенно есть. Тем не менее приведу несколько контраргументов: во-первых, существу­ют исключительно «компьютерные» иг­ры, в которых разработчики могут по­зволить себе задействовать все воз­можности современных ПК. Во-вто­рых,   кроссплатформенные  про­екты при грамотном и тщатель­ном портировании можно хо­рошо оптимизировать под приставки, оставив при этом   в   РС-версии        возможность   ус­тановки куда бо­лее высокого каче­ства  графики  (хоро­ший пример - Metro 2033: The Last Refuge, к которой мы сегодня еще вернемся). В-третьих, многие хотят и в ста- рых играх иметь больше fps - для то-

го, чтобы картинка двигалась плавнее, чтобы можно было прикрутить какое-ни­будь нереальное сглаживание и в конеч­ном итоге «омолодить» с графической точки зрения свою любимую игру. Ведь, согласитесь, в те же Half-Life 2 и Oblivion в момент их выхода большинство гейме­ров играли далеко не на максимальных

Процессор Материнская плата Оперативная память Блок питания ОС Драйверы


настройках и потому не могли оценить всех возможностей их движков.

Также, несомненно, имеет место и про­сто торможение процессов разработки новых GPU ввиду множества технических трудностей и ограничений. Осваивать бо­лее тонкие техпроцессы с каждым разом становится все труднее, плюс нельзя вы­лезать за предельные величины тепловы­деления, энергопотребления и габарит­ных размеров. Да и мировой финансо­вый кризис здесь тоже наверняка сыграл свою роль (вообще, какая универсальная вещь этот кризис - любую проблему на него можно списать, и будет звучать прав­доподобно. - Прим. автора).

В итоге мы видим достаточно медлен­ную эволюцию графических адаптеров для ПК. С каждым анонсом новой серии утверждается, что именно она является революционной и возносит производи­тельность до небес, а реалистичность -до кинематографического уровня. Эти слоганы мы слышим уже без малого лет десять, так что вряд ли осталось много людей, которые на них падки, - ну разве что совсем зеленые новички. При этом я вовсе не хочу сказать, что считаю выпуск новых серий видеокарт бесполезным за­нятием, - наоборот, каждая свежая ли­нейка приносит какое-то важное усовер­шенствование. Да что там греха таить, как только в редакции появляется оче­редной тестовый сэмпл топовой видюхи, я спешу утащить его домой - не только

 

 

Таблица 1. Параметры видеопроцессоров

 

 

 

 

GF100

GT200

G80

Flops (одинарная точность), шт. / такт

 

512 (FMA)

240 (MAD)

128 (MAD)

Flops (двойная точность), шт. / такт

 

256 (FMA)

30 (FMA)

-

SFU в одном SM, шт.

 

4

2

2

Планировщики warp'oв в одном SM, шт.

 

2

1

1

Разделяемая память в одном SM, Кбайт

 

16-48

16

16

Одновременно обрабатываемые потоки,

шт.

24 576

30 720

12 288

 

Таблица 2. Конфигурация тестового стенда

 

Intel Core i7 920 @ 3,33 ГГц

Gigabyte GA-EX58-UD5

Corsair Dominator DDR3-1600 @ 1330 МГц (7-7-7-21), 3 Гбайт

Hiper HPU-5K680, 680 Вт

Microsoft Windows 7 Ultimate

ATI Catalyst 10.3 / NVIDIA ForceWare 197.17 Beta

 

исследовать, но и просто поиграть. Мне нравится запускать игры на максималь­ных настройках, и вообще, я считаю, что интересный сюжет / игровой процесс и хорошая графика - не взаимоисключаю­щие, а, наоборот, замечательно дополня­ющие друг друга вещи.

Наконец, даже если не говорить не­посредственно об игровой производи­тельности, в свежих картах почти всегда есть какие-нибудь интересные вспомо­гательные фишки - новые выходные ин­терфейсы, встроенные звуковые про­цессоры, прикладной софт, позволяю­щий задействовать GPU для расчетов, и многое другое.

Надеюсь, мне удалось несколько вы­править общее пессимистическое впе­чатление, которое наверняка сложилось у вас после прочтения вводной части ста­тьи. Ведь сегодня у нас как-никак почти что праздник: выход новой архитектуры NVIDIA, в которой появилась поддержка DirectX 11 и много других «плюшек». По-


явления чипов на ее базе нам пришлось ждать очень долго: если считать от мо­мента выпуска конкурирующего реше­ния, совместимого с DX11, - ядра Cyp­ress из серии Evergreen от ATI, - то полу­чится, что ответ NVIDIA запоздал на це­лых полгода, что по меркам старой, бо­лее динамичной видеоиндустрии могло быть приравнено чуть ли не к целой эпохе. Так стоило ли фанатам считать дни до официальной презентации, делая зарубки на корпусе адаптера «двухсотой» серии? Сегодня это станет известно.

Знакомиться с архитектурой мы бу­дем на примере единственного на дан­ный момент ее воплощения в кремнии -графического процессора GF100, кото­рому суждено стать флагманом новой линейки видеочипов. Итак, передаю сло­во коллеге.

Общий взгляд на Fermi

Давайте для начала обрисуем портрет но­винки в общих чертах. В состав GF100 вхо-


дит 512 шейдерных процессоров, кото­рые группами по 32 штуки объединены в 16 блоков, называемых потоковыми мультипроцессорами (Streaming Multipro­cessor, SM). В состав каждого SM также входят блоки планировки и диспетчериза­ции, набор регистров и кэш первого уров­ня. Все мультипроцессоры подключены к общему кэшу L2 объемом 768 Кбайт и контроллерам памяти.

Блоки SM сгруппированы по четыре штуки в кластеры обработки графики (Graphics Processing Clusters, GPC). Каж­дый GPC снабжен своим растеризацион-ным движком (Raster Engine, RE), а в пред­шественницах Fermi весь графический процессор обслуживался одним RE.

С памятью GF100 взаимодействует при помощи шести 64-разрядных конт­роллеров, формирующих единую 384-бит­ную структуру. Столь выдающаяся шири-на шины вкупе с тем, что GF100 может работать с GDDR5, позволяет разраба­тывать видеокарты, обладающие поис-


 

 

 

Таблица 3. Характеристики видеокарт

 

 

 

 

 

 

GeForce GTX480

GeForce GTX470

Radeon НО 5870

Radeon HD 5850

GeForce GTX285

GeForce GTX295

Radeon HD5970

Рекомендуемая цена, руб.

19 000

14 000

11 800

8800

8800

14 700

17 700

Графический процессор

GF100

GF100

Cypress

Cypress

GT200b

2 x GT200b

2 x Cypress

Потоковые процессоры, шт.

480

448

1600(320)

1440 (288)

240

2x240

2 x 1600 (2x320)

Текстурные блоки, шт.

60

56

80

72

80

2x80

2x80

Блоки растровых операций, шт.

48

40

32

32

32

2x28

2x32

Частота ядра, МГц

700

607

850

725

648

576

725

Частота шейдерного блока, МГц

1401

1215

850

725

1476

1404

725

Частота памяти, МГц

924 (3696)

837 (3348)

1200 (4800)

1000 (4000)

1242(2484)

999(1998)

1000 (4000)

Шина памяти, бит

384

320

256

256

512

2x448

2x256

Пропускная способность памяти, Гбайт/с

177,4

133,9

153,6

128,0

159,0

2 x 145,2

2 x 128,0

 

Объем памяти, Мбайт

1536

1280

1024

1024

1024

2x896

2 x 1024

Количество транзисторов, млн шт.

3000

3000

2154

2154

-1400

2 x-1400

2x2154

Техпроцесс, нм

40

40

40

40

55

55

40

Площадь ядра, мм2

529

529

334

334

470

2x470

2x334

Пиковая потребляемая мощность, Вт

250

215

188

170

183

289

294

 

Потребляемая мощность в простое, Вт

47

33

27

27

N/A

N/A

51

 

 

 

 

GEFORCE GTX 480. Отличительный признак тестового экземпляра - отсутствие каких-либо наклеек с названием компании-производителя

В состав каждого из 16 потоковых муль­типроцессоров входит 32 так называемых CUDA-ядра. Те, в свою очередь, включают в себя по одному ALU.

тине огромной пропускной способнос­тью памяти.

Также на общей схеме GF100 можно обнаружить интерфейс соединения с ши­ной PCI Express (Host Interface) и планиров­щик GigaThread, распределяющий блоки потоков между внутренними планировщи­ками мультипроцессоров.

Очевидно, при создании производных вариантов GF100 в том, что касается вы­числительной части чипа, минимальной «замораживаемой» единицей окажется именно один SM. В частности, именно та­кую ситуацию мы можем наблюдать в слу­чае с картой GTX 480 (да-да, это не опе­чатка) - до полной конфигурации шейдер-ного блока ей не хватает как раз одного потокового мультипроцессора.

Вы спросите, почему NVIDIA не пред­ставила видеоускоритель, в котором ис­пользовалась бы полная версия GF100? Дело тут в том, что производство чипов по 40-нанометровому техпроцессу пока недостаточно отлажено и фабрики выпу­скают слишком мало кристаллов, совер­шенно лишенных дефектов. В таких ус­ловиях NVIDIA приняла решение не изго­тавливать пока карт GeForce на основе «полного» GF100.

Потоковый мультипроцессор

В состав каждого из 16 потоковых мульти­процессоров входит 32 так называемых CUDA-ядра. Те, в свою очередь, включа­ют в себя по одному арифметико-логиче­скому устройству и блоку вычислений с плавающей запятой. В архитектуре Fermi нашел широкое применение новый стан­дарт вычислений IEEE 754-2008, подразу­мевающий возможность выполнения опе­раций совмещенного сложения-умноже­ния (Fused Multiply-Add, FMA) как одинар­ной, так и двойной точности. Если гово­рить о предшественнике GF100, GT200,


то там схема FMA использовалась только в операциях двойной точности.

Преимущество FMA перед старым под­ходом (Multiply-Add, MAD) заключается в более высокой точности вычислений, так как в рамках FMA не производится округ­ление промежуточного результата - соот­ветствующее действие затрагивает толь­ко итоговое значение.

Еще одно достоинство архитектуры Fermi по сравнению с предшественницей заключается в разрядности АПУ для опе­раций умножения - 32 бита против 24. Кроме того, новое арифметико-логичес-

кое устройство дополнительно оптими­зировано под выполнение 64-разрядных операций.

С кэшем и основной памятью потоко­вый мультипроцессор взаимодействует при помощи 16 блоков загрузки / сохране­ния данных, каждый из которых может быть отдан на откуп своему потоку.

Также в состав SM входят четыре уст­ройства специального назначения (Special Function Units, SFU), отвечающих за выпол­нение трансцендентных функций (напри­мер, тригонометрических).

Планировщик warp'oe

Так как ранее о warp'ax мы не говорили, самое время объяснить, что это за зверь. Так называются группы, состоящие из 32 параллельных потоков, - именно та­кими скоплениями потоки и поступают в мультипроцессор.

Наличие в SM двух планировщиков warp'oe при благоприятном сочетании


поступающих операций позволяет загру­жать работой все исполнительные блоки мультипроцессора (32 CUDA-ядра, 16 ус­тройств загрузки / сохранения и четыре SFU), распределяя по ним содержимое сразу пары warp'oe.

Работа с текстурами

При определении места текстурных бло­ков в архитектуре Fermi инженеры NVIDIA применили абсолютно тот же подход, что и в отношении вышеупомянутых движ­ков растеризации, - то есть они предпо­чли разделить крупные модули на мел­кие составляющие. Если в GT200 на каждые три мультипроцессора была выделена единая группа из восьми текстурников, то в GF100 в состав одно­го SM входит четыре «лич­ных» текстурных модуля.

Что любопытно, несмотря на меньшее общее количество TMU (64 штуки про­тив 80), GF100 превосходит GT200 по производительности в операциях текс-турирования.

Тесселяция

Еще одна группа функциональных бло­ков, при проектировании которой NVIDIA сделала ставку на небольшое количество мелких модулей, а не на один крупный, от­вечает за работу с геометрическими дан­ными. Каждому из потоковых мультипро­цессоров GF100 выделен свой PolyMorph Engine, который среди прочего занимает­ся и тесселяцией.

Если кто забыл, напомню, что тесселя­ция - это автоматическое разбиение круп­ных полигонов на более мелкие. Исполь­зование такой техники совместно с карта­ми смещения (специальными текстурами, в которых закодирована информация о том, на сколько нужно сместить опреде­ленные вершины геометрической модели) позволяет значительно повысить детали­зацию изображения без увеличения объ­ема хранимых в ЗУ данных и роста нагруз­ки на шину памяти.

Кстати говоря, компания AMD к раз­работке своего последнего тесселятора подошла по-другому - в видеопроцессо­рах Evergreen весь чип обслуживается одним таким блоком.

Блоки растровых операций

В процессоре GF100 суммарно насчиты­вается 48 блоков растровых операций (ROP'ob). Они разделены на шесть групп, каждая из которых состоит из восьми та­ких модулей и относится к своему конт­роллеру памяти (в случае GT200 на один контроллер приходилось лишь по четы­ре ROP'a). Еще одно отличие GF100 от GT200 заключается в том, какое запоми­нающее устройство используют ROP'ы при работе, - в «двухсотом» им было вы­делено отдельное ЗУ, а в «сотенном» они имеют доступ к общему кэшу второ­го уровня.

Новая организация блоков растро­вых операций позволяет существенно снизить потери производительности при переходе от сглаживания MSAA 4х к MSAA 8х. Кроме того, существенно возросшая мощь ROP'ob дала основа­ние NVIDIA ввести новый алгоритм сгла­живания - CSAA (Coverage Sampling An­tialiasing) 32х.

Работа с памятью

Существенно от своих предшественниц Fermi отличается в плане иерархии па­мяти, которая благодаря появлению кэ-


шей общего назначения стала включать в себя три уровня вместо прежних двух. На первом из них находится ОЗУ, на вто­ром - кэш L2, а затем следует ступень, на которой располагаются кэш L1 и раз­деляемая память, необходимая для об­мена данными между разными потоками из одного блока.

Здесь стоит отметить последнюю па­ру запоминающих устройств. Если в чи­пах G80 и GT200 каждый потоковый мультипроцессор включал в себя только 16 Кбайт разделяемой памяти, то в слу­чае с GF100 все несколько занятнее. Разделяемая память и кэш первого уров­ня представляются здесь как части еди­ного 64-килобайтного ЗУ, а пропорция их

Объем изменений, которым подвергся старый графический процессор, весьма существенен, но радикально архитекту¬ра не перекраивалась.

объемов в зависимости от ситуации мо­жет иметь вид либо «16/48 Кбайт», либо «48/16 Кбайт».

Частоты

Как вы наверняка помните, во всех сво­их видеопроцессорах, основанных на унифицированной шейдерной архитек­туре (то есть в чипе G80 и его потом­ках), NVIDIA применяла схему с раз­дельной синхронизацией шейдерного домена и прочих блоков GPU. Причем между собой соответствующие частоты связывались относительно слабо - на них было наложено лишь одно ограни­чение, согласно которому шейдерные процессоры по быстродействию долж-


ны были превосходить остальные моду­ли минимум в два раза. При разработке же GF100 калифорнийские инженеры решили отказаться от такой схемы, но все же от самой идеи разночастотности они не отреклись.

Итак, в новых графических процессо­рах NVIDIA на «базовой» частоте работа­ют шейдерный домен и кэш первого уровня, а на строго вдвое меньшей - все остальные модули, кроме блоков растро­вых операций и кэша L2 (эта пара живет обособленно).

Как видите, кардинально здесь ниче­го не изменилось, но вот у оверклокеров при разгоне новых видеокарт свободы действий поубавилось.

Осмотр на месте

BootSector: Ну как, соста­вили впечатление о но­винке? Как видите, объем произведенных изменений весьма существенен, но радикально архитектура не перекраи­валась. Можно говорить о том, что пе­реход GT200-GF100 похож на переход G80-G92-GT200. Тогда, как вы помните, производительность сопоставимых по це­новому позиционированию видеокарт по­высилась, но не настолько, чтобы это по­разило воображение; а как будет сейчас? Это нам удастся выяснить при помощи инженерного сэмпла видеокарты GTX 480 производства самой NVIDIA и уже знако­мой вам тестовой системы, описанной в таблице #2. Но для начала давайте внима­тельно рассмотрим видеокарту.Если компания ATI / AMD придумала для своих последних видеокарт брос­кий и агрессивный дизайн, больше наводящий на мысли о суровых хищниках, чем о мирных вечнозеленых растениях, то в NVIDIA пример с конкурента брать не стали. Видеокарта выглядит строго и аккуратно, очертания ее корпуса оста­лись почти неизменными, если сравни­вать с предыдущим одночиповым фраг-маном - GTX 285, так что, если налепить на нее цветастый шильдик, можно сразу и не понять, что перед тобой - представи­тель новой серии. Наиболее заметные особенности GTX 480 - четыре толстые теплотрубки, выходящие за пределы кор­пуса (внутри притаилась пятая), да нике­лированный участок радиатора, выне­сенный на лицевую панель кожуха. Карта обещает быть очень горячей (заявленное тепловыделение рекордно для одночипо-вого продукта - 250 Вт), поэтому подоб­ные меры вполне оправданны. Только вот от дополнительной поверхности теплооб­мена вряд ли будет много толку, так как в большей части корпусов она окажется смотрящей вниз и расположенной в «мертвой зоне». Кожух, кстати, можно снять с видеокарты, «отжав» шесть языч­ков, - похожее решение применялось в одноплатных GTX 295 с вентилятором по-

 

середине. Также схожесть между выше­упомянутыми картами проявляется в на­личии отверстий в печатной плате, пред­назначенных для дополнительного захва­та воздуха турбиной.

По длине GTX 480 полностью иден­тична GTX 285, причем выяснить это мне удалось без помощи штангенциркуля: де­ло в том, что вторая из упомянутых карт, владельцем которой я являюсь, впритык входит в корпус Ascot 6AR6, в букваль­ном смысле прочерчивая борозду по от­секу для винчестеров. Точно так же плот­но, но без лишних усилий в кейс втисну­лась и «480-я». Уже плюс: скажем, Rade­on HD 5870 в мой не самый тесный кузо­вок, не извлекая отсек с винчестерами, поставить нельзя.

GTX 470 имеет схожие с GTX 480 фор­му и размеры, но лишена выступающих теплотрубок и фрагмента радиатора на кожухе - ее тепловыделение не должно выходить за рамки 215 Вт. В плане же ко­личества, типов и расположения выход­ных интерфейсов для монитора GTX 480 сильно отличается от HD 5870: на свежей «зеленой» карте в рядок стоят два DVI и один нестандартный mini HDMI. Набирающий популярность интерфейс DisplayPort отсутствует полностью, и это минус, зато для выброса горячего воздуха задейству-ется вентиляционное отверстие разме­ром в полный слот, что, несомненно, яв­ляется плюсом.

Объем установленной на карте памя­ти составляет целых 1,5 Гбайт - этого бу­дет достаточно для всех современных игр с самыми качественными текстурами. Причем эта память - стандарта GDDR5, который впервые используется в топовых решениях NVIDIA (исторически же, если говорить о «зеленых» картах, он появил­ся сначала на GT 240, выпущенной в кон­це 2009-го). Ширина шины - 384 бита (как у 8800 Ultra), а эффективная частота -аж 3696 МГц, так что, казалось бы, в пла­не пропускной способности GTX 480 должна стать абсолютной чемпионкой. Но на самом деле в архитектуре GF100 проявилось уже другое ограничение, не связанное непосредственно ни с разряд­ностью, ни с частотой: возможности конт­роллера ввода-вывода. Он не позволяет на все 100% реализовать потенциал под­системы памяти, так что по реальной про­пускной способности GTX 480 и HD 5870 идут примерно на равных.

Еще интересно вот что: в своих офи­циальных презентациях NVIDIA акценти­рует внимание на поддержке ЕСС (Error-Correcting Code) для регистровой, кэш- и оперативной памяти видеокарт GF100. ЗУ типа ЕСС обычно применяется в сер­верных системах - там, где нужна повы­шенная надежность. Наиболее распро­страненные реализации алгоритмов дан­ного кода требуют наличия дополнитель­ного девятого бита в каждом байте, ко­торый бы хранил информацию о четно­сти восьми значащих битов. В модулях памяти для этого вводят дополнитель­ный 9-й (ну или, соответственно, допол­нительные 17-й и 18-й и так далее) чип памяти, но в NVIDIA решили поступить по-другому и просто предусмотреть «отъ-едание» одной девятой объема всей па­мяти под нужды ЕСС, буде необходимость в нем возникнет. По умолчанию в видео­картах код исправления ошибок не ис­пользуется.

Наверное, хватит уже теории, вам ведь не терпится узнать, какова карта в деле. Вот и нам тоже. Включать в тестовую подбор­ку слишком много видеокарт мы не стали: понятное дело, что основной конкурент GeForce GTX 480 - это Radeon HD 5870. Также интересно сравнить новую карту с GTX 285 - предыдущим одночиповым флагманом, и еще с GTX 295 и HD 5970 -просто самыми мощными продуктами ос­новных игроков рынка.

Последние крупные испытания видео­карт мы проводили почти полгода назад, и с тех пор пакет тестовых программ из­менился: из него исчезли старые игры вроде Call of Duty: World at War, Left 4 Dead и S.T.A.L.K.E.R.: Clear Sky, зато появились новые: Battlefield: Bad Company 2, Left 4 Dead 2, S.T.A.L.K.E.R.: Call of Pripyat, Bat­man: Arkham Asylum и Metro 2033: The Last Refuge. Как видите, почти равноцен­ная замена (смайл). Настройки везде мы выставляли на абсолютный максимум, что вполне логично, учитывая позициониро­вание новой видеокарты.

Но начнем мы с богомерзкой синтети­ки, чтобы сразу с ней и расправиться. Из нее у нас - неизменный 3DMark Vantage (дань традициям) и бенчмарк Unigine Hea­ven версии 2.0, использующий возможно­сти DirectX 11. Про 3DMark что-либо гово­рить излишне, а вот на втором останов­люсь подробнее. Во-первых, он создан нашими с вами собратьями, а во-вторых, крайне красив - его можно запустить про­сто ради того, чтобы полюбоваться ориги­нальной фэнтезийной графикой. Но, ког­да лирическое настроение вас покинет, самое время вспомнить об одной из ос­новных особенностей бенчмарка - хоро­шей поддержке программно-аппаратной тесселяции.

Вообще, тесселяция - это замеча­тельная технология, возможности кото­рой по повышению визуального качест­ва картинки едва ли не безграничны. Со­вмещая использование так называемой карты высот и дробления полигонов на мелкие составные части, она позволяет буквально «выращивать» на ровном ме­сте сложный рельеф. Причем этот рель­еф - всамделишный, а не бутафорский, как у технологии Parallax Mapping: грубо говоря, взглянув сбоку на стену из необ­работанного камня, вы не увидите, что на самом деле она плоская, как стол, - на­оборот, отдельные булыжники будут выде­ляться еще больше.

Но при этом не стоит считать видео­карты на базе GF100 или Cypress (в кото­рых реализована поддержка этой техно­логии) эдакими «универсальными улуч-шателями», которые за счет тесселяции делают все игры краше и живее: если разработчики не предусмотрели исполь­зования этой возможности или реализо­вали ее чисто для галочки, то сама по се­бе она не заработает так, как вы бы хотели, и потенциал видюхи просто не будет использован. Точно так же не стоит ждать тесселяции в любой из игр, несовмести­мых с DirectX 11 (а таких сейчас подавля­ющее большинство).

Если говорить о результатах, то в бен­чмарке от Unigine побеждает карта от NVIDIA, причем отрыв тем серьезнее, чем более высокая степень тесселяции вклю­чена (кстати, перебарщивать с данным па­раметром не стоит - это тот самый случай, когда кашу можно испортить маслом). А вот 3DMark Vantage не продемонстрировал серьезных преимуществ новой архитекту­ры NVIDIA над Cypress: GTX 480 отстала от HD 5870. Впрочем, если взглянуть на ре­зультат GTX 285, можно заметить, что про­гресс однозначно есть.

Ситуация в двух играх, задействующих возможности DX9, складывается в пользу свежей карты от NVIDIA: она либо идет вровень с HD 5870, либо заметно обходит ее, а отрыв от собственного одночипового предшественника и вовсе ошеломляю­щий. В Batman: AA на руку GF100 одно­значно сыграла поддержка PhysX, кото­рый в новой ревизии этой игры применя­ется очень широко.

В Crysis Warhead GTX 480 ненамного обгоняет основного конкурента, особенно по минимальной скорости смены кадров. А вот Battlefield: Bad Company 2, не­ожиданно оказавшаяся весьма «тяже­лой» с графической точки зрения игрой, в большей части сцен отдала пред­почтение HD 5870.

Встроенный бенчмарк вечно молодя­щегося S.T.A.L.K.E.R. (на этот раз версии Call of Pripyat) по-прежнему способен по­ставить на колени почти любую видеокар­ту, но GTX 480 в нем показывает себя не­много лучше HD 5870.

И наконец, новинка последних не­дель - Metro 2033: The Last Refuge. Очень атмосферная игра с великолепными гра­фикой и сюжетом. Выкрутив все настрой­ки на максимум и включив тесселяцию, мы смогли убедиться, что эту игрушку еще долго можно будет использовать как мери­ло производительности. GTX 480 здесь может праздновать победу - основные конкуренты повержены.

Отдельно нужно остановиться на каче­стве антиалиасинга во всех играх: коллега упомянул о новом режиме CSAA 32х, но не сказал, что в NVIDIA наконец-то решили проблему, которая меня всегда просто вы­водила из себя: раньше сглаживанию бы­ли подвержены лишь края трехмерных объектов, а вот детали, созданные при по­мощи текстур с элементами прозрачности (трава, листья, сетка-рабица, колючая про­волока), оставались «рваными» даже при максимальных настройках качества гра­фики. Зато теперь алгоритм CSAA Alpha to Coverage умеет пересчитывать в бо­лее высоком разрешении и такие текс­туры, вводя для их краев промежуточные уровни прозрачности, - и все смот­рится просто шоколадно. Нет, в самом деле, это великолепное усовершенство­вание, пусть и дается оно путем некото­рого снижения fps и работает пока не со всеми движками.

А дальше?

После завершения игровых испытаний на умолчальных настройках должен по­следовать разгон и тестирование вы­числительных возможностей архитек­туры Fermi. Вернее, должен был бы, но, увы, тестовый сэмпл GTX 480 оказался очень тестовым, и, лишь услышав о возможном разгоне, гордая видеокарта решила, что не станет терпеть эти из­мывательства и сама наложила на себя руки. Я уронил скупую мужскую слезу и принял нелегкое решение отложить про­должение испытаний до того момента, как нам пришлют новый образец. Вас же призываю не пугаться такого поведения карты: на ней были все необходимые на­клейки, извещающие меня о том, что ес­ли данный «экспериментальный» экзем­пляр хотя бы раз запустится, это уже бу­дет счастье.


Тщательные замеры уровня шума и тепловыделения я по уже понятным при­чинам провести не успел, но беглая оценка этих показателей позволяет мне говорить, что карта вышла очень горя­чей и довольно шумной при максималь­ной нагрузке.

Заключение

Выводы на этот раз будут неоднозначные. Да, NVIDIA вновь забрала себе переходя­щий приз обладателя самой мощной одно-чиповой видеокарты. Наша тестовая под­борка получилась достаточно репрезента­тивной, и, проанализировав еще и резуль­таты сторонних тестов, можно сказать, что в среднем мы имеем около 10-12% пре­восходства GeForce GTX 480 над Radeon HD 5870. Плюс здесь еще можно сделать поправку на бета-версию драйверов для «зеленой» карты - в будущем этот разрыв должен увеличиться до 15-20%. Но не сто­ит забывать и о том, что AMD и ее парт­неры готовят к выпуску версии HD 5870 с 2 Гбайт памяти, повышенными частота­ми или даже тем и другим сразу.А основное преимущество продук­ции «красных» - это, как обычно, низкая стоимость. GTX 480 и 470 поступят в продажу 12 апреля по цене $500 и $350 соответственно. Даже если вспомнить о том, что свежие карты всегда продают­ся с наценкой, все равно мы сомнева­емся, что в ближайшие месяцы NVIDIA опустит цены на GTX 480 до отметки хо­тя бы $400.

В рукаве NVIDIA - козыри в виде вы­соких вычислительных мощностей ар­хитектуры Fermi, эффективной тесселя-ции, хорошей поддержки PhysX и срав­нительного богатого набора CUDA-при-ложений. Но игра на рынке дискретной графики нечасто складывается так, что­бы эти козыри можно было использо­вать. Наиболее перспективными мне пока кажутся тесселяция и CUDA - если программисты будут активнее работать в этих направлениях, мы получим более красивые игры, более быстрое выпол­нение тяжелых задач и, в конечном сче­те, более полное использование возмож­ностей GF100.

Пока же мы видим, что со своей новой видеокартой NVIDIA однозначно не про­валилась, но и не «выстрелила». Посмот­рим, что будет дальше.

 

 

 

ИСТОЧНИК  UP