Geforce gtx 780 ti тесты в играх. Видеокарты


  • Часть 2 — Практическое знакомство
  • Часть 3 — Результаты игровых тестов (производительность)

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референсная карта Nvidia.

Платa

  • GPU: Geforce Titan (GK110)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 875—1020 МГц (номинал — 875—1020 МГц)
  • Частота работы памяти (физическая (эффективная)): 1750 (7000) МГц (номинал — 1750 (7000) МГц)
  • Ширина шины обмена с памятью: 384 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 15/875—1020 МГц (номинал — 15/875—1020 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 2880
  • Число блоков текстурирования: 240 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 48
  • Размеры: 270×100×37 мм (карта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 264/86/70 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 780 Ti 3072 МБ 384-битной GDDR5 PCI-E

Карта имеет 3072 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах на лицевой стороне PCB.

Карта требует дополнительного питания в виде двух разъемов: 8- и 6-контактного.

О системе охлаждения.

Nvidia Geforce GTX 780 Ti 3072 МБ 384-битной GDDR5 PCI-E

Система охлаждения полностью повторяет эталонный кулер от GTX Titan. Кулер имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются и т. д. Мы уже не раз рассказывали о такой схеме современного охлаждения топовых ускорителей.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, дающую пониженный уровень шума. Должны сказать, что при максимальной нагрузке шум все же слегка ощущается, ведь максимальная частота вращения — выше 2200 оборотов в минуту.

Микросхемы памяти охлаждаются центральным радиатором (у кулера есть специальная пластина, прижимающаяся к микросхемам памяти и транзисторам силового блока).

Мы провели исследование температурного режима с помощью новой версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 84 градуса, что для такого мощного ускорителя более чем нормально.

Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 13.11beta8; Nvidia версии 331.70(для GTX 780 Ti) / 331/58 (для остальных Geforce)

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org .
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка .
  • RightMark3D 2.0 с кратким описанием: под Vista без SP1 , под Vista c SP1 .

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 780 Ti GTX 780 Ti )
  • Geforce GTX Titan со стандартными параметрами (далее GTX Titan )
  • Geforce GTX 780 со стандартными параметрами (далее GTX 780 )
  • Radeon R9 290X со стандартными параметрами в режиме «Uber Mode» (далее R9 290X )
  • Radeon HD 7990 со стандартными параметрами (далее HD 7990 )

Для анализа результатов новой видеокарты высшего класса Geforce GTX 780 Ti были выбраны именно эти решения по следующим причинам. Geforce GTX Titan является эксклюзивной моделью на базе того же чипа GK110, обладает большим объемом видеопамяти и продается намного дороже. Titan — прежде мощнейшее одночиповое решение компании Nvidia, и будет интересно посмотреть, насколько быстрее получилась новинка. Сравнение с Geforce GTX 780 будет интересно потому, что это менее дорогая видеокарта компании, основанная на таком же чипе, но имеющем на четверть меньше активных исполнительных блоков.

От конкурирующей компании AMD для нашего сравнения были выбраны две видеоплаты, основанные на разных графических процессорах и даже разном их количестве. Radeon R9 290X на время выхода новинки Nvidia является ее ближайшим конкурентом по цене, а заодно и самой производительной видеоплатой компании AMD. А Radeon HD 7990 имеет сразу два видеочипа Tahiti и не является конкурентом для GTX 780 Ti, но нам будет интересно посмотреть, как скорость такого мощного двухчипового решения соотносится с лучшим одночиповым в исполнении Nvidia.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

С простейшими тестами современные GPU справляются с легкостью, скорость мощных решений в них всегда упирается в различные ограничители, что особенно относится к Geforce. Эти тесты не способны показать возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них зачастую ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia давно перестали оптимизироваться для таких задач, что отлично показывают результаты сегодняшнего сравнения.

Посмотрите, все платы Geforce слабо отличаются по скорости друг от друга, разница между GTX 780 Ti и Titan составляет лишь 1—4% при гораздо большей теоретической. Вышедшая сегодня новая модель видеокарты в этом сравнении хоть и оказывается лучшей среди плат Nvidia, но явно уступает главному конкуренту в лице Radeon R9 290X, которая всегда оказывается заметно впереди. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нем больше зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя новые топовые платы Geforce на базе архитектуры Kepler в нем также показывают сильные результаты, что мы и видим по неплохим в целом цифрам новой Geforce GTX 780 Ti.

Самая мощная плата из семейства Geforce GTX 700 оказалась быстрее эксклюзивной GTX Titan на 5—6%, что также меньше, чем теоретическая разница, и может быть объяснено разве что упором в производительность блоков ROP. Своего главного конкурента новинка компании Nvidia в одном из тестов слегка обходит — в тесте Water, где важнее скорость текстурирования, я не математическая производительность, по которой у плат AMD есть некоторое преимущество. Поэтому во втором тесте результаты Geforce GTX 780 Ti немного ниже, чем у Radeon R9 290X. В среднем же в этих тестах явный паритет.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье « ».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler, так получилось и в этот раз.

В тесте «Frozen Glass» скорость больше зависит от математической производительности, и в случае всех плат Geforce всегда есть некая преграда, из-за которой платы Nvidia проигрывают почти вдвое почти лучшей одночиповой Radeon. Модель Geforce GTX 780 Ti оказывается лишь на 1% быстрее GTX Titan, что лишь подтверждает странный упор производительности для всех Geforce.

А вот во втором тесте «Parallax Mapping» новая видеокарта Geforce GTX 780 Ti показала производительность на 15% выше, чем у GTX Titan, что уже очень близко к теории. Что касается сравнения с конкурентом, то сопоставление новинки с соперничающей моделью Radeon HD R9 290X не самое радужное — плата AMD быстрее и в этом тесте — почти на треть. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение видеоплат производства компании Nvidia несколько улучшилось, ведь они традиционно справляются с текстурными выборками лучше, чем с математическими вычислениями. Но Radeon R9 290X все равно опережает сегодняшнюю новинку с хорошим запасом, особенно в тесте Frozen Glass, где разница остается неприличной. Новинка на 4—12% быстрее, чем GTX Titan, что более-менее соотносится с теорией. Что касается сравнения с R9 290X, то GTX 780 Ti близка к ней только в тесте Parallax Mapping, да и то разница превышает 20%.

Впрочем, это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики ».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты уже совсем не ограничены производительностью только текстурных выборок или филлрейтом, и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед как минимум в тесте сложного параллакс-маппинга, особенно после тщательной доводки драйверов Catalyst.

Топовая новинка компании Nvidia показывает в этих задачах очень хороший результат, опережая лучшую из предшественниц на базе того же чипа GK110 на 11%, что близко к теоретическим цифрам разницы в математической производительности. Что касается сравнения с самой мощной топовой видеокартой на базе чипа Hawaii от конкурента, то GTX 780 Ti отстает от нее лишь в тесте параллакс-маппинга. А вот в тесте Fur новая плата Radeon R9 290X всё же проиграла Geforce GTX 780 Ti, хотя и не так уж сильно. В общем, в этих тестах ситуация неоднозначна.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

Новая топовая плата Geforce GTX 780 Ti опережает эксклюзивную модель GTX Titan на 11—12%, обходя остальные решения Nvidia, что соответствует теории. Но, с учетом того, что в этом тесте даже платы AMD предыдущего поколения быстрее новинок серии Geforce GTX 780, рассматривать сравнение R9 290X и GTX 780 Ti нет смысла — модель компании AMD показывает слишком высокий результат, не говоря уже о двухчиповой карте предыдущего поколения, которая стала тут быстрейшей.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Ситуация похожа на ту, что мы видели на предыдущей диаграмме, но видеокарты Nvidia уступают своим соперникам от AMD даже еще чуть больше. Новинка Geforce GTX 780 Ti оказывается быстрее модели GTX Titan также до 11%, что близко к теоретической разнице по математической производительности. К сожалению, проигрыш прямому конкуренту в виде Radeon R9 290X весьма впечатляющий. Снова подтверждается то, что преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без включения SSAA, и в этот раз Geforce GTX 780 Ti опережает модель GTX Titan аж на 16—18%, что даже больше теоретической разницы в скорости ALU. Скорее всего, скорость тут зависит еще и от ПСП видеопамяти. Но так как видеоплаты Nvidia в этом тесте всегда справляются с работой хуже конкурирующих решений от AMD, то модель Geforce GTX 780 Ti в обновленном D3D10-варианте теста без суперсэмплинга снова показывает результат хуже, чем Radeon R9 290X, не говоря уже о двухчиповой HD 7990. Посмотрим, что изменит включение суперсэмплинга:

Всё снова примерно так же, как и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается еще более тяжелой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась лишь немного, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Мы снова видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce, и старшая топовая плата на чипе Hawaii обгоняет анонсированную сегодня Geforce GTX 780 Ti с огромным преимуществом. По сравнению с другими платами Nvidia, новинка показывает лучшую производительность, опережая модель GTX Titan на 10—11%, насколько примерно должна и по теории. Понятно, что GTX 780 отстала еще больше. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов обычно лишь примерно соответствуют разнице в частотах и количестве вычислительных блоков, на них влияет разная эффективность их использования в конкретных решениях, также важна и оптимизация драйверов. В случае теста Mineral, новая модель Geforce GTX 780 Ti всего лишь на 8% обгоняет GTX Titan, что явно ниже теоретической разницы по математической производительности между ними. Вероятно, сказывается какое-то ограничение, потому что разницей в характеристиках этого не объяснить.

Как мы уже знаем, архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Kepler калифорнийской компании удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, серьезно возросла. Это мы видим по результатам нашего первого математического теста, где лучшая видеокарта Geforce хотя всё еще и уступает плате на основе чипа Hawaii, но конкурент GTX 780 Ti опережает ее уже лишь на 9%. Впрочем, судя по ценам, видеокарта Nvidia должна быть впереди, так что есть еще над чем поработать.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

А вот во втором математическом тесте мы видим совсем другие результаты видеокарт относительно друг друга. Разница между GTX Titan и сегодняшней новинкой в этом тесте стала даже чуть больше теоретической — 19%. Это гораздо больше походит на истинную разницу в математической производительности.

К сожалению, даже при таком сильном результате, новый одночиповый топ Nvidia серии Geforce GTX 700 не может справиться со своим конкурентом от AMD, еще и имеющим меньшую цену. Geforce GTX 780 Ti не может ничего противопоставить свежей плате компании AMD, которая оказывается быстрее нее во втором математическом тесте на 12%. Радует лишь то, что GTX 780 Ti явно быстрее GTX 780 и Titan.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близко к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Есть некоторая разница между результатами видеокарт на чипах Nvidia и AMD, обусловленная отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее, даже несмотря на увеличение количества геометрических блоков в Hawaii.

Но разница между AMD и Nvidia уже не так велика, как это было раньше. У решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются быстрее. Сегодняшняя новинка Geforce GTX 780 Ti оказывается примерно равной по производительности более раннему решению в виде GTX Titan, что говорит о тестировании производительности именно геометрического конвейера. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD, и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и все выводы остаются прежними. Новая модель Geforce GTX 780 Ti всё так же показывает производительность на одном уровне с другими платами на базе чипа GK110. А конкурирующий Radeon R9 290X всё так же отстает от них, так что в выводах ничего не меняется.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — еще и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

К сожалению, но «Hyperlight» просто не работает на всех современных видеокартах компании AMD, включая и топовую Radeon R9 290X. В какой-то момент очередное обновление драйверов привело к тому, что данный тест просто не запускается на платах этой компании. И поэтому самый интересный геометрический тест нашего пакета, который предполагает большую нагрузку именно на геометрические шейдеры, ничего не может сказать о сравнении плат AMD и Nvidia.

Но мы хотя бы можем посмотреть, что изменилось в случае решений Nvidia. Относительные результаты решений в разных режимах примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

Скорость рендеринга в этом тесте ограничена в основном геометрической производительностью, но в случае сбалансированной загрузки геометрических шейдеров все результаты близки. Geforce GTX 780 Ti показала скорость на 6—8% выше уровня Titan, что говорит о том, что дело явно не только в геометрической производительности. Впрочем, цифры могут серьезно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

В этом тесте наиболее важным параметром является скорость обработки геометрии, с которой дела у Nvidia обстоят прекрасно, особенно у полностью разблокированного чипа GK110, на котором основана рассматриваемая модель Geforce GTX 780 Ti. Из-за большего количества геометрических блоков Geforce GTX 780 Ti превосходит плату GTX Titan на 14—19%, а последняя, в свою очередь, ощутимо быстрее младшей платы на базе чипа GK110 — GTX 780.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт, и пропускная способность памяти, что особенно заметно в легком режиме. Результаты видеокарт Nvidia зачастую ограничены чем-то странным, о чем говорят схожие результаты всех видеокарт, основанных на графическом процессоре GK110.

Самой быстрой среди одночиповых решений в сравнении ожидаемо стала топовая Radeon R9 290X, а представленная сегодня новинка Geforce GTX 780 Ti проигрывает ей во всех режимах, даже в тяжелом, где разница меньше всего. Новая топовая плата Nvidia превзошла по скорости GTX Titan в этом тесте на 10—13%, что близко к теории. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме серьезно изменилась — результаты решений компании AMD в тяжелых режимах ухудшились, а для Geforce — остались почти на тех же позициях. Теперь Radeon R9 290X показывает результат заметно выше скорости новинки Nvidia только в самом простом режиме, а в среднем и тяжелом анонсированная сегодня Geforce GTX 780 Ti ее опережает. Разница между GTX 780 Ti и GTX Titan составляет 9—12%, что соответствует теории.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. По каким-то причинам показатели всех плат Geforce на базе GK110 в легком режиме остаются сильно заниженными, и они чуть ли не вдвое хуже скорости двухчиповой Radeon HD 7990. Скорость же новой топовой платы Geforce GTX 780 Ti относительно своих собратьев в этом тесте неплоха, новый одночиповый топ на базе GK110 оказался быстрее GTX Titan на 8—10%. Рассмотрим второй вариант этого же теста:

Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в легких режимах. Результаты сегодняшней новинки в лице Geforce GTX 780 Ti от Nvidia оказались лишь на 5% лучше, чем у GTX Titan на базе того же чипа, что говорит о том, что основным лимитом производительности в этом тесте для видеокарт Nvidia является производительность блоков ROP, скорее всего.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. Вероятно, при анализе результатов новой видеокарты Geforce GTX 780 Ti в этом пакете мы сделаем какие-то новые полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Старшая топовая модель Geforce GTX 780 Ti, которая вышла сегодня, в этом тесте лишь на 2% быстрее бывшей недавно наиболее производительной видеокартой GTX Titan, что не слишком близко к теории, надо признать.

Естественно, что GTX 780 отстает от пары самых дорогих решений Nvidia по скорости текстурирования еще больше. Что касается сравнения платы Geforce GTX 780 Ti с решением конкурента Radeon R9 290X, то новинка Nvidia по текстурной скорости чуть быстрее платы, основанной на графическом процессоре Hawaii. Что было ожидаемо, исходя из теоретических показателей.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В данном случае измеряется не пиковая скорость блоков ROP, цифры из подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно пропускную способность, а не производительность ROP.

Поэтому результат анонсированной платы Nvidia в тесте производительности блоков ROP получился на 10% лучшим, по сравнению с GTX Titan, так как теоретическая разница по ПСП между ними есть. То же самое касается и опережения конкурента в лице Radeon R9 290X — на деле скорость именно блоков ROP у платы AMD выше, но из-за меньшей ПСП она проигрывает новинке Geforce GTX 780 Ti.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая, и текстурная производительность, а возможно и скорость ROP, так как в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 780 Ti опережает более дорогую плату Nvidia лишь на 5%, что не совсем соответствует теоретической разнице в скорости текстурирования и вычислительной производительности.

Если сравнивать новинку с решением конкурента, то в этом тесте GTX 780 Ti не может противостоять Radeon R9 290X, не говоря о двухчиповой HD 7990, так как GPU производства AMD являются более эффективными в этой конкретной задаче. Увы, но отставание GTX 780 от ближайшего по цене конкурента составляет 20%, что довольно много.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров и основными факторами влияния должна являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась весьма странная, обе видеокарты Radeon показывают частоту кадров около 130 FPS, а результаты трех Geforce также уперлись в предел, но уже на уровне около 95—100 FPS, как мы видели и ранее.

И всё же, новинка опередила дорогущую GTX Titan на 7%, как ни странно. Новая модель топового семейства от Nvidia показывает скорость на треть хуже, чем старшая плата конкурента — Radeon R9 290X. И всё это несмотря на то, что геометрическая производительность видеокарт Nvidia должна быть выше, чем у решений конкурента, так как они имеют большее количество соответствующих исполнительных блоков. Мы еще перепроверим геометрическую производительность в тестах DirectX 11.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация изменилась, и в этот раз явным лидером является двухчиповая Radeon HD 7990, которая идет у нас сегодня вне зачета. Новинка компании Nvidia смогла всего лишь на 1% превзойти плату GTX Titan на базе того же чипа GK110, что говорит об упоре именно в геометрическую производительность, по крайней мере для плат Nvidia.

Если сравнивать скорость новинки Geforce с единственным конкурентом от AMD, то новая плата весьма близка к своему сопернику — они обе показывают схожий результат в данной задаче. И это хороший результат скорее для Radeon, ведь он и стоит дешевле, да и раньше синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывали, что платы Nvidia значительно опережают конкурирующие модели компании AMD, а теперь всё не так очевидно.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Это не относится разве что к двухчиповой плате Radeon HD 7990, которая явно неэффективно отработала в этом случае. Однако если сравнивать анонсированную сегодня Geforce GTX 780 Ti с Radeon R9 290X, то последняя обходит плату Nvidia на 18%.

Вышедшая сегодня на рынок видеокарта GTX 780 Ti показала скорость даже чуть медленнее модели GTX Titan того же производителя и основанную на таком же чипе, что абсолютно не соответствует теории. Сегодняшняя новинка всё-таки превзошла GTX 780 на 11%, хотя должна бы победить с куда большим перевесом. Вероятно, сказалось какое-то ограничение GPU Boost, снизившей частоту GK110 в составе GTX 780 Ti во время выполнения последнего синтетического теста пакета.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia примерно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия (любопытно, что у видеоплаты на Hawaii она снова проявилась, хоть и небольшая). Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде пропускной способности памяти и производительности ROP.

В данном случае скорость видеокарт упирается в ПСП. Новая топовая плата компании Nvidia в этом тесте оказалась на 12% быстрее предшествующей модели GTX Titan. Если сравнивать новинку с платой AMD, то Geforce GTX 780 Ti и прямой конкурент Radeon R9 290X примерно равны, хотя плата Nvidia стоит несколько дороже.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В случае этого теста расклад сил между решениями разных компаний получился совершенно иной. У видеоплат Nvidia есть явное преимущество в подобных расчетных задачах, а видеокарты Radeon не очень хорошо справляются с ними. Поэтому было бы логично, если бы в этом тесте победила мощнейшая из плат Nvidia — представленная сегодня карта модели Geforce GTX 780 Ti, имеющая больше активных вычислительных блоков и работающая на высокой частоте.

Но нет, GTX 780 Ti в вычислительной задаче снова уступила пару процентов более дорогой GTX Titan. Скорее всего, в расчетных задачах частота графического процессора GK110 в случае игровой видеокарты опускается ниже уровня, устанавливаемого в случае «вычислительного» варианта — GTX Titan. Что же касается конкурента, то Radeon R9 290X остался далеко позади, почти вдвое уступив новинке Nvidia.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним интересным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость чаще всего упирается в ПСП или производительность ROP, и результат новой видеокарты Geforce GTX 780 Ti подтверждает это — он почти идентичен скорости GTX Titan в этом тесте. Все Geforce в этом подтесте далеко позади Radeon R9 290X, но уже не из-за ПСП, а из-за скорости блоков ROP.

Во втором подтесте с заметно более сложными попиксельными расчетами все несколько интереснее. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler, поэтому неудивительно, что все платы Nvidia снова проиграли новому решению на базе чипа Hawaii. Radeon R9 290X на базе нового графического процессора заметно быстрее в том числе и новинки Geforce GTX 780 Ti, которая, в свою очередь, обогнала GTX Titan на впечатляющие 18%, что примерно соответствует теории по скорости математических вычислений.

В тесте с тесселяцией результат новинки примерно такой же, что и в первом подтесте. Модель GTX 780 Ti показала почти одинаковую с GTX Titan скорость, проиграв прямому сопернику в лице Radeon R9 290X. Так получилось потому, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем не упирается в производительность блоков обработки геометрии, поэтому скорости обработки треугольников у плат компании AMD хватает для того, чтобы показать высокие результаты.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

А в этом примере применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений по этому тесту приносит и другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжелых условиях графические процессоры Nvidia всё же намного производительнее.

Анонсированная сегодня модель Geforce GTX 780 Ti показала аномально низкий результат, по сравнению с GTX Titan на таком же чипе GK110. И отставание в 15—20% при трех самых простых уровнях тесселяции ничем не объяснить, ведь GTX 780 Ti по всем теоретическим параметрам (кроме объема видеопамяти) быстрее Titan. Вероятно, мы видим результат программной ошибки в виде неоптимизированных драйверов. И только при самой сложной тесселяции новинка вырывается вперед, как и должна.

И сравнение с конкурентом в тяжелых условиях для новинки положительное, ведь у нее больше геометрических блоков, по сравнению с Hawaii. Поэтому GTX 780 Ti гораздо быстрее карты AMD нового поколения, но только в тяжелых условиях, когда скорость Radeon серьезно снижается, в то время как у новой платы Nvidia она остается достаточно высокой.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы протестировали решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, новая топовая видеокарта от компании AMD показывает достаточно высокий результат, стараясь конкурировать с Geforce, но до уровня GTX 780 Ti она не дотягивается даже в этом случае. А при увеличении геометрической работы, новинка Nvidia вырывается вперед еще дальше.

Видеокарты Nvidia в этом тесте весьма быстры, новая Geforce GTX 780 Ti оказалась на 5-10% производительнее более дорогой GTX Titan, как и должно быть по теории, в отличие от предыдущего теста. Конкуренту же для соперничества с картами Nvidia скорости всё еще не хватает, хотя в реальных играх нагрузка на геометрические блоки гораздо меньше, и там всё будет совсем иначе.

Выводы по синтетическим тестам

Результаты синтетических тестов видеокарты Geforce GTX 780 Ti, которая стала мощнейшей платой топовой серии компании Nvidia, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новая плата является одним из самых мощных решений на рынке, и она должна успешно конкурировать с другими топовыми платами, несмотря на довольно высокую цену.

Главное, что мы определили — новинка явно быстрее Geforce GTX Titan в большинстве тестов, и это при ощутимой разнице в цене в пользу GTX 780 Ti. Неудивительно, что для игр новая плата Nvidia становится одним из наиболее мощных предложений в самом верхнем ценовом диапазоне. За исключением некоторых задач, анонсированная сегодня модель Nvidia неплохо выступила и по сравнению с мощнейшим Radeon R9 290X. Наш набор синтетических тестов показал, что по производительности они будут соперничать друг с другом и в играх, тем более что решения Nvidia там традиционно выступают лучше, чем в «синтетике».

Новая модель Geforce GTX 780 Ti явно нацелена на тех энтузиастов, которые не готовы на компромиссы и планируют играть в современные и будущие игры при максимальных настройках в самых высоких разрешениях, и готовы заплатить за это немного больше денег, чем стоит конкурирующая Radeon R9 290X. Больше всего обрадуются те, кто уже хотел покупать Geforce GTX Titan для игр, а меньше всего — те, кто ее недавно купил. Ведь новая модель Nvidia стоит дешевле, но в играх будет даже производительнее. Давайте как раз и перейдем к оценке реальной производительности GTX 780 Ti в играх в следующей части статьи.

Выпустив в феврале 2013 года видеокарту GeForce GTX TITAN ($999) и дополнив её в мае месяце более доступной моделью GeForce GTX 780 ($649), компания NVIDIA вплоть до конца октября могла спокойно почивать на лаврах, собирая себе все «сливки» на рынке энтузиастов-оверклокеров и наиболее обеспеченных любителей игр. Сейчас уже никто не скажет, сколь долго ещё продолжалась бы эта, с точки зрения NVIDIA, идиллия, но именно анонсирование AMD Radeon R9 290X побудило компанию из Санта-Клары, во-первых, серьёзно снизить рекомендованные цены на GeForce GTX 780/GTX 770 и, во-вторых, выпустить наконец нового флагмана – видеокарту NVIDIA GeForce GTX 780 Ti .

Теперь можно смело забыть про TITAN, а фанатам NVIDIA срочно избавляться от своих GeForce GTX 780, поскольку новая Ti-версия не оставляет им ни единого шанса сразу по всем ключевым характеристикам. Лучше/быстрее/дешевле на архитектуре «Kepler» и 28-нм технологическом процессе NVIDIA уже точно ничего не выпустит, поэтому мы имеем все основания назвать GeForce GTX 780 Ti настоящим венцом архитектуры «Kepler», его апогеем и феерией. Впрочем, давайте обо всём по порядку.

1. Обзор видеокарты NVIDIA GeForce GTX 780 Ti

технические характеристики и рекомендованная стоимость

Технические характеристики видеокарты GeForce GTX 780 Ti приведены в таблице в сравнении с эталонными версиями GeForce GTX TITAN, GeForce GTX 780 и AMD Radeon R9 290X:



Как видно из таблицы характеристик, ключевое отличие новой видеокарты заключается в графическом процессоре. На GeForce GTX 780 Ti установлен полноценный GK110 архитектуры «Kepler», содержащий в себе все 15 потоковых мультипроцессоров (SMX), как и у профессиональных ускорителей Tesla K40, 2880 унифицированных шейдерных процессоров и 240 текстурных блоков. Это на 25% больше, чем у обычных GeForce GTX 780 и на 7,1% больше, чем у TITAN. Кроме того, слегка возросли частоты графического процессора, которые теперь составляют 876/928 МГц. А вот рост частоты видеопамяти куда более внушительный и составляет почти 1000 эффективных мегагерц (7000 МГц против 6008 МГц у TITAN или 780).



В дополнение GeForce GTX 780 Ti поддерживает новейшую технологию «Power Balancing», которая заключается в организации наиболее сбалансированного питания видеокарты за счёт автоматического распределения мощности разных его источников (внешний/PCI-E) и должна способствовать повышению оверклокерского потенциала. Позднее NVIDIA обещает внедрить данную технологию и в видеокарты GeForce GTX TITAN с GTX 780 (по всей видимости, с новыми ревизиями GPU). Ну и, наконец, уже известная нам с вами GPU Boost версии 2.0, по мнению NVIDIA, делает новую видеокарту уникальной с точки зрения достижения максимальных частот/производительности при высоких 3D-нагрузках.

Из программных обновлений отметим поддержку GeForce GTX 780 Ti новой технологии ShadowPlay. Используя возможности аппаратной поддержки графическими процессорами семейства «Kepler» кодировщика H.264 NVENC, данная технология позволяет осуществлять захват игрового видеоряда. При минимальном влиянии на производительность (менее 10% - по информации NVIDIA), ShadowPlay позволяет записывать ролики с частотой 60 кадров в секунду, но пока только в разрешении 1920х1080 (1080p). Вероятно, в будущем возможности видеозахвата будут расширены. Кроме ShadowPlay, выделим и новую программно-аппаратную технологию вертикальной синхронизации G-SYNC. Обоим нововведениям NVIDIA мы планируем уделить особое внимание в одной из будущих статей.

дизайн и особенности печатной платы

Из внешних отличий новой GeForce GTX 780 Ti от GTX 780 и GTX TITAN можно отметить только надпись на фронтальном кожухе системы охлаждения, более тёмный радиатор под стеклом, а также отсутствие микросхем памяти на обратной стороне печатной платы:




В верхней части кожуха кулера сохранена подсветка символов «GEFORCE GTX», которая наверняка порадует эстетов. Размеры видеокарты составляют стандартные для этой линейки 267х100х39 мм, а весит она 922 грамма.

GeForce GTX 780 Ti оснащена четырьмя видеовыходами: DVI-I и DVI-D (оба Dual-Link), HDMI версии 1.4a и DisplayPort версии 1.2:


C обратной стороны видеокарты виден открытый радиатор и винты крепления кожуха системы охлаждения:


В общем, внешне всё, как и у GeForce GTX 780 или GTX TITAN, включая разъёмы дополнительного питания и коннекторы для SLI-режимов:


Примечательно, что несмотря на возросшее число мультипроцессоров SMX, повысившиеся частоты графического процессора и видеопамяти, NVIDIA для новой GeForce GTX 780 Ti приводит тот же предельный уровень тепловыделения, как и у GTX 780 или GTX TITAN, равный 250 ватт. Вероятно, сделано это исходя из маркетинговых соображений, а может и новая ревизия графического процессора B1 оказалась действительно более экономичной?

Печатная плата GeForce GTX 780 Ti по дизайну и расположению элементов напоминает платы GeForce GTX TITAN/780:



Однако силовая часть явно имеет восемь фаз питания графического процессора на силовых транзисторах DrMOS вместо шести у GTX TITAN/780:


Вместе с тем, управляющий контроллер не изменился – это хорошо зарекомендовавший себя NCP4206 производства ON Semiconductor:


Кристалл графического процессора площадью 561 кв.мм. выпущен в Тайване на 34-й неделе 2013 года (середина августа) и, самое главное, относится к совершенно новой ревизии B1:


Маркировка – GK110-425-В1 (напомним, что у кристаллов TITAN маркировка GK-110-400-A1). Частоты графического процессора GeForce GTX 780 Ti в 3D-режиме равны 876/928 МГц при напряжении 1,175 В. При переходе в 2D-режим частота снижается до 324 МГц, а напряжение опускается до 0,875 В. Впрочем, как показывает практика, напряжения могут варьироваться у каждого экземпляра GK110. О характеристиках графического процессора мы рассказали вам в предыдущем подразделе статьи.

Добавим, что качество ASIC нашего GPU оказалось равно 77,8%:


Как и у GeForce GTX 780, на лицевой стороне печатной платы GeForce GTX 780 Ti распаяны 12 микросхем GDDR5-памяти в FCBGA-упаковке общим объёмом 3 Гбайт. Чипы выпущены компанией SK Hynix (у всех TITAN и GTX 780 были Samsung, заметим), и имеют маркировку H5GQ2H24AFR-R2C :


На данный момент это самые быстрые серийно-выпускаемые микросхемы Hynix, способные работать на эффективной частоте 7000 МГц при напряжении 1,5 В, на которых память GeForce GTX 780 Ti и функционирует. При 384-битной ширине шины обмена с памятью такая частота «выливается» в теоретическую пропускную способность 336 Гбайт/сек, что даже выше, чем у Radeon R9 290X с его 512-битной шиной и 5000 МГц памятью (320 Гбайт/сек).

Последняя доступная на момент подготовки статьи версия утилиты GPU-Z уже знакома с характеристиками GeForce GTX 780 Ti:



эффективность системы охлаждения

Система охлаждения GeForce GTX 780 Ti не претерпела ровным счётом никаких конструктивных изменений. Это всё тот же кулер TITAN/GTX 780 с испарительной камерой в основании и алюминиевым радиатором, металлической подложкой, а также радиальным вентилятором с адаптивной регулировкой скорости вращения:



Впрочем, одно изменение всё же есть, пусть оно и не конструктивное – радиатор у GeForce GTX 780 Ti никелирован, что хорошо видно, как сквозь прозрачное стекло сверху, так и через торец видеокарты, где нагретый воздух выбрасывается за пределы корпуса системного блока:


Судя по данным мониторинга, скорость вращения вентилятора может регулироваться в диапазоне от 1000 до 4250 об/мин.

Для проверки температурного режима работы видеокарт в качестве нагрузки мы использовали пять циклов теста весьма ресурсоёмкой игры Aliens vs. Predator (2010) при максимальном качестве графики в разрешении 2560х1440 пикселей с анизотропной фильтрацией уровня 16х и MSAA4x:



Для мониторинга температур и прочих параметров применялись программа MSI Afterburner версии 3.0.0 beta 16 и утилита GPU-Z версии 0.7.4. Все тесты проводились в закрытом корпусе системного блока, конфигурацию которого вы сможете увидеть в следующем разделе статьи, при комнатной температуре 25 градусов Цельсия.

Итак, посмотрим на возможности кулера GeForce GTX 780 Ti в автоматическом режиме работы:



Автоматический режим


В результате мы получили 86 градусов Цельсия пиковой температуры при максимальной скорости вентилятора 3090 об/мин. Напомним, что оснащённая точно такой же системой охлаждения GeForce GTX TITAN прогревалась до 87 градусов Цельсия при максимальной скорости вентилятора 3040 об/мин, а GeForce GTX 780 – до 82 градусов Цельсия при 2350 об/мин. Так что новая GeForce GTX 780 Ti стала и горячее, и, как следствие, шумнее GTX 780. Кроме этого, следует обратить внимание на тот факт, что частота работы графического процессора GeForce GTX 780 Ti во время тестирования постоянно равнялась 1020 МГц, вместо заявленных в boost-режиме 928 МГц. Добавим, что Power Limit при тестах был увеличен до 106%.

При выставленной вручную максимальной скорости вентилятора системы охлаждения GeForce GTX 780 Ti пиковая температура графического процессора снизилась до 71 градусов Цельсия:



Максимальная скорость


Правда, скорость 4250 об/мин, при которой кулер функционировал, – это слишком уж шумно для пусть и игровой, но всё же домашней видеокарты.

оверклокерский потенциал

Знаете что самое главное в GeForce GTX 780 Ti? Вовсе не полноценное по количеству потоковых мультипроцессоров и блоков ядро «Kepler», не высокочастотная память с рекордной пропускной способностью, и даже не никелированный радиатор системы охлаждения, а ревизия ядра – B1. Потому что если кто-то думает, что из графического процессора GK110-425-В1 в составе GeForce GTX 780 Ti уже выжаты «все соки», то это заблуждение, а с точки зрения оверклокинга заблуждение чуть ли не преступное.

Дело в том, что, как оказалось, даже имея крайне ограниченные возможности по повышению Power Limit (всего 106%), полное отсутствие возможности повышения напряжения и при использовании довольно посредственной с точки зрения эффективности штатной системы охлаждения, графический процессор смог стабильно функционировать при увеличении частоты сразу на 240 МГц! И это, заметьте, мы говорим о базовой частоте . Для тех же GeForce GTX TITAN это было бы рекордным значением «на воздухе», а у GTX 780 только отборные, наиболее удачные экземпляры с оригинальными кулерами способны на столь впечатляющий разгон. Здесь же сразу +240 МГц, да ещё и +760 МГц по видеопамяти:


Частоты видеокарты после разгона составили 1116/1168/7760 МГц:


При этом фактически, если верить данным мониторинга, во время высокой нагрузки частота графического процессора достигала 1260 (!) МГц, хотя чаще всего она находилась у отметки 1246 МГц:



К примеру, после разгона буквально нашпигованной различными фирменными технологиями MSI GeForce GTX 780 Lightning нам удалось достичь частоты 1227 МГц, и это ниже чем сегодняшний результат эталонного образца GeForce GTX 780 Ti. Остаётся только догадываться, какие номинальные частоты будут у серийных GeForce GTX 780 Ti с высокоэффективными оригинальными кулерами, и каков будет их разгон. К нашим результатам добавим, что для их достижения мы были вынуждены задать вручную скорость вращения вентилятора на отметке 85% или 3530 об/мин, что, конечно же, шумно, но в противном случае штатная система охлаждения попросту не справлялась с охлаждением большого и горячего процессора, и частоты снижались.

энергопотребление

Измерение энергопотребления системы с различными видеокартами осуществлялось с помощью многофункциональной панели Zalman ZM-MFC3 , которая показывает потребление системы «от розетки» в целом (без учёта монитора). Измерение было проведено в 2D-режиме, при обычной работе в Microsoft Word или интернет-«сёрфинге», а также в 3D-режиме. В последнем случае нагрузка создавалась с помощью четырёх последовательных циклов вступительной сцены уровня «Swamp» из игры Crysis 3 в разрешении 2560х1440 пикселей при максимальных настройках качества графики, но без использования сглаживания MSAA.

Для сравнения уровня энергопотребления NVIDIA GeForce GTX 780 Ti мы включили в тест системы с видеокартами NVIDIA GeForce GTX TITAN на номинальных частотах и при разгоне, эталонной NVIDIA GeForce GTX 690, EVGA GeForce GTX 780 Superclocked ACX на сниженных до уровня эталонной GeForce GTX 780 частотах, а также AMD Radeon HD 7990 и CrossFireX-связку из двух MSI Radeon R9 280X. Вот что получилось:



Энергопотребление NVIDIA GeForce GTX 780 Ti вполне ожидаемо выросло в сравнении с предшественниками, но нельзя сказать, что намного. К примеру, система с GeForce GTX 780 Ti потребляет всего на 29 ватт больше, чем с GTX 780 и на 10 ватт больше, чем с GTX TITAN. Более того, даже разогнанная GeForce GTX 780 Ti в составе достаточно быстрой конфигурации легко укладывается в 600 ватт, а такая мощность блоков питания, как мы знаем, не является на сегодняшний день чем-то из ряда вон выходящим. На этом фоне куда более впечатляющим выглядит уровень энергопотребления систем с двухпроцессорными видеокартами NVIDIA GeForce GTX 690 и, в особенности, AMD Radeon HD 7990. Ну а рекордсменом по уровню энергопотребления сегодня стал CrossFireX-тандем из двух MSI Radeon R9 280X, которому потребуется качественный блок питания мощностью не менее 750 ватт.

Дополним обзор видеокарты ссылкой на BIOS , и переходим к методике тестирования с тестовой конфигурацией.

2. Тестовая конфигурация, инструментарий и методика тестирования

Тестирование производительности видеокарт было проведено на системе следующей конфигурации:

Системная плата: Intel Siler DX79SR (Intel X79 Express, LGA 2011, BIOS 0590 от 17.07.2013);
Центральный процессор: Intel Core i7-3970X Extreme Edition 3,5/4,0 ГГц (Sandy Bridge-E, C2, 1,1 В, 6x256 Kбайт L2, 15 Мбайт L3);
Система охлаждения CPU: Phanteks PH-TC14PЕ (2xCorsair AF140 , 900 об/мин);
Термоинтерфейс: ARCTIC MX-4 ;
Видеокарты:

NVIDIA GeForce GTX TITAN 6 Гбайт 837/876/6008 МГц и 972/1011/7288 МГц;
NVIDIA GeForce GTX 690 2х2 Гбайт 915/1020/6008 МГц;
EVGA GeForce GTX 780 Superclocked ACX 3 Гбайт (03G-P4-2784-KR) 863/916/6008 МГц;
AMD Radeon HD 7990 2x3 Гбайт 1050/6000 МГц;
CrossFireX MSI Radeon R9 280X Gaming 2x3 Гбайт 1050/6000 МГц;

Оперативная память: DDR3 4x8 Гбайт G.SKILL TridentX F3-2133C9Q-32GTX (2133 МГц, 9-11-11-31, 1,6 В);
Системный диск: SSD 256 Гбайт Crucial m4 (SATA-III, CT256M4SSD2, BIOS v0009);
Диск для программ и игр: Western Digital VelociRaptor (SATA-II, 300 Гбайт, 10000 об/мин, 16 Мбайт, NCQ) в коробке Scythe Quiet Drive 3,5";
Архивный диск: Samsung Ecogreen F4 HD204UI (SATA-II, 2 Тбайт, 5400 об/мин, 32 Мбайт, NCQ);
Корпус: Antec Twelve Hundred (передняя стенка – три Noiseblocker NB-Multiframe S-Series MF12-S2 на 1020 об/мин; задняя – два Noiseblocker NB-BlackSilentPRO PL-1 на 1020 об/мин; верхняя – штатный 200-мм вентилятор на 400 об/мин);
Панель управления и мониторинга: Zalman ZM-MFC3 ;
Блок питания: Corsair AX1200i (1200 Вт), 120-мм вентилятор;
Монитор: 27" Samsung S27A850D (DVI-I, 2560х1440, 60 Гц).

Разумеется, в первую очередь мы сравним новинку с самой дорогой однопроцессорной видеокартой NVIDIA – GeForce GTX TITAN, которая была протестирована на номинальных частотах и при разгоне:




Ещё более грозным соперником GeForce GTX 780 Ti является двухпроцессорная GeForce GTX 690, пусть и вышедшая более полутора лет назад, но по прежнему являющаяся одной из самых быстрых видеокарт современности. И раз уж мы включили в тестирование двухпроцессорную видеокарту NVIDIA, то и AMD нельзя обойти стороной – её сегодня представляет AMD Radeon HD 7990:




Заметим, что если частоты GeForce GTX 690 номинальные, то у Radeon HD 7990 они слегка подняты (+50 МГц по ядру). Сделано это не с какой-то корыстной целью, а чтобы сравнить в следующей статье эту видеокарту с производительностью парой новых MSI Radeon R9 280X Gaming в CrossFireX-режиме, частота графического процессора которых составляет как раз 1050 МГц. Надеемся, вы простите нас за эту вольность в сегодняшней статье.

Для сравнения GeForce GTX 780 Ti с обычной GeForce GTX 780 в тесты включена видеокарта EVGA GeForce GTX 780 Superclocked ACX, частоты графического процессора которой были приведены к эталонным для GeForce GTX 780. В свою очередь, CrossFireX-связка из двух MSI Radeon R9 280X Gaming функционировала на частотах 1050/6000 МГц:




Вот такое, довольно масштабное сравнение у нас сегодня планируется. К сожалению, новых AMD Radeon R9 290X/R9 290 в данном тестировании не будет, поскольку компания так и не прислала эти видеокарты на тесты. Все вопросы и гневные отзывы по этому поводу просьба направлять напрямую в адрес AMD.

Как обычно, для снижения зависимости производительности видеокарт от скорости платформы, 32-нм шестиядерный процессор при множителе 48, опорной частоте 100 МГц и активированной функции Load-Line Calibration был разогнан до 4,8 ГГц при повышении напряжения в BIOS материнской платы до 1,38 В:



Технология Hyper-Threading активирована. При этом 32 Гбайт оперативной памяти функционировали на частоте 2,133 ГГц с таймингами 9-11-11-20_CR1 при напряжении 1,6125 В.

Тестирование, начатое 2 ноября 2013 года, было проведено под управлением операционной системы Microsoft Windows 7 Ultimate x64 SP1 со всеми критическими обновлениями на указанную дату и с установкой следующих драйверов:

чипсет материнской платы Intel Chipset Drivers – 9.4.4.1006 WHQL от 21.09.2013 ;
библиотеки DirectX End-User Runtimes, дата выпуска – 30 ноября 2010 года ;
драйверы видеокарт на графических процессорах NVIDIA – GeForce 331.70 Beta от 02.11.2013 для GTX 780 Ti и GeForce 331.65 WHQL от 23.10.2013 для всех остальных видеокарт NVIDIA;
драйверы видеокарт на графических процессорах AMD – AMD Catalyst 13.11 BETA8 (13.250.18.0) от 29.10.2013;

Производительность видеокарт была проверена в двух разрешениях: 1920х1080 и 2560х1440 пикселей. Для тестов использовались два режима качества графики: «Quality + AF16x» – качество текстур в драйверах по-умолчанию с включением анизотропной фильтрации уровня 16х, и «Quality + AF16x + MSAA 4х(8х)» с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания степени 4x или 8x, в случаях, когда среднее число кадров в секунду оставалось достаточно высоким для комфортной игры. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. Если же данные настройки в играх отсутствовали, то параметры изменялись в панелях управления драйверов Catalyst и GeForce. Там же была принудительно отключена вертикальная синхронизация. Кроме указанного, никаких дополнительных изменений в настройки драйверов не вносилось.

Видеокарты были протестированы в двух графических тестах и четырнадцати играх, обновленных до последний версий на дату начала подготовки материала. Из новинок в нашем тестовом списке появилась Batman: Arkham Origins:

3DMark (2013) (DirectX 9/11) – версия 1.0, тестирование в сценах «Cloud Gate», «Fire Strike» и «Fire Strike Extreme»;
Unigine Valley Bench (DirectX 11) – версия 1.0, максимальные настройки качества, AF16x и(или) MSAA 4x, разрешение 1920х1080;
(DirectX 11) – версия 1.1.0, встроенный тест (битва при Sekigahara) на максимальных настройках качества графики и использовании в одном из режимов MSAA 8x;
Battlefield 3 (DirectX 11) – версия 1.4, все настройки качества графики на «Ultra», двойной последовательный проход заскриптованной сцены из начала миссии «На охоту» продолжительностью 110 секунд;
Sniper Elite V2 Benchmark (DirectX 11) – версия 1.05, использовался Adrenaline Sniper Elite V2 Benchmark Tool v1.0.0.2 BETA максимальные настройки качества графики («Ultra»), Advanced Shadows: HIGH, Ambient Occlusion: ON, Stereo 3D: OFF, Supersampling: OFF, двойной последовательный прогон теста;
Sleeping Dogs (DirectX 11) – версия 1.5, использовался Adrenaline Action Benchmark Tool v1.0.2.1 , максимальные настройки качества графики по всем пунктам, Hi-Res Textures pack установлен, FPS Limiter и V-Sync отключены, двойной последовательный прогон теста с суммарным сглаживанием на уровне «Normal» и на уровне «Extreme»;
Hitman: Absolution (DirectX 11) – версия 1.0.447.0, встроенный тест при настройках качества графики на уровне «Ultra», тесселяция, FXAA и глобальное освещение включены.
Crysis 3 (DirectX 11) – версия 1.2.0.1000, все настройки качества графики на максимум, степень размытости – средняя, блики включены, режимы с FXAA и с MSAA4x сглаживанием, двойной последовательный проход заскриптованной сцены из начала миссии «Swamp» продолжительностью 110 секунд;
Tomb Raider (2013) (DirectX 11) – версия 1.1.743.0, использовался Adrenaline Action Benchmark Tool, настройки качества на уровне «Ultra», V-Synс отключён, режимы с FXAA и с 2xSSAA сглаживанием, технология TressFX активирована, двойной последовательный проход встроенного в игру теста;
BioShock Infinite (DirectX 11) – версия 1.1.21.65455, использовался Adrenaline Action Benchmark Tool с настройками качества «Ultra» и «Ultra+DOF», двойной прогон встроенного в игру теста;
Metro: Last Light (DirectX 11) – версия 1.0.0.15, использовался встроенный в игру тест, настройки качества графики и тесселяции на уровне «Very High», технология Advanced PhysX включена, тесты с- и без SSAA-сглаживания, двойной последовательный проход сцены «D6».
GRID 2 (DirectX 11) – версия 1.0.85.8679, использовался встроенный в игру тест, настройки качества графики на максимальный уровень по всем позициям, тесты с- и без MSAA8x сглаживания, восемь машин на трассе «Чикаго»;
Company of Heroes 2 beta (DirectX 11) – версия 3.0.0.10894, двойной последовательный прогон встроенного в игру теста при максимальных настройках качества графики и физических эффектов;
Total War: Rome II (DirectX 11) – версия 1.0.0.4, настройки качества на уровне «Extreme», V-Synс отключён, SSAA сглаживание активировано, двойной последовательный проход встроенного в игру теста;
ArmA III (DirectX 11) – версия 1.04.111745, использовался тест ArmA3Mark , настройки качества на уровне «Ultra», V-Synс отключён, двойной последовательный проход теста;
Batman: Arkham Origins (DirectX 11) – версия 1.0.4, настройки качества на уровне «Ultra», V-Synс отключён, все эффекты активированы, все функции «DX11 Enhanced» задействованы, Hardware Accelerated PhysX = High, двойной последовательный проход встроенного в игру теста.

Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1%. Если отклонения прогонов тестов превышали 1%, то тестирование повторялось ещё, как минимум, один раз, чтобы получить достоверный результат.

3. Результаты тестов производительности

На диаграммах видеокарты на графических процессорах AMD поколения выделены традиционным красным цветом, на графических процессорах NVIDIA – зелёным, а новая GeForce GTX 780 Ti отмечена тёмно-бирюзовым цветом. Давайте посмотрим, что получилось и проанализируем результаты.

3DMark (2013)


На своих номинальных частотах GeForce GTX 780 Ti легко опережает не только свою предшественницу GeForce GTX 780, но и более дорогую GeForce GTX TITAN во всех без исключения тестовых сценах 3DMark (2013). Двухпроцессорная GeForce GTX 690 немного впереди, но её результат GeForce GTX 780 Ti легко перекрывает в разгоне. Лидерами данного тестирования являются двухпроцессорная AMD Radeon HD 7990 и CrossFireX-связка из двух новых MSI Radeon R9 280X.

Unigine Valley Bench

Совсем по другому складывается ситуация в сцене Unigine Valley:



«Красные» выглядят здесь уже не столь уверенно, как в 3DMark, хотя и одерживают победу в режиме с использованием сглаживания (AMD зачастую успешнее NVIDIA справлялась с методиками улучшения качества изображения). Однако больше всего здесь впечатляет отрыв GeForce GTX 780 Ti от GTX 780, составляющий 16% в лёгком графическом режиме и 11% с MSAA8x. Кроме того, GTX 780 Ti оставляет позади и GTX TITAN, а вот двухпроцессорная мощь GeForce GTX 690 «по зубам» новинке лишь при существенном повышении частот. Отменную видеокарту выпустила NVIDIA полтора года назад, неправда ли?

Total War: SHOGUN 2 – Fall of the Samurai


Первый же игровой тест подтвердил ранее полученные результаты в полусинтетических бенчмарках. В номинальном режиме работы GeForce GTX 780 Ti на 12-14% быстрее GeForce GTX 780, и на 3-4% опережает GeForce GTX TITAN. Форсирование частот видеокарты при разгоне позволяет ей ускориться сразу на 14-19% и вплотную приблизиться к GeForce GTX 690, которая крайне эффективна в данной игре. Того же самого мы, к сожалению, не можем сказать про AMD Radeon HD 7990, удивительно уступившей даже паре MSI Radeon R9 280X в CrossFireX-режиме. Последняя связка, кстати, является лидером в Total War: SHOGUN 2 – Fall of the Samurai.

Battlefield 3

Battlefield 3 не является серьёзной нагрузкой современным топовым видеокартам, но и её результаты позволяют сравнить производительность видеокарт:


Здесь GeForce GTX 780 Ti выглядит ещё убедительнее как на фоне GeForce GTX 780 (+16~19%), так и на уровне GeForce GTX TITAN (+7~10%). Масштабируемость производительности новинки при разгоне попросту превосходная – прирост составил от 12 до 19% в зависимости от режима качества. Тем не менее, даже несмотря на впечатляющий разгон, немного впереди остались обе двухпроцессорные видеокарты и CrossFireX-тандем, за исключением качественных режимов с использованием сглаживания.

Sniper Elite V2 Benchmark

Не менее уверенно GeForce GTX 780 Ti побеждает своих сестёр и в тесте Sniper Elite V2:


GeForce GTX 780 отстаёт от неё на 18-20%, а GeForce GTX TITAN грустно уступает 7-10%. Повышение частот приносит GeForce GTX 780 Ti дополнительные 17-20% и это позволяет новинке выйти на один уровень производительности с двухпроцессорной GeForce GTX 690. Разумеется, последняя тоже разгоняется. Конкуренты из AMD не дремлют, демонстрируя в данной игре весьма высокий уровень производительности.

Sleeping Dogs

Результаты Sleeping Dogs, как и Battlefield 3, лучше оценивать по режимам с использованием сглаживания или хотя бы в разрешении 2560х1440 пикселей:


Видеокарты на графических процессорах AMD здесь традиционно сильны, но это не помешало героине сегодняшней статьи продемонстрировать всю свою мощь. Так, GeForce GTX 780 отстаёт от неё на величину до 21%, а GeForce GTX TITAN – до 6%. Результаты двухпроцессорной GeForce GTX 690 новинке не удаётся побить даже при впечатляющем разгоне графического процессора и видеопамяти.

Hitman: Absolution

В игре Hitman: Absolution позиции видеокарт AMD также довольно сильны, поэтому продукты NVIDIA ведут борьбу только друг с другом:


Видимо, из-за высокой процессорозависимости данной игры в режимах без использования сглаживания и не очень подходящего для NVIDIA движка, результаты GeForce GTX 780 Ti выглядят не столь впечатляющими на фоне GeForce GTX 780 и GeForce GTX TITAN. Так, например, первую видеокарту удаётся опередить максимум на 10%, а вторую всего на 6%. GeForce GTX 690 является самой быстрой из NVIDIA, но в отличие от предыдущих тестов, её результат GeForce GTX 780 легко перекрывает на повышенных частотах.

Crysis 3

Скоро будет уже год, как вышла Crysis 3, но данная игра по-прежнему является одной из наиболее сложных задач для современных видеокарт, включая самые дорогие:


Поэтому здесь есть где «развернуться» новой GeForce GTX 780 Ti. Резко подешевевшая в последние недели GeForce GTX 780 отстаёт от свежеиспечённого флагмана на 13-15%, а прежде грозный и доступный лишь весьма обеспеченным единицам GeForce GTX TITAN медленнее на 3-7%. Только владельцы двухпроцессорной GeForce GTX 690 могут спать спокойно – их видеокарта давно и надёжно является самой быстрой на графических процессорах NVIDIA. К слову, даже впечатляющий разгон GeForce GTX 780 Ti помог ей опередить номинальную GeForce GTX 690 только в одном тестовом режиме Crysis 3 из трёх. Нельзя не отметить и уверенное выступление Radeon HD 7990, а об эффективности работы CrossFireX на паре MSI Radeon R9 280X мы поговорим в следующей статье.

Tomb Raider (2013)

Иначе как блестящим выступление GeForce GTX 780 Ti в Tomb Raider не назовёшь:


Обычная GeForce GTX 780 отстаёт от GeForce GTX 780 Ti сразу на 19-22%, GeForce GTX TITAN – на 8-10%, и даже двухпроцессорная GeForce GTX 690 трепещет перед разогнанной GTX 780 Ti, правда только на номинальных частотах. А вот кто точно не трепещет перед новинкой, так это видеокарты AMD: Radeon HD 7990 быстрее GeForce GTX 780 Ti на 20 и более процентов, да и CrossFireX выглядит ничуть не хуже.

BioShock Infinite

Низкое минимальное значение кадров в секунду типично для всех видеокарт сегодняшнего тестирования в BioShock Infinite:


Что касается результатов по среднему FPS, то картина вполне типичная для сегодняшнего тестирования. В номинальном режиме работы GeForce GTX 780 Ti опережает GeForce GTX 780 на 15-18%, быстрее GeForce GTX TITAN на 7-9% и медленнее двухпроцессорной GeForce GTX 690 на 13-18%. Разгон GeForce GTX 780 Ti позволяет ей вплотную подобраться к GeForce GTX 690, но всё же не опередить её. AMD Radeon HD 7990 держится молодцом, практически на уровне GeForce GTX 690, а вот к CrossFireX-связке есть вопросы, так как следуя логике, проигрывать Radeon HD 7990 в BioShock Infinite она не должна.

Metro: Last Light

Результаты тестирования приведены при включённой технологии «Advanced PhysX»:


По всей видимости, эффективность работы мультипроцессорных технологий в игре Metro: Last Light по-прежнему оставляет желать лучшего, так как и результаты GeForce GTX 690 выглядят не столь выразительно, как во всех предыдущих играх, и Radeon HD 7990 с CrossFireX-связкой из пары MSI Radeon R9 280X ничем не впечатлили. В противоборстве однопроцессорных видеокарт безапелляционную победу одерживает GeForce GTX 780 Ti, опережая GeForce GTX 780 на 17-23%, GeForce GTX TITAN на 8-14%, и ещё больше впечатляя своей производительностью при разгоне.

GRID 2

Не менее уверенно расправляется GeForce GTX 780 Ti со своими конкурентами и в игре GRID 2:


Так GeForce GTX 780 остаётся позади на 15-16%, «Титан» медленнее на 6-10%, и даже «крепкий орешек» GeForce GTX 690 оказался по зубам разогнанной GeForce GTX 780 Ti. При этом нельзя сказать того же самого про Radeon HD 7990 – результаты этой видеокарты в GRID 2 недостижимы для всех остальных участников тестирования, включая успешно разогнанную GeForce GTX 780 Ti.

Company of Heroes 2

Не менее уверенно выступают Radeon в игре Company of Heroes 2:


Правда, здесь есть одно важное «но». Дело в том, что для получения столь высоких FPS для Company of Heroes 2 в драйверах Catalyst нам пришлось активировать режим «AFR», который хоть и повысил производительность Radeon HD 7990 и CrossFireX-связки, но привёл к перманентному мерцанию текстур во время всего теста. Так что эту победу AMD можно назвать «Пирровой». Что касается результатов GeForce GTX 780 Ti на фоне оставшихся участников тестирования, то здесь всё привычно здорово: +17-18% над GeForce GTX 780, +4-5% над GeForce GTX TITAN и небольшой проигрыш GeForce GTX 690, легко компенсируемый разгоном графического процессора и видеопамяти GeForce GTX 780 Ti.

Total War: Rome II


Игра Total War: Rome II создавалась при поддержке AMD, поэтому высокие результаты видеокарт на её графических процессорах нас не удивляют. В свою очередь, новая GeForce GTX 780 Ti легко разгромила GeForce GTX 780 (+15-21%), и немного огорчила владельцев тысячедолларовых GeForce GTX TITAN, опередив эту видеокарту на 6-8% в разрешении 1920х1080 пикселей и отстав на 3-5% в разрешении 2560х1440 пикселей. Судя по этим результатам, Total War: Rome II стала единственной игрой тестирования, где наблюдалась нехватка 3 Гбайт видеопамяти GeForce GTX 780 Ti. Ну а двухпроцессорную GeForce GTX 690 заставить работать на полную мощность в Total War: Rome II не удалось.

ArmA III

Производительность видеокарт в игре ArmA III оказалась ограничена скоростью платформы, но по наиболее ресурсоёмкому режиму всё же можно сделать какие-то выводы:


GeForce GTX 780 Ti – лидер теста даже в номинальном режиме работы. Только двухпроцессорная Radeon HD 7990 смогла превзойти показанный новинкой результат, но и то всего на 1 кадр в секунду.

Batman: Arkham Origins

Batman: Arkham Origins мы тестируем впервые, поэтому приведём полностью использованные во время теста настройки графики:



Как видите, строка Hardware Accelerated PhysX активирована на уровень «High», который не поддерживается видеокартами на графических процессорах AMD, поэтому их на диаграмме нет. Для справки добавим, что в режиме Hardware Accelerated PhysX = Normal, разрешении 2560х1440 пикселей и с использованием сглаживания MSAA8x видеокарта Radeon HD 7990 набирает 76 средних и 25 минимальных кадров в секунду.

Результаты видеокарт NVIDIA приведены ниже:


По всей видимости, технология SLI в игре Batman: Arkham Origins требует оптимизации, поэтому результаты GeForce GTX 690 не столь убедительны, как в прежних тестах и едва выше номинальной GeForce GTX 780 Ti. Последняя, в свою очередь, быстрее GeForce GTX 780 на 11-15% и GeForce GTX TITAN на 5-9%. В очередной раз отметим прекрасную масштабируемость GeForce GTX 780 Ti при разгоне – повышение частот видеокарты с 876/928/7000 МГц до 1116/1168/7760 МГц приводит к увеличению производительности в Batman: Arkham Origins на 17-19%.

Традиционно дополним диаграммы итоговой и переходим к сводным диаграммам.

4. Сводные диаграммы

В первую очередь оценим, насколько новая GeForce GTX 780 Ti опережает теперь уже старую GeForce GTX 780. Результаты приведены на номинальных частотах обеих видеокарт, а за точку отсчёта приняты показатели GeForce GTX 780:



Отметим дружный прирост производительности, за исключением игр и режимов с высокой зависимостью от скорости платформы. Наиболее ярко превосходство GeForce GTX 780 Ti проявляется в Metro: Last Light, Tomb Raider, Total War: Rome II и Sniper Elite V2, а в среднем по всем тестам составляет 13,4-15,2% в разрешении 1920х1080 пикселей и 15,1-16,5% в разрешении 2560х1440 пикселей. При этом напомним, что исходя из недавно скорректированных на GeForce GTX 780 цен, стоимость GTX 780 Ti ($699) на 200 долларов США или 40% выше рекомендованной цены GeForce GTX 780 ($499).

Следующая пара сводных диаграмм расскажет нам, какова разница между GeForce GTX 780 Ti и GeForce GTX TITAN на номинальных частотах:



За исключением результатов в разрешении 2560х1440 пикселей в игре Total War: Rome II, новинка везде опередила свою более дорогую сестру и в среднем преимущество GeForce GTX 780 Ti составляет 5,9-7,1% в 1920х1080 и 5,8-6,7% в разрешении 2560х1440. Очевидно, что при разнице 300 долларов США в пользу GeForce GTX 780 Ti и без того короткая эра GeForce GTX TITAN близится к завершению для игроков.

В отличие от GeForce GTX TITAN, старая двухпроцессорная GeForce GTX 690 ещё имеет право на рыночную жизнь, поскольку в сумме пока ещё быстрее GeForce GTX 780 Ti:



Только в игре Total War: Rome II технология SLI оказалась неработоспособна, но этот казус наверняка вскоре будет исправлен новыми драйверами GeForce и обновлениями самой игры.

Не быстрее GeForce GTX 780 Ti и двухпроцессорной AMD Radeon HD 7990:



Исключение составляет Metro: Last Light, где и CrossFireX недостаточно эффективна, и активированная «Advanced PhysX» играет не на руку видеокартам на графических процессорах AMD. В среднем во всем тестам, не принимая в расчёт мерцающую Company of Heroes 2, GeForce GTX 780 Ti медленнее Radeon HD 7990 на 8,9-11,7% в разрешении 1920х1080 пикселей и на 12,1-13,4% в разрешении 2560х1440 пикселей.

Отдельно хотелось бы отметить прекрасную масштабируемость производительности GeForce GTX 780 Ti при разгоне, на что мы обращали внимание при анализе результатов. Напомним, что эталонную видеокарту удалось разогнать с 876/7000 МГц до 1116/7760 МГц (+27,4/10,9%), и вот к каким приростам производительности привёл такой разгон:



Максимальный эффект от разгона был достигнут в ресурсоёмких режимах игр Hitman: Absolution и Crysis 3, а в целом по всем игровым тестам он составил +12,4~15,0% в режимах без сглаживания и +15,2~17,5% при его активации. Добавим, что с таким разгоном GeForce GTX 780 Ti не страшны ни NVIDIA GeForce GTX 690, ни AMD Radeon HD 7990 (на своих номинальных частотах, разумеется).

5. Тестирование в CUDA и OpenCL приложениях

Сегодня, кроме традиционных тестов в графических приложениях и играх, мы дополнительно провели изучение эффективности работы новой ревизии GK110 и GeForce GTX 780 Ti в расчётных программах и программах кодирования, использующие алгоритмы CUDA и OpenCL. Разумеется, в данном тестировании принимают участие только видеокарты на графических процессорах NVIDIA.

Первым на очереди вновь стал тест SmoothVideo Project (SVP) – SVPMark 3.0.3a. За результат мы приняли число баллов, полученных в синтетическом тесте GPU:



Как видим, разница в производительности между видеокартами мизерна, а номинально лидирует GeForce GTX 780.

Далее мы измеряли скорость кодирования HD-видео с помощью Freemake Video Converter версии 4.1.0. Для кодирования было взято FullHD-видео размером 1,77 Гбайт (короткометражный мультфильм компании Disney «Кот в сапогах: Три Чертёнка», которое мы конвертировали в формат для iPad 3. На выходе получался файл размером около 441 Мбайт. Чем меньше время, указанное на диаграмме в секундах, – тем лучше результат:



Двухпроцессорная GeForce GTX 690 и здесь быстрее всех, обработав видео всего за 79 секунд. Однако, второе место заняла как раз GeForce GTX 780 Ti в разгоне, а в номинальном режиме работы её производительность точно такая же, как и у разогнанной GeForce GTX TITAN. Медленнее всех, как и следовало ожидать, с задачей справилась GeForce GTX 780. К слову, шестиядерный процессор Intel Core i7-3970X Extreme Edition на частоте 4,8 ГГц справляется с этой задачей только за 144 секунды, так что толк от CUDA здесь, определённо, есть.

Ещё одним тестом данного раздела стал DirectCompute Benchmark версии 0.45b. На диаграммах мы приводим результаты DirectCompute и OpenCL:



В номинальном режиме работы GeForce GTX 780 Ti ничего особенного в DirectCompute Benchmark не демонстрирует, зато после разгона, благодаря прекрасной масштабируемости, лидирует в тесте DirectCompute, опережая разогнанную GeForce GTX TITAN, и уверенно занимает второе место в тесте OpenCL, где нет равных двухпроцессорной GeForce GTX 690.

Следующий на очереди – тест LuxMark :



В отличие от трёх предыдущих тестов, двухпроцессорная GeForce GTX 690 выглядит в Luxmark совсем не уверенно, хотя этот тест всецело поддерживает такие видеокарты. Очевидно, что ядро GK104, на котором основана GeForce GTX 690, по вычислительной мощи не идёт ни в какое сравнение с GK110. Все GeForce 7-й серии оказались быстрее GeForce GTX 690, а лучшие результаты демонстрирует героиня сегодняшнего тестирования – GeForce GTX 780 Ti.

Последним тестом Compute Unified Device Architecture (CUDA) стала программа рендеринга, основанная на технологии Arion 2 , и использующая алгоритмы, расчёты по которым значительно ускоряются графическими процессорами NVIDIA. В тестировании мы использовали два метода рендеринга: аппаратный, когда задействованы только ресурсы видеокарты, и гибридный, когда используется и видеокарта, и центральный процессор. Посмотрим на результаты:



Результаты в обоих режимах работы теста имеют одну и ту же закономерность: GeForce GTX 780 Ti в номинальном режиме столь же быстра, как и двухпроцессорная GeForce GTX 690 и разогнанная GeForce GTX TITAN. Если разогнать саму GeForce GTX 780 Ti, то конкурентов у неё в этом тесте и вовсе нет. И вновь добавим, что в режиме рендеринга «Software» шестиядерный процессор Intel Core i7-3970X Extreme Edition на частоте 4,8 ГГц в тесте Arion набирает лишь 832 балла. То есть разогнанная GeForce GTX 780 Ti быстрее такого процессора в четыре раза.

Заключение

NVIDIA GeForce GTX 780 Ti без оговорок и лирических отступлений является самой быстрой однопроцессорной 3D-видеокартой. По производительности её преимущество над обычной GeForce GTX 780 составляет 13~17%, а над GeForce GTX TITAN – 6~7%. Конкурировать с ней по производительности сегодня способны только двухпроцессорные видеокарты NVIDIA GeForce GTX 690 и AMD Radeon HD 7990, но и они пасуют при разгоне. Логично, что при этом новинка получилась не только более горячей, но и более шумной, что, впрочем, совсем скоро легко решится появлением серийных моделей с оригинальными и высокоэффективными системами охлаждения. В то же время, уровень энергопотребления возрос незначительно, всё же ±20 ватт в этом классе не могут и не должны приниматься во внимание. Зато новая ревизия B1 графического процессора GK110 впечатлила нас сегодня очень высоким уровнем оверклокерского потенциала, а сама видеокарта – превосходной масштабируемостью производительности от разгона. Рекомендованная стоимость GeForce GTX 780 Ti заметно выше цены GeForce GTX 780 (с учётом недавнего снижения), но ниже, чем стоит GeForce GTX TITAN, поэтому среди этой троицы видеокарт, на наш взгляд, выбор очевиден. Не уверены насчёт TITAN, но среди GeForce GTX 780 есть все основания ожидать графических процессоров ревизии B1, а значит и ещё более привлекательных для оверклокеров продуктов. Время покажет.

Благодарим российское представительство компании NVIDIA
и персонально Ирину Шеховцову
за предоставленную на тестирование видеокарту
.


Методика тестирования

Конфигурация тестовых стендов
CPU Intel Core i7-3960X @ 4,6 ГГц (100x46) Intel Core i7-3970X @ 4,6 ГГц (100x46)
Материнская плата ASUS P9X79 Pro
Оперативная память DDR3 Kingston HyperX 4x2 Гбайт @ 1600 МГц, 9-9-9
ПЗУ Intel SSD 520 240 Гбайт
Блок питания Corsair AX1200i, 1200 Вт Seasonic Platinum-1000, 1000 Вт
Охлаждение CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Операционная система Windows 7 Ultimate X64 Service Pack 1
ПО для карт AMD AMD Catalyst 13.11 Beta
v8 (для Radeon R9 290); v5 (для остальных)
+ Catalyst Application Profiles 13.5 CAP1
ПО для карт NVIDIA 331.70 (для GeForce GTX 780)
331.58 WHQL (для остальных)

Для измерения мощности системы используется стенд с блоком питания Corsair AX1200i. Энергосберегающие технологии CPU во всех тестах отключены. Шина PCI-Express работает в режиме 3.0. Для активации PCI-E 3.0 на видеокартах серий GeForce 600 и 700 в системе на чипсете X79 применяется патч от NVIDIA.

В настройках драйвера NVIDIA всегда в качестве процессора для вычисления PhysX выбирается CPU. В настройках AMD всегда настройка Tesselation переводится из состояния AMD Optimized в Use application settings.

Набор бенчмарков
Программа API Настройки Анизотропная фильтрация, полноэкранное сглаживание Разрешение
3DMark 2011 DirectX 11 Профиль Extreme - -
3DMark DirectX 11 Тест Fire Strike (не Extreme) - -
Unigine Heaven 2 DirectX 11 DirectX 11, макс. качество, тесселяция в режиме Extreme AF 16x, MSAA 4x 1920х1080 / 2560х1440
Crysis Warhead + Framebuffer Crysis Warhead Benchmarking Tool DirectX 10 DirectX 10, макс. качество. Демо Frost Flythrough AF 16x, MSAA 4x 1920х1080 / 2560х1440
Battlefield 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Going Hunting AF 16x, MSAA 4x + FXAA 1920х1080 / 2560х1440
Batman: Arkham City. Встроенный бенчмарк DirectX 11 Макс. качество AF, MSAA 4x 1920х1080 / 2560х1440
DiRT Showdown . Встроенный бенчмарк DirectX 11 Макс. качество, Global Illumination вкл. Трасса Shibuya, 8 машин AF, AA 4х 1920х1080 / 2560х1440
Far Cry 3 + FRAPS DirectX 11 DirectX 11, макс. качество, HDAO. Начало миссии Secure the Outpost AF, MSAA 4x 1920х1080 / 2560х1440
Tomb Raider. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 1920х1080 / 2560х1440
Bioshock Infinite. Встроенный бенчмарк DirectX 11 Макс. качество. Postprocessing: normal AF 16x, FXAA 1920х1080 / 2560х1440
Crysis 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Post Human AF 16x, MSAA 4x 1920х1080 / 2560х1440
Metro: Last Light. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 1920х1080 / 2560х1440

⇡ Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

⇡ Разгон, температура, энергопотребление

В штатном режиме GeForce GTX 780 Ti удерживает достаточно высокие тактовые частоты под нагрузкой. Во время тестового прогона Crysis 3 GPU работал на частоте 1006—1020 МГц (ненамного больше, чем у GTX 780 и GTX TITAN) с редкими проседаниями до 993 МГц. При этом максимальное напряжение на GPU составляло 1,187 В, в то время как GTX 780 и GTX TITAN довольствуются 1,162 В.

Если сравнивать GTX 780 Ti с Radeon R9 290X, то выходит, что обе видеокарты (при условии, что R9 290X работает в Uber Mode с более высокой скоростью вращения вентилятора) под нагрузкой стабильно держат частоту в районе 1 ГГц.

Вот только процессор GK110 при этом сохраняет температуру в пределах 83 °C и турбинка его системы охлаждения раскручивается до 2336 об/мин, а Hawaii разогревается до 93 °C, в то время как кулер вращается на скорости 2727 об/мин.

Забавно, но, если судить по тесту в Crysis 3, GeForce GTX 780 Ti в пиковом энергопотреблении немного превосходит Radeon R9 290X, да и системы охлаждения у соперников на вид одинаковы по мощности, но R9 290X явно испытывает трудности с теплоотводом. Возможно, причина в разной площади кристаллов GK110 и Hawaii: у первого — 533 мм 2 , а у второго — 455 мм 2 , отсюда и разная плотность теплового потока.

Кроме того, нельзя не отметить, что система охлаждения GTX 780 Ti хороша не только изысканным дизайном и светящейся надписью, но и отличными акустическими характеристиками. Даже при скорости 4261 об/мин, что является максимумом для крыльчатки, шум нельзя сравнить с ревом штатного охладителя Radeon R9 290X на таких же оборотах. Кроме того, спектр шума у NVIDIA более мягкий и приятный слуху.

По оверклокерским возможностям GeForce GTX 780 Ti уступает «ванильной» разновидности GTX 780, что вполне ожидаемо, если учесть дополнительное тепловыделение от трех ранее дремавших SMX и повышенное напряжение на GPU. К тому же у нового флагмана мизерный запас по TDP — его можно увеличить лишь на 6%. На всякий случай включив вентилятор на полные обороты, чтобы температура не влияла на динамику частоты, и отдав приоритет температуре в EVGA Precision, мы смогли увеличить базовую частоту до 986 МГц, а максимальное зарегистрированное значение выросло до 1130 МГц. Частота под нагрузкой достаточно стабильна — в ходе теста в Crysis 3 она не опускалась ниже 1111 МГц.

Если судить по состоянию индикаторов Power/Voltage/OV/Utilization Limit, которыми NVIDIA снабдила видеокарты с технологией GPU Boost 2.0, препятствием на пути разгона видеокарты становится лимит энергопотребления и одновременно — напряжение питания GPU. Попытки покрутить опцию Overvoltage попросту ни к чему не привели: заданного подъема напряжения на 75 мВ на графиках не зарегистрировано.

Base Clock, МГц Макс. Boost Clock, МГц Base Clock, МГц (разгон) Макс. зарегистрированная Boost Clock,
МГц (разгон)
GeForce GTX 780 Ti 876 1020 (+144) 986 1130 (+144)
GeForce GTX TITAN 836 1006 (+145) 966 1150 (+184)
GeForce GTX 780 863 1006 (+143) 1053 1215 (+162)

Производительность: синтетические тесты

  • В этом тесте GeForce GTX 780 Ti предсказуемо быстрее всех однопроцессорных видеокарт, а по параметру 3DMark Score даже превосходит GeForce GTX 690.

  • А вот в более свежей версии бенчмарка результаты GeForce GTX 780 Ti поразительно точно совпадают с тем, чего достиг Radeon R9 290X.
  • И вновь GTX 780 Ti набрал больший итоговый балл, чем у GTX 690.

Unigine Heaven 2

  • GTX 780 Ti наступает на пятки обеим видеокартам на базе двух GPU.
  • Разница между GTX 780 Ti и Radeon R9 290X весьма велика. Спасибо быстрой обработке геометрии, которая, как ничто иное, важна в этом тесте, богатом аппаратной тессляцией.

⇡ Производительность: игровые тесты

Crysis Warhead

  • Превосходство GTX 780 Ti над предыдущими видеокартами с чипом GK110 не столь выражено, как в других тестах.
  • GTX 780 Ti немного, но все же медленнее, чем Radeon R9 290X.

Battlefield 3

  • Здесь GTX 780 Ti в очередной раз уверенно превосходит R9 290X.

Batman: Arkham City

  • GTX 780 Ti - король этого бенчмарка. Ему удалось заткнуть за пояс не только Radeon R9 290X, но и «двухголовый» GeForce GTX 690.

DiRT Showdown

  • Преимущество опять перешло на сторону Radeon R9 290X.
  • Впрочем, внутри команды NVIDIA на платформе GK110 новый флагман существенно превосходит «обычный» GeForce GTX 780.

Far Cry 3

  • Far Cry 3 - одна из тех игр, где разница между GeForce GTX 780 Ti и Radeon R9 290X наиболее велика (в пользу NVIDIA).
  • Более того, GTX 780 Ti отработал практически не хуже, чем Radeon HD 7990.

Tomb Raider

  • Еще одно разгромное поражение для Radeon R9 290X.

Bioshock Infinite

  • Здесь GTX 780 Ti все еще впереди по отношению к R9 290X, хотя разница уже менее выражена.

Crysis 3

  • Из двух видеокарт - GeForce GTX 780 Ti и Radeon R9 290X — первый быстрее, и намного.
  • Фактически GTX 780 Ti подбирается к позициям Radeon HD 7990.

Metro: Last Light

  • Radeon R9 290X держится уверенно, уступая сопернику не более 1 FPS.
  • Сам GeForce GTX 780 Ti практически равен GeForce GTX 690.

⇡ Производительность: разгон

Оверклокинг GeForce GTX 780 Ti ощутимо влияет на очки в синтетических тестах 3DMark, но в играх повышение частоты большого значения не имеет. Как ни крути, а разгон GPU NVIDIA с технологией GPU Boost - не очень плодотворное занятие. Тем более что GTX 780 Ti сильно ограничен рамками TDP и не дает возможности повысить напряжение питания, как следствие - повышение частоты было не таким большим, как в случае с GeForce GTX 780 в базовой версии.

⇡ Игровые тесты + Unigine Heaven 2

⇡ Выводы

В диапазоне цен от $400 до $550, который обычно занимают игровые видеокарты для энтузиастов, AMD сегодня сильна как никогда. Фактически впервые в истории противостояния двух главных производителей дискретных GPU видеоадаптеры AMD не только не уступают конкурентам равной стоимости, которые предлагает NVIDIA, но даже заметно превосходят их по производительности. Но у NVIDIA в запасе было секретное оружие — полностью разблокированный графический процессор GK110. Пускай GeForce GTX 780 невозможно сделать настолько дешевым, чтобы он мог предоставить такую же производительность по цене $400 (сколько стоит Radeon R9 290), зато «зеленые» в состоянии создать видеокарту, гораздо более дорогую, чем Radeon R9 290X, но при этом она безоговорочно превосходит последнего по производительности.

Просто у GK110 изначально был запас масштабирования вплоть до тех высот, которые продемонстрировал сегодня GeForce GTX 780 Ti, а GPU Hawaii в составе Radeon R9 290X уже полностью проявил свой потенциал. Во-первых, конечно же, GK110 включает на миллиард больше транзисторов по сравнению с Hawaii. Но, что не менее важно, NVIDIA по-другому распорядилась этим бюджетом. AMD вложилась в большое количество ROP, что делает R9 290X более приспособленным к играм в 4K-разрешении, но NVIDIA сделала акцент на блоках фильтрации текстур. Преимущество в обработке геометрии также вновь на стороне топового GPU NVIDIA. Как показывают тесты, в разрешении вплоть до 2560х1440 последние параметры все еще более важны, чем скорость заполнения пикселов.

Любопытно, что GTX 780 Ti и Radeon R9 290X очень близки по тактовым частотам GPU и, судя по всему, обладают примерно одинаковым энергопотреблением (как минимум 280-290 Вт), что само по себе говорит в пользу NVIDIA, ибо GK110 — более сложный и высокопроизводительный чип, чем Hawaii. Но при всем этом видеокарта NVIDIA еще и нагревается меньше. Нельзя не похвалить референсный кулер, который GTX 780 Ti унаследовал от своих предшественников, но дело явно не только в системе охлаждения. Похоже, что GK110 сам по себе более эффективно отдает тепло.

Впрочем, если судить с чисто практических позиций, то GeForce GTX 780 Ti и Radeon R9 290X не являются прямыми конкурентами в силу разницы по ценам в $150. Новый флагман NVIDIA, как и базовая версия GTX 780 ранее, оказался единственным представителем собственной ценовой категории для энтузиастов, которые готовы отдать дополнительные деньги сверх привычных $500-550, составляющих цену видеокарты класса High-End. В таком качестве ему вряд ли появится альтернатива вплоть до того, как производство GPU освоит техпроцесс 20 нм.

Напоследок замолвим слово о GeForce GTX TITAN, которая до сего момента считалась самой производительной однопроцессорной видеокартой NVIDIA. После выхода GeForce GTX 780 Ti ее продолжат продавать, и даже о снижении цены не было никаких официальных заявлений. По всей видимости, TITAN по-прежнему будет стоит $1 000, но теперь его преподносят как «просьюмерский» видеоадаптер с возможностью выполнять неграфические вычисления двойной точности на скорости 1/3 от FP32. По сути, некий аналог Quadro K6000 для не-профи. Ценность TITAN как игровой видеокарты после выхода GeForce GTX 780 Ti уже окончательно уничтожена.

Видеокарта – одна из важнейших составляющих любого игрового компьютера. При подборе комплектующего для ПК, отдельное внимание стоит уделить выбору графического процессора, поскольку именно он отвечает за обработку текстур и поддержание плавности передачи кадров. Nvidia Geforce GTX 780 Ti – это отличная видеокарта, которая часто присутствует в сборках персональных компьютеров средней производительности. Устройство хорошо демонстрирует себя при полной нагрузке в современных играх, не сильно греется, не шумит при работе и стоит недорого.

Geforce GTX 780 TI – это первая в истории видеокарта с одним графическим ядром на базе GK110 с частотой 875 мегагерц. Она, как и большинство видеокарт от Nvidia, способна к разгону и при максимальной нагрузке может похвастаться частотой в 962 МГц, что является очень неплохим показателем для видеокарты средней ценовой категории.

Nvidia Geforce GTX 780 TI обладает 3072 Мб оперативной памяти GDDR5 с пропускной скоростью 336 ГБ/с. Ядро GK110 создано для работы с 64-х битной системой, поэтому идеально смотрится в связке с современными операционными системами (Windows 10, 8).

Основные характеристики GTX 780 Ti выглядят так:

  • Количество ядер CUDA – 2880.
  • Базовая тактовая частота графического ядра – 875 МГц.
  • Скорость заполнения текстур – 210 GigaTexels/sec.
  • Быстродействие – 7 ГБ/сек.
  • Ширина интерфейса памяти – 384 бит.
  • Техпроцесс – 0.028 мкм.
  • Частота работы памяти DDR5 – 1750.
  • Интерфейс PCI-E 3.0.
  • Поддержка DirectX 12.

После разгона частоты ядра и памяти могут возрасти на 5-15%, что дает неплохой прирост к производительности.

Цена GTX 780 Ti полностью оправдывает себя, поскольку видеокарта прекрасно справляется с большим количеством задач.

Обзор GTX 780 Ti

Внешне устройство выглядит весьма привлекательно: закрытый металлический корпус, компактный радиатор и кулер для охлаждения. Не зря дизайн этой видеокарты до сих пор использует компания Nvidia в своих современных разработках.

Для дополнительного питания карта оснащена переходником на 6pin/8pin. Подключается он непосредственно к блоку питания компьютера.


Повышенное энергопотребление GTX 780 Ti позволяет видеокарте работать на полную мощность. При этом нельзя сказать, что она «съедает» уж очень много электроэнергии. Стандартного блока питания на 500W вполне хватит для стабильной работы этого графического процессора.

Разгон видеокарты Nvidia Geforce GTX 780 Ti

Как и любая другая видеокарта, GTX 780 подлежит разгону. Небольшая прибавка к производительности заметно скажется на работе ПК, прибавит с десяток кадров во время игры и поспособствует майнингу на GTX 780 Ti.

Разгон GTX 780 Ti выполняется при помощи официального бесплатного программного обеспечения Nvidia Inspector. После скачивания и запуска утилиты вся информация о видеокарте будет выведена на экран.

Пошаговая инструкция осуществления разгона:

  1. Внизу необходимо нажать на кнопку «Show Overlocking», после чего перейти непосредственно к корректировке частот графического ядра, шейдерных блоков и памяти видеокарты.
  2. В появившемся окне перетаскиваем ползунки «Base Clock Offset» на +80-90 мегагерц, «Memory Clock Offset» на +100 и «Power and Temperature Target» до максимума. Последний показатель отвечает за потребление энергии. Чем он больше, тем больше производительность на выходе.
  3. Для охлаждения вытягиваем центральный ползунок «Fan» (скорость вращения кулеров) до 100%.
  4. После произведенных операций жмем кнопку «Apply Clocks&Voltage» и закрываем программу.

Проверить стабильность работы после внесенных изменения можно в стресс-тесте утилиты FurMark.

Майнинг на GTX 780 Ti – одно из преимуществ этой видеокарты. После разгона она способна производить вычисления и обрабатывать графические данные, которые используются при майнинге криптовалюты.

Тестирование в играх

GTX 780 Ti выдает стабильные 60-70 FPS во многих требовательных играх. Классические продукты игровой индустрии, такие как TES V: Skyrim, GTA V, The Witcher 2 и другие, работают без каких-либо просадок и зависаний.

После тестов в Benchmark и FurMark становится ясно, что 780 Ti – тот графический процессор, с которым придется считаться даже современным видеокартам.

Обновление драйверов

Драйвер на GTX 780 Ti можно скачать с официального сайта производителя. Чтобы установить/обновить драйвера на вашем ПК, необходимо следовать инструкциям инсталлятора Nvidia.

Утилита автоматически определит модель и тип вашего устройства, подберет необходимое программное обеспечение и установит его.

Из-за выхода семейства видеокарт AMD Volcanic Islands, на рынке графических адаптеров начался жёсткий ажиотаж. nVidia даже снизили цены на свои топовые видеокарты, но и это не помогло. Нужно было что-то делать и как то менять ситуацию в свою сторону. Нужна была особая модель, которая уделала бы флагаман — AMD Radeon R9 290X и убрала его из списка конкурентов.

В принципе такая видеокарта у nVidia есть — это GeForce GTX TITAN. Это самая быстрая видеокарта на одном чипе на момент выхода. Но её цена слишком высока и для большинства она просто недоступна. Даже не каждый геймер решится купить себе такую. Ведь за эти деньги можно запросто купить хороший компьютер с отличной производительностью.

И вот, nVidia наконец-то выпустили видеокарту, которая лучше конкурента от AMD и доступней по цене — GeForce GTX 780 Ti. Она же стала главой семейства видеокарт GTX 7хх.

Можно предположить, что это своеобразный козырь, который зелёные держали в рукаве. Была просто выждана определённая пауза и выбран подходящий момент для выпуска.

Технические характеристики

Данной видеокарте было возвращено три из пятнадцати крупных блоков от архитектуры Kepler – потоковых мультипроцессоров. Она значительно мощнее, особенно в плане шейдерных инструкций и текстурирования.

Также она поддерживает видеопамять частотой 7 ГГц, тем самым увеличивается пропускная способность аж на 14%.

Размеры референсной версии

  • Высота: 26,67 cm / 10,5 дюймов
  • Длина: 11.16 cm / 4,376 дюймов
  • Ширина: Два слота

Спецификации GPU

  • Ядер CUDA: 2880
  • Базовая тактовая частота: 875
  • Тактовая частота с ускорением: 928
  • Скорость заполнения текстур: 210 (GigaTexels/s)

Спецификации памяти

  • Быстродействие памяти (Gbps): 7.0
  • Объем памяти: 3072 MB
  • Интерфейс памяти: 384-bit GDDR5
  • Максимальная полоса пропускания памяти: 336

Возможности

  • FXAA и TXAA: +
  • Поддержка технологии NVIDIA SLI: +
  • Purevideo: +
  • 3D Vision: +
  • PhysX: +

Программное окружение: CUDA

  • DirectX: 11
  • OpenGL: 4.3
  • Шина: PCI-E 3.0
  • 3D Игры: +
  • Blu Ray 3D: +

Спецификации

  • Максимальное цифровое разрешение: 4096×2160
  • Максимальное VGA разрешение: 2048×1536
  • Медиа соединение: HDMI, DisplayPort, Dual Link DVI-I, Dual Link DVI-D
  • Поддержка нескольких дисплеев: +
  • HDCP: +
  • HDMI: +
  • Аудио вход для HDMI: Internal

Мощность и температура

  • Максимальная температура: 95
  • Потребление энергии: 250 W
  • Минимальные системные требования по питанию: 600 W
  • Разъемы питания: 6-pin & 8-pin

Сравнение GTX 780 TI и GTX 780

GeForce GTX 780 GeForce GTX 780 Ti
GPU GK110 GK110
Число транзисторов 7,1 млрд 7,1 млрд
Техпроцесс, нм 28 28
Тактовая частота GPU, МГц: Base Clock / Boost Clock 863/900 875/928
Потоковые процессоры 2304 2880
Текстурные блоки 192 240
Блоки растеризации (ROP) 48 48
Видеопамять: тип, объем, Мбайт GDDR5, 3072 GDDR5, 3072
Тактовая частота памяти: реальная (эффективная), МГц 1753 (7010) 1502 (6008)
Разрядность шины памяти, бит 384 384
Интерфейс PCI-Express 3.0 x16
Вывод изображения
Интерфейсы 1 х DL DVI-I,
1 x DL DVI-D,
1 x HDMI 1.4a,
1 x DisplayPort 1.2
Максимальное разрешение VGA: 2048×1536,
DVI: 2560×1600,
HDMI: 4096х2160,
DisplayPort: 4096×2160
Максимальная потребляемая мощность, Вт 250 250

Производители

MSI GTX 780 Lightning 3 GB

Она обладает частотой ядра: 980 МГц и частотой памяти 1502 МГц

MSI GTX 780 TwinFrozr Gaming 3 GB

ASUS GTX 780 DirectCU II OC 3 GB

Она обладает частотой ядра: 889 МГц и частотой памяти 1502 МГц

EVGA GTX 780 Superclocked w/ ACX Cooler 3 GB

Она обладает частотой ядра: 967 МГц и частотой памяти 1502 МГц

Видеокарта Gigabyte GTX 780 WindForce OC 3 GB

Она обладает частотой ядра: 954 МГц и частотой памяти 1502 МГц

Palit GTX 780 Super JetStream 3 GB

Она обладает частотой ядра: 980 МГц и частотой памяти 1550 МГц

MSI GTX 780 Gaming 6 GB

Она обладает частотой ядра: 902 МГц и частотой памяти 1502 МГц

Сравнение с конкурентами

Технические спецификации/Модель AMD Radeon R9 290X nVidia GeForce GTX 780 nVidia GeForce GTX 780 Ti nVidia GeForce GTX Titan
GPU Hawaii XT GK110 (GK110-300-A1) GK110 (GK110-425-B1) GK110 (GK110-400-A1)
Техпроцесс 28 нм 28 нм 28 нм 28 нм
Число транзисторов 6,2 млрд. 7,1 млрд. 7,1 млрд. 7,1 млрд.
Тактовая частота GPU (базовая частота) 864 МГц 876 МГц 837 МГц
Тактовая частота GPU (частота Boost) 1.000 МГц 902 МГц 928 МГц 876 МГц
Частота памяти 1.250 МГц 1.502 МГц 1.750 МГц 1.502 МГц
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5
Объём памяти 4.096 Мбайт 3.072 Мбайт 3.072 Мбайт 6.144 Мбайт
Ширина шины памяти 512 бит 384 бит 384 бит 384 бит
Пропускная способность памяти 320,0 Гбайт/с 288,4 Гбайт/с 336 Гбайт/с 288,4 Гбайт/с
Версия DirectX 11.2 11.1 11.1 11.1
Потоковые процессоры 2.816 2.304 2.880 2.688
Текстурные блоки 176 192 240 224
Конвейеры растровых операций (ROP) 64 48 48 48
TDP > 250 Вт 250 Вт 250 Вт 250 Вт

Сравнивая 780 Ti с конкурентами можно понять её плюсы и минусы. К примеру, количество потоковых процессов не сильно отличается от других, а вот пропускная способность всё же немного выше. Но вот у AMD значительно выше количество видеопамяти, частота Boost и пиксельная скорость заполнения. Сейчас именно PowerTune и GPU Boost сильно влияют на производительность. И оценить её уж не так просто. Так что сравнивать все эти основные характеристики не так важно.

Разгон и тесты

Разгон GTX 780 Ti это нечто. У видеокарты значительные скрытые резервы.

Инженеры компании постарались на славу. Из-за более усовершенствованного чипа и улучшенной системы питания можно разогнать её на 200 Мгц не поднимая при этом напряжения.

Тесты в бенчмарках

Тесты в играх

Crysis 3

В Crysis 3 видеокарта показала отличные результаты, до 36 fps при максимальных настройках.

Total War ROME II

Эта игра просто напичкана различными современными графическими наворотами.

В FullHd разрешении fps составлял от 65-99 при максимальных настройках.

Call of Duty Ghosts

В FullHd разрешении fps составлял от 132 до 148 при максимальных настройках.

Выводы

Можно сказать что GTX 780 Ti это образец видеокарты высокого качества, которая предназначена для серьёзных игр. nVidia сделали шаг в развитии GPU семейства Kepler. Можно утверждать, что эта архитектура достигла своего потолка.

Выбор редакции
Знак Зодиака составляет всего 50% Вашей личности. Остальные 50% нельзя узнать, читая общие гороскопы. Нужно составить индивидуальный...

Описание растения шелковица белая. Состав и калорийность ягод, полезные свойства и предполагаемый вред. Рецепты вкусных блюд и применение...

Как и большинство его коллег, советских детских писателей и поэтов, Самуил Маршак не сразу начал писать для детей. Он родился в 1887...

Дыхательная гимнастика по методу Стрельниковой помогает справляться с приступами высокого давления. Правильное выполнение упражнений -...
О ВУЗе Брянский государственный университет имени академика И.Г. Петровского - самый крупный вуз региона, в котором обучается более 14...
Вопрос №1. 1). Вставьте пропущенные буквы, объясните написание слов. Прил…жжение, выр…сти, к…снуться, м…кать, разг…раться, ск…кать,...
Экономический календарь Форекс – это настольная книга каждого трейдера независимо от опыта торговли и уровня профессионализма, и особенно...
Представители класса паукообразных – существа, живущие рядом с человеком на протяжении многих веков. Но этого времени оказалось...
Белые туфли у девушек и женщин практически всегда ассоциируются со свадебным нарядом, хотя белый цвет туфель уже давно не обязателен. А...