NVIDIA GeForce RTX 3070 Ti
В тестах видеокарта NVIDIA GeForce RTX 3070 Ti, проявила себя следующим образом – по данным бенчмарка Passmark, модель набрала 21653 баллов. При этом максимальное количество баллов на сегодняшний день равняется 260261 балл. По данным бенчмарка 3DMark, видеокарта набрала 29198 баллов из 49575 возможных. Версия Directx – 12.2.
По части совместимости, видеокарта подключается по интепрфейсу PCIe 4.0 x16. Касательно охлаждения, здесь требования по теплоотводу составляют 290 Вт. В наших тестах видеокарта набирает 6488030 баллов.
NVIDIA GeForce RTX 3070 Ti: технические характеристики и тесты
NVIDIA начала продажи GeForce RTX 3070 Ti 31 мая 2021 по рекомендованной цене 599$. Это топовая десктопная видеокарта на архитектуре Ampere и техпроцессе 8 нм, в первую очередь рассчитанная на геймеров. На ней установлено 8 Гб памяти GDDR6X на частоте 19 ГГц, и вкупе с 256-битным интерфейсом это создает пропускную способность 608.3 Гб/с.
С точки зрения совместимости это двухслотовая карта, подключаемая по интерфейсу PCIe 4.0 x16. Длина референсной версии – 267 мм. Для подключения требуется дополнительный 1x 12-pin кабель питания, а потребляемая мощность – 290 Вт.
Она обеспечивает хорошую производительность в тестах и играх на уровне 60.87% от лидера, которым является NVIDIA GeForce RTX 4090.
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce RTX 3070 Ti, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | 17 | |
Место по популярности | 62 | |
Соотношение цена-качество | 20.34 | |
Архитектура | Ampere (2020−2022) | |
Графический процессор | Ampere GA104 | |
Тип | Десктопная | |
Дата выхода | 31 мая 2021 (2 года назад) | |
Цена на момент выхода | 599$ | |
Цена сейчас | 757$ (1.3x) | из 168889 (A100 PCIe 80 GB) |
Отношение производительности к цене. Чем выше, тем лучше.
Характеристики
Общие параметры GeForce RTX 3070 Ti: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce RTX 3070 Ti, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Количество потоковых процессоров | 6144 | из 20480 (Data Center GPU Max NEXT) |
Частота ядра | 1575 МГц | из 2610 (Radeon RX 6500 XT) |
Частота в режиме Boost | 1770 МГц | из 3599 (Radeon RX 7990 XTX) |
Количество транзисторов | 17,400 млн | из 14400 (GeForce GTX 1080 SLI (мобильная)) |
Технологический процесс | 8 нм | из 4 (GeForce RTX 4080) |
Энергопотребление (TDP) | 290 Вт | из 2400 (Data Center GPU Max Subsystem) |
Скорость текстурирования | 339.8 | из 969.9 (H100 SXM5 96 GB) |
Совместимость и размеры
Параметры, отвечающие за совместимость GeForce RTX 3070 Ti с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Интерфейс | PCIe 4.0 x16 |
Длина | 267 мм |
Толщина | 2 слота |
Дополнительные разъемы питания | 1x 12-pin |
Оперативная память
Параметры установленной на GeForce RTX 3070 Ti памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.
Тип памяти | GDDR6X | |
Максимальный объём памяти | 8 Гб | из 128 (Radeon Instinct MI250X) |
Ширина шины памяти | 256 бит | из 8192 (Radeon Instinct MI250X) |
Частота памяти | 19000 МГц | из 22400 (GeForce RTX 4080) |
Пропускная способность памяти | 608.3 Гб/с | из 3276 (Aldebaran) |
Разделяемая память | — |
Видеовыходы
Перечисляются имеющиеся на GeForce RTX 3070 Ti видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Обзор Nvidia GeForce RTX 3070 Ti: ускоренный вариант GeForce RTX 3070 с защитой от майнинга по алгоритму ethash
Продолжаем практические обзоры видеокарт семейства GeForce RTX 30 компании Nvidia, и сегодня поговорим о второй модели из двух, представленных недавно на выставке Computex 2021 — GeForce RTX 3070 Ti. Если GeForce RTX 3080 Ti по характеристикам оказалась весьма близка к топовой RTX 3090, то RTX 3070 Ti вряд ли будет догонять по производительности старшую RTX 3080: ее основные отличия от модели не-Ti — в ускоренном GPU и типе видеопамяти. На рассматриваемую сегодня новинку установили чипы нового типа памяти GDDR6X, который применяется в старших моделях линейки RTX 30.
Но это не все, также в RTX 3070 Ti применяется полная версия графического процессора GA104, тогда как в модели RTX 3070 имелись неактивные исполнительные блоки. Сегодня мы постараемся понять мотивацию Nvidia для выпуска подобной видеокарты, так как особой нужды в ней сходу просто не видим. Разве что если рассматривать новинку в качестве обновления линейки — для того, чтобы заинтересовать новых покупателей. Но в наше время дефицита полупроводников и сильно завышенных цен конкретно на GPU, их и так разбирают, как горячие пирожки. Особенно по рекомендованным ценам, особенно майнеры.
Но мы знаем, что компания Nvidia уже предприняла некоторые шаги по улучшению ситуации, в том числе и выпуском видеокарт RTX 3080 Ti и RTX 3070 Ti — в них ограничена производительность самого популярного алгоритма майнинга криптовалют — эфира, второй по капитализации криптовалюты, которую чаще всего добывают на GPU. И по опыту RTX 3080 Ti можно сказать, что защита действительно работает, майнинг эфира на этой модели гораздо менее выгоден, и вряд ли привлекает массу майнеров. Особенно сейчас, когда и доходность майнинга снизилась, и курсы основных криптовалют просели.
Впрочем, пока что майнинг все равно остается доходным делом, и даже при том, что «защищенные от майнеров» модели видеокарт не сильно интересны для майнеров, вышедшую неделю назад RTX 3080 Ti смели с виртуальных полок интернет-магазинов за минуты! Но только там, где цены были близки к рекомендованной, а по 200+ тысяч новинку вполне можно купить. Энтузиасты игр устали от завышенных вдвое-втрое цен из-за дефицита и вот наконец-то появились выгодные для них предложения. Вполне возможно, таковым будет и GeForce RTX 3070 Ti, которая точно не будет высокопроизводительной при майнинге эфира, зато для игроков подходит отлично.
Кратко напомним, что решения Nvidia, основанные на архитектуре Ampere, отличаются от видеокарт архитектуры Turing тем, что они обеспечивают заметно более высокую производительность — благодаря оптимизации и производству по более тонкому техпроцессу, игровые решения новой архитектуры примерно в полтора раза быстрее аналогичных Turing в традиционных задачах растеризации, и до двух раз быстрее при трассировке лучей. Мы уже рассмотрели несколько видеокарт архитектуры Ampere, основанных на разных модификациях чипов GA102 и GA104, и сегодня наше внимание приковано к одному из самых интересных для игроков вариантов — модели RTX 3070 Ti, основанной на полной версии среднеценового чипа GA104.
Этот GPU поддерживает все технологии компании, и выглядит очень выгодным вариантом, особенно при рекомендованной цене и завышенных розничных на модели видеокарт без защиты от майнинга. И если розничные цены на новинку не будут слишком высоки, то это — отличный вариант апгрейда для обладателей таких решений предыдущих поколений, как GTX 1070 Ti и RTX 2070 Super. GeForce RTX 3070 Ti отлично подойдет для современных игр при максимально возможных настройках, включая аппаратную трассировку лучей. Единственное, что не всегда получится играть в 4K-разрешении, но оно все же является прерогативой топовых решений.
Основой рассматриваемой сегодня модели видеокарты является уже известный нам графический процессор архитектуры Ampere, о котором мы уже писали. Также, эта новая архитектура имеет достаточно много общего с предыдущими архитектурами Turing и Volta, и перед прочтением материала полезно ознакомиться с нашими предыдущими статьями по теме:
- [02.06.21] Nvidia GeForce RTX 3080 Ti: новый лидер, если не брать в расчет GeForce RTX 3090
- [01.12.20] Nvidia GeForce RTX 3060 Ti: Nvidia Ampere спускаются еще ниже по ценовой лестнице
- [27.10.20] Nvidia GeForce RTX 3070: очень привлекательное по цене младшее решение семейства Nvidia Ampere
- [30.09.20] Nvidia GeForce RTX 3090: самое производительное, но не чисто игровое решение
- [18.09.20] Nvidia GeForce RTX 3080, часть 2: описание карты Palit, игровые тесты, выводы
- [16.09.20] Nvidia GeForce RTX 3080, часть 1: теория, архитектура, синтетические тесты
- [19.09.18] Nvidia GeForce RTX 2080 Ti — обзор флагмана 3D-графики 2018 года
- [14.09.18] Игровые видеокарты Nvidia GeForce RTX — первые мысли и впечатления
Графический ускоритель GeForce RTX 3070 Ti | |
---|---|
Кодовое имя чипа | GA104 |
Технология производства | 8 нм (Samsung «8N Nvidia Custom Process») |
Количество транзисторов | 17,4 млрд |
Площадь ядра | 392,5 мм² |
Архитектура | унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др. |
Аппаратная поддержка DirectX | DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2 |
Шина памяти | 256-битная: 8 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X |
Частота графического процессора | до 1770 МГц |
Вычислительные блоки | 48 потоковых мультипроцессоров, включающих 6144 CUDA-ядра для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64 |
Тензорные блоки | 192 тензорных ядра для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32 |
Блоки трассировки лучей | 48 RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH |
Блоки текстурирования | 192 блока текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов |
Блоки растровых операций (ROP) | 12 широких блоков ROP на 96 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра |
Поддержка мониторов | поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a) |
Спецификации референсной видеокарты GeForce RTX 3070 Ti | |
---|---|
Частота ядра | до 1770 МГц |
Количество универсальных процессоров | 6144 |
Количество текстурных блоков | 192 |
Количество блоков блендинга | 96 |
Эффективная частота памяти | 19 ГГц |
Тип памяти | GDDR6X |
Шина памяти | 256-бит |
Объем памяти | 8 ГБ |
Пропускная способность памяти | 608 ГБ/с |
Вычислительная производительность (FP32) | до 21,7 терафлопс |
Теоретическая максимальная скорость закраски | 170 гигапикселей/с |
Теоретическая скорость выборки текстур | 340 гигатекселей/с |
Шина | PCI Express 4.0 |
Разъемы | по выбору производителя |
Энергопотребление | до 290 Вт |
Дополнительное питание | два 8-контактных разъема |
Число слотов, занимаемых в системном корпусе | 2 |
Рекомендуемая цена | $599 (57 900 рублей) |
Полное название новой модели соответствует принципу наименования решений компании, когда к более поздним промежуточным решениям добавляются сначала суффиксы Ti, а затем и Super — при необходимости. Новинка занимает положение в линейке между RTX 3070 и RTX 3080, ее рекомендованная цена составляет $599, или 57 900 рублей для нашего рынка, что также между ценами на соседние видеокарты без суффиксов. Но повторимся, что рекомендованные цены на видеокарты сейчас не имеют отношения к розничным, и нужно учитывать два уровня цен — официальный, далекий от реальности, и рыночный, вызванный дисбалансом в уровнях спроса и предложения. Будет очень хорошо, если розница уложится хотя бы в 100 тысяч рублей, а уж по рекомендованной цене все RTX 3070 Ti точно разлетятся очень быстро.
Конкурентом со стороны AMD для RTX 3070 Ti можно считать Radeon RX 6800, для которого установлена очень близкая рекомендованная цена в $579, хотя в рознице есть некоторый перекос из-за того, что видеокарты AMD обеспечивают несколько меньшую производительность при майнинге, но к RX 6800 это не особо относится. Так что конкуренция между RX 6800 и RTX 3070 Ti может стать вполне реальной, или перекос даже пойдет уже в другую сторону, так как видеокарта AMD не имеет искусственного ограничения производительности при майнинге эфира и станет более выгодной в этом деле.
Что касается сравнения конкурентов в игровых задачах, то у Ampere есть явные преимущества в виде более эффективной аппаратной трассировки лучей и поддержки технологии увеличения производительности DLSS. Зато у видеокарты AMD больше видеопамяти — 16 ГБ против 8 ГБ, хотя в играх в обозримом будущем это вряд ли как-то серьезно скажется. Но даже при том, что 8 ГБ для ценового уровня RTX 3070 Ti сейчас можно считать оптимальным объемом видеопамяти, но в некоторых случаях может наблюдаться ее нехватка — к примеру, если производительности GPU хватит для 4K при включенной трассировке лучей, а видеопамяти уже нет.
Поговорим о еще одном интересном моменте — уровне потребления энергии. Для RTX 3070 Ti он установлен значительно выше уровня обычной RTX 3070 — 290 Вт. А для RTX 3070 это всего лишь 220 Вт. Конечно, в новой модели применяется полная версия GPU, но в RTX 3070 она урезана совсем незначительно, да и рабочие частоты не так уж отличаются. Так в чем секрет увеличенного потребления энергии новинкой? Конечно же, в новом типе видеопамяти, ведь чипы GDDR6X потребляют немало энергии и выделяют много тепла, как мы знаем по старшим решениям семейства.
Система охлаждения референсного варианта GeForce RTX 3070 Ti основана на том же принципе, что и в ранее представленных моделях: RTX 3080, RTX 3080 Ti и RTX 3090. Но вряд ли он станет массовым на рынке, поэтому особого смысла рассматривать новую модель в исполнении самой Nvidia нет, такие карты не будут продаваться в больших количествах. Зато партнеры компании, производящие видеокарты, уже выпустили на рынок множество решений собственного дизайна, включая разогнанные варианты и имеющие довольно массивные и эффективные системы охлаждения.
Остается надеяться, что видеокарты модели GeForce RTX 3070 Ti появятся в продаже по вменяемым ценам, близким к рекомендованной, ну или хотя бы не в разы превышающим ее. Явно недостаточные объемы производства чипов, огромный спрос на новые видеокарты со стороны и геймеров и майнеров привел к дефициту видеокарт семейства GeForce RTX 30, что и выражается в 2-3 раза завышенных розничных ценах. Пока что все попытки изменить это не привели к глобальным изменениям на рынке, но подвижки небольшие уже есть.
Архитектурные особенности
Графический процессор GA104, используемый в GeForce RTX 3070 Ti, уже известен нам по модели RTX 3070, которая является одной из самых популярных моделей Nvidia архитектуры Ampere, но новая видеокарта основана на другой версии чипа с лучшими характеристиками по количеству исполнительных блоков, а также на ней установлена более скоростная GDDR6X-память, что также должно дать некоторый прирост производительности.
Как и все графические процессоры компании Nvidia, чип GA104 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации Raster Operator (ROP) и контроллеры памяти.
Полный чип GA104 содержит шесть кластеров GPC и 48 мультипроцессоров SM — по 8 штук на каждый кластер. Каждый GPC содержит по четыре TPC, состоящих из пары SM, пары RT-ядер и движка PolyMorph Engine для работы с геометрией. Всего полная версия графического процессора GA104 содержит 6144 потоковых CUDA-ядра, 48 RT-ядер второго поколения и 192 тензорных ядра третьего поколения.
Модель GeForce RTX 3070 Ti использует полную версию чипа, поэтому текстурных блоков в GPU 192 штуки, а количество блоков ROP — 96. То есть, разница с RTX 3070 не так уж велика — в более ранней версии чипа просто были отключены два мультипроцессора. Подсистема памяти тут также в полном варианте, который включает восемь 32-битных контроллеров памяти, что дает 256-бит в общем. Каждый 32-битный контроллер связан с разделом кэш-памяти второго уровня объемом в 512 КБ, так что общий объем L2-кэша получается равным 4 МБ.
На видеокарте GeForce RTX 3070 Ti установлено 8 ГБ памяти нового типа — GDDR6X, и вместе с 256-битной шиной и рабочей частотой в 9,5(19) ГГц это дает 608 ГБ/с пропускной способности, что более чем на треть выше, чем у простой RTX 3070. А вот объем видеопамяти у них одинаковый, что неудивительно, ведь GDDR6X-память довольно дорога. На 256-битную шину можно поставить 8 или 16 ГБ, и второй вариант явно был бы слишком дорог по себестоимости для решений такого ценового уровня. Поэтому и на Ti-вариант пришлось ставить 8 ГБ. Это вдвое меньше, чем у конкурента, но вряд ли появятся какие-то сложности, так как даже в 4K-разрешении при максимальных настройках игры до сих пор реально не требуют большего объема памяти. RTX 3070 Ti подходит скорее для разрешений вроде 2560×1440, которое предъявляет заметно меньшие требования к объему видеопамяти.
Рассматривать в очередной раз все архитектурные улучшения Ampere нет смысла, все уже было написано в теоретическом материале по GeForce RTX 3080. Основным нововведением Ampere является удвоение FP32-производительности для каждого мультипроцессора SM, по сравнению с семейством Turing, что привело к значительному повышению пиковой производительности. Почти то же самое касается и RT-ядер — хотя их число и не изменилось, внутренние улучшения привели к удвоению темпа поиска пересечений лучей с геометрией. Улучшенные тензорные ядра хоть и не увеличили производительность при обычных условиях, но темп таких вычислений удвоился, а также появилась возможность удвоения скорости обработки так называемых разреженных матриц.
Добавим немного информации о поддержке стандарта вывода изображения HDMI 2.1 и аппаратного декодирования видеоданных в формате AV1. Они поддерживаются всей серией GeForce RTX 30, включая и RTX 3070 Ti. Разъемы стандарта HDMI 2.1 позволяют подключить устройства с 4K-разрешением и частотой обновления в 120 Гц или 8K с 60 Гц, а аппаратный декодер AV1 обеспечивает просмотр онлайн-видео в лучшем качестве, по сравнению с известными форматами, вроде H.264, HEVC и VP9.
Несколько слов о производительности новинки. В своем ценовом диапазоне представленная модель сравнивается с GeForce RTX 2070 Super, и RTX 3070 Ti примерно в полтора раза быстрее этой модели предыдущего поколения, а также вдвое быстрее GeForce GTX 1070 Ti из еще более раннего поколения. Давайте сравним некоторые теоретические показатели производительности GeForce RTX 3070 Ti и RTX 2070 Super, чтобы понять, насколько быстрее стало решение нового семейства по сравнению с аналогичной по позиционированию картой из предыдущего поколения.
Новая модель RTX 3070 Ti имеет 6144 вычислительных CUDA-ядра, что более чем вдвое больше, чем у RTX 2070 Super. Эти ядра обеспечивают 22 терафлопс шейдерной производительности для FP32-вычислений, выделенные RT-ядра дают эквивалент 42 терафлопс при трассировке лучей, а тензорные ядра — 174 терафлопс (с учетом разреженности матриц) в соответствующих вычислениях с применением искусственного интеллекта, включая технологию увеличения производительности DLSS. Неудивительно, что в играх и других приложениях новая GeForce RTX 3070 Ti оказалась значительно быстрее, чем GeForce RTX 2070 Super:
По данным Nvidia, видеокарта GeForce RTX 3070 Ti в среднем в полтора раза быстрее аналогичной по позиционированию RTX 2070 Super из предыдущего семейства в играх при 2K-разрешении и максимальных настройках, включающих трассировку лучей. Новая модель предназначена для пользователей, желающих играть во все современные игры при самых высоких настройках качества без каких-то компромиссов, разве что не всегда в 4K-разрешении.
По сравнению с GTX 1070 Ti, новинка дает примерно вдвое более высокую производительность при традиционной растеризации, и в разы быстрее ее при трассировке лучей, которая даже не всегда поддерживается играми в случае GTX 1070 Ti. В общем, у Nvidia получилась неплохая замена для GTX 1070 Ti и RTX 2070 Super. Но насколько RTX 3070 Ti быстрее обычного варианта RTX 3070? Мы скоро узнаем это на практике, но по основным показателям, таким как производительность математических вычислений, скорость текстурных выборок и пропускная способность памяти, новое решение на полной версии GA104 должно быть быстрее как минимум на 5%-7%. А если рендеринг упирается в ПСП, то и до 25%-33%, но такое бывает довольно редко.
Как и другие решения линейки, модель GeForce RTX 3070 Ti поддерживает все последние технологии Nvidia, такие как RTX, DLSS, Reflex и Broadcast. Nvidia продолжает работу по внедрению своих технологий в игры, на выставке Computex 2021 было объявлено о добавлении технологий DLSS, Reflex и RTX в несколько игр. Например, технология снижения задержек при игре Reflex будет внедрена в War Thunder и Escape from Tarkov, DLSS появится в Red Dead Redemption 2, а трассировка лучей RTX — в Doom Eternal.
На данный момент уже более 60 игр с поддержкой технологий Nvidia включают применение трассировки лучей и/или технологии DLSS, и в их число входят самые популярные игры, как сетевые, так и однопользовательские. А еще порядка 16 игр с поддержкой технологий RTX уже были анонсированы и находятся в разработке. Скорее всего, их количество будет расти постоянными темпами и уже не обязательно с помощью Nvidia. Аппаратное ускорение трассировки лучей завоевало популярность в том числе и на новых игровых консолях, поэтому количество мультиплатформенных игр с трассировкой будет постоянно увеличиваться.
В этот раз референсный вариант GeForce RTX 3070 Ti отсутствует у нас по логистическим причинам, и за основу мы взяли видеокарту Palit, которая по своим частотным характеристикам полностью соответствует эталонной видеокарте Nvidia.
Особенности видеокарты Palit GeForce RTX 3070 Ti Gaming Pro
Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае.
Объект исследования: ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 3070 Ti Gaming Pro 8 ГБ 256-битной GDDR6X
Palit GeForce RTX 3070 Ti Gaming Pro 8 ГБ 256-битной GDDR6X | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | GeForce RTX 3070 Ti (GA104) | |
Интерфейс | PCI Express x16 4.0 | |
Частота работы GPU (ROPs), МГц | 1770(Boost)—1935(Max) | 1770(Boost)—1950(Max) |
Частота работы памяти (физическая (эффективная)), МГц | 9500 (19000) | 9500 (19000) |
Ширина шины обмена с памятью, бит | 256 | |
Число вычислительных блоков в GPU | 48 | |
Число операций (ALU/CUDA) в блоке | 128 | |
Суммарное количество блоков ALU/CUDA | 6144 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 192 | |
Число блоков растеризации (ROP) | 96 | |
Число блоков Ray Tracing | 48 | |
Число тензорных блоков | 192 | |
Размеры, мм | 295×102×56 | 240×100×35 |
Количество слотов в системном блоке, занимаемые видеокартой | 3 | 2 |
Цвет текстолита | черный | черный |
Энергопотребление пиковое в 3D, Вт | 295 | 290 |
Энергопотребление в режиме 2D, Вт | 30 | 30 |
Энергопотребление в режиме «сна», Вт | 11 | 11 |
Уровень шума в 3D (максимальная нагрузка), дБА | 34,0 | 34,6 |
Уровень шума в 2D (просмотр видео), дБА | 18,0 | 18,0 |
Уровень шума в 2D (в простое), дБА | 18,0 | 18,0 |
Видеовыходы | 1×HDMI 2.1, 3×DisplayPort 1.4a | 1×HDMI 2.1, 3×DisplayPort 1.4a |
Поддержка многопроцессорной работы | нет | |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 |
Питание: 8-контактные разъемы | 2 | 1 (12-контактный) |
Питание: 6-контактные разъемы | 0 | 0 |
Максимальное разрешение/частота, DisplayPort | 7680×4320@30 Гц | |
Максимальное разрешение/частота, HDMI | 7680×4320@60 Гц | |
Стоимость на момент подготовки обзора | рекомендованная — от 57 900 рублей, предполагаемая реальная стоимость — 170 000 рублей или выше |
Память
Карта имеет 8 ГБ памяти GDDR6X SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K256M32JE-19) рассчитаны на номинальную частоту работы в 5500 (21000) МГц. Расшифровщик кодов на упаковках FBGA находится здесь.
Особенности карты и сравнение с Palit GeForce RTX 3070 Gaming Pro (8 ГБ)
Palit GeForce RTX 3070 Ti Gaming Pro (8 ГБ) | Palit GeForce RTX 3070 Gaming Pro (8 ГБ) |
---|---|
вид спереди | |
![]() |
![]() |
вид сзади | |
![]() |
![]() |
Очевидно, что для варианта RTX 3070 Ti в компании Palit использовали их же печатную плату для RTX 3070. Отличия исключительно в типе видеопамяти (GDDR6X у 3070 Ti вместо GDDR6 у 3070). То есть платы практически идентичны.
У карты Palit в сумме 12 фаз: 2 на память и 10 на GPU.
Зеленым цветом отмечена схема питания ядра, красным — памяти. Для управления схемой питания GPU используется ШИМ-контроллер uPI Semiconductor uP9512R (способен управлять 8 фазами максимум), и ему в помощь идет uS5650Q. Оба расположены на оборотной стороне платы.
На той же задней стороне имеется ШИМ-контроллер uP1666Q (uPI), который управляет 2-фазной схемой питания микросхем памяти.
В преобразователе питания GPU, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае AOZ5311NGI (Alpha&Omega Semiconductor), каждая из которых рассчитана максимум на 50 А.
В конвертере питания микросхем памяти используются другие мосфеты: SM7342EKKP (Sinopower).
Подсветкой управляет отдельный контроллер Holtek HT50F52241.
Вышеупомянутый uPS5650Q также отвечает и за мониторинг.
Штатные частоты памяти и ядра у карты Palit равны референсным значениям.
Управление работой карты обеспечивается силами фирменной утилиты Thunder Master v4.7. К сожалению, данная версия платы разгон практически не поддерживает, потребление поднять невозможно, поэтому все попытки повысить частоты практически ни к чему не привели.
Нагрев и охлаждение
Мы уже неоднократно говорили, что для новых карт инженерами Nvidia задумана специальная система охлаждения, требующая компактных печатных плат, поэтому PCB карт серии GeForce RTX 30 у многих партнеров Nvidia весьма компактны, а принципы работы кулеров аналогичны референсным. Здесь мы видим уже привычный большой двухсекционный пластинчатый никелированный радиатор с тепловыми трубками, подошва которого охлаждает GPU. Микросхемы памяти, как и преобразователи питания VRM, охлаждаются с помощью отдельной пластины, прикрученной к основному радиатору. Задняя пластина служит только элементом жесткости.
Поверх радиатора установлен кожух с тремя вентиляторами ∅95 мм, которые имеют двойные подшипники. Особенность СО состоит в том, что крайний правый (на фото) вентилятор продувает радиатор насквозь, через отверстия в задней пластине, а крайний левый выдувает горячий воздух за пределы корпуса сквозь отверстия в брекете карты. PCB укорочена именно для эффективной работы правого вентилятора.
Видеокарта останавливает вентиляторы при малой нагрузке, если температура GPU опускается ниже 55 градусов. Разумеется, СО при этом становится бесшумной. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.
Мониторинг температурного режима с помощью MSI Afterburner:
После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 76 градусов, что является удовлетворительным результатом для видеокарт такого уровня. Максимальное энергопотребление достигло 295 Вт. Максимальный нагрев микросхем памяти составил 85 градусов.
Мы засняли и ускорили в 50 раз 8-минутный прогрев:
Максимальный нагрев наблюдался в районе преобразователей питания (как ядра, так и памяти).
Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.
- Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
- Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
- Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark
Оценка градаций уровня шума следующая:
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
В режиме простоя в 2D температура была не выше 50 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.
При просмотре фильма с аппаратным декодированием ничего не менялось.
В режиме максимальной нагрузки в 3D температура достигала 76 °C. Вентиляторы при этом раскручивались до 2000 оборотов в минуту, шум вырастал до 34,0 дБА: это отчетливо слышно. В видеоролике ниже хорошо видно, как растет шум (он фиксировался на пару секунд через каждые 30 секунд).
В целом такой шумовой режим можно считать приемлемым.
Подсветка
Подсветка у карты многоцветная, ARGB, реализована в виде широкой полосы, идущей по диагонали поперек СО.
Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой Thunder Master.
К сожалению, выбор режимов весьма скудный.
В целом программное управление подсветкой карты может предложить неплохое сочетание эффектов, особенно совместно с подсветкой материнских плат или корпуса. К сожалению, синхронизации работы с утилитами управления для материнских плат известных производителей не предусмотрено.
Комплект поставки и упаковка
Комплект поставки, кроме традиционного руководства пользователя, включает мало кому нужный сейчас переходник питания с 6-контактных разъемов на один 8-контактный. Имеется небольшой бонус в виде фирменного календарика.
Тестирование: синтетические тесты
Конфигурация тестового стенда
- Компьютер на базе процессора AMD Ryzen 9 5950X (Socket AM4):
- Платформа:
- процессор AMD Ryzen 9 5950X (разгон до 4,6 ГГц по всем ядрам);
- ЖСО Cougar Helor 240;
- системная плата Asus ROG Crosshair Dark Hero на чипсете AMD X570;
- оперативная память TeamGroup T-Force Xtreem ARGB (TF10D48G4000HC18JBK) 32 ГБ (4×8) DDR4 (4000 МГц);
- SSD Intel 760p NVMe 1 ТБ PCI-E;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
- блок питания Seasonic Prime 1300 W Platinum (1300 Вт);
- корпус Thermaltake Level20 XT;
Набор синтетических тестов продолжает постоянно меняться, добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.
Мы полностью отказались от ранее активно использовавшихся нами тестов RightMark3D, так как они устарели слишком сильно, и на столь мощных GPU или не запускаются вообще, или упираются в различные ограничители, не загружая работой блоки графического процессора и не показывая его истинную производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что оставили в полном составе, так как заменить их попросту нечем, хотя и они уже изрядно устарели.
Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), хотя и они тоже постепенно изживают себя, а также несколько разнообразных тестов для измерения производительности трассировки лучей, программной и аппаратной. В качестве полусинтетических тестов у нас также используется и несколько подтестов из популярного пакета 3DMark, включая Time Spy и другие.
Синтетические тесты проводились на следующих видеокартах:
- GeForce RTX 3070 Ti со стандартными параметрами (RTX 3070 Ti)
- GeForce RTX 3080 со стандартными параметрами (RTX 3080)
- GeForce RTX 3070 со стандартными параметрами (RTX 3070)
- GeForce RTX 2080 Ti со стандартными параметрами (RTX 2080 Ti)
- GeForce RTX 2080 Super со стандартными параметрами (RTX 2080 Super)
- Radeon RX 6800 со стандартными параметрами (RX 6800)
Для анализа производительности новой видеокарты GeForce RTX 3070 Ti мы выбрали несколько моделей компании Nvidia из двух последних поколений. Хотя для сравнения с прошлым поколением правильнее было бы взять GeForce RTX 2070 Super аналогичного позиционирования, мы решили выбрать модели RTX 2080 Super и RTX 2080 Ti, как самые мощные Turing. А из текущего поколения выбрали RTX 3070 и RTX 3080, которые находятся в нынешней линейке ниже и выше новинки. Особенно интересно будет узнать, насколько быстрее RTX 3070 Ti получилась относительно «простой» не-Ti версии.
А вот соперник из стана компании AMD в этот раз всего лишь один. Единственным ценовым конкурентом для GeForce RTX 3070 Ti является Radeon RX 6800 с чуть меньшей рекомендованной ценой, поэтому именно эту модель мы и взяли для сравнения. Остальные графические процессоры архитектуры RDNA второго поколения имеют рекомендованную цену заметно выше, чем у сегодняшней новинки, хотя рыночные странности и могут привести к обратной ситуации.
Мы традиционно рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они все же получаются несколько заниженными для некоторых GPU. Полная версия GA104 в исполнении RTX 3070 Ti хоть и имеет чуть больше текстурных модулей, по сравнению с урезанной моделью в RTX 3070, но никакой разницы между ними мы не обнаружили. Что касается RTX 3080, то вполне понятно, что она далеко впереди.
Сравнение новинки с единственным конкурентом AMD продолжает выводы прошлых сравнений. Скорость текстурирования у нового семейства Radeon из-за большого количества текстурных блоков весьма высока, с количеством TMU в архитектуре RDNA 2 все отлично. Radeon обычно имеют большее количество блоков текстурирования и с такими задачами почти всегда справляются лучше видеокарт конкурента с аналогичным ценовым позиционированием. Поэтому новинка весьма далека от RX 6800 в этом тесте.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.
Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP, вот и в этом случае разницы между RTX 3070 Ti и RTX 3070 нет, и в этот раз ситуация объясняется тем, что блоков ROP в двух модификациях GA102 одинаковое количество.
Видеокарты компании Nvidia по пиковой скорости заполнения сцены почти всегда были не так хороши, вот и GeForce RTX 3070 Ti уступила единственному Radeon в сравнении. Видеокарты AMD в этом тесте всегда имеют отличные показатели, и RX 6800 снова обогнала все представленные GeForce.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем часто неплохо коррелируют с тем, что получается в игровых тестах.
Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce RTX 3070 Ti. снова показала результат ровно на уровне RTX 3070. Получается, что никакие увеличения теоретических показателей в этом тесте не привели к росту производительности. Неужели все упирается в филлрейт, ведь блоков ROP у карт одинаковое количество? Что касается RTX 3080, то она заметно быстрее, то же самое получается, если сравнивать RTX 3070 Ti с RX 6800. Графические процессоры AMD и в этом тесте всегда были сильны, поэтому неудивительно, что RX 6800 оказалась быстрее даже чем RTX 3080.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы давно уже получаем явно некорректные результаты в этом тесте, поэтому учитывать результаты всех видеокарт GeForce тут просто нет смысла, они просто неверны. И модель RTX 3070 Ti ничего не изменила, так как дело в драйверах, которые одинаковы для всех GPU. И никто уже не оптимизирует их для столь древнего тестового пакета.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они хотя бы чуть ближе к истине, чем в прошлом подтесте этого же бенчмарка. Но рассматриваемая сегодня видеокарта Nvidia и в этот раз показала результат точно как у RTX 3070. Ну а явными лидерами являются видеокарты Radeon, особенно семейства RX 6000. Впрочем, результаты решений Nvidia в этом подтесте некорректны, так что смысла в их анализе немного.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно близка к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, и новая архитектура Ampere должна бы раскрыть свои уникальные возможности, но тест слишком устарел и не показывает современные GPU с лучшей стороны.
Снова удивляемся тому, что RTX 3070 Ti оказалась ровно на уровне RTX 3070 — просто чертовщина какая-то, так быть не должно. Получается, из всех шести подтестов 3DMark Vantage мы вообще ничего не поняли. Похоже, скоро и этот тест придется выкидывать из набора синтетики. Новинка чуть уступает конкурирующему решению компании AMD на основе архитектуры RDNA 2, которые в этом тесте обычно не столь сильны. Рассмотрим более современные тесты, использующие повышенную нагрузку на GPU.
Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.
В первом Direct3D11-тесте новая GeForce RTX 3070 Ti чуть опередила RTX 3070, но снова весьма незначительно, так что тест явно не упирается в математическую производительность. RTX 3080 впереди, а еще дальше Radeon RX 6800, опередившая все карты Nvidia. Правда, по опыту предыдущих тестов мы знаем, что GeForce в этом тесте выступают не очень хорошо. Да и, судя по крайне высокой частоте кадров, вычисления в этом примере из SDK уже слишком просты для мощных видеокарт, и лучше рассматривать другие тесты.
Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.
Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU. С ними дела неплохо обстоят у решений Nvidia, но видеокарты семейств RDNA 1 и 2 заметно улучшили позиции конкурирующей компании, особенно топовые из серии Radeon RX 6000. Вот и RX 6800 опередила сегодняшнюю новинку. Если же рассматривать RTX 3070 Ti по сравнению с RTX 3070, то ее преимущество хотя бы есть, пусть и небольшое. Вероятно, что и эти тесты не слишком показательны.
Третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный. При тестировании мы использовали настройки по умолчанию.
Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. И вот тут разница есть именно из-за повышенной ПСП. Новая видеокарта GeForce RTX 3070 Ti имеет на треть больше ПСП, по сравнению с RTX 3070, поэтому показала результат явно лучше, чем у RTX 3070. Хотя RTX 3080 далеко впереди. Ну а единственная карта Radeon, представленная в нашем сравнении, оказалась чуть позади, на уровне RTX 3070. В этом тесте частота кадров также излишне высока — очередная задача постепенно стала слишком простой для современных GPU.
Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.
Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Ampere. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.
Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU в целочисленных вычислениях. Решения Nvidia лучше справляются с такими операциями, и в новой GeForce RTX 3070 Ti ничего не изменилось, поэтому она оказалась на уровне RTX 3070. А вот RTX 3080 заметно впереди. Единственная видеокарта Radeon модели RX 6800 оказалась сильно хуже всех GeForce — вероятно, дело в недостатке программной оптимизации в драйверах.
Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.
В этом тесте видеокарты Nvidia также всегда доминировали, и сегодняшний тест это подтверждает. Производительность в тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Наш предыдущий опыт говорит также и о сильном влиянии программной оптимизации драйвера на результаты теста, вот и сегодня получилось так, что новинка не просто обогнала RTX 3070, что нормально, но и RTX 3080, что явно объясняется улучшениями в драйверах. В этом смысле видеокартам AMD похвастать нечем, включая и новые решения архитектуры RDNA 2 — поэтому RX 6800 оказалась далека от всех видеокарт Nvidia.
Последний пример с поддержкой D3D12 — известный тест nBody Gravity. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.
По количеству кадров в секунду видно, что эта вычислительная задача непроста, хотя современные GPU справляются с ней заметно лучше предыдущих поколений. Сегодняшняя новинка GeForce RTX 3070 Ti, основанная на полной версии графического процессора GA104, показала результат чуть лучше, чем RTX 3070, что соответствует теории. RTX 3080 немного их опережает, ну а единственная Radeon в этой задаче явно не раскрыла свои возможности из-за недостатка программной оптимизации, поэтому очень сильно проиграла.
В качестве дополнительного вычислительного теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.
Если рассматривать производительность новой модели GeForce RTX 3070 Ti в этой задаче по сравнению с RTX 3070, то новинка быстрее примерно настолько, насколько должна быть по теории — порядка 5%-7%. Да и по сравнению с RTX 3080 она выглядит неплохо. А вот единственная в тесте модель Radeon все же впереди, и будет очень интересно посмотреть, какая ситуация сложится в игровых тестах, которые частенько неплохо коррелируют с TimeSpy. Пока же получается, что RTX 3070 Ti немного уступает RX 6800, но это без учета производительности трассировки лучей, к которой мы и переходим.
Одним из первых тестов производительности трассировки лучей стал бенчмарк Port Royal создателей известных тестов серии 3DMark. Этот тест работает на всех графических процессорах с поддержкой DirectX Raytracing API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей в двух режимах, а также традиционным для растеризации методом.
Бенчмарк показывает сразу несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и очень сильно загружает в том числе и мощные GPU. Но для сравнения производительности разных GPU в этой конкретной задаче тест отлично подходит. Тест всегда хорошо показывает как разницу в поколениях видеокарт Nvidia, так и разницу в подходах двух компаний.
Рассматриваемая сегодня модель RTX 3070 Ti проигрывает RTX 3080 и на несколько процентов опережает RTX 3070, как и должно быть по большинству теоретических показателей. Интересно, что с включением трассировки лучей большей сложности, разница между Ti и не-Ti моделями чуть снижается, но это всегда 5%-7%. А вот конкурент в виде RX 6800 явно отстает при включении трассировки, хотя опережает в тесте растеризации. Это неудивительно — трассировка лучей в его исполнении явно менее эффективна, а вот традиционная растеризация удается решению AMD несколько лучше.
Позднее вышел еще один подтест 3DMark, направленный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего, он не гибридный, и не использует растеризацию вовсе, а только трассировку лучей, поэтому гораздо лучше отражает скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке используется уже известная нам по другим подтестам 3DMark, и она довольно небольшая — BVH-структура в теории может поместиться в Infinity Cache, что может помочь новым видеокартам серии Radeon RX 6000.
GeForce RTX 3070 Ti совсем немного опередила RTX 3070, основанную на том же чипе, но урезанном, и обе они заметно медленнее, чем RTX 3080. Хорошо заметно улучшение в RT-ядрах по сравнению с RTX 2080 Super из прошлого поколения, которая почти в полтора раза медленнее. Что касается конкурента AMD, то RX 6800 прилично уступает новинке и конкурентом в таких задачах ей не будет. Выделенные RT-ядра Nvidia, использующие модель MIMD, выполняют заметно большую часть работы и более универсальны, они не теряют в производительности при включении трассировки так сильно, как ядра Ray Accelerator + обычные SIMD-ядра у решений AMD.
Переходим к полусинтетическим бенчмаркам, которые сделаны на игровых движках, и соответствующие проекты должны выйти в скором времени. Первым тестом стал Boundary — один из китайских игровых проектов с поддержкой DXR и DLSS. Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Также в тесте используется технология DLSS, качество которой можно настраивать, и мы протестировали два варианта — без DLSS, чтобы сравнить с AMD Radeon, и с максимально возможным качеством для DLSS.
Без включения DLSS даже в Full HD-разрешении приемлемо работают только мощные видеокарты серии GeForce RTX 30, а вот RX 6800 сильно отстает от них, а 4K-разрешение на всех GPU просто неиграбельно. Новая модель RTX 3070 Ti снова лишь чуть опередила RTX 3070, что вполне объяснимо, хотя разница между ними ниже ожидаемой нами. Результаты Radeon RX 6800 показали все то же самое — в тестах трассировки лучей они не могут конкурировать с GPU Nvidia. Тем более, что у них есть еще и поддержка DLSS:
4K-разрешение даже с DLSS остается недоступным для всех, кроме старших видеокарт линейки RTX 30, тем более, что можно использовать и менее качественный вариант этой технологии. Результат новой GeForce RTX 3070 Ti оказался снова лишь чуть лучше, чем у RTX 3070, ну а RTX 3080 далеко впереди, что объяснимо теоретически. Новинка может и не позволит комфортно играть в 4K при максимальных настройках с включением DLSS, но разрешение типа 2560×1440 ей точно под силу. А ведь именно это и обещает компания Nvidia.
Рассмотрим еще один полуигровой бенчмарк, также основанный на грядущей китайской игре — Bright Memory. Интересно, что оба теста довольно похожи по результатам и по качеству изображения, хотя по тематике они совсем разные. И все же этот бенчмарк даже еще чуть более требователен, особенно конкретно к производительности трассировки лучей. Жаль, что на видеокартах AMD он не работает, требуя именно Nvidia RTX.
В этом тесте новая модель на полноценном графическом процессоре GA104 показала ожидаемый результат, опередив RTX 3070 уже заметно сильнее, но RTX 3080 в высоком разрешении все равно далеко впереди. Вероятно, на результатах сказывается пропускная способность памяти, а вот в ее объем мы пока что так и не уперлись, и 8 ГБ пока хватает. Что касается разницы между RTX 3070 Ti и RTX 2080 Super, то новинка оказалась значительно быстрее старой модели даже более высокого рыночного позиционирования.
Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.
Рассматриваемая модель GeForce RTX 3070 Ti явно обходит RTX 3070 примерно настолько, насколько и должна по теории — на 5%-7%. Удивляет лишь то, что с увеличением сложности они сближаются. А вот RTX 3080 впереди них довольно далеко. Результат новинки позволяет ей опередить конкурирующий Radeon, и особенно хорошо это заметно по самому сложному подтесту, отставание RX 6800 в котором получилось более чем полуторакратным.
И все это при том, что никакие аппаратные возможности по ускорению трассировки лучей тест не использует. По сравнению с Turing (да и RDNA), подобные математически-интенсивные нагрузки с большим влиянием кэширования лучше подходят для новой архитектуры Ampere, и в этом тесте новые GPU выступают лучше предшественников аналогичной сложности и цены. Если сравнить новинку с RTX 2080 Ti, то хорошо видно, что она заметно быстрее решения поколения Turing.
Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества новых видеокарт. В прошлых тестах мы использовали разные версии бенчмарка: которая выдает результат в виде времени, затраченного на рендеринг и в виде количества миллионов просчитанных путей за секунду.
Этот тест также показывает программную трассировку лучей, но на решениях архитектуры RDNA 2 нам не удалось запустить тест, к сожалению, поэтому сравнения с Radeon RX 6800 не будет. Новая модель GeForce RTX 3070 Ti оказалась быстрее RTX 3070 более чем на 11%, что говорит об упоре производительности в ПСП, которая у новинки на треть выше. Более мощная RTX 3080 еще быстрее. Очередной ожидаемый результат в сложных вычислительных тестах для нового представителя архитектуры Ampere, который чуть ли не вдвое опередил лучшее решение предыдущего поколения — RTX 2080 Ti.
Ну и еще одно приложение рендеринга — OctaneRender. Это довольно популярный рендерер, который можно использовать в большинстве приложений для создания 3D-контента, а главное, что он использует возможности CUDA и RTX, а версия OctaneRender 2020.1.5 получила поддержку Ampere. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестирует производительность сразу в нескольких тестовых сценах, отличающихся по нагрузке. Увы, но OpenCL тестом и рендерером не поддерживается. Приведем общее количество очков:
Новая модель GeForce RTX 3070 Ti ожидаемо опередила условную предшественницу в виде RTX 3070, и разница составила 10%-11% как в случае чисто программного расчета, так и с применением аппаратного ускорения. Похоже, что в вычислительных задачах новинка на фоне RTX 3070 выступает лучше, чем в растеризационных задачах. Отставание от RTX 3080 вполне ожидаемо, как и разница между семействами RTX 30 и RTX 20. Включение аппаратного ускорения RTX заметно сильнее сказывается на результатах Ampere — в этом виновата и повышенная производительность RT-ядер второго поколения, а также удвоенный темп FP32-вычислений и изменения в системе кэширования. Поэтому новая среднеценовая RTX 3070 Ti оказалась заметно быстрее лучшего решения архитектуры Turing.
Мы решили включать в материалы отдельный тест второй версии технологии DLSS, хотя ранее уже были проведены тесты с применением DLSS в приложениях с трассировкой лучей, мы посчитали полезным сделать и отдельное тестирование в разрешении 4K. Рассмотрим результаты четырех GPU компании Nvidia в популярном разрешении с включением технологии DLSS максимально возможного качества:
Без включения DLSS 2.0, рендеринг производится в полном разрешении, что очень сильно сказывается на производительности, и этого уровня FPS явно недостаточно и в случае RTX 3080, не говоря о менее мощных GPU. Именно поэтому для таких решений, как сегодняшняя новинка, технология DLSS весьма полезна. RTX 3070 Ti в этом тесте опередила RTX 3070, как и должна была, ну а RTX 3080 ожидаемо далеко впереди. Если же сравнить новую видеокарту с лучшей платой из семейства Turing, то если без включения DLSS разница была невелика, то снижение внутреннего разрешения рендеринга заметно улучшило показатели RTX 2080 Ti, и вот они уже примерно на одном уровне.
Недавно мы ввели еще один раздел неграфических вычислений на GPU — криптографические вычисления, а раньше тут был еще и связанный с ними майнинг криптовалют, но теперь они выделены в практические тесты, наряду с игровыми. Так что в подразделе осталось только одно приложение — hashcat. Это очень быстрый инструмент для «восстановления паролей» (ну, или их взлома, хотя такое наименование разработчики не любят, конечно). Программное обеспечение использует как возможности CPU, так и GPU при помощи OpenCL, а алгоритмов хэширования поддерживается очень много, среди них хэши Microsoft LM, MD4, MD5, семейство SHA, форматы Unix Crypt, MySQL и Cisco PIX.
Многие алгоритмы можно взломать («восстановить») за короткое время при помощи ускорения подбора на графическом процессоре. Кроме банальной атаки «грубой силой» (brute-force), поддерживаются маски — например, стандартная маска для многих паролей в виде первой заглавной буквы и двух или четырех цифр в конце, обозначающих год. На GPU подобные задачи исполняются очень быстро — заметно быстрее, чем на CPU, и ненадежные пароли взломать становится гораздо проще.
Результаты вполне соответствуют ожиданиям, если смотреть по теоретическим показателям увеличения вычислительной производительности. Новая модель RTX 3070 Ti быстрее старой RTX 3070 не так уж много, что соответствует теории. Правда, был шанс, что будет упор в скорость памяти, но нет, это не майнинг эфира. RTX 3080 далеко впереди, как и должна по теории. Radeon RX 6800 показала скорость вычислений на уровне RTX 3070 и RTX 3070 Ti, как и ее старшие собратья. При майнинге должно было получиться схожее соотношение сил, но Nvidia урезала хэшрейт RTX 3070 Ti при майнинге эфира, и поэтому она должна отставать от соперника при добыче криптовалюты. Вы можете увидеть практические тесты майнинга на новом GPU после игровых тестов.
Тестирование: игровые тесты
Список инструментов тестирования
Во всех играх использовалось максимальное качество графики в настройках.
- Hitman III (IO Interactive/IO Interactive)
- Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.2
- Death Stranding (505 Games/Kojima Productions)
- Assassin’s Creed Valhalla (Ubisoft/Ubisoft)
- Watch Dogs: Legion (Ubisoft/Ubisoft)
- Control (505 Games/Remedy Entertainment)
- Godfall (Gearbox Publishing/Counterplay Games)
- Resident Evil Village (Capcom/Capcom)
- Shadow of the Tomb Raider (Eidos Montreal/Square Enix), HDR включен
- Metro Exodus (4A Games/Deep Silver/Epic Games)
Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −7,0 −10,9 −14,0 GeForce RTX 3070 Ti GeForce RTX 3070 +8,1 +7,5 +7,7 GeForce RTX 3070 Ti Radeon RX 6800 −7,3 −10,0 −15,5 GeForce RTX 3070 Ti Radeon RX 6800 XT −16,8 −20,8 −27,9 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −12,7 −14,9 −16,9 GeForce RTX 3070 Ti GeForce RTX 3070 +5,5 +6,8 +8,9 GeForce RTX 3070 Ti Radeon RX 6800 +6,7 −1,6 0,0 GeForce RTX 3070 Ti Radeon RX 6800 XT −10,3 −16,0 −10,9 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −1,2 −6,0 −17,0 GeForce RTX 3070 Ti GeForce RTX 3070 +5,0 +7,6 +10,7 GeForce RTX 3070 Ti Radeon RX 6800 +1,2 +4,4 +2,5 GeForce RTX 3070 Ti Radeon RX 6800 XT −5,6 −2,1 −15,3 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −5,4 −6,3 −5,5 GeForce RTX 3070 Ti GeForce RTX 3070 +4,8 +4,2 +8,3 GeForce RTX 3070 Ti Radeon RX 6800 −16,2 −14,0 −5,5 GeForce RTX 3070 Ti Radeon RX 6800 XT −24,8 −20,4 −16,1 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −9,6 −15,6 −17,6 GeForce RTX 3070 Ti GeForce RTX 3070 +2,4 +3,2 +5,0 GeForce RTX 3070 Ti Radeon RX 6800 +2,4 −4,4 +2,4 GeForce RTX 3070 Ti Radeon RX 6800 XT −4,5 −13,3 −12,5 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −16,9 −11,9 −23,5 GeForce RTX 3070 Ti GeForce RTX 3070 +10,3 +9,9 +8,3 GeForce RTX 3070 Ti Radeon RX 6800 −1,7 +11,3 +2,6 GeForce RTX 3070 Ti Radeon RX 6800 XT −11,3 0,0 −11,4 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −18,3 −16,0 −17,2 GeForce RTX 3070 Ti GeForce RTX 3070 +6,8 +8,2 +9,1 GeForce RTX 3070 Ti Radeon RX 6800 −23,0 −13,2 −9,4 GeForce RTX 3070 Ti Radeon RX 6800 XT −28,2 −22,5 −22,6 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −13,7 −16,1 −19,0 GeForce RTX 3070 Ti GeForce RTX 3070 +7,1 +7,6 +8,0 GeForce RTX 3070 Ti Radeon RX 6800 −19,0 −18,0 −11,0 GeForce RTX 3070 Ti Radeon RX 6800 XT −28,7 −27,7 −22,1 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −2,4 −18,5 −24,8 GeForce RTX 3070 Ti GeForce RTX 3070 +5,1 +9,8 +10,1 GeForce RTX 3070 Ti Radeon RX 6800 +0,8 +3,1 −8,4 GeForce RTX 3070 Ti Radeon RX 6800 XT −6,8 −17,9 −20,8 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −1,5 −5,6 −16,7 GeForce RTX 3070 Ti GeForce RTX 3070 +4,1 +7,4 +9,1 GeForce RTX 3070 Ti Radeon RX 6800 −0,8 0,0 +3,4 GeForce RTX 3070 Ti Radeon RX 6800 XT −0,8 −4,7 −18,9 В таких играх в целом RTX 3070 Ti на 5%-10% производительнее, нежели RTX 3070, однако до RTX 3080 ему далеко (тут даже быстрая GDDR6X-память не поможет: все-таки ядро GA104 значительно слабее по блокам, чем GA102). Что касается соперничества с Radeon, то если раньше RX 6800 практически всегда опережал RTX 3070, то RTX 3070 Ti приблизился к RX 6800, иногда даже догоняя его.
Большинство игр все еще не поддерживают технологию трассировки лучей, также на рынке еще очень много видеокарт, аппаратно не поддерживающих RT. То же самое справедливо и для «умной» технологии антиалиасинга Nvidia DLSS. Поэтому самые массовые тесты мы по-прежнему проводим в играх без трассировки лучей. Тем не менее, на сегодня уже половина из регулярно тестируемых нами видеокарт поддерживает технологию RT, поэтому мы проводим тесты не только с использованием обычных методов растеризации, но и с включением RT и/или DLSS. Понятно, что в этом случае видеокарты семейства AMD Radeon RX 6000 участвуют в тестах без аналога DLSS.
Результаты тестов с включенной аппаратной трассировкой лучей (и DLSS) в разрешениях 1920×1200, 2560×1440 и 3840×2160
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −10,0 −13,6 −17,6 GeForce RTX 3070 Ti GeForce RTX 3070 +8,6 +8,6 +7,7 GeForce RTX 3070 Ti Radeon RX 6800 +103,2 +81,0 +133,3 GeForce RTX 3070 Ti Radeon RX 6800 XT +65,8 +40,7 +86,7 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −12,1 −12,9 −17,0 GeForce RTX 3070 Ti GeForce RTX 3070 +7,4 +8,0 +8,3 GeForce RTX 3070 Ti Radeon RX 6800 +180,6 +157,1 +225,0 GeForce RTX 3070 Ti Radeon RX 6800 XT +128,9 +100,0 +160,0 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −0,6 −2,4 −2,9 GeForce RTX 3070 Ti GeForce RTX 3070 +1,2 +5,1 +9,1 GeForce RTX 3070 Ti Radeon RX 6800 +3,0 +20,6 +63,0 GeForce RTX 3070 Ti Radeon RX 6800 XT −3,9 +13,1 +34,7 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −18,0 −15,7 −10,3 GeForce RTX 3070 Ti GeForce RTX 3070 +4,2 +4,9 +8,3 GeForce RTX 3070 Ti Radeon RX 6800 +22,0 +26,5 +36,8 GeForce RTX 3070 Ti Radeon RX 6800 XT −2,0 +7,5 +8,3 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −15,4 −13,6 −16,7 GeForce RTX 3070 Ti GeForce RTX 3070 +3,0 +3,5 +2,0 GeForce RTX 3070 Ti Radeon RX 6800 +153,7 +161,8 +163,2 GeForce RTX 3070 Ti Radeon RX 6800 XT +103,9 +122,5 +108,3 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −23,7 −24,2 −21,9 GeForce RTX 3070 Ti GeForce RTX 3070 +10,9 +11,1 +8,7 GeForce RTX 3070 Ti Radeon RX 6800 +42,0 +51,5 +38,9 GeForce RTX 3070 Ti Radeon RX 6800 XT +16,4 +28,2 +13,6 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −19,5 −18,6 −14,3 GeForce RTX 3070 Ti GeForce RTX 3070 +10,3 +10,7 +11,6 GeForce RTX 3070 Ti Radeon RX 6800 +114,0 +151,5 +166,7 GeForce RTX 3070 Ti Radeon RX 6800 XT +75,4 +112,8 +118,2 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −18,5 −16,0 −16,4 GeForce RTX 3070 Ti GeForce RTX 3070 +6,3 +12,7 +10,9 GeForce RTX 3070 Ti Radeon RX 6800 +5,2 +9,9 +7,0 GeForce RTX 3070 Ti Radeon RX 6800 XT −6,5 −5,3 −7,6 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −8,9 −27,3 −19,0 GeForce RTX 3070 Ti GeForce RTX 3070 +5,7 +6,7 +8,5 GeForce RTX 3070 Ti Radeon RX 6800 +43,8 +39,1 +37,8 GeForce RTX 3070 Ti Radeon RX 6800 XT +29,6 +20,8 +24,4 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −10,7 −9,0 −20,0 GeForce RTX 3070 Ti GeForce RTX 3070 +5,6 +8,9 +10,3 GeForce RTX 3070 Ti Radeon RX 6800 +21,0 +22,0 +23,1 GeForce RTX 3070 Ti Radeon RX 6800 XT +11,9 +13,0 +3,2 Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce RTX 3070 Ti GeForce RTX 3080 −14,1 −13,8 −11,9 GeForce RTX 3070 Ti GeForce RTX 3070 +8,2 +7,8 +10,6 GeForce RTX 3070 Ti Radeon RX 6800 +27,4 +38,0 +100,0 GeForce RTX 3070 Ti Radeon RX 6800 XT +17,9 +27,8 +67,7 У Radeon RX 6000 мы по-прежнему видим очень серьезное падение производительности при активации технологии RT, в данном случае выигрышно смотрится не только RTX 3070 Ti, но и RTX 3070. Конечно, применение трассировки лучей в целом вызывает падение производительности у всех карт, поддерживающих данную технологию, однако у GeForce RTX 30 есть мощные отдельные блоки RT-ядер, а также имеется поддержка «умного» антиалиасинга DLSS, который помогает поднять скорость, компенсируя падение от включения RT (и даже выводя ускоритель «в плюс») за счет тоже отдельных тензорных ядер. Всего этого у продуктов AMD пока нет (ждем выхода обещанной технологии FidelityFX Super Resolution, хотя первые рассказы о ней не впечатляют).
Рейтинг iXBT.com
Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:
- Вариант рейтинга iXBT.com без включения RT
Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по самому слабому ускорителю — GeForce GTX 1650 (то есть сочетание скорости и функций GeForce GTX 1650 приняты за 100%). Рейтинги ведутся по 28 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят GeForce RTX 3070 Ti и его конкуренты.
Рейтинг приведен суммарно для всех трех разрешений.
№ Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб. 04 RX 6800 XT 16 ГБ, 2015—2401/16000 840 53 160 000 06 RX 6800 16 ГБ, 1815—2271/16000 740 49 150 000 07 Palit RTX 3070 Ti 8 ГБ Gaming Pro, 1770—1935/19000 710 42 170 000 08 RTX 3070 8 ГБ, 1725—1950/14000 660 42 158 000 09 RTX 2080 Ti 11 ГБ, 1635—1950/14000 650 39 165 000 Если мы рассматриваем классические игры (без трассировки лучей и DLSS), то RTX 3070 Ti в лице карты Palit прилично оторвался от флагмана предыдущего поколения RTX 2080 Ti и почти догнал RX 6800.
- Вариант рейтинга iXBT.com с включением RT
Рейтинг составлен по 8 тестам с применением технологии трассировки лучей и/или DLSS (результаты Radeon RX 6000 учтены только в 4 тестах без DLSS). На сегодня RT поддерживается ускорителями серий Nvidia GeForce RTX и AMD Radeon RX 6000. Этот рейтинг нормирован по GeForce RTX 2060 (то есть сочетание скорости и функций GeForce RTX 2060 приняты за 100%).
Рейтинг приведен суммарно для всех трех разрешений.
№ Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб. 04 Palit RTX 3070 Ti 8 ГБ Gaming Pro, 1770—1935/19000 250 15 170 000 05 RTX 3070 8 ГБ, 1725—1950/14000 230 15 158 000 06 RTX 2080 Ti 11 ГБ, 1635—1950/14000 220 13 165 000 11 RX 6800 XT 16 ГБ, 2015—2422/16000 160 10 160 000 15 RX 6800 16 ГБ, 1815—2271/16000 130 9 150 000 В играх с трассировкой лучей соперничество новых Radeon с GeForce RTX происходит на уровень ниже: даже RTX 3070 в рейтинге выше, чем RX 6800 XT и, тем более, RX 6800.
Рейтинг полезности
Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей. Учитывая возможности карты GeForce RTX 3070 Ti и ее явную нацеленность на использование в разрешениях уровня 2.5К и 4К, приводим рейтинг только для разрешения 3840×2160 (поэтому цифры в рейтинге iXBT.com иные). Для расчета рейтинга полезности использованы розничные цены на начало июня 2021 года.
Внимание! По известным причинам расчет рейтингов полезности сейчас стал бессмысленным, мы приводим эти рейтинги просто по традиции, но при сложившейся ситуации на рынке выводы на их основе делать нельзя. Опять же, для GeForce RTX 3070 Ti мы взяли ожидаемую розничную цену, а какой она будет в реальности, мы на момент подготовки обзора не знали.
- Вариант рейтинга полезности без включения RT
- Вариант рейтинга полезности с включением RT
Результаты тестирования в майнинге (mining, hashrate)
Для подсчета хэшрейта (hashrate) при майнинге «эфира» (Ethereum/ETH/ETC) и «вороны» (Ravencoin/RVN) использовался майнер T-Rex (0.20.04), фиксировался средний показатель за 2 часа в двух режимах:
- по умолчанию (лимит потребления снижен до 70%, частота GPU снижена на 200 МГц, частота памяти по умолчанию, вентиляторы выставлены в ручном режиме на 70%)
- оптимизация (лимит потребления снижен до 70%, частота GPU снижена на 200 МГц, частота памяти повышена на 500—1000 МГц (в зависимости от карты), вентиляторы выставлены в ручном режиме на 80%)
Для тестирования GeForce RTX 3060 использовался тот самый «утекший» драйвер версии 470.05, в котором отключена защита от майнинга, с другими версиями драйвера его хэшрейт составляет 24/26 MH/s.
Тесты подтверждают, что защита от майнинга по алгоритму ethash реально работает, сбрасывая хэшрейт в 2 раза. В итоге GeForce RTX 3070 Ti демонстрирует эффективность майнинга ETH/ETC на уровне GeForce RTX 2070 Super и отстает от Radeon RX 5700, имея при этом существенно более высокую стоимость.
ETH с настройками по умолчанию
При настройках по умолчанию частота памяти не достигает номинальных эффективных частот в 19 ГГц, оставаясь на уровне 18,5 ГГц, и при этом нагрев микросхем памяти достигал 82 °C (при работе СО в режиме по умолчанию). Если задействовать оптимизированные безопасные настройки для майнинга, хэшрейт поднимается не сильно.
ETH с оптимизацией
Посмотрим теперь на алгоритм kawpow, на котором базируется Ravencoin — монета, которая за последнее время сильно выросла в популярности. Переход на нее очень прост, ею торгуют все биржи, популярные пулы также принимают майнинг по ней. Да и в майнере T-Rex потребуется лишь скорректировать батник.
RVN с настройками по умолчанию
Хэшрейт по RVN в целом (см. на диаграмме выше) примерно в 2 раза ниже, чем хэшрейт по ETH (35 MH/s у GeForce RTX 3070 Ti — это не половинный, а полноценный хэшрейт по RVN). То есть защита от майнинга в данном случае не работает. При этом частота памяти снова не достигла номинала, а вот нагрев памяти резко вырос — до 90 градусов на GDDR6X. Безопасная оптимизация почти ничего не добавила — видимо, с учетом потенциального перегрева такой памяти.
RVN c оптимизацией
Таким образом, мы снова получили два вывода (как и в случае с GeForce RTX 3080 Ti):
- Защита работает только против алгоритма ethash, и если вскоре майнить на видеокартах начнут по другому алгоритму (например, kawpow или octopus), то защита будет сведена к нулю.
- Видеокарты семейства GeForce RTX 3080/3080 Ti/3090 Founders Edition очень плохо годятся для майнинга, ибо перегрев памяти GDDR6X происходит даже в случае приличного охлаждения внутри корпуса — надо ставить крайне агрессивное охлаждение с вытекающими проблемами шума. А вот видеокарты GeForce RTX 3070 Ti не достигают опасных пределов нагрева такой памяти.
Оптимизация настроек работы видеокарт под майнинг в нашем случае не предусматривает сильного разгона видеопамяти, также обязательным является внешний обдув видеокарт. Особо тщательно надо следить за нагревом GDDR6X у GeForce RTX 3070 Ti/3080/3080 Ti/3090, ибо максимум для этой памяти — 110 градусов, и она долго не проживет, постоянно работая в условиях нагрева выше 100 °C.
Выводы
Ранее мы убедились в том, что GeForce RTX 3080 Ti, топовый игровой продукт на сегодня (GeForce RTX 3090 все-таки предназначен не только для игр), подходит для игр в разрешении 4К при ультра-настройках графики с RT и DLSS, а его предшественник GeForce RTX 3080 обеспечивал достаточную скорость в том же 4К во всех играх без RT (а ряде игр — и с RT). В то же время GeForce RTX 3070 повторяет результат флагмана предыдущего поколения GeForce RTX 2080 Ti, который в 2018 году открыл разрешение 4К для геймеров, обеспечивая в нем приличную производительность при условии, что игрок не будет включать трассировку лучей без одновременного включения DLSS. Осенью 2020 года вышедший GeForce RTX 3070 поднял и эту планку, выдавая приемлемую производительность в 4К с использованием RT без DLSS и весьма хорошую скорость при сочетании RT c DLSS в ряде игр. Поэтому ускоренный вариант GeForce RTX 3070 в лице GeForce RTX 3070 Ti не только полностью «закрывает» разрешение 2.5К при любых настройках в играх, но и предлагает отменную играбельность в 4К. Да, самые сложные по графике игры с включением RT потребуют GeForce RTX 3080/3080 Ti, однако с GeForce RTX 3070 Ti все-таки уже можно уверенно смотреть на 4К, и владельцы таких мониторов или телевизоров могут присматриваться к новому ускорителю.
По производительности GeForce RTX 3070 Ti ближе к GeForce RTX 3070, чем к GeForce RTX 3080, а вот его условная цена находится посредине между ними: рекомендованная цена для США — 600 долларов, тогда как у GeForce RTX 3080 — 700, а у GeForce RTX 3070 — 500. (Понятно, что сейчас из-за жуткого дефицита видеокарт, в особенности серии GeForce RTX 30, все ценники в несколько раз выше рекомендованных.)
По логике ценообразования последних месяцев, GeForce RTX 3070 Ti должен стоить от 140 до 180 тысяч рублей (между GeForce RTX 3070 и GeForce RTX 3080 на момент подготовки обзора), хотя рекомендованная для российского рынка цена — 58 тысяч рублей. С начала 2021 года ценники определяются спросом майнеров, а не геймеров, и видеокарты стоят пропорционально их хэшрейту, а не возможностям в играх. С другой стороны, одной из главных «фишек» новых Ti-модификаций GeForce RTX 30 является защита от майнинга. Правда, это не комплексная и полноценная защита от майнинга любой криптовалюты: алгоритмов очень много, отследить все — физически невозможно (вся мощь GPU будет уходить на анализ того, что же это такое на нем сейчас считается), да и новые монеты плодятся постоянно. Поэтому и GeForce RTX 3080 Ti, и GeForce RTX 3070 Ti, и выпускаемые с некоторых пор видеокарты на базе GeForce RTX 3060 Ti/3070/3080 оснащаются защитой лишь против самого популярного алгоритма ethash (для криптовалют ETH/ETC). Защита внедряется в новые LHR(Low/Lite Hash Rate)-видеокарты аппаратно: сам графический процессор используется прежний, но изменяется ID карты и убирается возможность прошивать альтернативный BIOS. Новые ID не поддерживаются прежними версиями драйверов, а все новые версии уже имеют встроенное определение алгоритма ethash, и судя по тому, что GeForce RTX 3060 с программной защитой до сих пор выдает полноценный хэшрейт на ethash только на утекшей версии драйверов 470.05, где этой защиты нет, взломать драйверы Nvidia пока никому не удалось. Это вселяет надежду. И поэтому мы в качестве предполагаемой цены GeForce RTX 3070 Ti взяли 170 тысяч рублей: майнят на видеокартах пока в основном Ethereum, а для него хэшрейт GeForce RTX 3070 Ti сравнительно невысокий, и майнерам этот продукт должен быть менее интересен. Почему 170 000, когда GeForce RTX 3070 (не LHR) уже можно найти за 140 тысяч? Дело в том, что аналогичная предварительная оценка GeForce RTX 3080 Ti в 200 000 рублей оказалась неверной: в реальности, несмотря на антимайнинговую подготовку этих карт, фактические цены начинались с 225 тысяч, уходя вверх за границы здравого смысла. Поэтому мы предполагаем, что начальные цены на GeForce RTX 3070 Ti тоже будут сильно завышены даже относительно GeForce RTX 3070.
В остальном с точки зрения технологий (в играх и не только) для GeForce RTX 3070 Ti актуально все не раз сказанное ранее в отношении архитектуры Nvidia Ampere. Прежде всего, конечно же, это хорошая играбельность: напомним, что GeForce RTX 3070 Ti обеспечивает полный комфорт в «классических» играх без использования трассировки лучей в разрешении 4К при условии максимального качества графики, то же самое справедливо и для игр с использованием трассировки лучей при задействовании умного антиалиасинга DLSS, а остальные игры с RT (но без DLSS) будут играбельны в 2.5K при максимальном качестве графики.
Кроме того, GeForce RTX 3070 Ti, как и все семейство GeForce RTX 30, предлагает поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение при 120 Гц при помощи одного кабеля, аппаратное декодирование видеоданных в формате AV1, технологию RTX IO, способную в будущем обеспечить быструю передачу и распаковку данных с накопителей прямо в GPU, а также технологию снижения задержек Reflex, полезную для киберспортсменов. Об этом мы не раз уже говорили.
Что касается рассмотренной видеокарты Palit GeForce RTX 3070 Ti Gaming Pro (8 ГБ) с точки зрения потребительских характеристик, то карта занимает три слота в системном блоке, но при этом ее длина менее 30 см, поэтому она уместится почти в любой корпус. СО отличается хорошей эффективностью — правда, она и шумновата. У карты отличная система питания, но ручной разгон практически невозможен из-за жесткого лимита по энергопотреблению. Стоит отметить стильный внешний вид с диагональной подсветкой.
Напомним, что все новые продукты Nvidia — GeForce RTX 3080 Ti, GeForce RTX 3070 Ti, LHR-версии предыдущих моделей — имеют поддержку Resizable Bar (надо лишь обновить BIOS материнской платы, чтобы эта функциональность PCIe была включена). То есть новое поколение видеокарт GeForce RTX 30 имеет ту же прибавку в скорости, что и видеокарты семейства Radeon RX 6000, поскольку их технология AMD Smart Access Memory — это и есть Resizable Bar.
В заключение еще раз констатируем: Nvidia GeForce RTX 3070 Ti прекрасно подходит для игр с максимальным качеством графики в разрешении 2.5К без условий и ограничений, а также для разрешения 4К в играх без трассировки лучей или с RT + DLSS.
В номинации «Оригинальный дизайн» плата Palit GeForce RTX 3070 Ti Gaming Pro (8 ГБ) получила награду:
Благодарим компанию Palit Russia
и лично Алексея Чебатко
за предоставленную на тестирование видеокартуБлагодарим компанию TeamGroup
и лично Ethnie Lin
за предоставленную оперативную память для тестового стендаДля тестового стенда:
процессор AMD Ryzen 9 5950X предоставлен компанией AMD, а также
материнская плата ROG Crosshair Dark Hero предоставлена компанией AsusОбзор видеокарты NVIDIA GeForce RTX 3070 Ti: продукт своего времени
Вместе с GeForce RTX 3080 Ti NVIDIA представила обновленную версию игрового ускорителя средне-высокой ценовой категории, который, если верить чипмейкеру, до сих пор был самым востребованным предложением во всей 30-й серии GeForce. В последнее утверждение легко поверить, ведь RTX 3070 развивает практически такой же уровень производительности в играх, как GeForce RTX 2080 Ti, за сумму вдвое меньше рекомендованной стоимости бывшего флагмана. По крайней мере так было бы в нормальных рыночных условиях, а на самом деле дефицит видеокарт взвинтил цены RTX 3070 аккурат до того уровня, на котором держались премиальные разновидности RTX 2080 Ti. Тем не менее даже с поправкой на аномальную рыночную ситуацию соотношение возможностей и стоимости GeForce RTX 3070 действительно выглядит привлекательнее, чем у старших моделей NVIDIA на чипах Ampere. Особенно если взять для сравнения свежий RTX 3080 Ti, который принес от силы 14 % дополнительного игрового быстродействия сверх уровня RTX 3080, а стоит, даже по официальным оценкам, на $500 больше.
В отличие от заново родившегося GeForce RTX 3080, RTX 3070 не имеет прямых конкурентов среди видеокарт AMD 6000-го семейства. С одной стороны находится более дешевый, но и сравнительно медленный Radeon RX 6700 XT, а с другой — Radeon RX 6800, который превосходит RTX 3070 по быстродействию в любых задачах, за исключением игр с рейтрейсингом и некоторых рабочих приложений, располагает вдвое большим объемом оперативной памяти, но одновременно и стоит заметно больше. Ну что ж, тем интереснее узнать, каким получился RTX 3070 Ti. Ведь для того чтобы претендовать на быстродействие, аналогичное уровню Radeon RX 6800 или выше, оригинальному RTX 3070 была необходима серьезная переработка.
⇡#Технические характеристики, цены
Базовая версия GeForce RTX 3070 комплектуется частично урезанным графическим процессором GA104, однако во всей 30-й серии, за исключением RTX 3090, нет другой модели, настолько близкой к полностью функциональной конфигурации GPU. Ускоритель лишился всего лишь двух потоковых мультипроцессоров (SM), которые в сумме содержат 256 CUDA-ядер для операций над числами FP32 стандартной точности и 8 блоков наложения текстур. Похоже, NVIDIA использовала урезанную формулу вычислительных компонентов скорее для того, чтобы увеличить выход годных кристаллов GA104, нежели для сегментации модельного ряда — настолько незначительной была потеря. Модификация Ti восстановила утраченные блоки, и заодно были увеличены рабочие частоты графического процессора: с 1725 до 1770 МГц по отметке Boost Clock.
Неужели этого достаточно, чтобы оправдать рождение новой модели 30-го семейства? Конечно же, нет, однако нам придется еще раз вернуться к особенностям оригинального RTX 3070. Как показали эксперименты с разгоном видеокарт на основе GA104 — GeForce RTX 3060 Ti и RTX 3070, их производительность лучше реагирует на повышение тактовых частот оперативной памяти, нежели самого графического процессора. Немудрено, ведь при быстродействии как у RTX 2080 Ti платы RTX 3070 комплектуются точной такими же микросхемами GDDR6 стандарта 14 Гбит/с, но процессор GA104 имеет сравнительно узкую 256-битную шину памяти вместо широкой 384-битной у TU102.
Предсказуемым решением проблемы могли бы стать быстрые чипы с номиналом 16 Гбит/с, ведь новые контроллеры VRAM позволяют выжать из GDDR6 даже большую пропускную способность. Однако RTX 3070 Ti перевели сразу на GDDR6X, хотя ранее NVIDIA не подтверждала, что GA104 умеет обращаться с такими микросхемами. Память GDDR6X в составе RTX 3070 Ti имеет пропускную способность в 19 Гбит/с на контакт, что при разрядности шины в 256 бит предоставляет GPU совокупную ПСП в размере 608 Гбайт/с — то есть сразу на 36 % больше, чем у оригинального RTX 3070.
Производитель NVIDIA Модель GeForce RTX 3060 GeForce RTX 3060 Ti GeForce RTX 3070 GeForce RTX 3070 Ti GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090 Графический процессор Название GA106 GA104 GA104 GA104 GA102 GA102 GA102 Микроархитектура Ampere Ampere Ampere Ampere Ampere Ampere Ampere Техпроцесс 8 нм (8N) 8 нм (8N) 8 нм (8N) 8 нм (8N) 8 нм (8N) 8 нм (8N) 8 нм (8N) Число транзисторов, млн 12 000 17 400 17 400 17 400 28 300 28 300 28 300 Тактовая частота, МГц: Base Clock / Boost Clock 1 320/1 777 1 410/1 665 1 500/1 725 1 575/1 770 1 440/1 710 1 365/1 665 1 395/1 695 Шейдерные ALU FP32 3 584 4 864 5 888 6 144 8 704 10 240 10 496 Блоки наложения текстур (TMU) 112 152 184 192 272 320 328 Блоки операций растеризации (ROP) 48 80 96 96 96 112 112 Тензорные ядра 112 152 184 192 272 320 328 RT-ядра 28 38 46 48 68 80 82 Оперативная память Разрядность шины, бит 192 256 256 256 320 384 384 Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 875 (15 000) 1 750 (14 000) 1 750 (14 000) 1 188 (19 000) 1 188 (19 000) 1 188 (19 000) 1 219 (19 500) Объем, Мбайт 12 288 8 192 8 192 8 192 10 240 12 288 24 576 Шина ввода/вывода PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 Производительность Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 12 738 16 197 20 314 21 750 29 768 34 099 35 581 Производительность FP64/FP32 1/32 1/32 1/32 1/32 1/32 1/32 1/32 Производительность FP16/FP32 1/1 1/1 1/1 1/1 1/1 1/1 1/1 Пропускная способность оперативной памяти, Гбайт/с 360 448 448 608 760 912 936 Вывод изображения Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 TBP/TDP, Вт 170 200 220 290 320 350 350 Розничная цена (США, без налога), $ 329 (рекоменд. в момент выхода) 399 (рекоменд. в момент выхода) 499 (рекоменд. в момент выхода) 599 (рекоменд. в момент выхода) 699 (рекоменд. в момент выхода) 1 199 (рекоменд. в момент выхода) 1 499 (рекоменд. в момент выхода) Розничная цена (Россия), руб. 32 990 (рекоменд. в момент выхода) 39 990 (рекоменд. в момент выхода) 45 490 (рекоменд. в момент выхода) 57 900 (рекоменд. в момент выхода) 63 490 (рекоменд. в момент выхода) 116 900 (рекоменд. в момент выхода) 136 990 (рекоменд. в момент выхода) Тестирование производительности RTX 3070 Ti станет лучшим экспериментом для того, чтобы оценить, какое преимущество дала ускорителям NVIDIA эксклюзивная разновидности SGRAM. Но даже по паспортным характеристикам новинки заметно, как сильно она увеличила другой параметр — энергопотребление. Теперь RTX 3070 развивает уже не скромные 220, а все 290 Вт мощности, и другому объяснению, кроме как аппетитам новой памяти, «жор» никак не поддается.
Еще одним свойством 256-битной шины VRAM, которое, увы, не исправишь сменой микросхем, стал неудобный выбор объема локальной памяти: либо 8, либо 16 Гбайт. Пока большинство игр все еще устраивает первый вариант даже при разрешении 4К, но такая конфигурация едва ли подходит дорогим видеокартам, которые приобретают с расчетом на долгое время без апгрейда, а ведь RTX 3070 Ti — далеко не середнячок по быстродействию. С другой стороны, 16 Гбайт пока кажутся избыточными для потребительской видеокарты.
В итоге GeForce RTX 3070 Ti и его основной соперник, Radeon RX 6800, производят впечатление очень разных устройств, каждое со своим набором достоинств и недостатков. Не подлежит сомнению, что RTX 3070 Ti обладает более высокой производительностью в играх с трассировкой лучей, не говоря уже о поддержке DLSS, однако в пользу RX 6800 говорит вдвое больший объем оперативной памяти и намного меньшее энергопотребление (в отличие от соперника, ему хватает 250 Вт мощности). Но NVIDIA, очевидно, уверена в преимуществе собственного продукта, иначе RTX 3070 Ti не назначили бы цену от $599 (или 57 990 в рублях), в то время как официальная стоимость RX 6800 составляет $579. Именно так сегодня следует воспринимать цены, озвученные чипмейкерами — как свидетельство возможностей того или иного продукта по сравнению с ближайшими аналогами, а не как конкретный ориентир. Вслед за RTX 3080 Ti младшая модель ограничена в возможностях майнинга, но сейчас видеокарты покупают за любые деньги, лишь бы их можно было найти в продаже, а сколько в действительности будет стоить новинка, вы узнаете уже завтра, когда по всему миру начнутся продажи.
Партнеры NVIDIA наладили выпуск RTX 3070 Ti по чертежам оригинального RTX 3070, однако в некоторых случаях им придется модифицировать конструкцию в соответствии с повышенным тепловыделением Ti и, что не менее важно, необходимостью усиленного охлаждения чипов GDDR6X. Одна из партнерских версий от популярной в России компании Palit — хороший тому пример.
⇡#Palit GeForce RTX 3070 Ti GamingPro: конструкция
Мы бы предпочли выполнить обзор RTX 3070 Ti, используя Founders Edition в качестве отправной точки, а уже потом заняться партнерскими моделями, но в данном случае можно не опасаться, что на результаты сравнительного тестирования повлияет заводской разгон GPU. Обновленная модификация GeForce RTX 3070 под маркой GamingPro представляет собой почти такую же видеокарту, как оригинальное издание RTX 3070 (но, разумеется, с иными спецификациями), и вследствие повышенного тепловыделения Ti производитель уже не нашел возможности установить тактовые частоты выше референсных значений.
Действительно, эстетика устройства и внешние детали системы охлаждения не претерпели ни малейших изменений. Похожим решением Palit комплектует и старшие видеокарты 30-й серии, включая RTX 3080 и RTX 3090. Единственные отличия от более дорогих моделей, заметные при поверхностном осмотре, — вес устройства и материал бэкплейта. Обратная сторона печатной платы RTX 3080 (а также Ti-версии) и RTX 3090 накрыта металлической пластиной, которая отводит тепло от текстолита или (в случае RTX 3090) дополнительных чипов оперативной памяти. Palit GeForce RTX 3070 GamingPro, не важно Ti или нет, довольствуется пластиковой крышкой, которая выполняет лишь декоративную функцию.
Как бы то ни было, система охлаждения Palit выглядит вполне адекватно для нового представителя 30-й серии, даже с учетом громадной разницы в потребляемой мощности между RTX 3070 и RTX 3070 Ti. Видеокарта занимает в корпусе компьютера больше двух слотов расширения, а радиатор обдувают три вентилятора диаметром 85 мм. Вместе со множеством других партнеров NVIDIA Palit взяла на вооружение эффективную схему организации воздушных потоков, когда значительная часть радиатора выходит за пределы площади компактной печатной платы и продувается одним из радиаторов насквозь. Через декоративную решетку в центре сияют RGB-светодиоды — неотъемлемая черта большинства современных видеокарт.
Внутри система охлаждения RTX 3070 Ti GamingPro устроена по тому же принципу, что и в предыдущей версии продукта. Крупный двухсекционный радиатор пронизан четырьмя теплотрубками, а снизу напаяна алюминиевая рама, которая придает всей конструкции необходимую жесткость и служит теплосъемником для других горячих компонентов — силовых каскадов и дросселей VRM. Однако у кулера новой модели есть важная особенность: теперь микросхемы оперативной памяти напрямую смыкаются с отполированным теплосъемником, а не с каркасом радиатора. Похоже, новый тип VRAM (а также возможность мониторинга температуры чипов по встроенным датчикам) побуждает производителей видеокарт обратить должное внимание на эту деталь конструкции — давно пора!
Комплектация устройства привычно скромная для видеокарт данной ценовой категории: в коробке GamingPro, помимо самого ускорителя, мы нашли только буклет документации, переходник с двух шестиконтактных разъемов питания на один восьмиконтактный и календарик на 2021 год.
⇡#Palit GeForce RTX 3070 Ti GamingPro: печатная плата
Электроника видеокарты Palit распаяна на печатной плате, которая представляет собой одну из вариаций референсного дизайна (не путать с платами Founders Edition, которые со времен 20-й серии GeForce не являются референсом ни номинально, ни фактически). Данная PCB позволяет выделить в общей сложности десять фаз для питания графического процессора — и все они задействованы в RTX 3070 Ti GamingPro (как, впрочем, и в оригинальном RTX 3070 того же производителя). Регулятор напряжения GPU содержит два ШИМ-контроллера: восьмифазный чип uP9512R от uPI Semiconductor и двухфазный uP1660Q. В качестве ключей VRM используются сборки AOZ5311NQI от Alpha & Omega с номинальным током 50 А.
Регулятор напряжения оперативной памяти по-прежнему двухфазный, на основе чипа uS5650Q. Главный сюрприз GeForce RTX 3070 Ti — это поддержка микросхем GDDR6X. Но еще сильнее удивляет тот факт, что для перехода на новый тип VRAM, знаменитый строгими требованиями к питанию и разводке сигнальных линий, не потребовалось вносить заметных изменений в схему референсной PCB. В данном случае используются чипы с номинальной пропускной способностью 19 Гбит/с — точно такие же, которые мы уже видели на плате GeForce RTX 3080 Ti. По всей видимости, настоящие сложности появляются вместе с большим количеством микросхем и широкой 320- или 384-битной шиной, свойственной старшим моделям 30-й серии.
⇡#Тестовый стенд, методика тестирования
Тестовый стенд CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота) Материнская плата ASUS MAXIMUS XI APEX Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14) ПЗУ Intel SSD 760p, 1024 Гбайт Блок питания Corsair AX1200i, 1200 Вт Система охлаждения CPU Corsair Hydro Series H115i Корпус CoolerMaster Test Bench V1.0 Монитор NEC EA244UHD Операционная система Windows 10 Pro x64 ПО для GPU AMD Все видеокарты AMD Radeon Software Adrenalin 2020 Edition 21.5.2 ПО для GPU NVIDIA GeForce RTX 3070 Ti NVIDIA GeForce Game Ready Driver 466.21 Остальные видеокарты NVIDIA GeForce Game Ready Driver 466.54 Игры без трассировки лучей Игра API Метод тестирования Настройки графики Полноэкранное сглаживание Assassin’s Creed Valhalla DirectX 12 Встроенный бенчмарк Макс. качество графики TAA High Cyberpunk 2077 DirectX 12 OCAT, скриптовая сцена после пролога Макс. качество графики TAA Borderlands 3 DirectX 12 Встроенный бенчмарк Макс. качество графики TAA Control DirectX 12 OCAT Макс. качество графики TAA DOOM Eternal Vulkan OCAT, начало миссии Mars Core Макс. качество графики TAA Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. Shading Rate 100% TAA Red Dead Redemption 2 Vulkan Встроенный бенчмарк Макс. качество графики TAA High Total War: THREE KINGDOMS DirectX 12 Встроенный бенчмарк (Battle Benchmark) Макс. качество графики TAA Watch Dogs: Legion DirectX 12 Встроенный бенчмарк Макс. качество графики TAA Игры с трассировкой лучей Игра API Метод тестирования Настройки графики Полноэкранное сглаживание/масштабирование Control DirectX 12 OCAT Макс. качество графики. Ray Tracing Preset: High TAA/DLSS 2.0 (Quality) Cyberpunk 2077 DirectX 12 OCAT, скриптовая сцена после пролога Макс. качество графики TAA/DLSS 2.0 (Quality) Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra TAA/DLSS 1.0 Minecraft with RTX Beta DirectX 12 OCAT, бенчмарк в мире Portal Pioneers Макс. дальность рендеринга MSAA 4x/DLSS 2.0 Quake II RTX Vulkan (расширения VK_KHR) Timedemo, demo1.dm2 Макс. качество графики TAA Watch Dogs: Legion DirectX 12 Встроенный бенчмарк Макс. качество графики TAA/DLSS 2.0 (Quality) В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если бенчмарка нет).
Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел берется значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк самостоятельно регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота. В Assassin’s Creed Valhalla мы вынуждены ориентироваться на минимальный фреймрейт по данным интегрированного бенчмарка.
Вычисления общего назначения, кодирование/декодирование видео Приложение Настройки API AMD NVIDIA AMD NVIDIA Adobe Premiere Pro CC 2020 PugetBench for Premiere Pro 0.88 GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS) OpenCL CUDA GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS) Blender 2.92 Демо Class Room с сайта Blender Foundation Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 OpenCL CUDA/OptX Демо Nissan GTR от AMD Рендерер AMD Radeon ProRender 3.1 OpenCL + Vulkan DXVA Checker 4.1.2, Decode Benchmark H.264 (Microsoft H264 Video Decoder) 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) D3D11VA H.265 (Microsoft HEVC Video Extensions) 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0) VP9 (Microsoft VP9 Video Extensions) 1920 × 1080; 3840 × 2160; 7680 × 4320 AV1 (Microsoft AV1 Video Extension) FFmpeg 4.2.1, кодирование H.264 1920 × 1080 -c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M -c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M AMF NVENC 3840 × 2160 -c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M -c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M FFmpeg 4.2.1, кодирование H.265 1920 × 1080 -c:v hevc_amf -quality speed -level 4 -b:v 3M -c:v hevc_nvenc -preset fast -level 4 -b:v 3M 3840 × 2160 -c:v hevc_amf -quality speed -level 5 -b:v 7.5M -c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M 7680 × 4320 Н/Д -c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M REDCINE-X PRO Декодирование файлов RED R3D с разрешением 4К, 6К и 8К — — OpenCL CUDA Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве тестовой нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.
⇡#Участники тестирования
В тестировании производительности приняли участие следующие видеокарты:
- NVIDIA GeForce RTX 3070 Ti (1575/1770 МГц, 19 Гбит/с, 8 Гбайт); ; ; ; ; ; ; .
Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты с заводским разгоном приведены в соответствие с референсными параметрами (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.
⇡#Тактовые частоты, энергопотребление, температура, уровень шума и разгон
В названии видеокарты Palit GeForce RTX 3070 Ti GamingPro нет аббревиатуры OC, и это заметно по тактовым частотам графического процессора. Полностью функциональный кристалл GA104 под игровой нагрузкой развивает устойчивую частоту 1874 МГц, тогда как даже базовая версия RTX 3070 в исполнении Founders Edition стабилизируется на уровне 1919 МГц. Но удивляться незначительному откату тактовых частот не стоит, ведь разница в энергопотреблении между этими ускорителями составляет внушительные 57 Вт. Вот, оказывается, насколько прожорлива оперативная память нового стандарта GDDR6X. Мы предполагали, что в резерв мощности RTX 3070 Ti заложена поправка на качество чипов GA104, лучшие из которых теперь отбираются для установки в мобильные ПК, однако выяснилось, что ядро свежей модели довольствуется практически таким же напряжением питания, как в обычном GeForce RTX 3070.
Рабочие параметры под нагрузкой (Crysis 3) Видеокарта Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.) Частота вращения вентиляторов 2, об/мин (% от макс.) Средн. Макс. Средн. Макс. Средн. Средн. Palit GeForce RTX 3070 Ti GamingPro (+100 МГц, 22 Гбит/с, 10 Гбайт) 1943 1980 1,02 1,08 2089 (54%) 2088 (54%) Palit GeForce RTX 3070 Ti GamingPro (1575/1770 МГц, 19 Гбит/с, 10 Гбайт) 1874 1905 1,02 1,07 2038 (53%) 2039 (53%) NVIDIA GeForce RTX 3070 FE (1500/1730 МГц, 14 Гбит/с, 8 Гбайт) 1919 1935 1,00 1,01 1767 (50%) 1766 (50%) NVIDIA GeForce RTX 3080 FE (1440/1710 МГц, 19 Гбит/с, 10 Гбайт) 1900 1920 1,04 1,06 1747 (49%) 1747 (52%) NVIDIA GeForce RTX 3080 Ti FE (1365/1665 МГц, 19 Гбит/с, 12 Гбайт) 1817 1890 0,9879 1,05 2108 (58%) 2108 (62%) NVIDIA GeForce RTX 3090 FE (1395/1695 МГц, 19,5 Гбит/с, 24 Гбайт) 1987 2010 1,04 1,08 1141 (43%) 1141 (43%) AMD Radeon RX 6700 XT (2321/2581 МГц, 16 Гбит/с, 12 Гбайт) 2432 2467 1,134 1,20 1510 (44%) Н/Д AMD Radeon RX 6800 (1700/2105 МГц, 16 Гбит/с, 16 Гбайт) 2076 2198 Н/Д Н/Д 1603 (48%) Н/Д AMD Radeon RX 6800 XT (1825/2250 МГц, 16 Гбит/с, 16 Гбайт) 2104 2182 1,15 1,15 1179 (35%) Н/Д AMD Radeon RX 6900 XT (1825/2250 МГц, 16 Гбит/с, 16 Гбайт) 2141 2291 1,066 1,18 998 (30%) Н/Д Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.
Хорошая новость для потенциальных владельцев продукта Palit состоит в том, что изменения, которые производитель внес в конструкцию кулера, сработали. Чипы GDDR6X при штатных настройках тактовых частот не прогреваются выше 78 °C в играх на открытом стенде. Что касается охлаждения GPU, то в BIOS ускорителя зашито стандартное ограничение на уровне 75 °С, а в самой горячей точке температура достигает также вполне приемлемых 88 °С.
Увы, без полной переработки системы охлаждения RTX 3070 невозможно справиться с другим неприятным следствием повышенного энергопотребления микросхем GDDR6X: видеокарта шумит громче любого из устройств, которые мы привлекли для сравнения (а это референсные модели AMD серии Radeon 6000 и NVIDIA Founders Edition).
Кроме того, GeForce RTX 3070 Ti GamingPro лишена возможности увеличить TBP для эффективного разгона графического процессора, поэтому все, что нам удалось выжать из GPU, — это еще 69 МГц средней тактовой частоты под игровой нагрузкой, что, разумеется, не имеет какого бы то ни было практического значения. А вот память GDDR6X, рассчитанная на пропускную способность 19 Гбит/с, достигла колоссальной величины в 22 Гбит/с. Ну что ж, это отличный повод выяснить, нуждается ли процессор GA104 в еще большей ПСП, чем та, что прописана в референсных спецификациях RTX 3070 Ti.
⇡#Игровые тесты (1920 × 1080)
Результаты первых же игровых тестов, при разрешении 1080p, оказались довольно-таки разочаровывающими. GeForce RTX 3070 Ti продемонстрировал примерно такое же быстродействие, которое можно выжать из базовой модели после агрессивного разгона GPU и VRAM (что, по большому счету, и сделала NVIDIA для того, чтобы получить версию Ti): в среднем обновленный ускоритель отделяют от оригинала 5 % игрового фреймрейта. Этого достаточно, чтобы укрепить позиции видеокарты по отношению к Radeon RX 6700 XT (разница между ними составляет 13 % FPS в пользу RTX 3070 Ti), но Radeon RX 6800 сохранил за собой среднее преимущество в 4 % частоты смены кадров.
- Платформа: