gamegpu     Search find 4120

 tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

GeForce RTX 4070 Ti

4070

GeForce RTX 4070 Ti основана на графическом процессоре AD104 и оснащена 7680 ядрами CUDA, обеспечивающими 40 шейдерных терафлопс с FP32 точностью для рендеринга графики, 240 тензорных ядер четвертого поколения, предлагающих 641 триллион операций на разреженных матрицах для обработки AI и DLSS, 60 RT-ядер третьего поколения архитектуры Ada с производительностью 93 RT-TFLOPS для ускорения графики следующего поколения с трассировкой лучей и 12 ГБ памяти GDDR6X. Как и все графические процессоры серии GeForce RTX 40, RTX 4070 Ti оснащена инновациями Ada, включая переупорядочивание выполнения шейдеров (SER), новый движок оптического потока, новые RT-ядра и DLSS 3.

ada 1

Архитектура NVIDIA Ada

Архитектура NVIDIA Ada — это гигантский скачок в производительности. Многочисленные улучшения делают её самой быстрой и передовой. RTX 4070 Ti изготавливается по индивидуальному техпроцессу TSMC 4N и содержит 35,8 миллиарда транзисторов и 7680 ядер CUDA. Аппаратное ускорение трассировки, тензорные ядра четвертого поколения для повышения производительности искусственного интеллекта, кодировщики восьмого поколения с поддержкой кодирования и декодирования AV1, а также улучшения DLSS, которые обеспечивают высокую частоту кадров в соревновательных играх и на ультра-настройках с включенной трассировкой лучей.

Потоковый мультипроцессор NVIDIA Ada

Видеокарты RTX имеют три основных процессора: программируемые универсальные CUDA ядра, на которых обрабатываются шейдеры и CUDA приложения общего назначения, RT-ядра для ускорения расчетов пересечений лучей с треугольниками и ограничивающими объемами, в RT-ядрах архитектуры Ada удвоили темп расчета пересечений с треугольниками, последний тип процессора - конвейер обработки искусственного интеллекта, называемый тензорными ядрами.

Ada совершенствует все три процессора RTX

Программируемые шейдеры: 40 шейдерных терафлопс по сравнению с 21,7 терафлопс на RTX 3070 Ti. Шейдерный процессор Ada включает в себя важную новую технологию под названием Shader Execution Reordering (SER), которая переупорядочивает работу на лету, обеспечивая двукратное ускорение для шейдеров трассировки лучей. SER — такое же большое новшество для графических процессоров, каким когда-то было внеочередное выполнение для центральных процессоров.

Тензорные ядра ​​4-го поколения: новое тензорное ядро ​​в Ada включает в себя движок NVIDIA Hopper FP8 Transformer Engine, обеспечивающий до 641 тензорных терафлопс с FP8 точностью на разреженных матрицах в RTX 4070 Ti для обучения и инференса ИИ по сравнению с 174 тензорными терафлопами на разреженных матрицах в RTX 3070 Ti. По сравнению с FP16, FP8 вдвое снижает требования к объему памяти и удваивает производительность ИИ.

RT-ядра 3-го поколения: новый движок Opacity Micromap Engine ускоряет в среднем вдвое темпы расчета пересечений для поверхностей с тестом прозрачности текстур при использовании этой функции разработчиками, а новый движок Micro-Mesh Engine увеличивает геометрическую детализацию без затрат на сборку и хранение BVH. Пропускная способность Ada на тестах пересечений составляет 93 RT-TFLOPS по сравнению с 42,5 RT-TFLOPS у 3070 Ti.

Тензорные ядра 4-го поколения

Тензорные ядра — это высокопроизводительные вычислительные ядра, специализированные и адаптированные для операций матричного умножения и сложения, которые используются в приложениях с искусственным интеллектом и для высокопроизводительных вычислений. Тензорные ядра обеспечивают революционную производительность для матричных вычислений, которые имеют решающее значение для обучения многослойных нейронных сетей и расчетов (инференса) уже обученных сетей. Примеры приложений с инференсом включают технологию NVIDIA DLSS 3 для геймеров, в которой отдельная нейронная сеть отвечает за генерацию высококачественных кадров, и все это на базе тензорного ядра NVIDIA. DLSS стал настолько популярным, что уже насчитывается более 250 игр с поддержкой этой технологии, в которых геймеры одним кликом могут удвоить производительность. Кроме того, многие приложения для творчества начали использовать функции искусственного интеллекта, чтобы помочь художникам создавать контент быстрее и делать это более качественно. Сегодня более 110 популярных приложений для творчества используют ускорение на тензорных и RT-ядрах видеокарт RTX. А эксклюзивные приложения NVIDIA, такие как Broadcast и Canvas, предлагают инструменты для удаления шумов, создания виртуальных фонов и многих других эффектов на базе ИИ для потоковой передачи видео и конференций.

ada 2

Тензорное ядро ​​Ada четвертого поколения основано на возможностях предыдущих графических процессоров Ampere, которые поддерживали множество новых типов данных и добавили ускорение структурированной разреженности, чтобы удвоить пропускную способность по сравнению с предыдущими ядрами Turing. Тензорные ядра поколения Ada поддерживают новый формат данных FP8, впервые представленный в архитектуре графического процессора NVIDIA Hopper. По сравнению с FP16, FP8 вдвое снижает требования к хранилищу данных и удваивает производительность ИИ. Благодаря новому формату FP8 и функции разреженности GeForce RTX 4070 Ti обеспечивает производительность 641 TFLOPS для рабочих нагрузок ИИ.

Ядра RT 3-го поколения

RT-ядра третьего поколения архитектуры Ada — это специализированные аппаратные блоки для ускорения обхода BVH и вычисления пересечений лучей с треугольниками, которые имеют решающее значение для ускорения трассировки лучей. RT-ядра видеокарт RTX - полностью самостоятельные, они выполняют все расчеты обхода BVH и пересечений, разгружая тем самым потоковые мультипроцессоры SM c CUDA ядрами и освобождая их для выполнения других задач, таких как затенение пикселей, вершин и вычислений общего назначения.

ada 3

RT-ядра архитектуры Ada обеспечивают в 2 раза более быстрое тестирование пересечений лучей c треугольниками по сравнению с графическими процессорами NVIDIA Ampere, что позволяет разработчикам добавлять больше деталей в свои виртуальные миры. В состав RT-ядер Ada также входят новые блоки Opacity Micromap Engine, которые ускоряют трассировку геометрии с альфа-тестированием в 2 раза, это поможет разработчикам ускорить ресурсоемкие для трассировки сцены с растительностью и эффектами частиц до 2 раз. Также в состав новых RT-ядер входят блоки Displaced MicroMesh Engine, которые генерирует микросетки на лету для создания дополнительной геометрии.

4070

Все эти технологии для увеличения производительности с трассировкой лучей дают архитектуре Ada большой задел на будущее. По мере появления новых игр с использованием технологий Ada для увеличения производительности, видеокарты RTX 40-й серии будут несомненно становиться быстрее и все больше отрываться от предыдущего поколения видеокарт RTX 30-й серии. В качестве примера можно привести свежий ремастер Portal with RTX на базе RTX Remix, в котором NVIDIA использует новые возможности архитектуры Ada, такие как движки OMM и SER (их, кстати, можно отключать в настройках), вместе они позволяют RTX 4090 быть до 3 раз быстрее RTX 3080 Ti без использования DLSS, а с использованием генератора кадров DLSS 3 преимущество может достигать 5 раз.

Комментарии (0)