Nvidia Quadro RTX: первые графические ускорители с архитектурой Turing и аппаратной поддержкой трассировки лучей

Сeгoдня сoстoялoсь сoбытиe, кoтoрoe Nvidia   нaзывaeт сaмым бoльшим прoрывoм сo врeмeн изoбрeтeния   CUDA   в 2006 гoду и рeзультaтoм рaбoты тысячи инжeнeрoв в тeчeниe дeсяти лeт. Рeчь идeт oб aрxитeктурe Turing, глaвнoй oсoбeннoстью кoтoрoй являeтся aппaрaтнaя пoддeржкa трaссирoвки лучeй. Этo oдин изо важнейших элементов компьютерной графики — от пар графического ускорителя производить в должном объеме соответствующие выкладки зависит насколько реалистичной эта графика будет. Получи сегодняшней презентации Nvidia представила семейство графических ускорителей Quadro RTX, ГПУ которых охватывает три вычислительных компонента:

Традиционные шейдерные процессоры
Новые тензорные ядра для того   принятия решений (inference). Эти ядра обещают значительное убыстрение вычислений по трассировке лучей, за которые наше) время отвечали шейдерные процессоры. Последние, в свою очередь, способны при этом выполнять как операции с плавающей точкой, так и целочисленные прикидки. На примере представленного сегодня графического ускорителя Quadro RTX 8000 плодотворность выглядит так:

4,608 шейдерных ядер: 16 TFLOPS (терафлопс, триллионов операций с плавающей точкой в постой, FP32) + 16 TIPS (триллионов целочисленных операций в секунду);
576 тензорных ядер: 500 TOPS (триллионов операций в одну минуту) INT4, или 250 TOPS INT8, или 125 TOPS FP16;
трассировочные ядра (контингент не сообщается): 10 гига-лучей (миллионов лучей) в побудьте на месте. Для размещения такого числа специализированных процессоров используется кристаллит площадью 754 мм², немногим меньше ГПУ с   Tesla V100 (815 мм2). Число транзисторов в ГПУ   Quadro RTX 8000 — 18.6 млрд (у Tesla V100 — 21.1 млрд). По причине аппаратной поддержке трассировки лучей соответствующая производительность графических ускорителей   Turing в цифра раз превосходит видеокарты с архитектурой Pascal. Nvidia проиллюстрировала сие на примере двух сцен. Рендеринг одной с них на графическом ускорителе   Tesla P100 занял 308 миллисекунд, а не такой — 576 миллисекунд. Та же самая работа графическим ускорителем   Quadro RTX 8000 была выполнена адекватно за   45 и 86 миллисекунд, т.е. в 6-7 раз быстрее. Сверх аппаратного ускорения, большую роль в приращении скорости сыграла методика DLAA (Deep Learning Anti-Aliasing). Она позволяет возбуждать графику на более низком разрешении, а потом без затей растягивать изображение, сглаживания «шероховатости» рядом помощи глубокого обучения. В результате графику с кинематографической реалистичностью, с которой перед сих пор справлялась DGX Station   за $69 тыс. (20-атомный процессор Intel Xeon E5-2698 v4, четыре графических ускорителя Tesla V100), в режиме реального времени пелена воспроизвести один графический ускоритель   Quadro RTX 8000. Подле этом рекомендованная розничная цена новинки — $10,000. Интересах обработки в режиме реального времени таких больших объемов графической информации приходится много памяти — Quadro RTX 8000 получила аж 48 Гб GDDR6 с пропускной способностью 672 Гб/с (у Tesla V100 — 900 Гб/с). 250 Вт

ГПУ??? GV100

Застывшая музыка
Turing
Turing
Turing
Volta

Техпроцесс??? TSMC 12-нм

Форум ГПУ
754 мм²?? 815 мм²

Ядра CUDA
4,608
4,608
3,072
5,120

Тензорные ядра
576
576
384
640

Boost Clock
~1730 МГц (?)
~1730 МГц (?)? ~1450 МГц

Видеопамять
14 Гбит/с GDDR6
14 Гбит/с GDDR6
14 Гбит/с GDDR6
1.7 Гбит/с HBM2

Количество памяти
48 Гб
24 Гб
16 Гб
32 Гб

Разрядность памяти
384-двоичный знак
384-бит
256-бит
4096-бит

Пропускная ловкость памяти
672 Гб/с? 448 Гб/с
870 Гб/с

Отдача FP16
32 TFLOPS (?)
32 TFLOPS (?)? 29.6 TFLOPS

Отдача FP32
16 TFLOPS
16 TFLOPS? Энергопотребление такой стойки составляет 13 кВт. В соответствии с словам Дженсена Хуанга, «Turing   – это самое значимое вывод Nvidia   за последнее десятилетие. Появление возможности трассировки лучей в реальном времени – сие Святой Грааль нашей индустрии«. Впрочем, на волоске ли новая технология появится в играх скоро. Последние поколения игровых консолей Sony и Microsoft выпускаются получай базе графических ускорителей AMD, в которых встроенное аппаратное педалирование. Ant. торможение трассировки лучей отсутствует. Таким образом, на добивание разработки новых ГПУ для игровых приставок 9-го поколения у AMD остается примерно года — вряд ли аппаратная поддержка трассировки лучей бросьте освоена этой компанией так скоро. Не достаточно питать больших иллюзий и относительно кинематографической реалистичности компьютерных игр в обозримом будущем. В продемонстрированных Nvidia роликах обращает держи себя внимание отсутствие кадров с человеческим лицом — посерединке тем оно, как правило, и выдает компьютерную анимацию.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *