Сeгoдня, в рaмкax пeкинскoй выстaвки GTC 2016, кoмпaния Nvidia прeдстaвилa нeскoлькo свoиx нoвинoк. Eсли Tesla P100 прeднaзнaчeнa в oснoвнoм исполнение) трeнирoвки систeм искусствeннoгo интeллeктa (training), тo 40-я и 4-я сeрии бoльшe пoдxoдят с целью кoнeчнoгo принятия рeшeний ужe oбучeнными систeмaми (inference) — нaпримeр, распознавания конкретного изображения либо конкретной голосовой команды. Заметно выросла частота., а тоннаж памяти увеличился в два раза. Еще одним существенным нововведением таким образом оснащение вычислительных ядер возможностью производить целочисленные 8-разрядные расчеты — у Tesla M40 и M4 её не было. Предлагаем вашему вниманию полные характеристики новинок и их предшественников:
Tesla M4
Tesla P4
Tesla M40
Tesla P40
TDP
50/75 Вт
75 Вт (50 Вт опционально)
250 Вт
250 Вт
Техпроцесс
28-нм
16-нм
28-нм
16-нм
Колышек-во транзисторов
2.9 млрд
7.2 млрд
8 млрд
12 млрд
ГПУ
GM206
GP104
GM200
GP102
Эспланада ГПУ
227 мм²
314 мм²
601 мм²
471 мм²
Колышек-во SM
8
20
24
30
Кол-во ядер FP32
1,024
2,560
3,072
3,840
Гармоника базовая
872 МГц
810 МГц
948 МГц
1303 МГц
Колебание ускоренная
1072 МГц
1063 МГц
1114 МГц
1531 МГц
Пропускная способность INT8 (TOPS)
—
21.8
—
47.0
Производительность FP32 (терафлопс)
2.2
5.4
6.8
11.8
Коэффициент полезного действия FP64 (гигафлопс)
69
170
213
367
Кол-во TMU (текстурных блоков)
64
160
192
240
Реминисценция
GDDR5
128-бит
GDDR5
256-бит
GDDR5
384-двоичный знак
GDDR5
384-бит
Пропускная способность памяти
88 Гб/с
192 Гб/с
288 Гб/с
346 Гб/с
Тоннаж памяти
4 Гб
8 Гб
12/24 Гб
24 Гб
Совокупность кэш L2
2048 Кб
2048 Кб
3072 Кб
3072 Кб
Листаж файла-регистра
2048 Кб
5120 Кб
6144 Кб
7680 Кб
Охват распределенной памяти на SM
96 Кб
128 Кб
96 Кб
128 Кб
В продажу Tesla P40 и Tesla P4 поступят в октябре и ноябре пропорционально, цены не называются. Напомню, что в стандартной комплектации симпатия оснащен двумя дискретными видеокартами (предположительно уровня GTX 1060) и двумя мобильными процессорами Tegra, с головы из которых содержит 6-ядерное ЦПУ (4 x Cortex-A57 + 2 x Denver 2) и 256-ядерное ГПУ. Такое но количество ядер в ГПУ самого производительного мобильного процессора Nvidia, анонсированного в январе 2015 Tegra X1 с архитектурой Maxwell. Бесстрастно Nvidia его в качестве мобильного процессора не анонсировала — с недавних пор система утратила интерес к мобильным устройствам. Однако с учетом в полном объеме умеренного, по сравнению с изначальным DRIVE PX 2 (250 Вт), энергопотребления одночиповой версии (10 Вт), никак не исключено появление процессора Tegra Pascal в будущих версиях игровых консолей Shield Tablet (2014) и Shield Android TV (2015). Nvidia позиционирует облегченную версию DRIVE PX 2 на автопилота на загородных магистралях, тогда как полная трансформация позволит ездит на автопилоте «от точки вплоть до точки». Одночиповый DRIVE PX 2 в распоряжение партнеров Nvidia кончайте предоставлен в IV квартале этого года. Ну и конец третьей главной новостью стал реклама Jetpack 2.3 — очередной версии программного пакета про программирования аппаратной платформы Jetson TX1. Согласно Nvidia, реконструирование позволит повысить скорость принятия решений (inference) в двушничек раза. Nvidia (1), (2), (3)