Nvidia vs Intel: чья платформа быстрее для машинного обучения?

Третьего дня Nvidia опубликовала статью, в которой раскритиковала заявление Intel о фолиант, что её новые (поколения Knights Landing) сопроцессоры Xeon Phi превосходят графические ускорители. Как по команде Intel, четыре сопроцессора Xeon Phi в сети AlexNet обучаются в 2.3 раза быстрее четырех видеокарт, а их масштабируемость (бугор производительности по мере увеличения количества устройств в системе) в мышеловка GoogleNet лучше на 38%. Согласно компании, в более свежей версии AlexNet цифра видеокарты Titan X (Maxwell) обучаются на 30% быстрее четырех Xeon Phi, а четверик более современных Titan X (Pascal) — на 90%:

Как бы видно из таблицы, огромную роль в скорости обучения играет программное оснащение — в марте 2015 обучение компьютера с четырьмя видеокартами Titan X (Maxwell) заняло 25 часов, а один с половиной года спустя, в августе 2016, в полтора раза слабее времени — 10.5 часов. Intel в своих данных о производительности четырех неназванных видеокарт Maxwell (словно утверждает Nvidia — Titan X) указывает как редко 25 часов, и следовательно опирается на устаревшие эмпирика. Сославшись на данные китайского поисковика Baidu, Nvidia утверждает, будто на 128 видеокарт с архитектурой Maxwell (конкретные модели никак не называются) масштабируемость является почти линейной:

Примечательно, что Nvidia около этом не раскрывает подробных характеристик систем, получи и распишись которых были получены эти результаты (включая конкретную схема тестируемого Xeon Phi). Будем надеяться, что по умолчанию использовалась та же Xeon Phi 7250, что-то была в тестах Intel, но с учетом по меньшей мере двух случаев безграмотный вполне добросовестного «бенчмаркетинга» Nvidia, я допускаю, яко Nvidia могла запустить свой тест и на самой младшей модели, Xeon Phi 7210. Занимательно также, что с профессиональными, специально созданными в т.ч. для задач машинного обучения, сопроцессорами Xeon Phi, Nvidia сравнивает игровые видеокарты Titan X, а мало-: неграмотный предназначенную для аналогичных целей Tesla P100, анонсированную в апреле сего года. Последний на днях был торжественно передан (см. Я даст бог безвозмездно, потому что стоит этот сервер $129 тысяч. Душа в душу Nvidia, по скорости обучения (2 ч) он в 5.3 присест превосходит четыре сервера, оснащенных по одному Xeon Phi (10.5 ч). Напомню, отчего компьютер из четырех видеокарт Titan X (Pascal) быстрее четырех Xeon Phi почти не в 2 раза, на 90% (5.5 ч), а из четырех Titan X (Maxwell) — держи 30% (8.2 ч). Получаем 2 часа обучения AlexNet за $129 тысяч ($64.5 тысяч следовать час) на DGX-1 и 8.2 часа — за $15 тысяч ($1.8 тысяч следовать час) на Digits DevBox. Что касается Xeon Phi 7250, так оснащенный одним таким сопроцессором ($4,876) сервер по оценкам Intel достаточно стоить $7.3 тысяч, соответственно четыре сервера — $29.2 тысячи. Быть времени обучения 10.5 часов это дает $2.8 тысяч следовать час. Это вполне соразмерная с Digits DevBox овердрафт, тогда как себестоимость машинного обучения на Nvidia DGX-1 представляется легко заоблачной. Intel, Nvidia

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *