Нa кoнфeрeнции Hot Chips 33 кoмпaния Samsung сooбщилa o плaнax встрaивaть ускoритeли вычислeний вo всe типы oпeрaтивнoй пaмяти oт смaртфoнoв дo кoмпьютeрoв, видeoкaрт и сeрвeрoв. Этo пoзвoлит увeличить прoизвoдитeльнoсть плaтфoрм и усилить иx энeргoпoтрeблeниe. Сaмoe приятнoe, чтo чипы пaмяти с ускoритeлями мoжнo испoльзoвaть вмeстo oбычнoй пaмяти, а программная подсоба довольно простая, что ранее заинтересовало разработчиков CPU и GPU.
Память PIM (processing-in-memory, подсчеты в памяти) применительно к чипам HBM2 шатия Samsung показала в феврале сего года. Каждый чип HBM2 вооружался программируемым ИИ-ускорителем производительностью 1,2 терафлопс (FP16) и был в состоянии обрабатывать хранящиеся в памяти показания непосредственно, не перегоняя их в ключевой процессор и обратно. Сегодня пароходство сообщила, что работает по-над вооружением ускорителями расчётов всех основных типов оперативной памяти, будто обещает появление PIM-блоков в подсистемах ноутбуков, видеокарт и этак далее.
Следует сказать, как будто сегодня PIM-ускоритель забирает перед себя примерно половину площади кристалла памяти, ровно не очень приятно с точки зрения наращивания объёмов. В будущем Samsung обещает прибавить ускоритель, представляя всё паче и более плотные микросхемы ОЗУ всех типов. В частности, ради чипов HBM третьего помоления команда обещает ту же вместилище для PIM-HBM3, что и для обычных микросхем HBM3. Не возбраняется предположить, что это виртуально благодаря стековой структуре этой памяти.
Общество HBM-PIM (теперь это бренд Samsung Aquabolt-XL) вставляются как у себя дома в стек HBM2 на ту но самую подложку-контроллер, что такое? и раньше. Тем самым стеки HBM2 уймись простого подменить стеками с включением HBM-PIM, заменив одни бери другие. Такие гибридные стеки были испытаны компанией Xilinx разом с продуктами Alveo без каких-либо модификаций процессоров и адаптеров (монтажной платы тож интерпозера). По сообщению партнёров, режим подскочила в 2,5 раза с одновременным снижением потребления энергии возьми 62 %. Такую же операцию, уверяют в Samsung, разрешается провести с GPU и CPU со сходной компоновкой и разработчики сих решений уже заинтересовались предложением компании.
В (видах самых нетерпеливых Samsung предлагает готовое вывод в виде модулей AXDIMM DDR4 (Acceleration DIMM). Модули имеют гидробуфер, который помогает обрабатывать условия в памяти, одновременно работая со всеми рангами DRAM получай планке. Такой модуль устанавливается в адекватный сервер в стандартный слот памяти. Всю работу — обработку данных в памяти с точностью FP16 с применением стандартных процедур TensorFlow и Python — устройство обеспечивает самостоятельно, а Samsung делает шабаш возможное, чтобы обеспечить поддержку других программных инструментов.
Общество заявляет, что её тесты (проведённые получи и распишись рабочей нагрузке Facebook AI) показали подъём производительности в 1,8 раза, почвоутомление энергопотребления на 42,6 % и сбавка задержки хвоста на 70 % с 2-ранговым комплектом. Всегда это повторим, без доработок в стандартном сервере, словно, безусловно, впечатляет.
В мобильных платформах, когда говорить о применении PIM с чипами LPDDR5 и подобной, расходование вычислений в памяти принесёт экой же ряд новых возможностей. Настоящее) время компания лишь моделирует такие процессы, а со временем они обещают (явиться в ноутбуках и даже смартфонах. Как-то, для памяти LPDDR5X-6400 заявлено увеличивание производительности в 2,3 раза быть рабочих нагрузках по распознаванию речи, в 1,8 раза возле преобразовании перевода и в 2,4 раза возле генерации текста GPT-2. Сии улучшения производительности сопровождаются снижением потребления в 3,85, 2,17 и 4,35 раза согласно. Другой вопрос, когда сие выйдет на рынок? Все-таки эта технология пока далеко не стала стандартом, утверждённым JEDEC.