За разработкой метода параллельных вычислений стоят исследователи Калифорнийского университета в Риверсайде (UCR). И существует он не только на бумаге, так как его работоспособность была продемонстрирована на 56-м ежегодном Международном симпозиуме IEEE/ACM по микроархитектуре. Инновационный подход показал, что можно вдвое повысить производительность и энергопотребление систем без замены «железа». При этом не важно, какой CPU или GPU используется, и компьютер это или смартфон.
Как рассказал Унг-Вей Ценг (Hung-Wei Tseng), адъюнкт-профессор факультета электротехники и вычислительной техники Калифорнийского университета, пользователям не нужно добавлять (приобретать) новые процессоры для увеличения мощности — всё уже есть. Достаточно лишь грамотного управления аппаратными ресурсами, то есть оптимизации процесса выполнения задач. Созданная платформа одновременной и гетерогенной многопоточности (SHMT) разительно отличается от классических методов программирования. Суть ее в том, чтобы распределять задачу сразу между всеми компонентами (CPU, GPU, NPU, TPU и т. д.), а не отдавать данные на обработку только одному компоненту системы.
SHMT использует стратегию многопоточного планирования с учетом параметра quality-aware work-stealing (QAWS). Он требует минимум ресурсов, но обеспечивает контроль качества и балансирует рабочую нагрузку. Система исполнения создает и распределяет виртуальные операции (vOPS) на несколько высокоуровневых операций (HLOPs) для одновременного задействования сразу нескольких компонентов компьютера. После SHMT распределяет HLOPs по очередям задач для их выполнения на том или ином «железе» устройства.
Фишкой платформы, как уже было отмечено, является гибридность библиотек, за счет чего она демонстрирует свою эффективность на разных устройствах. ПК, смартфон или даже сервер — она работает везде. Демонстрация работоспособности метода же проводилась на плате с Nvidia Nano Jetson (включает 4-ядерный CPU ARM Cortex-A57 и 128-ядерный видеоускоритель с архитектурой Maxwell), а через слот M.2 Key E был подключен ускоритель Google Edge с тензорными ядрами. Работала вся система на базе ОС Ubuntu Linux 18.4 с 4 ГБ оперативной памяти.
Тесты продемонстрировали высокую эффективность новой платформы параллельной обработки. Наиболее эффективная политика QAWS показала увеличение скорости работы в 1,95 раза при снижении энергопотребления на 51% по сравнению с классическим методом вычислений. Авторы метода говорят, что при масштабировании метода до уровня центров обработки данных эффективность платформы вырастет еще сильнее — и всё это без замены оборудования.
На MWC 2024 показали телефон будущего: его носят на запястье (фото) — подробнее тут.