Добавить в корзинуПозвонить
Найти в Дзене

Thunderbolt 5 и RDMA превратили четыре Mac Studio в суперкомпьютер на 1,5 терабайтами памяти

Ютубер Джефф Гирлинг опубликовал подробный разбор кластерных вычислений на четырех компьютерах Mac Studio с процессорами M3 Ultra, которые предоставила ему Apple. Совокупная стоимость системы составила почти 40 тысяч долларов, а главной звездой эксперимента стала технология RDMA через интерфейс Thunderbolt 5. Благодаря этому решению четыре отдельных машины получили доступ к общему пулу оперативной памяти объемом полтора терабайта! https://youtu.be/x4_RsUxRjKU Суть технологии RDMA (Remote Direct Access Memory) заключается в том, что один процессор может напрямую обращаться к памяти другого компьютера без активного участия его центрального процессора. Thunderbolt 5 с пропускной способностью 80 гигабит в секунду обеспечивает достаточную скорость для такого взаимодействия, что вдвое быстрее предыдущего поколения интерфейса. Для сравнения: обычное подключение через Ethernet ограничено скоростью 10 гигабит в секунду, что делает его непригодным для серьезных вычислительных задач. Правда, ес

Thunderbolt 5 и RDMA превратили четыре Mac Studio в суперкомпьютер на 1,5 терабайтами памяти

Ютубер Джефф Гирлинг опубликовал подробный разбор кластерных вычислений на четырех компьютерах Mac Studio с процессорами M3 Ultra, которые предоставила ему Apple. Совокупная стоимость системы составила почти 40 тысяч долларов, а главной звездой эксперимента стала технология RDMA через интерфейс Thunderbolt 5. Благодаря этому решению четыре отдельных машины получили доступ к общему пулу оперативной памяти объемом полтора терабайта!

https://youtu.be/x4_RsUxRjKU

Суть технологии RDMA (Remote Direct Access Memory) заключается в том, что один процессор может напрямую обращаться к памяти другого компьютера без активного участия его центрального процессора. Thunderbolt 5 с пропускной способностью 80 гигабит в секунду обеспечивает достаточную скорость для такого взаимодействия, что вдвое быстрее предыдущего поколения интерфейса. Для сравнения: обычное подключение через Ethernet ограничено скоростью 10 гигабит в секунду, что делает его непригодным для серьезных вычислительных задач. Правда, есть нюанс — все компьютеры приходится соединять последовательно, что ограничивает размер кластера из-за возрастающих задержек.

Тесты показали впечатляющие результаты при использовании программы Exo с поддержкой RDMA. На модели языковой модели Qwen3 235B производительность выросла с 19,5 токенов в секунду на одной машине до 31,9 на четырех. Для сравнения, приложение Llama.cpp без RDMA продемонстрировало обратную динамику — падение с 20,4 до 15,2 токенов при добавлении узлов. Особенно впечатляет работа с моделью Kimi K2 Thinking 1T A32B с триллионом параметров, которая физически не помещается в память одного Mac Studio — четыре объединенных компьютера справились с задачей на скорости 28,3 токена в секунду.

Гирлинг отмечает, что система работает почти бесшумно, потребляя менее 250 ватт на каждый компьютер, и помещается в компактную десятидюймовую стойку.

Практическое применение этой технологии довольно широкое, хотя и специфическое. В первую очередь это исследования в области искусственного интеллекта — возможность запускать огромные языковые модели с сотнями миллиардов параметров локально, без облачных сервисов. Это критично для компаний, работающих с конфиденциальными данными: медицинских учреждений, финансовых организаций или научных лабораторий, где утечка информации недопустима.

Второе направление — обработка больших массивов данных в реальном времени. Например, анализ геномных последовательностей, климатическое моделирование или обработка данных с научных приборов. Традиционно для таких задач использовались дорогие серверные решения, а кластер из Mac Studio за 40 тысяч долларов — это относительно бюджетный вариант с низким энергопотреблением и почти бесшумной работой.

Третий сценарий, который упомянул сам Гирлинг, — работа с тяжелым видеоконтентом. Если Apple реализует поддержку протокола SMB Direct через интерфейс Thunderbolt 5, студии смогут организовать быстрые сетевые хранилища, где несколько монтажеров одновременно работают с материалами в разрешении 8K без задержек. Сейчас для этого нужны специализированные системы хранения данных стоимостью в десятки тысяч долларов.

@fixed

Apple
384,5 тыс интересуются