1 подписчик

cuLitho: когда физика света мешает делать чипы, а GPU приходит на помощь

19 апреля19 апр

6 мин

Справочная статья для тех, кто хочет понять, почему производство современных чипов — это вообще-то задача для суперкомпьютера Вы слышали про Moore's Law, про 3nm и 2nm, про то, как транзисторы стали меньше вируса. Но вот вопрос: как вообще нанести рисунок транзистора размером 2 нанометра на кремниевую пластину? Ответ: светом. Буквально — ультрафиолетовым лазером через трафарет. Проблема в том, что свет — это волна. А волны, проходя через узкие щели, гнутся, дифрагируют, интерферируют. Когда вы пытаетесь нарисовать объект размером 3nm светом с длиной волны 13.5nm (EUV) — начинается настоящий физический хаос. Края рисунка «плывут», углы скругляются, линии сужаются или расширяются. Напечатаешь «квадрат» — получишь «кляксу». Решение придумали давно: вычислительная литография (computational lithography). Идея простая: заранее деформировать трафарет так, чтобы после всех оптических искажений итог вышел правильным. Это как когда художник рисует портрет с перспективным искажением — посмотришь

Оглавление

Проблема, о которой мало кто думает
Почему это адски сложно
Что такое cuLitho

Справочная статья для тех, кто хочет понять, почему производство современных чипов — это вообще-то задача для суперкомпьютера

Проблема, о которой мало кто думает

Вы слышали про Moore's Law, про 3nm и 2nm, про то, как транзисторы стали меньше вируса. Но вот вопрос: как вообще нанести рисунок транзистора размером 2 нанометра на кремниевую пластину?

Ответ: светом. Буквально — ультрафиолетовым лазером через трафарет.

Проблема в том, что свет — это волна. А волны, проходя через узкие щели, гнутся, дифрагируют, интерферируют. Когда вы пытаетесь нарисовать объект размером 3nm светом с длиной волны 13.5nm (EUV) — начинается настоящий физический хаос. Края рисунка «плывут», углы скругляются, линии сужаются или расширяются. Напечатаешь «квадрат» — получишь «кляксу».

Решение придумали давно: вычислительная литография (computational lithography). Идея простая: заранее деформировать трафарет так, чтобы после всех оптических искажений итог вышел правильным. Это как когда художник рисует портрет с перспективным искажением — посмотришь прямо, увидишь кривую рожу, но если посмотреть под углом, окажется идеальное лицо.

Почему это адски сложно

Звучит просто: «поправь трафарет». На практике — это одна из самых вычислительно тяжёлых задач в производстве.

Один современный процессор содержит миллиарды транзисторов. Каждый контур каждого транзистора нужно проверить на предмет оптических искажений и скорректировать. Это называется OPC — Optical Proximity Correction (коррекция оптической близости). Ещё есть SMO (Source Mask Optimization) — когда вы оптимизируете не только трафарет, но и форму самого светового пучка.

Стандартная задача OPC для одного слоя современного чипа на CPU-кластере занимала 2–3 недели машинного времени. Не потому что алгоритмы плохие — просто объём вычислений чудовищный: сотни итераций симуляции для миллиардов точек.

Производители чипов держали целые фермы серверов только для этого. TSMC тратила на вычислительную литографию тысячи CPU-лет в год.

Что такое cuLitho

NVIDIA cuLitho — это библиотека ускорения вычислительной литографии на GPU.

Анонс состоялся в марте 2023 года на GTC. Дженсен Хуанг вышел на сцену и объявил: «Мы ускорили производство чипов в 40–60 раз». Это звучало как маркетинговое преувеличение — но за этим стояла вполне конкретная математика.

GPU идеально подходит для этой задачи по той же причине, по которой он хорош для нейросетей: параллельность. Симуляция распространения света — это, грубо говоря, очень много одинаковых вычислений, выполняемых независимо в разных точках пространства. Сотни тысяч ядер GPU справляются с этим несравнимо быстрее, чем тысячи CPU-ядер.

Конкретные цифры от NVIDIA:

40x–60x ускорение OPC-вычислений
То, что занимало 2 недели на CPU-кластере — занимает несколько часов на GPU-кластере
Один сервер с несколькими GPU заменяет 500 CPU-серверов для этих задач

Кто уже использует

Здесь начинается интересное. NVIDIA не просто написала библиотеку и выложила на GitHub. Они заключили партнёрства с главными игроками отрасли:

TSMC (крупнейший контрактный производитель чипов) — интегрирует cuLitho в свои производственные процессы. По масштабу TSMC это означает тысячи GPU, работающих над оптимизацией трафаретов для чипов Apple, Nvidia, AMD, Qualcomm и других.

ASML (единственный в мире производитель EUV-машин, без которых невозможно делать передовые чипы) — интегрирует cuLitho в свою систему оптимизации ASML Tachyon. Это принципиально важно: ASML не просто продаёт оборудование, они продают целый симуляционный стек.

Synopsys (крупнейший поставщик EDA-инструментов, то есть ПО для проектирования чипов) — интегрировал cuLitho в свои OPC-продукты.

Когда Дженсен рассказывает на конференциях о cuLitho, он не хвастается абстрактным достижением. Он говорит о технологии, которая уже сегодня влияет на то, с какой скоростью производятся чипы для всей мировой электроники.

Почему это важно не только для производителей

Есть несколько неочевидных последствий.

Скорость итераций. Раньше, когда изменение в дизайне чипа требовало пересчёта OPC за 2 недели, инженеры старались делать как можно меньше итераций. Сейчас — несколько часов. Это принципиально меняет рабочий процесс: можно быстрее проверять гипотезы, быстрее находить ошибки, быстрее выпускать новые узлы.

Стоимость. Меньше серверов = меньше капитальных затрат и энергопотребления. Парадоксально, но GPU — при всём своём аппетите — эффективнее CPU-фарм для этой конкретной задачи.

Качество. Когда вычисления быстрее, можно позволить себе более точные модели. Грубее говоря: вместо упрощённой симуляции — более физически точная, что напрямую влияет на процент брака.

Следующие поколения узлов. Переход к 2nm и 1.6nm (узел «Angstrom» у Intel, «N2» у TSMC) невозможен без ещё более сложной вычислительной литографии. cuLitho — это не просто ускорение текущих процессов, это enabler для того, что физически невозможно без GPU-ускорения.

Немного о том, как это устроено внутри

Если интересно «под капотом» — вот короткая версия без лишней формульной магии.

OPC в основе — это задача оптимизации. У вас есть целевой рисунок (как должен выглядеть транзистор), есть физическая модель распространения света, и вы итерационно корректируете форму трафарета, чтобы симулированный результат максимально совпадал с целевым.

Каждая итерация — это вычисление частичных производных (градиентов) для миллионов точек контура. Это точно такая же математика, как в обучении нейросетей — градиентный спуск. Не удивительно, что GPU это делает быстро: он буквально создан для массового параллельного вычисления градиентов.

cuLitho использует CUDA (понятно), оптимизированные ядра для операций с комплексными числами (нужны для расчётов волновой оптики), и tensor cores — те же блоки, что ускоряют матричное умножение в нейросетях.

Это один из примеров того, что Дженсен называет «ускоренными вычислениями»: взять задачу из совершенно другой области (производство чипов), найти в ней параллельную структуру, применить GPU — и получить 40x ускорение.

Связь с большой картиной

Есть элегантная рекурсивность в том, что GPU ускоряет производство GPU. Это как если бы кузнец использовал кузнечные инструменты, которые сам и сделал.

Когда Дженсен Хуанг говорит, что Nvidia — это не просто «поставщик железа», а платформа для всей AI-индустрии, cuLitho — хорошая иллюстрация. Это не GPU-ядра, это не CUDA-библиотека для нейросетей. Это технология, которая ускоряет само производство полупроводников — и тем самым влияет на то, как быстро весь мир получает доступ к новым чипам.

Ещё один слой «пирога», который Nvidia держит в руках.

Что стоит знать в одном абзаце

cuLitho — GPU-ускоренная библиотека NVIDIA для вычислительной литографии (Optical Proximity Correction и оптимизация масок). Ускоряет расчёт корректирующих трафаретов для производства чипов в 40–60 раз по сравнению с CPU-фармами, сокращая время с недель до часов. Используется TSMC, ASML и Synopsys. Технически основана на параллельных вычислениях градиентного спуска через CUDA, аналогично обучению нейросетей. Ключевой enabler для перехода к 2nm и более тонким узлам, где вычислительная сложность OPC растёт экспоненциально.

NVIDIA cuLitho вычислительная литография computational lithography OPC Optical Proximity Correction EUV TSMC ASML Synopsys производство чипов полупроводники CUDA ускоренные вычисления GPU SMO 2nm 3nm EDA Tachyon NVLink GTC 2023 Дженсен Хуанг Moore's Law параллельные вычисления фотолитография градиентный спуск tensor cores AI для CAD AI в производстве