Представьте, что можно заглянуть в сознание нейросети и увидеть, как рождаются ее мысли — от первых проблесков до сложных концепций. Теперь это реально. Команда руководителя научной группы LLM Foundations и T-Bank AI Research, аспиранта МФТИ Никиты Балаганского создала уникальный метод визуализации "мысленных процессов" больших языковых моделей. Ученый рассказал нам о том, как устроен этот прорыв в области интерпретируемого ИИ. Как работает эта карта? Метод использует «графы потоков признаков», чтобы отслеживать судьбу каждого понятия внутри ИИ. «Мы создали своего рода генеалогическое древо для "мыслей" нейронной сети. Наш метод позволяет проследить всю родословную конкретной идеи внутри модели. Мы можем увидеть, как из простых признаков, отвечающих за отдельные слова на ранних слоях, рождаются более сложные семантические конструкции на средних, и как они в итоге собираются в абстрактные темы на финальных этапах. Это похоже на то, как ручейки сливаются в реки, а реки — в океан», —
В Физтехе создали «карту мыслей» для ИИ. Теперь мы можем узнать, как они думают
13 ноября 202513 ноя 2025
33
2 мин