5 месяцев назад
Разгадка тайн машин Больцмана: путь к глубокому обучению
Задуманные как вероятностная платформа для сбора сложных распределений данных, эти машины изменили ландшафт искусственного интеллекта, вдохновив на новую эру алгоритмов и приложений глубокого обучения. Она названа в честь австрийского физика Людвига Больцмана, который разработал статистическую механику для объяснения поведения молекул газа. Машина Больцмана отражает суть статистической механики и применяет ее в области машинного обучения. Краткая история Концепция машины Больцмана была впервые представлена...
182 читали · 1 месяц назад
🧠💻 Температура в языковых моделях: от физики к ИИ
Сегодня мы погрузимся в захватывающий мир языковых моделей (LLM) и разберемся, как концепция из статистической физики помогает нам понять и настроить их работу. Речь пойдет о температуре и ее связи с распределением Больцмана.🚀 В контексте языковых моделей температура - это гиперпараметр, который влияет на разнообразие и предсказуемость генерируемого текста. Представьте, что это ручка настройки "креативности" модели. Математически температура (обозначим ее как T) применяется к логитам модели (необработанным...