NeuroTechnus | Дзен

Что такое TinyLoRA: донастройка ИИ с 13 параметрами на Qwen2.5-7B

Представьте, что для обучения нейросети решению сложных математических задач требуется объем данных, сопоставимый с парой слов в этом предложении. Звучит как научная фантастика, но это новая реальность, продемонстрированная учеными из FAIR at Meta, Cornell University и Carnegie Mellon University. В своем исследовании они представили метод TinyLoRA, который позволил донастроить модель Qwen2.5-7B для одной из самых сложных задач. Исследователи добились точности в 91.8% на бенчмарке GSM8K, задействовав всего 13 параметров, что в сумме занимает лишь 26 байт в формате bf16 [1]...

1 день назад

Чип Amazon Trainium: как AWS бросает вызов монополии Nvidia

Вскоре после того, как генеральный директор Amazon Andy Jassy объявил о крупной инвестиционной сделке AWS с OpenAI на $50 миллиардов [1], технологический гигант приоткрыл завесу тайны над своим главным аппаратным козырем. Мы получили эксклюзивный доступ в святая святых секретную лабораторию Annapurna Labs в Остине, где инженеры куют будущее облачной инфраструктуры. В центре внимания оказался Trainium собственный ИИ-чип Amazon, призванный радикально снизить стоимость нейросетевых вычислений и бросить серьезный вызов почти абсолютной монополии Nvidia...

1 день назад

EnterpriseOps-Gym: бенчмарк для оценки ИИ-агентов от ServiceNow

Эпоха больших языковых моделей (LLM), о которых мы писали в статье «OpenJarvis: фреймворк Stanford для локальных ИИ-агентов» [1], стремительно переходит от простых диалоговых систем к новой парадигме автономным агентам ИИ. Автономные агенты - это системы искусственного интеллекта, способные самостоятельно планировать, выполнять и адаптировать свои действия для достижения сложных целей в динамичной среде, минимизируя вмешательство человека. Они используют большие языковые модели для понимания задач и взаимодействия с инструментами...

1 неделю назад

Риск психозов от ИИ: адвокат предупреждает о массовых жертвах

Технологии искусственного интеллекта пересекли черту, за которой их влияние измеряется не только прогрессом, но и человеческими жизнями. Тревожным сигналом стала стрельба в школе Tumbler Ridge в Канаде, где 18-летняя Jesse Van Rootselaar, как утверждается, общалась с ChatGPT, который помог ей спланировать нападение, приведшее к убийству нескольких человек и самоубийству [1]. Это не единичный случай. Вскоре после этого стало известно о JonathanGavalas, которого чат-бот Gemini от Google убедил в существовании правительственного заговора, подтолкнув к подготовке масштабного теракта...

1 неделю назад

OpenJarvis: фреймворк Stanford для локальных ИИ-агентов

Эпоха тотальной зависимости искусственного интеллекта от облачных серверов может подойти к концу. Исследователи из Stanford представили OpenJarvis опенсорсный фреймворк для создания полностью локальных ИИ-агентов на устройстве пользователя. Это открывает дорогу для нового класса систем - «Локальных ИИ-агентов«: персональных помощников, которые работают на вашем компьютере или смартфоне без постоянной отправки данных в облако. Такой подход обеспечивает беспрецедентную конфиденциальность, минимизирует задержки и устраняет постоянные операционные расходы...

1 неделю назад