Найти в Дзене
пока я спал произошло то, что рано или поздно должно было произойти
примерно месяц назад активно обсуждалась история про переписывание проектов с т.н. токсичными лицензиями (например, GPL) - имеется в виду пересоздание проекта при соблюдении API, т.н. метод чистой комнаты; вот тут можно причаститься драмы от библиотеки chardet а вчера ночью произошло то, что было в некотором роде неизбежно после того, как в Anthropic перешли на написание кода с помощью Claude Code - кто-то случайно отправил в свежей версии...
17 часов назад
всем привет, с опозданием на два дня - новый выпуск Капитанского мостика; ВК нещадно тупил, поэтому удалось залить далеко не сразу; несмотря
ни на что, ведем как всегда мы, я и Дмитрий Колодезев #КапитанскийМосктик В этом подкасте Валентин Малых и Дмитрий Колодзев обсуждают конференцию по обработке текстов в Марокко, достижения в области искусственного общего интеллекта (AGI) и важность взаимодействия между людьми и ИИ. Они также затрагивают тему программирования с помощью LM-агентов и подчеркивают значимость умения слушать в современном мире. В этом разговоре обсуждаются изменения в программировании и управлении с появлением кодовых агентов и цифровых двойников...
1 день назад
сегодня я хочу рассказать про нашу статью Call, Reward, Repeat: Advancing Dialog State Tracking with GRPO and Function Calling; благо есть
повод - на EACL SRW она получила награду Outstanding paper суть работы довольно простая, но сначала надо сделать отступление и рассказать про саму задачу DST - Dialogue State Tracking; идея в том, что при общении с пользователем диалоговая система должна хранить полученные данные, чтобы выполнить потребность пользователя (1 картинка) еще до нас придумали,...
2 дня назад
коллеги прислали ссылку на статью из журнала "Природа" Nature, которая посвящена тому, чтобы обучить LLM рассуждать байесовски; тут надо
сделать отступление и пояснить, что это такое, а то не все в курсе; байесовское принятие решений - это когда субъект делает вероятностное суждение об объекте: например, вдалеке видно какое-то животное, можно предположить, что это скорее всего собака, но может быть и волк (1 картинка) важно отметить, что а) люди в среднем без специального обучения так рассуждать не умеют, про это написано много литературы, б) как следствие, LLM тоже не...
5 дней назад
сегодня мое любимое - про RNN-ки; недавно вышла статья от коллег из Колумбийского университета и IBM Research, где показывается, что можно
предсказывать ЭЭГ лучше, если использовать распознавание речи (1 картинка - обзор) звучит загадочно, но суть простая взяли ЭЭГ и проверили, что с разных регионов мозга можно снимать сигналы коррелириующие с разными аспектами распознавания речи (2 картинка); сделали...
1 неделю назад
что-то тема AGI людей не отпускает, вот и DeepMind выкатил свой тест когнитивных способностей (1 и 2 картинки); точнее не сам тест, а скорее
свои пожелания к тому, как он должен выглядеть на мой взгляд, этот подход является шагом назад по сравнению с подходом, изложенным новой "бандой четырех" во главе с Яном Лекуном; мы его разбирали на Капитанском мостике неделю назад, но на всякий случай еще раз (3 картинка): человеческий разум никогда...
1 неделю назад
всем привет, новый выпуск Капитанского мостика, ведем его как всегда мы - я и Дмитрий Колодезев
#КапитанскийМостик Обсуждение последних новостей в области искусственного интеллекта, включая военные разработки, регулирование и новые технологии. Экспертное мнение о будущем ИИ и его влиянии на общество и бизнес. Обсуждение последних трендов в области искусственного интеллекта, регуляции, технологий и рынка. Ведущие делятся своими взглядами на будущее ИИ, развитие аппаратных средств и влияние на бизнес и общество...
1 неделю назад
я почти ровно год назад вспоминал про nanoGPT от Андрея Карпатого, напомню, что суть там в том, чтобы максимально быстро натренировать
аналог GPT2-small со 124 млн параметров на 8 картах H100 до перплексии 3.28 или меньше; самый свежий результат был 2 недели назад - 86 секунд, за год смогли время уменьшить вдвое видимо, посмотрев на это, OpenAI запустили свое соревнование - надо обучить модель размером до 16 Мб (nanoGPT порядка 500 Мб) за 10 минут на тех же 8 картах H100; качество определяют...
1 неделю назад
пара новостей про распознавание лиц
: • YouTube запустил матчинг лиц в видео; это работает для известных людей, чтобы ограничить распространение дипфейков с ними; на мой взгляд вполне себе полезная история, вопрос в том - а что если реально кто-то попал на камеру с чем-то дискредитирующим? ну как в тех же файлах Эпштейна • свежая относительно похожая история из США: женщину посадили за решетку из-за того, что ее лицо система распознавания...
2 недели назад
подборка новостей про увольнения из-за ИИ, точнее чтобы компенсировать затраты на развитие ИИ
: • начнем с новости прошлого года от Microsoft - там собирались уволить 9000 человек • более свежая от Oracle - там хотят уволить до 45000 человек • еще от Meta* - здесь до 16 тысяч • ну и венчает все...
2 недели назад