Найти в Дзене
вообще эта новость вполне могла быть в любой день, но иллюстрация требует поставить ее в субботу; суть новости - Google выкатил генератор
заголовков для новостных сюжетов, и все заверте... я могу восстановить логику событий так, что кто-то решил обучить генератор делать привлекательные (кликабельные) заголовки; как следствие, генератор честно выучился делать кликбейт - то есть максимально "желтые"...
17 часов назад
всем привет, если вам нечем заняться на новогодние праздники, кроме доедания салатов, то еще есть возможность залететь в соревнование по
переводу на тюркские языки (будет идти до конца праздников) тем более, что появился повод, прямо под ёлочку 🎄 Tencent выпустили обновление своих моделей для машинного перевода Hunyuan 1.5 (если я правильно понял, то наилучшим переводом 混元 будет "первичный бульон", как источник для всего разнообразия жизни) коллеги выпустили две новых модели 1.8B и 7B, результаты...
1 день назад
я хотел сегодня пропустить, чтобы дать всем отдохнуть, но меня догнала огненная новость - мои бывшие коллеги из исследовательского центра
им. Н.Н. Лузина (это псевдоним, могу намекнуть на оригинальное навзвание - 🐉🪷🌺) выложили свой претрейн! модель под названием Gamayun на 1.5B параметров, лучше Qwen2.5 аналогичного размера на русском, арабском, болгарском, испанском и польском языках! также в этой работе...
2 дня назад
я долго думал, как поздравить всех с наступающим Новым Годом, а потом мне на глаза попалась эта милая история: некий энтузиаст сделал самую
крошечную языковую модель - вместе с кодом для обработки ввода-вывода она занимает всего 40 килобайт на самом деле все еще интереснее, эта языковая модель - это программа для CP/M для процессора Z80 с 64 кБ памяти; в языковой модели используется хэширование для входных токенов - в его случае триграмм, это обеспечивает устойчивость к опечаткам; модель сквантована в 2 бита (-2, -1, 0 и 1), но на инференсе используется...
3 дня назад
интересные новости приходят с той стороны глобуса: в Огайо депутат местного парламента предложил закрепить в законе, что любой ИИ является
неразумной сущностью ("nonsantient entity", даю ссылку на Wall Street Journal, т.к. сам законопроект у меня ни из-под одного прокси не открылся) это интересно обсудить, т.к. с одной стороны сейчас много людей, которые пытаются найти в LLM признаки разума - тут достаточно вспомнить тестировщика из Google, который 3,5 года назад их "нашел"; я считаю, что никакого разума там, конечно, не было и нет, но утверждать, что он не появится в процессе разработки, особенно условиях усилий большого количества людей по созданию т...
4 дня назад
если вас когда-либо занимал вопрос, "почему самолеты летают, а крыльями не машут", то ответ на него очень простой - потому что сделать
машущий крыльями аппарат оказалось гораздо сложнее ученые из моей альма-матер (МФТИ), похоже, наконец решили эту задачу - разработали систему управления маханием крыльями, которая похожа на реальную нервную...
5 дней назад
всем привет, итоговый выпуск капитанского мостика за 2025 год, мы снова вдвоем с Димой Колодезевым
ИИ-саммари: В этом выпуске обсуждаются ключевые события года, включая рост цен на технологии памяти, скорость изменений в индустрии, дефляцию технологий и трансформацию маркетинга. Также рассматриваются новые навыки, необходимые в программировании, и важность образования в технологической сфере России. В этом разговоре обсуждаются ключевые проблемы и перспективы агрономии, сравнение технологий в агропромышленности и IT, влияние цензуры...
6 дней назад
с берегов туманного Альбиона пришло две новости
: с одной стороны, ИИ-суммаризация приводит к тому, что создатели рецептов теряют в рекламном трафике но с другой стороны исследование коллег из Кэмбриджа показывает, что конспектирование (то есть та же...
1 неделю назад
летом обещали, а сейчас наконец дошли руки, военное министерство США заключило контракты с двумя бигтехами: Google и xAI
контракты эти на предоставление доступа к LLM на платформе GenAI.mil; у многих крупных организаций внутри есть аналоги - единая точка доступа к разным провайдерам LLM; анонсировано, что модели будут работать с Impact Level 5 - это аналог нашего грифа "для служебного пользования" (т...
1 неделю назад
тут пару дней назад чуть-чуть хайпанула статья от коллег из Google, суть которой описывается одной фразой повторение промта, увеличивает
качество генерации но интересно тут другое, коллеги подсказали, что такая идея уже была высказана почти два года назад; там правда было про то, что повторение улучшает качество эмбеддинга (картинка оттуда) как пошутили у нас в чате "решили повторить статью, чтобы улучшить результат" смешнее было бы, если бы свежая статья не ссылалась на более старую, но тут коллег...
1 неделю назад