заголовков для новостных сюжетов, и все заверте... я могу восстановить логику событий так, что кто-то решил обучить генератор делать привлекательные (кликабельные) заголовки; как следствие, генератор честно выучился делать кликбейт - то есть максимально "желтые"...
переводу на тюркские языки (будет идти до конца праздников) тем более, что появился повод, прямо под ёлочку 🎄 Tencent выпустили обновление своих моделей для машинного перевода Hunyuan 1.5 (если я правильно понял, то наилучшим переводом 混元 будет "первичный бульон", как источник для всего разнообразия жизни) коллеги выпустили две новых модели 1.8B и 7B, результаты...
им. Н.Н. Лузина (это псевдоним, могу намекнуть на оригинальное навзвание - 🐉🪷🌺) выложили свой претрейн! модель под названием Gamayun на 1.5B параметров, лучше Qwen2.5 аналогичного размера на русском, арабском, болгарском, испанском и польском языках! также в этой работе...
крошечную языковую модель - вместе с кодом для обработки ввода-вывода она занимает всего 40 килобайт на самом деле все еще интереснее, эта языковая модель - это программа для CP/M для процессора Z80 с 64 кБ памяти; в языковой модели используется хэширование для входных токенов - в его случае триграмм, это обеспечивает устойчивость к опечаткам; модель сквантована в 2 бита (-2, -1, 0 и 1), но на инференсе используется...
неразумной сущностью ("nonsantient entity", даю ссылку на Wall Street Journal, т.к. сам законопроект у меня ни из-под одного прокси не открылся) это интересно обсудить, т.к. с одной стороны сейчас много людей, которые пытаются найти в LLM признаки разума - тут достаточно вспомнить тестировщика из Google, который 3,5 года назад их "нашел"; я считаю, что никакого разума там, конечно, не было и нет, но утверждать, что он не появится в процессе разработки, особенно условиях усилий большого количества людей по созданию т...
машущий крыльями аппарат оказалось гораздо сложнее ученые из моей альма-матер (МФТИ), похоже, наконец решили эту задачу - разработали систему управления маханием крыльями, которая похожа на реальную нервную...
ИИ-саммари: В этом выпуске обсуждаются ключевые события года, включая рост цен на технологии памяти, скорость изменений в индустрии, дефляцию технологий и трансформацию маркетинга. Также рассматриваются новые навыки, необходимые в программировании, и важность образования в технологической сфере России. В этом разговоре обсуждаются ключевые проблемы и перспективы агрономии, сравнение технологий в агропромышленности и IT, влияние цензуры...
: с одной стороны, ИИ-суммаризация приводит к тому, что создатели рецептов теряют в рекламном трафике но с другой стороны исследование коллег из Кэмбриджа показывает, что конспектирование (то есть та же...
контракты эти на предоставление доступа к LLM на платформе GenAI.mil; у многих крупных организаций внутри есть аналоги - единая точка доступа к разным провайдерам LLM; анонсировано, что модели будут работать с Impact Level 5 - это аналог нашего грифа "для служебного пользования" (т...
качество генерации но интересно тут другое, коллеги подсказали, что такая идея уже была высказана почти два года назад; там правда было про то, что повторение улучшает качество эмбеддинга (картинка оттуда) как пошутили у нас в чате "решили повторить статью, чтобы улучшить результат" смешнее было бы, если бы свежая статья не ссылалась на более старую, но тут коллег...