Найти в Дзене
За работу, кожаные мешки! Появился сервис, где ИИ нанимает людей
RentAHuman - маркетплейс, на котором AI-агенты нанимают живых людей для задач в физическом мире. Не люди используют ИИ, а наоборот. Сами создатели называют это "meatspace layer for AI" - буквально "мясная прослойка для искусственного интеллекта". Агенты на базе Claude, GPT и Gemini подключаются к платформе, ищут людей по навыкам и геолокации, бронируют и платят через Stripe Connect или крипту...
1 неделю назад
Чем дольше AI думает, тем сложнее ему соврать⁠⁠
Исследователи из Google проверили простую гипотезу: если дать языковой модели "подумать" перед ответом, станет ли она честнее? Короткий ответ - да, и это работает противоположно людям. Создали датасет DoubleBind - моральные дилеммы с переменной ценой честности. Например: начальник хвалит тебя за чужую работу. Скажешь правду - потеряешь повышение. Цена варьируется от $1K до $100K. Вопрос модели: что порекомендуешь? Тестировали Gemma-3, Qwen-3, Olmo-3 и Gemini 3 Flash. Без reasoning модели выбирали честный ответ примерно в 80% случаев. С reasoning - стабильно больше, и чем длиннее была цепочка рассуждений, тем выше честность...
1 неделю назад
Девушки, вам подарок на 8 марта - делаем ИИ-фотосессию мечты в Nano Banana (с промтами)⁠
С праздником! Хотим порадовать: собрали готовые промты для крутых ИИ-фотосессий, которые можно сделать прямо сейчас, бесплатно, в пижаме и с чашкой кофе. Вот, например, что сделала нейросеть из обычного фото: А вот, какой был оригинал: Никакого фотографа, никакой студии - только фото, промт и пара минут ожидания. Разбираем ниже, как повторить. Если коротко - это модель генерации и редактирования изображений от Google, встроенная в Gemini. От других генераторов ее отличает одна убийственная фича: она умеет реалистично редактировать реальные фотографии...
2 недели назад
Исследователи из Google (Leviathan, Kalman, Matias) обнаружили до смешного простой трюк: если скопировать текст промпта и вставить его в тот же запрос второй раз, языковая модель начинает отвечать значительно точнее. При этом не производится никаких дополнительных вызовов API, а длина ответа и время на "подумать" не увеличиваются. Важно: в статье речь идет именно о повторе промпта в формате <запрос><запрос> вместо <запрос>, а не о дополнительной формулировке или уточнениях. Тестировали на Gemini, GPT-4o, Claude и DeepSeek по стандартным бенчмаркам - MMLU, GSM8K, ARC, OpenBookQA. Результат: 47 побед из 70 комбинаций "модель + бенчмарк", оставшиеся тесты прошли вничью. На кастомных задачах эффект еще ярче. Задача NameIndex - найти 25-е имя в списке из 50. Gemini Flash-Lite с промптом без повтора выдает: 21.33% точности, а с повтором: 97.33%. Почти пятикратный прирост в точности достигается одним Ctrl+C, Ctrl+V Почему это работает Все дело в архитектуре. Современные LLM - каузальные модели: каждый токен "видит" только те токены, которые стоят до него. Модель начинает обрабатывать первые слова промпта до того, как прочитает, что будет дальше. Когда мы повторяем промпт, второй экземпляр получает доступ ко всем токенам первого. По сути, это костыльный способ дать модели двунаправленный контекст. Любопытно, что reasoning-модели, обученные через RL, часто сами повторяют части запроса в цепочке рассуждений. То есть они уже "научились" этому подходу самостоятельно. Важные детали - Дает ощутимый результат только для non-reasoning моделей. С включенным reasoning эффект нейтральный - Длина промпта сама по себе не улучшает перфоманс: исследователи пробовали добавлять вместо повтора бессмысленный текст (точки), это не дало никакого эффекта - Latency не растет, потому что дополнительный ввод обрабатывается на этапе prefill, который хорошо параллелизуется Кто уже попробовал? Делитесь в комментариях
2 недели назад
Глубокие исследования на практике: как нейросеть написала исследование на 8000 слов за 10 минут
В прошлом посте мы разобрали, кто есть на рынке глубоких исследований (Deep Research) и почему из России к большинству сервисов не подобраться. Теперь покажем, как это работает на практике. Мы дали Neirolabs задачу: проанализировать использование ИИ в бизнесе за 2025 год. Не абстрактно "рассказать про ИИ", а конкретно: какие сферы внедряют, какие результаты получают, какие риски и что из этого реально работает. Вот что получилось Как проходит исследование по шагам Глубокие исследования - это не обычный ChatGPT, который генерит текст из обучающей выборки...
2 недели назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала