Mistral-Small-3.1-24B Созданная на основе Mistral Small 3 (2501), Mistral Small 3.1 (2503) добавлено современное понимание изображения и расширяет возможности контекста до 128 тыс. токенов без ущерба для производительности текста. С 24 млрд параметров эта модель достигает возможностей высшего уровня как в текстовых, так и в зрительных задачах. Он примерно на том же уровне, что и Gemma 3 27B в задачах на ненаправленное внимание, и определенно лучше, чем 4o-mini. Примеры: - Mistral Small v3.1 - gpt-4o-mini В этом выпуске Mistral переходит от собственной лицензии MRL (Mistral Research License) к более свободной лицензии Apache 2.0. Это изменение позволяет пользователям свободно использовать, изменять и распространять модели даже в коммерческих целях. Компания продолжит предлагать специализированные коммерческие модели для конкретных задач. Характеристики: 🟡 Обрабатывает 150 токенов в секунду 🟡 24B параметров 🟡 Окно контекста 128 тыс.токенов без потери производительности 🟡 Модель достигла 81% точности в тесте MMLU 🧑💻 API 🤗 Скачать модель - понадобится библиотека vLLM (GGUF пока не готов) 🖥 Статья Mistralу
Neurogen
380
подписчиков
Делаю нейросети доступными каждому
Perplexity Comet Perplexity выпустит ИИ-браузер Comet на основе Chromium. Разработчики поисковика основе искусственного интеллекта Perplexity заявили, что разрабатывают собственный веб-браузер. Он также получит функции искусственного интеллекта и будет называться Comet. На сайте Perplexity открыта запись в лист ожидания. Компания также «активно» набирает специалистов в команду разработки ИИ-бразуера. Также Perplexity выпустили десктопное приложение и там же можно скачать на телефон. Какие выделяют особенности выделяют у Comet: 🟡Глубокая интеграция исследований : Comet привносит комплексные аналитические инструменты Perplexity непосредственно в ваш опыт просмотра веб-страниц. 🟡Обработка информации в режиме реального времени : получайте доступ к актуальной информации со ссылками на источники, что повышает достоверность ваших исследований. 🟡Кроссплатформенная синергия : легко переключайтесь между настольным компьютером и мобильным устройством, не теряя своего места или контекста. 🟡Широкие возможности интеграции приложений : благодаря более чем 800 доступным интеграциям приложений Comet стремится стать центральным узлом вашей цифровой жизни.
BlenderMCP Очень интересный аддон, который позволяет связать Claude AI с Blender, за счёт чего claude сможет вашими текстовыми запросами управлять блендером, создавать и редактировать объекты и выполнять код python. Система состоит из двух основных компонентов: 1. Дополнение Blender ( addon.py) : дополнение Blender, которое создает сокет-сервер в Blender для получения и выполнения команд. 2. MCP Server ( src/blender_mcp/server.py) : сервер Python, реализующий протокол контекста модели и подключающийся к дополнению Blender. ⚙️Функционал: 🟡Двусторонняя связь: подключите Claude AI к Blender через сервер на основе сокетов 🟡Манипуляция объектами: создание, изменение и удаление 3D-объектов в Blender. 🟡Контроль материалов: применение и изменение материалов и цветов. 🟡Проверка сцены: получите подробную информацию о текущей сцене Blender. 🟡Выполнение кода: запуск произвольного кода Python в Blender от Клода 🐱Github - инструкция по установке
Обновление Gemini 2.0 Flash Experemental Теперь вы можете в реальном времени, в формате чата редактировать изображение текстовыми запросами. Gemini будет запоминать все запросы в формате контекста в памяти. Попробовать можно в AI Studio, выбираете Experemental версию в разделе Prewiew и output format выбираете image and text и пробуйте(бесплатно). Регион Россия не поддерживается, но русский язык гемини понимает. Так что включаем впн и пробуем. Функционал: 🟡Заменить лицо, одежду и другие объекты на оригинальном изображении; 🟡Отреставрировать фото или его колоризировать; 🟡Копировать текстуры на объекты; 🟡Добавлять текст на фото и переводить текст; 🟡Дорисовывать изображения.
🤯 Головная боль многих компаний — платить сотрудникам в любые страны без ограничений и с минимальными ресурсозатратами Как это обычно бывает: компания на Кипре или в Сербии, а команду разбросало по миру. При этом всем нужно вовремя платить за услуги и формировать закрывающие документы. Платформа 4dev.com позволяет платить десяткам сотрудников в любой точке мира и получать закрывающие документы по каждому платежу. Не нужно тратить время на лишние бумаги и особенности законодательств разных стран! Как это работает: При регистрации профиля вы подписываете договор с 4dev.com, исполнители делают то же самое. Вы заключаете всего один контракт с платформой, а 4dev.com берёт на себя документооборот и расчёты с вашей командой. - Выплаты удалённым сотрудникам и фрилансерам в 100+ стран, в том числе в СНГ - Автоматическое создание закрывающих документов по каждой выплате. Документы соответствуют международным стандартам финансовой отчётности - Комиссия 3% и ниже для бизнеса - Можно оплачивать услуги сотрудников в USDT Запишитесь на онлайн-демо: менеджер 4dev.com поможет найти решение под ваши задачи с помощью платформы 👉 записаться
В ответ на пост Поддержка Gemma 3 появилась в LM Studio Для этого необходимо обновиться до версии 0.3.13 В ходе тестов заметил, что распознавание изображений сбоит, приходится перезагружать модель, а так же какое-то странное использование видеопамяти и просадки производительности. Но в плане ответов модельки приятно порадовали.
▶️Gemma 3 - "лучшая в мире" компактная нейросеть от Google Нейросеть создана на базе тех же технологий, что и «самая продвинутая» модель компании Gemini 2.0. Google заявляет, что Gemma 3 — «лучшая в мире модель» среди нейросетей, которые работают на одном графическом процессоре (GPU) или тензорном процессоре (TPU). В тестах она превзошла такие известные модели, как DeepSeek-V3 и o3-mini. Это означает, что разработчики могут запускать мощные ИИ-приложения даже на стандартном оборудовании без дорогостоящих серверов. 🟡Gemma 3 поддерживает 35 языков, включая русский, и «предобучена» на 140 языках (русский понимает лучше чем gpt-4o и многие другие модели) 🟡Длина контекстного окна 128к токенов 🟡Есть версии на 1B, 4B, 12B и 27Bпараметров. 27B помещается на H100/A100 bf16. 🟡Внедрили ShieldGemma 2 - это инструмент который проверяет и отсеивает запрещенку на 3 категории: опасный контент, сцены насилия и откровенные материалы. Google предлагает несколько способов работы с моделью. Разработчики могут использовать Gemma 3 в облаке через Vertex AI, запускать ее в локальных средах или интегрировать в мобильные и десктопные приложения. Поддерижвает Hugging Face Transformers, PyTorch и Google AI Studio, упрощает ее адаптацию под конкретные задачи. Кому интересно можете почитать 26 страничный технический отчет гугла по gemma 3 Протестировать, как работает модель, можно в AI Studio, выбрав её из списка. Скачать Gemma 3 можно бесплатно с Hugging Face, Ollama и Kaggle. 🆓Потестить 🖥Блог 🤗HF 🟥Презентация
Gradio Sketch 2.0 🟡Инструмент для удобного создания интерфейса для нейронок, демок на HF и т.п без единой строчки кода. 🟡Также у них на сайте есть гайды для чайников по использованию градио. 🟡Есть доступ к использованию через API. (на локалке внизу страницы будет ссылка "использовать через api") ⁉️Как пользоваться 1. Заходим в терминал и пишем pip install --upgrade gradio 2. Ждем загрузку и индексацию 3. Пишем в терминал gradio sketch 4. Он вам выдет local url, просто заходите по нему и пользуйтесь 🐱Github 🌐Оф Сайт
📺Manus - новый китайский ИИ-агент "убийца Operator" Manus — это «первый полностью автономный», универсальный ИИ-агент, который может автономно выполнять от и до задачи в интернете от вашего имени (а не просто отвечать на вопросы или готовить отчеты, пусть и хорошие). По словам разработчиков, им уже воспользовались свыше 10 млн пользователей. Он работает в нескольких вкладках и программах в фоновом режиме, сам решает, как выполнить задачу, не требуя постоянных указаний от пользователя. 5 марта 2025 года Manus AI представили своего ИИ-агента. Группа людей получив.шая доступ к бета тестированию назвали Manus убийцей Operator от OpenAI и сравнили выход Manus с DeepSeek-R1. В тесте для ИИ-агентов GAIA, который проверяет их способность рассуждать, совершать действия на веб-страницах и просматривать медиафайлы, Manus превзошёл Deep research от OpenAI. При запросе «найти квартиру в Сан-Франциско» Manus не просто даёт выжимки с сайтов из поиска, а учитывает статистику преступлений, стоимость аренды и погодные условия. 📈Ключевые отличия от других ИИ инструментов: 🟡Автономное выполнение задач: Manus способен самостоятельно выполнять задачи от начала до конца, включая сбор данных, анализ и представление результатов в различных форматах (документы, таблицы, презентации). 🟡Интеграция с браузерами и инструментами: Manus использует виртуальные браузеры и может имитировать действия человека на веб-страницах, что позволяет ему выполнять сложные задачи в интернете. 🟡Гибкость и универсальность: Manus подходит для широкого спектра задач, от маркетинговых исследований до анализа ценовых трендов и создания приложений. Эти возможности позволяют Manus работать автономно в различных реальных приложениях, что делает его значительным достижением в области ИИ. Сообщается, что "Monica использует передовые модели искусственного интеллекта, включая OpenAI o3-mini, DeepSeek R1, GPT-4o, Claude 3.7 и Gemini 2.0, чтобы улучшить ваш опыт общения, поиска, письма и программирования" (Monica это китайская компания которая разработала магнус) Примеры использования Manus: 🟡Создание веб-сайтов 🟡Глубокий анализ данных 🟡Планирование поездок 🟡Генерация отчетов и таблиц 🟡Расчет бюджета 🟡Творческие и технические задачи, такие как генерация контента и автоматизация бизнес-процессов Если сравнивать Manus и DeepResearch (ИИ агент от OpenAI) — это два универсальных ИИ агента, предназначенных для выполнения сложных задач с минимальным вмешательством человека. Согласно заявлениям разработчиков, Manus достиг высоких результатов в тесте GAIA (General AI Assistant), превзойдя инструменты OpenAI GPT. Однако стоит отметить, что такие утверждения обычно исходят от самих компаний и могут требовать независимой верификации. ⁉️Как попробовать На данный момент попробовать манус через сайт можно только подав заявку в вайт лист по ссылке и ожидать приглашения с инвайт кодом. Но агент также доступен в виде расширения для браузеров Chrome и Edge, а также мобильного(Android & IOS) и приложения для ПК.
Как вам GPT 4.5? По моим тестам - умный но ленивый. Модель опять страдает тем, что не хочет писать длинный код, и всячески старается исхитриться, чтобы это не делать, в тое время как o1 и o3 без доп инструкций без проблем пишут код целиком с учётом всех правок. Кстати, идея нашим компаниям: прикрутите гибридный voicemod: Пользователь общается с моделью путем голосового общения, а модель кроме обычных ответов может так же сразу же, в фоне, генерирует и текстовый контента, то же код например. Тот VoiceMod, что сейчас предоставляют OpenAI в своём приложении, пока крайне далёк от представлений фантастов. Представьте, что кроме общения, модель бы могла делать скрины экрана, редактировать файлы, которые были загружены в диалог и вносить свои правки, а вы бы управляли бы всем этим лишь голосом. Удобно же?
🔥Веб-сервис от Wan Wan выкатили свой веб-сервис на котором есть функции text2video, image2video, text2img. При авторизации (google,github) вам сразу дают 50 токенов, помимо этого каждые сутки забирать еще по 50 кредитов, и также получать их за выполнение заданий. Купить кредиты нельзя, стоимость одного видео 10 кредитов, изображение 2 кредита. Также в дополнение к своему веб сервису они выпустили подробный промпт гайд на английском, вещь полезная. Разделы генератора: 🟡AI Image - доступно 4 модели (Wan2.1 Plus, Wan2.1 Turbo, Wan2.0 Turbo, Wan1.0). 🟡AI Video: генерация видео составляет примерно 8 минут - Text2Video - 2.1 Plus (выше качество, улучшенное движение, реалистичная физика и улучшенные визуальные эффекты), 2.1 Turbo (быстрая генерация, лучше движение, реалистичная физика и визуалы), 2.0 ( больше стилей, все😁😁) - Image2Video - можно добавить начальный и конечные кадры, также можно включить функцию создания звуковых эффекктов, Из интересного есть возможность попробовать Inspiration Mode - это увеличенный CFG Scale*. Доступно расширение для промпта Qween. ⚙️Тесты На тестах я решил сравнить Wan2.1 Plus для изображения и потом из этого же изображения сделать видео там же. Конкурировать с Wan будет Hunyan Wan Video: 1) Генерация изображения с дальнейшим создаением видео из этого изображения с дополнительным промптом Промпт для изображения Imagine futur fashion photoshoot on Mars planet , precision in design, beauty white woman, dark grey simple and light outfit, anamorphic lens, ultra realistic, hyber detailed, fashioncore, modelcore, portrait photo captured Mario Testino. use sony a7 II camera with an 30mm lens fat F.1.2 aperture setting to blur the background and isolate the subject. use distinctive lighting on the subject’s shot. The image should be shot in ultra-high resolution. Промпт для видео: meteorites start falling from the sky and the girl in glasses starts to dodge them but she is crushed by a meteorite Результаты - https://imgur.com/a/wan-09JH8I1 2) Генерация изображений, с последующей генерацией видео с начальным и конечным кадром из этих же изображений, без дополнительного промпта (еще закинул одну фотку как и в хуньяне просто без промпта сгенерировать видео) Промпт изображений: The back of a lonely white-haired, standing on the desolate seashore, with his long hair fluttering in the wind. The boy is wearing a black robe, with his hands in his pockets and his head down, looking particularly lonely. The background is a gray sky and a rough sea, with a few blurred mountains in the distance. The overall picture is cold in color, with a light mist effect. High-definition realistic photography, long-range composition. Результат - https://imgur.com/a/SDl0rxX (видео генерировалось долго, если локально пользоваться там все быстрее по идее намного) Hunyan Для тестов хуня я также использовал их веб версию - https://video.hunyuan.tencent.com/ (там можно почтой зарегаться и бесплатно генерить видео только скачайте переводчик страниц для браузера потому что там все на китайском) 1) Я дал китайцу фотку сгенерированную в ване, которую метеорит придавить должен был, и дал хуньяню точно такой же промпт для видео с этой фоткой, результат так себе, промпт хуньянем был совсем не понят Результат - https://imgur.com/a/lHrXbys 2) Тот же самый промпт для изображения, но в этот раз просто закинул картинку в генератор видео, картинку генерировал с помощью HunYuanDit_v1.2, видео Hunyuan Tusheng1.0 Результаты - https://imgur.com/a/OgYiTQj Итог Как по мне Wan создали очень крутой веб сервис, все удобно сделано, еще и токены на халяву дают каждый день, качество генераций и выбор моделей тоже хороший, я думаю для тестов и проб отлично подойдет, или сгенерировать что то в быту. *Метод Classifier-Free Guidance Scale использует безусловную и условную генерации, которые перемножаются друг с другом. Грубо говоря, сначала создается изображение без учета текстовой подсказки, а затем с ней. Чем выше CFG Scale, тем больше будет доминировать условное изображение
Решил из любопытства сделать симуляцию несуществующей игры по вселенной Fallout при помощи ChatGPT, которая играет в себя сама, при помощи локальной LLM. Ждите на GitHub в ближайшее время 😁