Neurogen | Дзен

GLM-4.7-Flash 30B-A3B MoE, позиционируется как самая сильная модель в классе 30B и как вариант для лёгкого деплоя без сильной потери в возможностях По таблице на странице модели GLM-4.7-Flash сравнивают с Qwen3-30B-A3B-Thinking-2507 и GPT-OSS-20B. Примеры значений (как указано у авторов): - AIME 25: 91.6 - GPQA: 75.2 - SWE-bench Verified: 59.2 - BrowseComp: 42.8 - τ²-Bench: 79.5 Поддерживается популярными фреймворками инференса, vLLM и SGLang, причём уточняется, что поддержка в main-ветках...

12 часов назад

Увидел прикольный тренд, люди спрашивают gpt

Изобрази максимально честную картинку о том, как я к тебе относился за всё время. И делятся результатами Прикрепил свое, еще вариантов накидаю в коменты

20 часов назад

Новый уровень нейро-озвучки

Новая пиратская платформа для любителей аниме, где озвучка полностью создаётся с помощью ии Разрабы взяли голоса актеров озвучки популярной студии AniLibria и на их основе, с помощью иишки, полностью озвучили все тайтлы, которые по каким то причинам не озвучила сама анилибрия И самое интересное, что звучит это все реально круто, я прикрепил к посту реакцию одной из жертв нейродубляжа, можете послушать...

1 день назад

Google научил Gemini читать вашу жизнь

Гугл завезли в гемини новую функцию Personal Intelligence, теперь ассистент может подключаться к вашим Gmail, Google Photos, YouTube и истории поиска Реальный кейс из их блога: парень стоял в очереди в шиномонтаж и не помнил размер шин. Gemini, нашёл спецификацию авто, предложил варианты шин под разные сценарии, вытащил номерной знак из фото в Google Photos, достал детали комплектации из старых писем Gmail Умеет связывать данные из нескольких источников (текст + фото + видео), вытаскивать конкретные детали из писем и фоток, давать рекомендации на основе вашей истории И тут конечно возникает...

2 дня назад

В ответ на пост https://huggingface.co/unsloth/FLUX.2-klein-9B-GGUF/tree/main

3 дня назад

GPU Poor LLM Arena

Если у вас нет топовой видяхи,это не повод не играться с LLM GPU-Poor LLM Gladiator Arena - это лмарена для бедных😏 Именно тот формат, который делает сравнение моделей живым и прикладным, а не только бенчмарки ради бенчмарков Проект вырос из простой идеи, вокруг стало много реально сильных tiny/compact моделей и захотелось сделать понятную площадку, где их можно сравнивать...

3 дня назад

Ну что господа? Замедления теперь и в ТГ

4 дня назад

FLUX-2 Klein

BFL представили новую опенсорс модель для генерации и редактирования изображений, которая генерирует менее чем за секунду Инференс менее чем за секунду, на 30%+ если не ошибаюсь быстрее всех конкурентов, идеально зайдет для real-time генерации Визуальные эффекты профессионального уровня создаются примерно также быстро как вы можете придумать промпт, модель сочетает скорость с качеством, которое раньше требовало значительно больше времени FLUX.2 Klein 9B (основная модель) - Дистиллированная модель с хорошим качеством - Инференс: ~0...

5 дней назад

Fun-CosyVoice 3.0

Преобразование текста в речь (TTS), основанная на больших языковых моделях, которая превосходит своего предшественника CosyVoice 2.0 по всем ключевым параметрам 0.5B параметров при конкурентном качестве 9 основных языков: китайский, английский, японский, корейский, немецкий, испанский, французский, итальянский, русский Zero-shot клонирование голоса для многоязычного и кросс-лингвального синтеза Достигла sota по точности содержания, сходству с голосом...

5 дней назад

В ai toolkit теперь можно тренить лоры для LTX 2

Пока требования не утешительные, RTX 5090 + 64 RAM, однако говорили что скоро влезет и в 24gb VRAM Тяжелые времена ☔️

5 дней назад

Cowork: Claude

Долго я наблюдал, рассуждал и решил что это заслуживает вашего внимания, последней каплей стала новость о том, что весь проект был написан самим клауд кодом за полторы недели 🤓 Эволюция Claude Code, но теперь не только для разработчиков. Это инструмент, который позволяет Claude работать с любыми типами файлов на вашем компьютере с невиданной ранее автономностью Claude получает доступ к выбранной вами папке, может читать, редактировать и создавать файлы, организует хаос в ваших загрузках, создает документы из разрозненных заметок В отличие от обычного чата, Cowork работает как настоящий коллега,...

6 дней назад

GLM-Image

Zai-org представили новую модель генерации изображений на гибридной архитектуре, совмещает авторегрессивный подход и диффузионный декодер 🔘Состоит из двух основных компонентов: 1️⃣Авторегрессивный генератор (9B параметров) - Базируется на модели GLM-4-9B - Расширенный словарь с визуальными токенами - Генерирует компактное кодирование (~256 токенов), которое затем расширяется до 1K-4K токенов - Поддерживает выход в высоком разрешении 1K-2K 2️⃣Диффузионный декодер (7B параметров) - Архитектура...

6 дней назад

Скрыли публикацию

1,0×