Найти в Дзене
GLM-4.7-Flash
GLM-4.7-Flash 30B-A3B MoE, позиционируется как самая сильная модель в классе 30B и как вариант для лёгкого деплоя без сильной потери в возможностях По таблице на странице модели GLM-4.7-Flash сравнивают с Qwen3-30B-A3B-Thinking-2507 и GPT-OSS-20B. Примеры значений (как указано у авторов): - AIME 25: 91.6 - GPQA: 75.2 - SWE-bench Verified: 59.2 - BrowseComp: 42.8 - τ²-Bench: 79.5 Поддерживается популярными фреймворками инференса, vLLM и SGLang, причём уточняется, что поддержка в main-ветках...
12 часов назад
Новый уровень нейро-озвучки
Новая пиратская платформа для любителей аниме, где озвучка полностью создаётся с помощью ии Разрабы взяли голоса актеров озвучки популярной студии AniLibria и на их основе, с помощью иишки, полностью озвучили все тайтлы, которые по каким то причинам не озвучила сама анилибрия И самое интересное, что звучит это все реально круто, я прикрепил к посту реакцию одной из жертв нейродубляжа, можете послушать...
1 день назад
Google научил Gemini читать вашу жизнь
Гугл завезли в гемини новую функцию Personal Intelligence, теперь ассистент может подключаться к вашим Gmail, Google Photos, YouTube и истории поиска Реальный кейс из их блога: парень стоял в очереди в шиномонтаж и не помнил размер шин. Gemini, нашёл спецификацию авто, предложил варианты шин под разные сценарии, вытащил номерной знак из фото в Google Photos, достал детали комплектации из старых писем Gmail Умеет связывать данные из нескольких источников (текст + фото + видео), вытаскивать конкретные детали из писем и фоток, давать рекомендации на основе вашей истории И тут конечно возникает...
2 дня назад
В ответ на пост https://huggingface.co/unsloth/FLUX.2-klein-9B-GGUF/tree/main
3 дня назад
GPU Poor LLM Arena
Если у вас нет топовой видяхи,это не повод не играться с LLM GPU-Poor LLM Gladiator Arena - это лмарена для бедных😏 Именно тот формат, который делает сравнение моделей живым и прикладным, а не только бенчмарки ради бенчмарков Проект вырос из простой идеи, вокруг стало много реально сильных tiny/compact моделей и захотелось сделать понятную площадку, где их можно сравнивать...
3 дня назад
FLUX-2 Klein
BFL представили новую опенсорс модель для генерации и редактирования изображений, которая генерирует менее чем за секунду Инференс менее чем за секунду, на 30%+ если не ошибаюсь быстрее всех конкурентов, идеально зайдет для real-time генерации Визуальные эффекты профессионального уровня создаются примерно также быстро как вы можете придумать промпт, модель сочетает скорость с качеством, которое раньше требовало значительно больше времени FLUX.2 Klein 9B (основная модель) - Дистиллированная модель с хорошим качеством - Инференс: ~0...
5 дней назад
Fun-CosyVoice 3.0
Преобразование текста в речь (TTS), основанная на больших языковых моделях, которая превосходит своего предшественника CosyVoice 2.0 по всем ключевым параметрам 0.5B параметров при конкурентном качестве 9 основных языков: китайский, английский, японский, корейский, немецкий, испанский, французский, итальянский, русский Zero-shot клонирование голоса для многоязычного и кросс-лингвального синтеза Достигла sota по точности содержания, сходству с голосом...
5 дней назад
Cowork: Claude
Долго я наблюдал, рассуждал и решил что это заслуживает вашего внимания, последней каплей стала новость о том, что весь проект был написан самим клауд кодом за полторы недели 🤓 Эволюция Claude Code, но теперь не только для разработчиков. Это инструмент, который позволяет Claude работать с любыми типами файлов на вашем компьютере с невиданной ранее автономностью Claude получает доступ к выбранной вами папке, может читать, редактировать и создавать файлы, организует хаос в ваших загрузках, создает документы из разрозненных заметок В отличие от обычного чата, Cowork работает как настоящий коллега,...
6 дней назад
GLM-Image
Zai-org представили новую модель генерации изображений на гибридной архитектуре, совмещает авторегрессивный подход и диффузионный декодер 🔘Состоит из двух основных компонентов: 1️⃣Авторегрессивный генератор (9B параметров) - Базируется на модели GLM-4-9B - Расширенный словарь с визуальными токенами - Генерирует компактное кодирование (~256 токенов), которое затем расширяется до 1K-4K токенов - Поддерживает выход в высоком разрешении 1K-2K 2️⃣Диффузионный декодер (7B параметров) - Архитектура...
6 дней назад