В сети X показывают работу большой языковой модели Qwen3.5-397B, которую пытливые энтузиасты смогли развернуть непосредственно на айфоне. Судя по видео, нейросеть функционирует локально через приложение LM Studio, обрабатывая запросы со скоростью около 0,6 токена в секунду — примерно одно слово каждые две секунды. Публикация вызвала бурную реакцию — от восторженных возгласов до откровенного недоверия. Впрочем, технические подробности из репозитория на GitHub подтверждают реальность эксперимента и раскрывают впечатляющие детали реализации. Речь идет о запуске нейросети с 397 миллиардами параметров — и это очень много. Энтузиасты создали специализированный движок, который считывает данные напрямую с накопителя смартфона, поскольку уместить всю информацию в оперативной памяти физически невозможно. Чтобы хоть как-то втиснуть гиганта в iPhone, разработчики применили агрессивное сжатие — каждое число в нейросети закодировано всего тремя битами вместо стандартных 16 или 32. На настольном ком
На iPhone смогли втиснуть гигантскую языковую модель ИИ на 400 миллиардов параметров
24 марта24 мар
2 мин