Найти тему

Марк Цукерберг подвез классную новость – Meta AI* представила новую модель Llama 3 70B, сравнимую с GPT-4, но с открытым исходным кодом! 🚀


А я собрал еще несколько интересных фактов из интервью, которое вышло вместе с релизом модели 🤓

- В ближайшие месяцы ожидаются новые модели, они будут мультимодальными;

- Огромное количество GPU было закуплено еще в 2022 и не под LLM задачи, а в рамках работы над Reels в Instragram 😁 Но вот наступила эра ИИ и нашлись и другие применения!

- Новую модель тренировали на большом количестве кода, потому что, как показала практика у пользователей есть большой запрос на задачи, связанные с программированием. В LLaMA 2 это не предусмотрели, а потому она не очень хороша в качестве программиста.

- Скорее всего в будущем обучение ИИ будет происходить не просто на имеющихся данных, а прям итерациями: обучили, сгенерировали синтетические данные, дообучились, и так по кругу.

На русском интервью пока не вышло, а на оригинал оставляю ссылку 💡

(Meta* признана экстремистской в РФ)

#НовостиИИ