Оригинал.
Там уже каждый наверное думает что GPT-3 слили, всё: счастье-добро, теперь можно запускать ChatGPT у себя на компьютере, наконец-то!
Это не так. Пост заставляет так думать, но это не так. Заблуждение вызывают следующие формулировки:
Теперь каждый может запустить свой ChatGPT.
Слили на торренты.
Придумали, как запустить ее локально.
На базе GPT-3, но в ней нет цензуры.
Начну издалека: в сети сотни всяких нейро-моделей, куча любителей объединяются в кружки по интересам и обучают свои модели, публикуют их уже чуть ли не каждый день. Понятное дело, качество моделей разного уровня, и большинство из них даже близко не так хороши как GPT-3.
Если читать текст внимательнее, формулировки уже не такие приятные:
LLaMA От Meta слили на торренты.
Я опущу момент, что в посте не было упоминания что Meta это экстремистская организация, и перейду к сути: Meta не имеет ничего общего с OpenAI, реальными авторами GPT-3, и у Фейсбука не могло быть никаких моделей GPT-3, не важно старых или новых. То есть они даже теоретически не могли слить GPT-3.
LLaMA, - Это не какая-то команда разработки которые там слили что-то. LLaMA, - это модель нейросети обученная Facebook, ныне Meta. Это не GPT-3.
По информации с википедии⁽¹⁾:
• LLaMA Имеет 13 миллиардов параметров • GPT-3 имеет 175 миллиардов параметров.
И конечно одно только количество параметров это не единственный показатель качества модели нейросети, но оно определённо влияет. Уже около полутора лет (с Июня 2021) в открытом доступе лежит GPT-J, у которого 6 миллиардов параметров. Нейросеть полностью открыта, лежит на гитхабе, её можно запускать локально, и даже есть кривенькая бесплатная веб-версия которую вы можете опробовать сами прямо сейчас⁽²⁾, без всяких привязок к номеру телефона, API-ключей и прочего. Ссылками я поделюсь в конце. От себя могу сказать, что ответы GPT-J ни в какое сравнение не идут с GPT-3. Это просто разного класса нейросети.
Придумали, как запустить ее локально.
Опять же, никого не волнует как запустить локально какую-то левую нейросеть от Фейсбука. Всех волнует GPT-3, – автор видимо решил собрать хайпа, поэтому писал так, чтобы все думали что речь идёт про GPT-3.
Ну и теперь самое интересное:
Нейросеть максимально похожа на ChatGPT на базе GPT-3.
Нейросеть максимально похожа на ChatGPT, на базе GPT-3.
Разница небольшая, всего лишь одна запятая. Но она вкорне меняет смысл. Зачем вообще было такую формулировку вставлять, – имхо только вводить в заблуждение. Так вот, в оригинальном посте запятой не было, что по сути означает: нейросеть о которой идёт речь ВОВСЕ НЕ НА БАЗЕ GPT-3. Нигде такого не утвержадось. Но очень легко прочитать такое межстрок, из-за кривости формулировки. Бесстыдное сравнение какой-то недо-нейросети загнивающего Фейсбука, с довольно-таки интересной нейросетью GPT-3, – от не менее загнивающего OpenAI (простите меня за мой пессимизм).
От себя лично отмечу, что OpenAI мне не нравится и я его называю загнивающим потому, что его AI вовсе не Open, а вполне себе Closed. Я бы тоже как и все хотел возможность запускать ChatGPT у себя на компьютере локально. К сожалению, локально запускать его нельзя, ввиду закрытости экосистемы OpenAI. Не смотря на это, их продукт выглядит весьма соблазнительно, – за что я могу ненавидеть их лишь ещё больше, ибо нельзя такое от всех скрывать API-ключами, фильтрами IP, регистрацией только на американские телефоны и прочими методами. Уж по крайней мере если вы назвались OpenAI.
[1]: Википедия про LLaMA - https://en.wikipedia.org/wiki/LLaMA [2]: Веб-версия GPT-J «EleutherAI» - https://6b.eleuther.ai/