ChatGPT - сегодня, самая продвинутая языковая модель включающая в себя генеративный "искусственный интеллект" предложенный компанией OpenAI. Несмотря на большое количество аналогов (Gemini от Google, Bing AI от Microsoft, AnonChatGPT, Copy.ai и другие), наибольшей популярностью пользуется именно ChatGPT и это не просто так, ведь данная языковая модель произвела фурор на рынке и открывает практически безграничные возможности начиная от программирования, создания изображений и заканчивая написанием статей на заданную тему. Остальные тоже это умеют, но это либо их единственная функция, либо они делают это хуже в сравнении с ChatGPT, который делает все вышесказанное одновременно и с большой точностью!
Наверняка, большинству пользователей ChatGPT стал известен в 2020 году, когда была презентована версия чата ChatGPT-3.5 и ChatGPT-3.5turbo - именно эти версии привлекли наибольшее количество пользователей. Но на самом деле, команда OpenAI начала свои разработки еще в 2018 году с презентации первой версии ChatGPT-1, которая была основана на архитектуре трансформатора от Google (2017 год). Нет, не электрического трансформатора и не трансформера из Всем известного фильма, а архитектуре-трансформере глубокого обучения - что на практике было чем-то невообразимо фантастическим. А обучалась данная модель на наборе данных из 7000 книг, которые авторы нашли в свободном доступе. Но несмотря на всю простоту описания - ChatGPT-1 это многофункциональная и сложно структурированная модель, где были применены сотни технологий для достижения поставленной цели, тут Вам и рекуррентные механизмы, и алгоритмы обработки памяти и контролируемого обучения, сложные архитектуры нейронных сетей и куча-куча всего новомодного. Вы только представьте насколько сложная модель была выпущена, если она включала 117 миллионов параметров.
Следующий этап развития - это ChatGPT-2, который был обучен уже на данных с 8 миллионов веб-страниц и имел уже 1,5 миллиарда параметров и это всего спустя один год (2019 - дата выхода ChatGPT-2). Помимо этого в модели был изменен алгоритм обучения, который теперь стал еще умнее и учитывал важность каждого компонента в последовательности по отношению к другим компонентам, так называемый алгоритм с вниманием. Данный подход позволил параллельно обучать модель, благодаря чему и был значительно расширен исходный набор обучающих данных. И все же, несмотря на сложность ChatGPT-2 - текст написанный с его использованием, было легко идентифицировать как "машинописный", но модель была уже способна дописывать текст только по одному заголовку.
Сентябрь 2020 года - презентация ChatGPT-3 - самой большой и продвинутой языковой модели в мире. Теперь параметров модели какое-то несчетное количество, а именно 175 миллиардов. На секундочку - это в 100 раз больше в сравнении с GPT-2. OpenAI развились настолько, что позволили себе арендовать сервера Microsoft Azure для обучения модели, а стоимость обучения достигала почти 5 миллионов долларов США. Обучающий набор состоял уже из разнородных данных, а именно 600 Гб сухого текста, всю англоязычную Википедию, те же датасеты с книгами и веб-сайтами от первой и второй версии GPT. Для русскоязычных пользователей было небольшим разочарованием то, что всего 0.11% данных из всего набора были на русском языке. Но даже этого хватило, чтобы ChatGPT-3 на высоком уровне обрабатывал запросы на русском, хоть и предпочтение все-же оставалось за английскими запросами, ведь это было и быстрее, и точнее. Тогда же OpenAI сделали платные тарифы, ведь спрос стал настолько большим, что требовалось масштабировать свои ресурсы для поддержания работы самого чата.
Март 2023 года - четвертое поколение GPT и соответственно ChatGPT-4. Тут Вам и обработка изображений, и аудио, и даже свои файлы подгружай для анализа. Сколько параметров в этой модели неизвестно наверняка до сих пор, но по приблизительным оценкам значение варьируется от 1.7 до 10 триллионов параметров. Количество нулей писать устанешь. Модель была настолько практична, что в сети появилось море новостей о том, как ChatGPT-4 решает олимпиаду по математике, как защищает научную степень или пишет научную работу лучше чем сам человек! Фурор от этой версии был настолько большим, что нескольким миллиардерам IT-отрасли пришлось "выкатить" OpenAI письмо, в котором они требовали остановить дальнейшие разработки в моделях, аргументировав это непоправимыми последствиями для всего мира. И как думаете, разработки на этом остановились? Ни тут то было...
13 мая 2024 года мир увидел обновление ChatGPT-4o, где о - означало всесторонние возможности GPT (omni). Ничего глобально нового в ней уже не было, но по отзывам пользователей можно судить о том, что модель стала еще лучше работать с запросами. Многие работодатели уже подумывают о том, чтобы уволить рядовых сотрудников и заменить их на комбинацию: Человек + ChatGPT. И как бы это смешно не было, но например в разработке программ, ChatGPT-4 уже превосходит уровень "Джуна" и по-идее можно уволить всех начальных программистов и оставить только Middle-разработчиков с доступом к ChatGPT. Как считаете, такая бизнес-схема имеет право на жизнь? Или может все это приведет к истреблению человечества?