Как показала практика последних двух лет, для создания мощных языковых моделей в первую очередь требуются огромные объёмы данных и соответствующие им вычислительные мощности. Осознание этого факта оказалось довольно грустным исследователей. Потому как это отодвинуло интерес к изучению и созданию передовых алгоритмов на второй план. Сейчас основные ресурсы направлены на получение самых объёмных датасетов и максимально производительного железа. Как следствие, видим очень острую конкуренцию и за железо, и за данные. Наиболее мощные образцы железа фактически попали под правительственный контроль. А с автоматизированным сбором данных активно начали бороться корпорации.
Что, по сути, стало причиной потрясений на рынке соцсетей. Серьёзные проблемы которые возникли у Реддита и Твиттера начались именно с попытки ограничить или сделать платным автоматизированный сбор контента. Это привело к невозможности работы сторонних клиентов, ограничениям на просмотр и прочим изменениями, которые вызвали с