Чтобы сделать ИИ эффективным, требуется много тренировок соответствующих моделей. Многие модели ИИ снабжаются данными, которые находятся в свободном доступе в интернете. Но что произойдет, когда искусственный интеллект усвоит все данные из сети? Фото из открытых источников Как сообщает Wall Street Journal, мы достигнем этой точки через несколько лет. Компании, занимающиеся ИИ, уже ищут альтернативы, чтобы в будущем создавать более крупные модели искусственного интеллекта с другими обучающими данными. Без новых данных все модели остались бы на одном уровне. Сообщается, что OpenAI уже реализует первоначальные планы по обучению GPT-5 через YouTube, точнее, с помощью транскрипции видео. По оценкам Earthweb, сейчас на YouTube размещено более миллиарда видеороликов. Таким образом, GPT-5 будет содержать много новых, естественно созданных данных. Другие компании хотят пойти по пути синтетических данных ИИ. Речь идет об обучающих данных, созданных самим ИИ. Однако, по мнению некоторых экспертов
Wall Street Journal: У ИИ скоро закончатся данные для обучения
8 апреля 20248 апр 2024
21
1 мин