Компания Tether сделала крупный шаг в сторону искусственного интеллекта.
Её ИИ-подразделение QVAC существенно расширило открытый синтетический набор данных, предназначенный для обучения моделей. Речь идёт о новой версии — QVAC Genesis II. В неё добавили 107 млрд новых токенов, благодаря чему общий объём датасета вырос до 148 млрд токенов, охватывающих 19 образовательных направлений. В компании подчёркивают: это заметно повышает масштаб, глубину и качество рассуждений, которые могут формировать обучаемые модели. Вторая версия датасета опирается на фундамент Genesis I, но заметно расширяет его.
QVAC Genesis II включает 10 новых областей знаний, среди которых химия, информатика, статистика, машинное обучение, астрономия, география, эконометрика и электротехника. По заявлению разработчиков, датасет воспроизводит уровень физики университетского курса. В совокупности Genesis I и Genesis II формируют, по словам Tether, самый полный синтетический образовательный набор данных, когда-либо выл