Добавить в корзинуПозвонить
Найти в Дзене
NeuroNest

T-one против гигантов: крошечная сеть бросает вызов BigTech

Когда банки выпускают тарифы с кэшбэком на ЖКХ, никто не хлопает в ладоши. А вот когда один из них внезапно выкладывает в открытый доступ свою модель распознавания речи - это уже что-то из разряда «Вы точно банк, а не стартап на стероидах?». «Т-Банк» не просто выкатил очередную нейросеть, а сделал шаг, который обычно ждёшь от энтузиастов в худи, а не от людей в костюмах из корпоративного офиса. И да, это реально круто. T-one — это не очередной сырой pet-проект. Это боевой движок, который банк использует сам и предлагает всем желающим: берите, кастомизируйте, дообучайте и внедряйте. Для тех, кто в теме, это как если бы в 2000-х кто-то открыл код Opera и сказал: «Пользуйтесь, пацаны, только сделайте лучше». В технических деталях тут тоже всё бодро. Модель на 70 миллионов параметров — компактная, но шустрая. Для сравнения: Whisper от OpenAI весит 1,5 ярда, а GigaAM от «Сбера» — 240 млн. То есть T-one — это тот самый вариант «мал, да удал». Влезает на один A100 и шпарит с задержкой меньше

Когда банки выпускают тарифы с кэшбэком на ЖКХ, никто не хлопает в ладоши. А вот когда один из них внезапно выкладывает в открытый доступ свою модель распознавания речи - это уже что-то из разряда «Вы точно банк, а не стартап на стероидах?». «Т-Банк» не просто выкатил очередную нейросеть, а сделал шаг, который обычно ждёшь от энтузиастов в худи, а не от людей в костюмах из корпоративного офиса. И да, это реально круто.

T-one — это не очередной сырой pet-проект. Это боевой движок, который банк использует сам и предлагает всем желающим: берите, кастомизируйте, дообучайте и внедряйте. Для тех, кто в теме, это как если бы в 2000-х кто-то открыл код Opera и сказал: «Пользуйтесь, пацаны, только сделайте лучше».

В технических деталях тут тоже всё бодро. Модель на 70 миллионов параметров — компактная, но шустрая. Для сравнения: Whisper от OpenAI весит 1,5 ярда, а GigaAM от «Сбера» — 240 млн. То есть T-one — это тот самый вариант «мал, да удал». Влезает на один A100 и шпарит с задержкой меньше 150 мс. А значит, можно прикручивать её к колл-центрам, голосовым ботам и вообще куда угодно — даже без клаудов и серверных ферм на Камчатке.

Почему это вообще важно? Потому что рынок ASR (Automatic Speech Recognition) у нас перегрет, но при этом по-настоящему доступных и гибких решений — кот наплакал. Все либо закрытые, либо жрут ресурсы, как прожорливый майнер на RTX. А тут — open-source, да ещё и с разрешением на коммерческое использование. То есть ты реально можешь запилить своего голосового ассистента, и никто не придёт за роялти.

К тому же, это не первый open-подарок от группы «Т-Технологии». В прошлом году они уже выложили свои LLM — T-Lite и T-Pro. Логика, как по мне, прозрачная: код — в мир, надстройки — себе. Бизнес не в железе и не в моделях, а в том, как ты их применяешь. Хочешь антифрод? Накинул. Хочешь чат-бота для клиентов? Пожалуйста. Всё, что нужно — уже есть под капотом.

Контекст тоже бодрит. Рынок разговорного ИИ в России только за прошлый год вырос на 25%, и это ещё без учёта того, как сейчас все бегут от зарубежных API после известных событий. Банки, ритейл, телеком — все смотрят на локальные решения, потому что:

  1. Санкции — никто не хочет зависеть от чужих серверов.
  2. Цены на облако — ух.
  3. Безопасность — данные клиентов за периметр не выноси, иначе прилетит.

T-one закрывает все эти боли. Суверенность? Есть. Стоимость? Ниже, чем у жирных моделей. Адаптация? Да хоть на медицину её натаскивай, хоть на переговоры юристов. Лицензия позволяет. Был бы энтузиазм — комьюнити всё дотянет.

А теперь пафосная, но справедливая мысль. Этот релиз — не про «вот вам ещё один инструмент». Это про смену парадигмы. Когда open-source начинает быть важным даже для крупных финтехов, значит, старые подходы трещат по швам. Вместо того чтобы платить за каждую минуту распознавания чужим, компании начинают строить своё. Экспертиза растёт внутри, продукт быстрее кастомизируется, а ИИ — становится не игрушкой, а рабочим инструментом.

И что особенно приятно — это всё не выглядит как пиар. Есть репозиторий, есть лицензия, есть описание пайплайна на Habr. Не какая-то «демо-версия для галочки», а реальный вклад в рынок.

Что будет дальше? Зависит от нас. Если комьюнити подключится — натаскает модель на новые датасеты, поделится скриптами, накрутит тесты — будет не просто ещё одна ASR, а новый стандарт для SMB и энтузиастов. Тем более что Минцифры с грантами на суверенный ИИ сейчас как никогда вовремя. И если у тебя есть проект, где важен голос, — самое время обратить внимание.

-2

Так что да, этот шаг от «Т-Банка» — немного как будто бы не из банковской оперы. Но от этого он только круче. Потому что настоящий прогресс часто приходит от тех, от кого его не ждёшь.

А теперь вопрос к вам, друзья:

А вы бы рискнули заменить платный ASR в своём продукте на open-source, если бы знали, что он работает не хуже?

Напишите в комментах — интересно, насколько вы готовы к такому «суверенному» повороту.