Сейчас есть огромное количество сервисов на все случаи жизни, но в основном они сделаны на базе всего нескольких нейросетей, потому что сделать экосистему (нейросеть + модели + интерфейс) под силу только очень крупным компаниям, таким как Stabiliti, Google, Microsoft, Open AI. Это примерно столь же сложно, как написать новую Windows. Поэтому "под капотом" почти любого сервиса вы найдете решение от одного из крупнейших разработчиков.
Ограничения
Перед внедрением нейросетей стоит обратить внимание, что легальное использование иностранных сервисов в РФ крайне проблематично:
- необходимость оплаты иностранной картой физлица и некорректная бухгалтерская отчетность
- подключение через VPN (который порой не работает по несколько дней),
- сложность легального использования результатов работы (особенно картинок) в России
- передача персональных данных или конфиденциальных сведений на иностранные сервера (например, когда госслужащие или сотрудники крупных компаний используют Chat GPT в своей работе с документами) - это серьезное нарушение
- возможны ограничения на легальную поставку и эксплуатацию американских серверных компонентов для нейросетей, как это происходит с Китаем (а других пока нет)
Open source как выход
Поэтому, наибольшие перспективы – у систем на базе open source (с открытым исходным кодом) решений. Это реальная альтернатива закрытым продуктам западных корпораций. Каждый может собрать и «допилить» продукт для себя или клиента из легально доступных решений. С этого начинали наши самые крупные компании, постепенно наращивая базу собственных решений.
В нашей работе в 1neuro.pro мы также используем open source компоненты с "чистыми" правами, дополняя их собственными наработками. Мы занимаемся довольно специфическими решениями - high end генерация изображений и видео для бизнеса (если простыми словами: делаем то, что невозможно сделать в Midjourney и остальных доступных сервисах). И делаем все в России, чтобы избежать возможных проблем для наших клиентов.
Сравнение доступных текстовых моделей
Из рекомендаций для быстрого старта использования нейросетей в бизнесе:
- Claude от Anthropic: даже "средняя" по возможностям модель - Sonnet, которая доступна бесплатно (после непростой регистрации), во многих случаях заметно превосходит Chat GPT 4 по качеству текста в том числе русского. Также она может очень хорошо и быстро распознавать и подробно описывать картинки, а также генерить код (но это я не пробовал). В нее также можно загружать документы для анализа или написания текстов на базе них, и получается очень неплохо. Самая продвинутая модель - Opus далеко превосходит остальных на данный момент.
- Французский Chat Mistral хорошо взаимодействует со ссылками, помогает работать с контентом интернет-страниц, например, делать описания товаров для маркетплейсов. Русский язык попроще, но тоже ничего, особенно если писать подробные промпты и потом немного редактировать.
- Copilot от Microsoft пишет весьма банально и очень политкорректно, обходя даже малейшие намеки на чувствительные темы. Картинки распознает, но по сравнению с Claude - посредственно, при этом полностью отказываясь работать с изображениями людей. Зато в нем встроена нейросеть Dall-e для генерации картинок, такая же как в Chat GPT 4. У нее в целом хорошо с геометрией и пальцами, но по уровню реалистичности и художественности она сильно не дотягивает до более продвинутых конкурентов (Midjourney и Stable Diffusion).
- Chat GPT 4 - прорывное до недавнего времени решение, но очень капризное и глючное. Вероятно, он обучился на массе запросов некомпетентных пользователей, или Open Ai постоянно подкручивает фильтры толерантности, но по факту ГПТ-4 запросто может отказаться делать то, что сделал полчаса назад. И после Клауди он, конечно, померк.
- Google Ai studio тупит, делает вид что работает с документами с гугл диска, но лишь притворяется, что их читает) Но интерфейс интересный, может когда-то допилят
В России сейчас возникло множество сервисов-прокладок, которые по API используют Chat GPT, например, что дает огромные возможности, но также может вызвать и проблемы описанные выше.
Вывод
Главный вывод: смотрите не только на интерфейс и возможности, но и "под капот" каждого сервиса, выясняйте, какие технические и правовые риски могут возникнуть, и только после этого внедряйте.