Разработка проектов с искусственым интеллектом, хоть и сулит потенциал для многих отраслей, зачастую требует больших затрат и ресурсов. Проекты с ИИ – от найма высококлассных специалистов до приобретения высокопроизводительных вычислительных ресурсов – могут стать сложной задачей для компаний с ограниченными ресурсами.
Проблема ограниченности ресурсов как раз актуальна для начинающих ИИ-компаний: у многих из них нет денег на эксперименты с несколькими моделями ИИ, исследование различных технологий и многократное тестирование моделей для достижения необходимой точности.
Мы работали с десятками ИИ-стартапов и видели, как они проходили путь от "ничего" до работающего продукта. И после многих итераций стало понятно, что есть 3 основные ошибки, которые совершают многие ИИ-стартапы, когда подходят к разработке цифрового продукта. Они не так очевидны, как может показаться.
ИИ-стартап – это не обычный стартап
Когда мы говорим о том, что стартапы теряют деньги, мы часто вспоминаем о наиболее типичных проблемах, таких как соблюдение нормативных требований, найм специалистов, масштабирование продукта и т.д.
Когда речь идет об ИИ-стартапах, возникает совершенно новый уровень ошибок и возможностей потери денег, обусловленных природой продукта.
Даже с учетом всех последних достижений в области искусственного интеллекта и машинного обучения создание ИИ-продукта все ещё является авантюрой: никогда нельзя быть уверенным в том, что продукт окажется эффективным и в конечном итоге будет стоить потраченных денег и времени.
Мутные воды машинного обучения
Причина этого кроется в природе используемых технологий. Проекты машинного обучения требуют моделей машинного обучения, которые необходимо обучать для обработки данных. Практически нет гарантии, что после обучения модель будет хорошо работать на реальных данных.
Перебор и недобор, проблемы с качеством и смещением данных, недостаточная проработка функций, неправильный выбор модели и некорректная постановка задачи – вот лишь некоторые проблемы, с которыми можно столкнуться при разработке ИИ-продуктов.
Не все из них можно решить простым переобучением или заменой одной ML-модели на другую, но даже если попытаться это сделать – каждая итерация стоит все больше денег и требует все больше времени, съедая бюджет проекта, который у стартапов весьма ограничен.
Стратегическое планирование
Стратегическое планирование и "дорожная карта" часто выделяются как жизненно важный этап для любого стартапа. Несмотря на то, что все это верно, не всегда легко применить этот совет на практике, особенно для стартапа, который хочет работать с технологиями искусственного интеллекта.
Именно в этом мы видим проблему большинства стартапов в области ИИ. Планирование с учетом множества неизвестных – сложная задача. Чаще всего мы видим, как стартапы с головой погружаются в разработку, не протестировав идею и не создав прототипов. Это можно назвать пустой тратой ресурсов, которые лучше было бы потратить собственно на разработку продукта.
Из нашего опыта работы со стартапами в области ИИ можно сделать вывод, что большинство стартапов испытывают трудности:
- Создание предварительной модели
- Разработка рабочего прототипа
А теперь к ошибкам!
Ошибка № 1: набор данных не соответствует проекту
Многие ИИ-стартапы, с которыми мы работали, испытывают трудности с созданием хорошего набора данных:
- Недостаточно большой набор данных – объем изображений в наборе данных обычно довольно мал и недостаточен для разработки продукта или прототипа.
- Не учитывается размер изображения – чаще всего изображения либо слишком большие, либо слишком маленькие, что приводит к очень плохой работе модели
- Не учитывается вычислительная мощность – большие изображения не могут быть обработаны на устройствах с низкой вычислительной мощностью, таких как веб-камера
- Не найден баланс между разрешением изображения и необходимой детализацией объекта.
Определите поставленную задачу
Собрать несколько сотен или тысяч изображений не так просто. Очень важно четко сформулировать проблему, которую вы пытаетесь решить, и определить, какие данные вам нужны. Это предполагает понимание типа задачи машинного обучения (например, классификация, регрессия, кластеризация и т.д.), а также признаков, которые могут быть важны для прогнозирования целевой переменной.
Больше – не всегда лучше
Еще одним важным фактором, который необходимо учитывать, является размер изображений. Размер изображения напрямую влияет на вычислительные ресурсы, необходимые для его обработки. Большие изображения требуют больше памяти и вычислительных мощностей, что может существенно замедлить обучение и вывод модели.
Учитывайте устройство
Вычислительная мощность играет важную роль не только при обучении, но и при запуске продукта. Часто модели приходится запускать на веб-камерах или мобильных устройствах, а большие изображения не могут быть эффективно обработаны из-за низкой вычислительной мощности этих устройств.
Объект против изображения
Уровень детализации изображения связан с его размером. Изображения с высоким разрешением позволяют получить более подробную информацию, но при этом вносят большую изменчивость, на которой должна учиться модель.
Поэтому необходимо найти баланс между достаточно высоким разрешением, чтобы уловить необходимые особенности, и не настолько высоким разрешением, чтобы затруднить обучение модели или уловить ненужные детали.
При выборе подходящего размера изображения часто учитываются все эти факторы, а также ограничения, связанные с конкретным случаем использования и доступными вычислительными ресурсами.
Ошибка №2: пропуск предварительной модели
В машинном обучении предварительная модель, также известная как базовая или наивная модель, служит отправной точкой или эталоном для сравнения с более сложными моделями, которые вы будете строить в процессе разработки модели.
Идея создания предварительной модели заключается в том, чтобы предоставить простое и быстрое в реализации решение с использованием базовых алгоритмов или методик, которое поможет понять, какой минимальной точности или производительности можно достичь. Базовая модель становится эталоном, и целью дальнейшей разработки и совершенствования модели является улучшение этого эталона.
Почему необходимо начинать с простой модели
Основное преимущество предварительной модели заключается в том, что она создает основу для итерационного совершенствования модели. Начав с простой модели, можно постепенно усложнять ее (добавлять новые функции, более сложные алгоритмы и т.д.) и постоянно проверять, действительно ли эти добавления повышают производительность.
Если очень сложная модель работает лишь немного лучше, чем предварительная, то предпочтение можно отдать более простой модели, поскольку она лучше интерпретируется и меньше подвержена риску перебора.
Ошибка №3: Отсутствие рабочего прототипа
Этап создания прототипа часто пропускают, считая его малозначимым для разработки продукта в целом, особенно по сравнению с MVP, который выглядит и ведет себя как конечный продукт.
Однако важно отметить, что если для традиционных технологических стартапов MVP – это хорошее приближение к конечному продукту, то для проектов в области искусственного интеллекта создание MVP вначале чаще всего оказывается вредным для проекта:
- основная цель прототипа – проверить, насколько реализуема идея проекта при современном уровне развития технологий ИИ
- прототип помогает принять решение на основе данных, когда речь идет о модели ML, размере набора данных и размере изображения
- прототип помогает оценить качество распознавания и соответствующим образом скорректировать требования к продукту
Проверка реализуемости идеи
Прежде всего, прототип служит доказательством концепции, позволяя стартапу оценить жизнеспособность своих идей. Он помогает проверить реализуемость алгоритмов и моделей ИИ, которые станут неотъемлемой частью продукта.
Особенно в сфере ИИ, где успех решения в значительной степени зависит от исходных данных и эффективности моделей, прототип крайне важен для проверки того, что предлагаемое решение работает на практике, а не только в теории.
Привлечение финансирования
Для стартапов, ищущих внешнее финансирование, прототип может повысить вероятность привлечения инвесторов. Осязаемый прототип дает инвесторам более четкое представление о продукте, его функциональности и потенциальной рыночной стоимости.
Он демонстрирует технические возможности команды и служит доказательством приверженности стартапа делу. Таким образом, прототип может сыграть важную роль в привлечении финансирования.
Раннее выявление рисков
Прототипирование позволяет выявить и снизить риски на ранней стадии. Это дает возможность выявить технические, эксплуатационные и рыночные проблемы, которые могут помешать успеху продукта.
Выявление этих проблем на ранней стадии позволяет стартапам разработать решения или планы действий на случай непредвиденных обстоятельств, что гораздо экономичнее, чем вносить изменения после того, как в разработку были вложены значительные средства.
Веб-приложение или чат-бот
В зависимости от проекта и потребностей основателей стартапа прототип может выглядеть как веб-приложение или как чат-бот.
Чат-бот быстро и легко разрабатывается, его легко представить инвесторам и деловым партнерам.
Веб-приложение в качестве прототипа, напротив, может демонстрировать более сложную функциональность.
Подытожим
Подводя итог всему вышесказанному, можно сказать, что AI-стартапы теряют деньги на 3 основных ошибках:
1. Несоответствие набора данных потребностям проекта:
Набор данных должен соотноситься с аппаратным обеспечением, на котором будет работать модель, объекты, которые необходимо распознать, и уровень детализации, необходимый для успешной обработки.
Перед началом работы над набором данных необходимо четко определить объекты, которые будут распознаваться, и аппаратное обеспечение, на котором будет работать модель.
2. Отсутствие предварительной модели:
Рассмотрите возможность создания предварительной модели для оценки минимальной точности и возможного уровня производительности.
3. Пропуск прототипа:
Рассмотрите возможность создания прототипа перед MVP, что поможет оценить риски на ранней стадии, проверить реализуемость идеи и привлечь финансирование.
Одним из путей решения проблем может быть обращение к более опытной компании для разработки ИИ-проекта, либо привлечение на отдельных стадиях. Компания Технологика всегда в этом может помочь!