Артем Бондарь, руководитель ИИ-сегмента компании Voximplant, рассказывает, как создаются алгоритмы, которых можно научить чему угодно — от сортировки фотографий до постановки диагнозов. Какой бы ни была задача модели, ее цель — предсказать результат по входным данным. Чем разнообразнее датасет (набор данных, «скармливаемых» модели), тем алгоритму проще найти закономерности, а значит, точнее будет результат на выходе. Сегодня в машинном обучении доминирует подход, ориентированный на саму модель, поэтому ML-инженеры тратят много времени на алгоритмы. От его выбора зависит скорость и точность работы. Несмотря на то, что этот подход проще и интереснее для инженеров, не стоит забывать о простом принципе garbage in, garbage out. Если собранные данные не репрезентативны, никакие алгоритмические хитрости не помогут улучшить качество работы модели. В идеальном мире компания, которая использует технологии машинного обучения, соблюдает культуру сбора данных. Но со сбора данных все только нач
Фильтрация контента и постановка диагноза: как ИИ учат сложным задачам без данных
14 июля 202214 июл 2022
2
2 мин