...и данная проблема невероятно опасна. Машинное обучение, или Machine Learning — процесс обучения компьютерных алгоритмов для выполнения новых задач по заданному примеру, используемый во многих сферах — от сельского хозяйства и страхования, до медицины и индустриальной промышленности. Но искусственный интеллект хорош настолько, насколько хорош датасет, на котором он обучается.
Одна из наиболее популярных отраслей с ипользованием машинного обучения, которая, по всей видимости, привнесёт колоссальные изменения в наше общество, — беспилотные автомобили. Но с большой силой приходит большая ответственность — плохо обученный автопилот может привести к фатальным последствиям, в прямом смысле. Вот почему мы были удивлены и крайне обеспокоены, когда изучали один из популярнейших датасетов для автопилота, используемый тысячами студентов для создания open-source автопилотов, содержащий критические ошибки и неточности. Мы провели ручную проверку 15 000 изображений в широко используемом датасет