В мире высоких технологий идёт настоящая битва за данные. Крупные компании, такие как OpenAI и Google, стремятся собрать как можно больше информации, чтобы обучить свои модели искусственного интеллекта. Но какие методы они используют и что происходит, когда они нарушают авторские права и законы? Давайте разберёмся! OpenAI решила переписать миллион часов видео с YouTube, чтобы создать свою модель транскрипции звука Whisper. Интересно, что отбором видеороликов лично занимался президент OpenAI Грег Брокман. Может быть, он знает секрет идеального контента для обучения ИИ? Google тоже активно использует данные с YouTube, но старается соблюдать договорённости с авторами видеоматериалов. Однако иногда эти договорённости нарушаются. Насколько строго компании следуют правилам и что стоит за кулисами этих соглашений? Сбор данных — это только начало. Важно не только собрать информацию, но и правильно её использовать. Некоторые компании создают специализированные наборы данных для каждой из своих
Война за данные: кто победит в гонке за информацией?
1 июля 20241 июл 2024
4
1 мин