sfd
Raindrop запустил A/B-тесты для AI-агентов: наконец-то можно понять, какая модель реально лучше работает
Представьте: каждую неделю выходит новая языковая модель. То OpenAI что-то обновит, то конкуренты выкатят свежую версию. И вот ты сидишь в компании, у тебя куча AI-агентов крутится в production, и думаешь: а стоит ли переходить на новую модель? А вдруг станет хуже? А как вообще это проверить на реальных пользователях, а не на синтетических тестах? Вот именно для этого стартап Raindrop (они занимаются observability для AI) запустил новую штуку: Experiments. По их словам, это первый A/B-тестинг, заточенный специально под корпоративных AI-агентов...
Инструкторы врали? Вся правда о С-рейтинге, которую от вас скрывали
Ребята, давайте по-честному: вся правда про эти «С-рейтинги» на батареях Привет всем! Сегодня поговорим на одну больную тему. Меня на эту мысль натолкнули ребята из GETPWR, за что им респект (если что это не реклама, думайте своей головой, картинки использую их, т.к. мне просто лень рисовать свои... уж извините). Смотрите, все мы летаем на литиевых аккумуляторах. И на каждой батарее есть циферка — «С-рейтинг». Помните, как нас учили на курсах? Говорили: «Смотрите на цифру после буквы «C». Чем она больше — тем батарея круче»...