Главное Интересное Политика Общество Экономика СВО В мире Спорт Шоу-бизнес Происшествия Культура Технологии Наука Авто

25 февраля в 04:58

Claude распознает бред в 94% случаев. GPT-5.2 поддакивает пользователю

Руководитель по ИИ в компании Arena Питер Гостев опубликовал Bullshit Benchmark — тест из 55 бессмысленных вопросов, которые звучат умно, но не имеют смысла.Хабр

#base-scroll-wrapper { opacity: 1; clip-path: none; overflow: scroll; }#base-scroll-wrapper::-webkit-scrollbar { height: 6px; background: none; }#base-scroll-wrapper::-webkit-scrollbar-thumb { border-radius: 8px; background-color: var(--zenColorBgTertiary); }#base-scroll-container { overflow: unset; }#tabs-skeleton-container { display: none; }

#theme-content-annotation { opacity: 1; }#chips-items { opacity: 1; }#chips-container { overflow: scroll; }#chips-container::-webkit-scrollbar { height: 6px; background: none; }#chips-container::-webkit-scrollbar-thumb { border-radius: 8px; background-color: var(--zenColorBgTertiary); }#card-skeleton { display: none; }

#ad-feed { display: none; }#ad-tsar { display: none; }#ad-banger { display: none; }#ad-column_top { display: none; }#ad-column_bottom { display: none; }

#ad-feed { display: none; }#ad-tsar { display: none; }#ad-banger { display: none; }#ad-column_top { display: none; }#ad-column_bottom { display: none; }

Добавить в корзину Позвонить