1 месяц назад
ATP/WTA rank vs Elo rating: что точнее для прогноза
ATP ranking — накопительная точковая система. За победу на Grand Slam final 2000 очков, ATP 1000 — 1000, ATP 500 — 500, ATP 250 — 250. Учитываются лучшие 19 результатов за последние 52 недели. Проблемы: (1) Не учитывает силу оппонентов — победа над 200-м даёт такие же points как над 2-м (в рамках турнира); (2) Не учитывает margin — 6-4 6-4 и 6-0 6-0 имеют одинаковое очков значение; (3) 52-week window — игрок может быть в top-10 по rank но в ужасной форме сейчас. ATP rank — marketing инструмент и basis для seeding, не прогностический tool. Elo rating (from chess Arpad Elo 1960s) измеряет чистый skill...
3 недели назад
🤖 Gait Analysis System — это Python-проект для анализа походки человека с использованием компьютерного зрения и машинного обучения
, позволяющий извлекать биомеханические параметры движения из видео. Ориентирован на обработку видео с человеком и определение ключевых точек тела для дальнейшего анализа движений, симметрии и характеристик шага. 📌 Основные особенности: 🔵Анализ походки по видео 🔵Определение ключевых точек тела 🔵Расчёт...
"Тесты новых GPT-шек от Artificial Analysis
"Тесты новых GPT-шек от Artificial Analysis https://www.linkedin.com/pulse/openai-gave-us-early-access-gpt-5-our-independent-dr6rc/ OpenAI представила единый API-эндпоинт для GPT-5, но разные уровни интенсивности рассуждений дают сильно различающийся уровень интеллекта. GPT-5 с уровнем High достигает новой планки интеллектуальных возможностей, в то время как Minimal находится примерно на уровне GPT-4.1 (но гораздо эффективнее по токенам). ⚙️ Конфигурация интенсивности рассуждений: GPT-5 поддерживает четыре режима: High, Medium, Low и Minimal...
9 месяцев назад
Principal Component Analysis (PCA) ⚙️
PCA — алгоритм, уменьшающий пространство признаков так, чтобы потерять как можно меньше информации. Его часто спрашивали на собеседованиях, и, когда я впервые его изучил, то получил удовольствие от такого изящного применения линейной алгебры. Давайте же начнём разбор 🧑‍💻 Найти новые ортогональные оси (главные компоненты), вдоль которых дисперсия данных максимальна, и проецировать данные на первые k таких осей. 1) Нормирование. Приводим признаки к сопоставимым шкалам. Иначе признаки с большими числовыми масштабами доминируют по дисперсии...