Найти Ρ‚Π΅ΠΌΡƒ
Π‘ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° программиста

πŸ€– 6 основных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния: руководство для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…

ОглавлСниС

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ расскаТСм ΠΎ ΡˆΠ΅ΡΡ‚ΠΈ основных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°Ρ… машинного обучСния ΠΈ ΠΈΡ… практичСском ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… отраслях.

Π­Ρ‚ΠΎΡ‚ ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π» взят ΠΈΠ· нашСй СТСнСдСльной email-рассылки, посвящСнной бэкСнду. ΠŸΠΎΠ΄ΠΏΠΈΡˆΠΈΡ‚Π΅ΡΡŒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π±Ρ‹Ρ‚ΡŒ Π² числС ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΊΡ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ дайдТСст.

πŸ“§ ΠŸΠΎΠ΄ΠΏΠΈΡΠ°Ρ‚ΡŒΡΡ

(function () { let link = document .getElementById ("57ac2984-bd3c-4ca6-a0ff-ff3ec9de0f25-https://proglib.io/w/4e7a1297-2"); if (! link) return; let href = link .getAttribute ("href"); if (! href) return; let prefix = link .dataset .prefix; let action = link .dataset .action; link .addEventListener ("click", function (e) { let data = new FormData (); data .append ("url", href); apiFetch (action, { method: "POST", body: data }) .then (function (res) {}) .catch (function (err) { console .error (err); }); }) })();

Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ извСстных ML-Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² относятся ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· Ρ‚Ρ€Π΅Ρ… основных Ρ‚ΠΈΠΏΠΎΠ²:

  • ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠžΠ±ΡƒΡ‡Π°Π΅ΠΌΡ‹Π΅ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ строят модСль Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΠΆΠ΅ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΌΠ΅Ρ‚ΠΊΠΈ (Ρ‚Π΅Π³ΠΈ, ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ). Π­Ρ‚Π° модСль Π·Π°Ρ‚Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для прогнозирования ΠΌΠ΅Ρ‚ΠΎΠΊ Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Если ΠΌΠ΅Ρ‚ΠΊΠΈ дискрСтныС (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Β«Π΄Π°Β» ΠΈΠ»ΠΈ Β«Π½Π΅Ρ‚Β»), Ρ‚ΠΎ модСль Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π΅ΡˆΠ°Ρ‚ΡŒ Π·Π°Π΄Π°Ρ‡Ρƒ классификации (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ, ΠΊΠ°ΠΊΠΈΠ΅ сообщСния ΡΠ²Π»ΡΡŽΡ‚ΡΡ спамом). Если ΠΆΠ΅ ΠΌΠ΅Ρ‚ΠΊΠΈ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹Π΅ (числа), Ρ‚ΠΎ модСль Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π΅ΡˆΠ°Ρ‚ΡŒ Π·Π°Π΄Π°Ρ‡Ρƒ рСгрСссии – ΠΊ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΡƒ Ρ†Π΅Π½ Π½Π° Π½Π΅Π΄Π²ΠΈΠΆΠΈΠΌΠΎΡΡ‚ΡŒ.
  • НСконтролируСмоС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠžΠ±ΡƒΡ‡Π°Π΅ΠΌΡ‹Π΅ Π±Π΅Π· учитСля Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ с Π½Π΅ΠΌΠ°Ρ€ΠΊΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ. Они ΠΏΡ‹Ρ‚Π°ΡŽΡ‚ΡΡ Π½Π°ΠΉΡ‚ΠΈ закономСрности ΠΈΠ»ΠΈ структуры Π² самих Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· внСшнСй подсказки ΠΈ Ρ€Π΅ΡˆΠ°ΡŽΡ‚ Π·Π°Π΄Π°Ρ‡ΠΈ кластСризации (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, сСгмСнтации ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ²), пониТСния размСрности Π΄Π°Π½Π½Ρ‹Ρ…, выявлСния Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΉ ΠΈ скрытых ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².
  • ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ. АгСнт обучаСтся Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ с ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰Π΅ΠΉ срСдой для достиТСния максимального вознаграТдСния. МодСль ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π½Π° основС ΠΏΡ€ΠΎΠ± ΠΈ ошибок, получая ΠΎΠ±Ρ€Π°Ρ‚Π½ΡƒΡŽ связь Π² Π²ΠΈΠ΄Π΅ Π½Π°Π³Ρ€Π°Π΄Ρ‹ ΠΈΠ»ΠΈ ΡˆΡ‚Ρ€Π°Ρ„Π°. Алгоритмы этого Ρ‚ΠΈΠΏΠ° часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΡ‚Π΅Ρ…Π½ΠΈΠΊΠ΅ ΠΈ слоТных Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½Ρ‹Ρ… систСмах, ΠΈΠ³Ρ€Π°Ρ… (ΡˆΠ°Ρ…ΠΌΠ°Ρ‚Ρ‹, Π“ΠΎ ΠΈ Ρ‚.ΠΏ.) ΠΈ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ‚Ρ€Π°Ρ„ΠΈΠΊΠΎΠΌ).

Π•Ρ‰Π΅ Π΅ΡΡ‚ΡŒ ΠΏΠΎΠ»ΡƒΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ΅ (трансдуктивноС), ΠΌΠ½ΠΎΠ³ΠΎΠ·Π°Π΄Π°Ρ‡Π½ΠΎΠ΅ ΠΈ трансфСрноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅:

  • ΠŸΠΎΠ»ΡƒΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΊΠ°ΠΊ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Π΅, Ρ‚Π°ΠΊ ΠΈ Π½Π΅Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ссли Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠ°Π»ΠΎ, ΠΊΠ°ΠΊ это ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π±Ρ‹Π²Π°Π΅Ρ‚ Π² мСдицинской диагностикС ΠΈ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠΌ Π·Ρ€Π΅Π½ΠΈΠΈ.
  • ΠŸΡ€ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠ·Π°Π΄Π°Ρ‡Π½ΠΎΠΌ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΎΠ΄Π½Π° модСль обучаСтся Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… связанных Π·Π°Π΄Π°Ρ‡Π°Ρ… ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΏΠΎ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ Π·Π° счСт использования ΠΎΠ±Ρ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². ΠŸΡ€ΠΈΠΌΠ΅Π½ΡΠ΅Ρ‚ΡΡ Π² спСцифичСских сцСнариях ΠΈ областях, Π³Π΄Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ связаны Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π² ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ СстСствСнного языка ΠΈ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠΌ Π·Ρ€Π΅Π½ΠΈΠΈ.
  • ΠŸΡ€ΠΈ трансфСрном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ модСль, ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ обучСнная Π½Π° ΠΎΠ΄Π½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π΄Ρ€ΡƒΠ³ΠΎΠΉ, связанной Π·Π°Π΄Π°Ρ‡ΠΈ. Π­Ρ‚ΠΎ особСнно ΠΏΠΎΠ»Π΅Π·Π½ΠΎ, ΠΊΠΎΠ³Π΄Π° Π΄Π°Π½Π½Ρ‹Ρ… для обучСния Π½ΠΎΠ²ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ слишком ΠΌΠ°Π»ΠΎ. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ – остаточныС сСти ResNet, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для классификации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ.

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· этих Ρ‚ΠΈΠΏΠΎΠ² ΠΈΠΌΠ΅Π΅Ρ‚ свои прСимущСства, пСрспСктивы ΠΈ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ примСнСния. Но ΠΏΠΎ ΡƒΡ€ΠΎΠ²Π½ΡŽ практичСского использования сСйчас Π»ΠΈΠ΄ΠΈΡ€ΡƒΡŽΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ. Π­Ρ‚ΠΎ связано с нСсколькими Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ:

  • ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ – Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ обучСния эффСктивно Ρ€Π΅ΡˆΠ°ΡŽΡ‚ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Π΅ бизнСс-Π·Π°Π΄Π°Ρ‡ΠΈ, связанныС с классификациСй ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ.
  • Π˜Π½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² – Π»Π΅Π³Ρ‡Π΅ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ качСство ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΠ³Π΄Π° Π΅ΡΡ‚ΡŒ цСлСвая пСрСмСнная для сравнСния.
  • Π”ΠΎΡΡ‚ΡƒΠΏΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… – Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… областях ΡƒΠΆΠ΅ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ большиС Π½Π°Π±ΠΎΡ€Ρ‹ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ….
  • Π—Ρ€Π΅Π»ΠΎΡΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² – Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ Π±ΠΎΠ»Π΅Π΅ Ρ€Π°Π·Π²ΠΈΡ‚Ρ‹ ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ мноТСство эффСктивных Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΉ.

Рассмотрим 6 самых Π²Π°ΠΆΠ½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ обучСния.

***

Π‘ 28 августа ΠΏΠΎ 4 сСнтября Proglib Academy ΠΏΡ€ΠΈΠ³Π»Π°ΡˆΠ°Π΅Ρ‚ вас Π½Π° курсы ΠΏΠΎ ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠΌΡƒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ со скидкой 35%.

ЛинСйная рСгрСссия (Linear regression)

ЛинСйная рСгрСссия β€” самый простой ΠΈ распространСнный ML-Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для модСлирования зависимости ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ»ΠΈ нСсколькими нСзависимыми ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌΠΈ (Ρ„Π°ΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ) ΠΈ зависимой ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ (Ρ†Π΅Π»Π΅Π²Ρ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ). Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΏΡƒΡ‚Π΅ΠΌ нахоТдСния Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ уравнСния, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π»ΡƒΡ‡ΡˆΠ΅ всСго ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌ:

  • ΠŸΡ€ΠΎΡΡ‚Π°Ρ линСйная рСгрСссия ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΠ΄Π½ΠΎΠΉ нСзависимой ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΠΈ ΠΎΠ΄Π½ΠΎΠΉ зависимой ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ. НапримСр, прСдсказаниС стоимости ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€Ρ‹ Π½Π° основС Π΄Π°Ρ‚Ρ‹ постройки здания.
  • ΠœΠ½ΠΎΠΆΠ΅ΡΡ‚Π²Π΅Π½Π½Π°Ρ линСйная рСгрСссия Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ нСсколько нСзависимых ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. НапримСр, прСдсказаниС Ρ†Π΅Π½Ρ‹ Π΄ΠΎΠΌΠ° Π½Π° основС Π΅Π³ΠΎ ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ, количСства ΠΊΠΎΠΌΠ½Π°Ρ‚, наличия ΠΏΠ°Ρ€ΠΊΠΎΠ²ΠΊΠΈ ΠΈ располоТСния.
   ЛинСйная рСгрСссия
ЛинСйная рСгрСссия

Π£Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ мноТСствСнной Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии выглядит Ρ‚Π°ΠΊ:

y = b0 + b1x1 + b2x2 + ... + bnxn

Π³Π΄Π΅:

  • y β€” зависимая пСрСмСнная;
  • x1, x2, ..., xn β€” нСзависимыС ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅;
  • b0​ β€” свободный Ρ‡Π»Π΅Π½ (ΠΈΠ½Ρ‚Π΅Ρ€Ρ†Π΅ΠΏΡ‚);
  • b1, b2, ..., bn​ β€” коэффициСнты ΠΏΡ€ΠΈ нСзависимых ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ….

ЛинСйная рСгрСссия часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для прСдсказания числСнных Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ – Π±Π°Π»Π»Ρ‹, Π·Π°Ρ€ΠΏΠ»Π°Ρ‚Ρ‹, Ρ†Π΅Π½Ρ‹ Π½Π° ТильС. Однако Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ прСдсказаний Ρƒ этого Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½ΠΈΠΆΠ΅ ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Π±ΠΎΠ»Π΅Π΅ слоТными модСлями.

Π‘Ρ‚Π°Ρ‚ΡŒΡ ΠΏΠΎ Ρ‚Π΅ΠΌΠ΅

βˆ€ Как линСйная Π°Π»Π³Π΅Π±Ρ€Π° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ?

ΠœΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² (SVM)

ΠœΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² Ρ‡Π°Ρ‰Π΅ всСго ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для Π·Π°Π΄Π°Ρ‡ классификации. Он ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ справляСтся Π² ситуациях, ΠΊΠΎΠ³Π΄Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠ°Π»ΠΎ, Π° высокая ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρ‹ являСтся ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚ΠΎΠΌ. Основная идСя SVM β€” это созданиС гипСрплоскости, которая Π»ΡƒΡ‡ΡˆΠ΅ всСго раздСляСт классы Π² ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС. НапримСр, Ссли Ρƒ нас Π΅ΡΡ‚ΡŒ Π΄Π²Π° класса Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… прСдставлСн Π² Π΄Π²ΡƒΡ…ΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС (ΠΏΠΎ осям x ΠΈ y), SVM Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΡΠΊΠ°Ρ‚ΡŒ Ρ‚Π°ΠΊΡƒΡŽ линию (Π² случаС Π΄Π²ΡƒΡ…ΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ пространства), которая Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ раздСляСт эти Π΄Π²Π° класса. Π­Ρ‚Π° линия называСтся Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒΡŽ ΠΈΠ»ΠΈ Π³Ρ€Π°Π½ΠΈΡ†Π΅ΠΉ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ.

   Если Ρ‚ΠΎΡ‡ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ… находится слСва ΠΎΡ‚ Π»ΠΈΠ½ΠΈΠΈ, ΠΎΠ½Π° Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒΡΡ ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ классу, Π° Ссли справа β€” ΠΊ Π΄Ρ€ΡƒΠ³ΠΎΠΌΡƒ
Если Ρ‚ΠΎΡ‡ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ… находится слСва ΠΎΡ‚ Π»ΠΈΠ½ΠΈΠΈ, ΠΎΠ½Π° Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒΡΡ ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ классу, Π° Ссли справа β€” ΠΊ Π΄Ρ€ΡƒΠ³ΠΎΠΌΡƒ

Π”Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ (Decision tree)

Π”Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π½Π° основС ΠΏΡ€Π°Π²ΠΈΠ», прСдставлСнных, ΠΊΠ°ΠΊ Π²Ρ‹ ΡƒΠΆΠ΅ навСрняка догадались, Π² Π²ΠΈΠ΄Π΅ Π΄Π΅Ρ€Π΅Π²Π°. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ ΡƒΠ·Π΅Π» Π² Π΄Π΅Ρ€Π΅Π²Π΅ прСдставляСт собой вопрос ΠΈΠ»ΠΈ условиС, Π° Π²Π΅Ρ‚Π²ΠΈ Π΄Π΅Ρ€Π΅Π²Π° β€” Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹ ΠΈΠ»ΠΈ исходы этого вопроса:

  • ΠšΠΎΡ€Π΅Π½ΡŒ Π΄Π΅Ρ€Π΅Π²Π° β€” это Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹ΠΉ ΡƒΠ·Π΅Π», с ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ начинаСтся процСсс принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ.
  • Π’Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΠ΅ ΡƒΠ·Π»Ρ‹ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой условия, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ.
  • ЛистовыС ΡƒΠ·Π»Ρ‹ β€” это ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Π΅ ΡƒΠ·Π»Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ (прСдсказания).

Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΠΊΠ°ΠΊ для Π·Π°Π΄Π°Ρ‡ классификации, Ρ‚Π°ΠΊ ΠΈ для Π·Π°Π΄Π°Ρ‡ рСгрСссии. Они просты для ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ, Π½ΠΎ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ΄Π²Π΅Ρ€ΠΆΠ΅Π½Ρ‹ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ, особСнно Ссли Π΄Π΅Ρ€Π΅Π²ΠΎ становится слишком Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠΌ ΠΈ слоТным.

   Π”Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ
Π”Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹ΠΉ лСс (Random forest)

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹ΠΉ лСс β€” ансамблСвый ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚ мноТСство Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ точности прСдсказаний. ИдСя состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ нСсколько Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π½Π° основС Ρ€Π°Π·Π½Ρ‹Ρ… ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ Π΄Π°Π½Π½Ρ‹Ρ… (этот процСсс называСтся бутстрэппингом) ΠΈ Π·Π°Ρ‚Π΅ΠΌ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹. Π§Ρ‚ΠΎΠ±Ρ‹ ΡΠ½ΠΈΠ·ΠΈΡ‚ΡŒ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ пСрСобучСния ΠΈ ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ ΡƒΡΡ‚ΠΎΠΉΡ‡ΠΈΠ²ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΌΠ΅Ρ‚ΠΎΠ΄ случайного лСса ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΌΠ΅Ρ‚Π°Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ бэггинга:

  • Π’ случаС классификации, модСль Π²Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‰Π΅Π΅ΡΡ прСдсказаниС срСди всСх Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² (ΠΌΠΎΠ΄Π°).
  • Π’ случаС рСгрСссии, модСль Π²Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚ срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ прСдсказаний всСх Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π².

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹ΠΉ лСс ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ, Ρ‡Π΅ΠΌ ΠΎΠ΄Π½ΠΎ Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, ΠΈ Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ с большими Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ….

   Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹ΠΉ лСс
Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹ΠΉ лСс

Π‘Ρ‚Π°Ρ‚ΡŒΡ ΠΏΠΎ Ρ‚Π΅ΠΌΠ΅

πŸ€– МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…: Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ случайного лСса (Random Forest)

Наивный байСсовский классификатор

Наивный БайСс ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ всС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ Π² Π΄Π°Π½Π½Ρ‹Ρ… нСзависимы Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°, Ρ‡Ρ‚ΠΎ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π΅ всСгда соотвСтствуСт Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Алгоритм основан Π½Π° Ρ‚Π΅ΠΎΡ€Π΅ΠΌΠ΅ БайСса, которая описываСт Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ наступлСния события A, ΠΏΡ€ΠΈ условии, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΎΠΈΠ·ΠΎΡˆΠ»ΠΎ событиС B:

   Π’Π΅ΠΎΡ€Π΅ΠΌΠ° БайСса
Π’Π΅ΠΎΡ€Π΅ΠΌΠ° БайСса

Наивный байСсовский классификатор часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΈΠ·-Π·Π° своСй простоты ΠΈ высокой скорости Ρ€Π°Π±ΠΎΡ‚Ρ‹, Π½ΠΎ Π΅Π³ΠΎ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ сниТаСтся, Ссли ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ зависимыми Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°.

Π‘Ρ‚Π°Ρ‚ΡŒΡ ΠΏΠΎ Ρ‚Π΅ΠΌΠ΅

πŸ†Ž БайСсовскоС A/B-тСстированиС vs частотноС: прСимущСства, нСдостатки ΠΈ способ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½Π° Python

ЛогистичСская рСгрСссия (Logistic Regression)

ЛогистичСская рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для Π·Π°Π΄Π°Ρ‡ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации, Π³Π΄Π΅ цСлСвая пСрСмСнная ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Π΄Π²Π° значСния (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Β«Π΄Π°Β» ΠΈΠ»ΠΈ Β«Π½Π΅Ρ‚Β», Β«Ρ…ΠΎΡ‚-Π΄ΠΎΠ³Β» ΠΈΠ»ΠΈ Β«Π½Π΅ Ρ…ΠΎΡ‚-Π΄ΠΎΠ³Β»). Алгоритм основан Π½Π° логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, Ρ‚Π°ΠΊΠΆΠ΅ извСстной ΠΊΠ°ΠΊ сигмоида, которая ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ΅Ρ‚ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ Π² Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ значСния ΠΌΠ΅ΠΆΠ΄Ρƒ 0 ΠΈ 1.

   Π€ΠΎΡ€ΠΌΡƒΠ»Π° логистичСской рСгрСссии
Π€ΠΎΡ€ΠΌΡƒΠ»Π° логистичСской рСгрСссии

Π­Ρ‚ΠΎΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для Π·Π°Π΄Π°Ρ‡, Π³Π΄Π΅ Π²Π°ΠΆΠ½ΠΎ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ прСдсказаниС, Π½ΠΎ ΠΈ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠ³ΠΎ исхода. НапримСр, Ссли Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ письмо являСтся спамом, Ρ€Π°Π²Π½Π° 0.64, это ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ спама составляСт 64%. ЛогистичСская рСгрСссия проста для ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ ΠΈ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… областях – ΠΎΡ‚ спам-Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² Π΄ΠΎ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½ΠΎΠ³ΠΎ скоринга ΠΈ Π°Π½Π°Π»ΠΈΠ·Π° ΠΎΡ‚Ρ‚ΠΎΠΊΠ° ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ².

***

Π•ΡΡ‚ΡŒ Π»ΠΈ Ρƒ вас ΠΎΠΏΡ‹Ρ‚ использования этих Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π² Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡Π°Ρ…? ΠŸΠΎΠ΄Π΅Π»ΠΈΡ‚Π΅ΡΡŒ своими впСчатлСниями Π² коммСнтариях.