π€ Feature-engine β ΡΡΠΎ Python-Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π΄Π»Ρ ΡΠ΄ΠΎΠ±Π½ΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΈ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠΈ Π΄Π°Π½Π½ΡΡ ΠΏΠ΅ΡΠ΅Π΄ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ΠΌ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ.
Π€ΠΎΠΊΡΡΠΈΡΡΠ΅ΡΡΡ Π½Π° ΠΏΡΠ΅Π΄ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ΅ Π΄Π°Π½Π½ΡΡ : ΡΠ°Π±ΠΎΡΠ΅ Ρ ΠΏΡΠΎΠΏΡΡΠΊΠ°ΠΌΠΈ, Π²ΡΠ±ΡΠΎΡΠ°ΠΌΠΈ, ΠΊΠΎΠ΄ΠΈΡΠΎΠ²Π°Π½ΠΈΠΈ ΠΊΠ°ΡΠ΅Π³ΠΎΡΠΈΠ°Π»ΡΠ½ΡΡ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ², ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ°ΡΠΈΡΡ ΠΈ ΠΎΡΠ±ΠΎΡΠ΅ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ², ΡΠΎΡ ΡΠ°Π½ΡΡ ΡΠΎΠ²ΠΌΠ΅ΡΡΠΈΠΌΠΎΡΡΡ Ρ ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½Π°ΠΌΠΈ sklearn.
π ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ:
π΅Π Π°Π±ΠΎΡΠ° Ρ ΠΏΡΠΎΠΏΡΡΠΊΠ°ΠΌΠΈ: Mean/Median/Mode, Arbitrary, End Tail Imputation
π΅ΠΠ±ΡΠ°Π±ΠΎΡΠΊΠ° Π²ΡΠ±ΡΠΎΡΠΎΠ²: IQR, Z-score, Winsorization, capping
π΅ΠΠΎΠ΄ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΠΊΠ°ΡΠ΅Π³ΠΎΡΠΈΠΉ: One-Hot, Ordinal, Target Mean, Rare Label Encoding
π΅ΠΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ°ΡΠΈΠΈ: log, box-cox, yeo-johnson, power
π΅ΠΡΠ±ΠΎΡ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ²: ΠΊΠΎΡΡΠ΅Π»ΡΡΠΈΡ, ΠΊΠΎΠ½ΡΡΠ°Π½ΡΠ½ΡΠ΅ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ, Π΄ΡΠ±Π»ΠΈΠΊΠ°ΡΡ
π΅ΠΠΎΠ»Π½Π°Ρ ΡΠΎΠ²ΠΌΠ΅ΡΡΠΈΠΌΠΎΡΡΡ ΡΠΎ sklearn Pipeline
β‘οΈΠ£ΡΡΠ°Π½ΠΎΠ²ΠΊΠ°: pip install feature-engine
βοΈ ΠΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΡ
β‘οΈΠ‘ΠΏΡΠ°Π²ΠΎΡΠ½ΠΈΠΊ ΠΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΡΠ°. ΠΠΎΠ΄ΠΏΠΈΡΠ°ΡΡΡΡ