[Preprocessing] Categorical Feature Encoding
·
ML_DL/딥러닝 공부하기
Encoding categorical feature를 numerical feature로 변환하는 작업 OneHotEncoder 해당 범주를 1, 나머지는 0으로 하는 feature가 새로 생성된다. ohe = OneHotEncoder(sparse=False) a = pd.DataFrame(ohe.fit_transform(df[['weather']]), columns=['ranniy', 'sunny', 'windy']) df_a = pd.concat([df.drop('weather', axis=1), a], axis=1) df_a LabelEncoder categorie feature의 범주에 정수값을 부여한다. (ex - sunny 1, rainny 2, windy 3) 순서대로 정수값이 부여되기 때문에..