[Preprocessing] Categorical Feature Encoding

2023. 4. 25. 15:59·ML_DL/딥러닝 공부하기
728x90
반응형

Encoding

  • categorical feature를 numerical feature로 변환하는 작업

OneHotEncoder

  • 해당 범주를 1, 나머지는 0으로 하는 feature가 새로 생성된다.
ohe = OneHotEncoder(sparse=False)

a = pd.DataFrame(ohe.fit_transform(df[['weather']]), columns=['ranniy', 'sunny', 'windy'])
df_a = pd.concat([df.drop('weather', axis=1), a], axis=1)
df_a

LabelEncoder

  • categorie feature의 범주에 정수값을 부여한다. (ex - sunny 1, rainny 2, windy 3)
  • 순서대로 정수값이 부여되기 때문에 범주간 순서가 없다면 사용을 지양한다. (sunny의 2배가 rainny인 것은 관계가 없다)
lbe = LabelEncoder()
b = pd.DataFrame(lbe.fit_transform(df['weather']))
b_df = pd.concat([df.drop('weather', axis=1), b], axis=1)
b_df

get_dummies

  • dataframe을 넣으면 categorie feature만을 numerical feature로 변환한다.
c = pd.get_dummies(df)
c

 

저작자표시 (새창열림)

'ML_DL > 딥러닝 공부하기' 카테고리의 다른 글

[파이토치로 시작하는 딥러닝] Part-1 Basic ML  (0) 2023.06.24
[Loss Function] Cross Entropy  (0) 2023.04.30
Model Ensemble  (0) 2023.03.24
Macro-F1 score  (0) 2023.03.21
[Pytorch] 모델 작성과 모델 학습 과정 정리  (0) 2023.02.15
'ML_DL/딥러닝 공부하기' 카테고리의 다른 글
  • [파이토치로 시작하는 딥러닝] Part-1 Basic ML
  • [Loss Function] Cross Entropy
  • Model Ensemble
  • Macro-F1 score
swwho
swwho
일상을 데이터화하다
  • swwho
    하루한장
    swwho
  • 전체
    오늘
    어제
    • 분류 전체보기 (188)
      • ML_DL (39)
        • MUJAKJUNG (무작정 시리즈) (18)
        • 딥러닝 공부하기 (21)
      • 데이터사이언스 (1)
        • EDA (1)
        • 데이터과학을 위한 통계 (0)
      • 데이터엔지니어링 (2)
      • 논문리뷰 (2)
        • Computer Vision (2)
      • Python 활용하기 (12)
      • 코딩테스트 (127)
        • Python (109)
        • MySQL (14)
      • Git (3)
      • MySQL 활용하기 (0)
      • 일상 이야기 (1)
  • 블로그 메뉴

    • 홈
    • 태그
  • 최근 글

  • 250x250
  • hELLO· Designed By정상우.v4.10.3
swwho
[Preprocessing] Categorical Feature Encoding
상단으로

티스토리툴바