[TIL] Day 38 - ML

 

 

 38일차 

Feature Engineering

  • mode, median 으로 결측치 대체하기
    • fillna() 가 series 로 들어오는 매개변수로 알아서 매핑해서 결측치를 대체한다.
  • 수치형 변수 범주형으로 변경
  • 유니폼 값에 다항식 전개 취하기
  • 로그1p 파생변수 만들기
  • 리스트 extend
  • df.get_dummies()
  • 피터 중요도 시각화하기
  • r2_score
  • cross_val_predict
  • metric 구하기
  • GradientBoosting Tree
    • learning_rate 경사에 따른 학습도 (약간 건너띄는 느낌)
    • n_estimator 트리의 갯수
  • 익명화된 데이터 다루기
  • 값이 하나뿐인 열 제거하기 nunique()
  • 이상치 잡아내기
  • 부스팅
  • 배깅
  • lightgbm, xgboost, catboost

 

 

 

 회고 

장마..

여기가 바다인지 육지인지..

 

 

 

 


 

728x90