머신러닝 알고리즘은 숫자만 인식할 수 있기 때문에, 문자나 범주형 카테고리 (성별, 지역, 직업 등)는 숫자로 바꿔줘야만 학습이 가능함 크게 두 가지로 나누면 (Label Encoding, One-Hot Encoding)(+ Ordinal Encoding 순서형 인코딩, Target Encoding 타겟 인코딩) 1. 레이블 인코딩 (Label Encoding)각 범주(category)를 숫자로 변환하는 가장 간단한 방법 남자 (0) 여자 (1) - 매우 간단, 효율적 - 메모리 효율성 뛰어남 모델이 숫자에 따른 순서나 크기가 있다고 잘못 해석할 수 있음 주로 두 개의 범주가 있는 경우 적합함 * 예시 (sklearn)from sklearn.preprocessing import LabelEnc..