최소-최대 정규화(Min-Max Normalization)
- 데이터를 0과 1 사이의 값으로 변환합니다.
- 계산 방식: (x - min(x)) / (max(x) - min(x))
- 장점: 데이터의 상대적 크기 관계를 유지할 수 있습니다.
- 단점: 이상치(outlier)에 민감합니다. 이상치가 있는 경우 정규화된 데이터의 범위가 좁아질 수 있습니다.
Z-점수 정규화(Z-Score Normalization)
- 데이터를 평균 0, 표준편차 1의 표준 정규 분포로 변환합니다.
- 계산 방식: (x - mean(x)) / std(x)
- 장점: 이상치에 강건합니다. 이상치가 있어도 정규화된 데이터의 범위가 크게 변하지 않습니다.
- 단점: 각 feature 간의 상대적 거리가 왜곡될 수 있습니다.