728x90 FeatureEngineering1 [PYTHON] 로그 변환(Log Transform) 활용 시점 3가지와 정규성 문제 해결 방법 데이터 분석과 머신러닝 모델링 과정에서 우리가 마주하는 실제 데이터는 교과서처럼 예쁜 정규분포(Normal Distribution)를 따르는 경우가 드뭅니다. 대부분의 수치 데이터는 한쪽으로 크게 치우친 왜도(Skewness)를 가지거나, 값의 범위가 기하급수적으로 차이나는 특성을 보입니다. 이때 데이터의 성질을 보존하면서도 통계적 유의성을 확보하기 위한 강력한 해결책이 바로 로그 변환(Log Transform)입니다. 본 가이드에서는 로그 변환의 수학적 원리와 실무 적용 시의 차이를 심도 있게 분석합니다.1. 로그 변환이 필요한 3가지 핵심 상황과 이론적 근거로그 변환은 큰 값을 작게 만들고 작은 값들 사이의 간격을 상대적으로 넓혀주는 비선형 변환 기법입니다. 이는 모델이 극단적인 데이터 포인트(Out.. 2026. 4. 8. 이전 1 다음 728x90