데이터 전처리(Data Cleaning) 데이터 분석 및 머신러닝 모델링을 위해 데이터를 정리하고 준비하는 과정 원시 데이터(raw data)는 불완전하거나, 노이즈가 많거나, 형식이 일관되지 않아 직접 모델링에 사용하기 어려움→ 데이터 전처리과정을 통해 데이터의 품질을 높이고, 분석 결과의 신뢰성을 확보 결측값 처리데이터셋에서 누락된 값을 처리하는 작업이상값 처리데이터셋에서 비정상적으로 큰 값이나 작은 값을 처리하는 작업중복 데이터 제거동일한 데이터가 여러 번 나타나는 경우 이를 제거데이터 타입 변환데이터의 타입을 적절하게 변환하는 작업데이터 정규화데이터의 범위를 일정하게 맞추는 작업인코딩범주형 데이터를 수치형 데이터로 변환샘플링데이터셋의 크기를 줄이거나 늘리는 작업특징 선택 및 추춟모델 성능을 높이기..