정규화(Normalization)표준화(Standardization)는 서로 다른 범위의 변수들을 같은 기준으로 맞추는 전처리 과정입니다. 아래에서 직접 숫자를 입력하거나 프리셋을 선택해, 같은 데이터에 각 방법을 적용하면 값이 어떻게 바뀌는지 확인하세요. 이상치 추가 버튼으로 극단값이 각 방법에 미치는 영향도 비교할 수 있습니다.
데이터 입력
⚠ 이상치(999) 추가 — 극단값이 각 방법에 어떤 영향을 주는지 확인하세요
변환 결과 비교
막대 높이 = 변환된 값
원본 데이터
Original
변환 없음 — 있는 그대로
값 그대로. 단위와 범위가 그대로 유지됩니다.
정규화
Min-Max 정규화
x' = (x − min) / (max − min)
결과값 범위: [0, 1]
최솟값→0, 최댓값→1로 고정됩니다.
표준화
Z-Score 표준화
x' = (x − μ) / σ
평균 → 0, 표준편차 → 1
정규분포를 가정한 스케일링.
표준화
Robust 표준화
x' = (x − median) / IQR
중앙값 → 0, IQR → 1
이상치에 가장 강건합니다.
⚠ 이상치(999)가 있을 때 — Min-Max vs Robust 비교

이상치 추가 버튼을 켜면 아래 차트가 활성화됩니다. Min-Max는 이상치 하나에 나머지 값들이 모두 왼쪽(0 근처)으로 눌리는 반면, Robust는 중앙값·IQR 기반이라 이상치 영향을 최소화합니다.

Min-Max — 이상치 전/후
Robust — 이상치 전/후
변환값 상세 비교
데이터 포인트별 변환 결과
언제 어떤 방법을 쓸까?
Min-Max 정규화
x' = (x − min) / (max − min)
결과 범위: 항상 [0, 1]
이미지 픽셀값(0~255) 정규화
신경망 입력층 전처리
변수 범위가 명확히 정해진 경우
⚠️이상치에 매우 민감 — 하나의 극단값이 전체를 왜곡
이미지처리 신경망 KNN
Z-Score 표준화
x' = (x − μ) / σ
결과: 평균=0, 표준편차=1
정규분포를 따르는 데이터
선형회귀, SVM, PCA 등 거리 기반 모델
단위가 다른 여러 변수를 같은 기준으로
⚠️분포가 크게 치우치면 효과 감소
선형회귀 SVM PCA 클러스터링
Robust 표준화
x' = (x − median) / IQR
결과: 중앙값=0, IQR=1
이상치가 많거나 분포가 치우친 데이터
센서 오류·로그 데이터 전처리
평균보다 중앙값이 더 대표값인 경우
⚠️결과 범위가 보장되지 않음
이상치대응 센서데이터 로그분석
CSV 또는 XLSX 파일을 업로드하고, 변환할 숫자형 열을 선택한 뒤 정규화·표준화 방법을 고르면 결과를 미리보고 CSV 또는 XLSX로 저장할 수 있습니다. 선택하지 않은 열은 원본 그대로 유지됩니다.
① CSV 파일 업로드
📂
CSV 또는 XLSX 파일을 드래그하거나 클릭해서 선택
CSV: UTF-8 / EUC-KR 인코딩 지원 · XLSX: Excel 파일 지원 · 최대 10MB