결측치(Missing Value)란 데이터셋에서 값이 기록되지 않은 항목입니다. 결측 비율과 패턴(무작위·연속·컬럼 집중)에 따라 분석 결과와 보간 전략이 달라집니다. 샘플 데이터 또는 CSV 파일을 직접 업로드해 탐지 결과를 확인하세요.
데이터 소스
결측 비율 15% 패턴
이상치 비율 5%
전체 셀 수
결측 셀 수
결측 비율
완전한 행 비율
이상치 셀 수
이상치 비율
결측 히트맵 — Y축: 변수 · X축: 관측치
정상
결측
이상치
컬럼별 결측 비율
시간 축 결측 분포
분석을 실행하면 해석이 표시됩니다.
이상치(Outlier)는 다른 데이터와 크게 다른 값으로, 센서 오류·이벤트·노이즈 등이 원인입니다. Z-Score는 평균·표준편차 기반, IQR은 사분위수 기반으로 이상치를 탐지합니다. 업로드한 파일이 있으면 해당 데이터로 자동 전환됩니다.
데이터셋 · 탐지 설정
이상치 강도 컬럼 방법
Z-Score 임계값 2.5 IQR 배수 1.5
전체 관측치
탐지된 이상치
이상치 비율
정상 범위
산점도 — 이상치 강조
정상
이상치
분포 히스토그램 + 탐지 경계
탐지된 이상치 목록
#인덱스Z-ScoreIQR 판정상태
탐지 실행 후 결과가 표시됩니다
분석을 실행하면 해석이 표시됩니다.
결측치 보간(Imputation)은 누락된 값을 통계적·수학적 방법으로 채우는 과정입니다. 방법에 따라 결과가 크게 달라지며, RMSE로 원본 대비 정확도를 비교할 수 있습니다. 업로드한 파일이 있으면 해당 데이터로 자동 전환됩니다.
데이터셋 · 보간 설정
결측 비율 20% 패턴 컬럼
보간 방법 선택
보간 전/후 비교
원본 (참조)
결측 포함 데이터
보간 결과
방법별 RMSE 비교 (낮을수록 정확)
현재 방법 RMSE
최우수 방법
최저 방법
보간 실행 후 결과가 표시됩니다.
박스플롯(Box Plot)은 Min · Q1 · Median · Q3 · Max 5가지 요약 통계를 하나의 그래프로 시각화합니다. 단계별로 추가 버튼을 눌러 각 요소가 어떻게 박스플롯을 구성하는지 순서대로 확인하세요.
데이터셋 · 컬럼 선택
컬럼
원시 데이터
단계별 박스플롯 구성
1 / 6
5수치 요약 통계 — 단계별 공개
통계량단계
박스플롯 시뮬레이션