피어슨 r(선형), 스피어만 ρ(단조 비선형), 켄달 τ(쌍별 일치도) 세 가지 상관 지표를 선택하거나 전체 비교로 동시에 확인할 수 있습니다.
행렬의 셀을 클릭하면 산점도 + 이차 적합선이 표시됩니다.
· ◈ 셀은 |r| < 0.3 무상관 구간 · 비선형 배지는 |ρ|−|r| > 0.1 (비선형 구조 의심)
분석 방법
📂
CSV / XLSX 파일을 클릭하거나 드래그
첫 행을 헤더로 인식 · CSV(쉼표/탭) 및 Excel(.xlsx) 지원
분석할 컬럼 선택
상관 행렬 히트맵
음의 상관양의 상관셀 클릭 → 산점도
산점도
해석 기준
-1.0 ~ -0.7
강한 음의
-0.7 ~ -0.3
약한 음의
-0.3 ~ 0.3
상관 없음
0.3 ~ 0.7
약한 양의
0.7 ~ 1.0
강한 양의
선형 회귀로 독립변수(X)가 종속변수(Y)에 미치는 영향을 모델링합니다.
CSV 업로드 시 X를 여러 개 선택하면 다중 회귀로 자동 전환됩니다.
R²(결정계수)가 1에 가까울수록 모델이 데이터를 잘 설명합니다.
📂
CSV / XLSX 파일을 클릭하거나 드래그
첫 행을 헤더로 인식 · CSV(쉼표/탭) 및 Excel(.xlsx) 지원
X — 독립변수 (여러 개 선택 시 다중 회귀)
Y — 종속변수 (1개만 선택)
산점도 + 회귀선
잔차 플롯 — 잔차가 수평 밴드 내 무작위 분포 → 선형 모델 적합
회귀 방정식
—
결정계수 R²
—
RMSE (오차)
—
예측 도구
X 값을 입력하면 예측값이 나타납니다
종속변수가 이진(0 또는 1)일 때 사용하는 분류 모델입니다.
시그모이드 함수로 각 클래스에 속할 확률을 계산하고,
P ≥ 0.5면 클래스 1로 분류합니다. 결정 경계와 혼동 행렬로 모델을 평가하세요.
📂
CSV / XLSX 파일을 클릭하거나 드래그
첫 행을 헤더로 인식 · 레이블 컬럼은 0과 1 두 값만 허용 · Excel(.xlsx) 지원
X1 (특성 1)
X2 (특성 2)
레이블 (0/1)
산점도 + 결정 경계
클래스 0클래스 1— — 결정 경계 (P=0.5)
시그모이드 함수 P(Y=1) = 1 / (1 + e−z)
z = w₁x₁ + w₂x₂ + b · z < 0 → P < 0.5 → 클래스 0 · z > 0 → P > 0.5 → 클래스 1
성능 지표
혼동 행렬 (Confusion Matrix)
혼동 행렬 해석
■ TP True Positive — 실제 1, 예측 1 · 올바른 탐지
■ TN True Negative — 실제 0, 예측 0 · 올바른 제외
■ FP False Positive — 실제 0, 예측 1 · 과잉 탐지 (1종 오류)
■ FN False Negative — 실제 1, 예측 0 · 탐지 실패 (2종 오류)
Recall(재현율) = TP / (TP+FN) → 불량·이탈처럼 놓치면 안 되는 경우 최우선 지표 Precision(정밀도) = TP / (TP+FP) → 오탐 비용이 높을 때 중요
t-검정(t-test)은 두 집단의 평균이 통계적으로 유의하게 다른지 검증합니다.
독립표본은 서로 다른 두 그룹을, 대응표본은 동일 대상의 처치 전·후를 비교합니다.
p < 0.05이면 귀무가설(두 평균이 같다)을 기각합니다.
t-분포 및 기각역 (α = 0.05, 양측 검정)
■ 기각역 (α/2 = 0.025) ·
— t-분포 곡선 ·
수직선 = 관측된 t-통계량
검정 결과
그룹별 분포 (박스플롯 + 개별 데이터 포인트)
박스: Q1~Q3 (IQR) · 굵은 선: 중앙값 · ● 점: 평균 · 수염: 1.5×IQR 범위 내 극값
가설검정 시뮬레이션은 귀무가설(H₀) 하에서 반복 표본추출을 통해 1종 오류·2종 오류·검정력(Power)을 직접 체험합니다.
슬라이더로 표본 크기(n)·실제 효과(μ₁−μ₀)·유의수준(α)을 조정하며 검정력이 어떻게 달라지는지 확인하세요.
p<α이면 귀무가설을 기각하고, 그렇지 않으면 2종 오류(β)가 발생합니다.