통계 분석 시뮬레이터

피어슨 r(선형), 스피어만 ρ(단조 비선형), 켄달 τ(쌍별 일치도) 세 가지 상관 지표를 선택하거나 전체 비교로 동시에 확인할 수 있습니다. 행렬의 셀을 클릭하면 산점도 + 이차 적합선이 표시됩니다. · ◈ 셀은 |r| < 0.3 무상관 구간 · 비선형 배지는 |ρ|−|r| > 0.1 (비선형 구조 의심)

분석 방법

📂

CSV / XLSX 파일을 클릭하거나 드래그

첫 행을 헤더로 인식 · CSV(쉼표/탭) 및 Excel(.xlsx) 지원

분석할 컬럼 선택

상관 행렬 히트맵

음의 상관

양의 상관 셀 클릭 → 산점도

산점도

해석 기준

-1.0 ~ -0.7

강한 음의

-0.7 ~ -0.3

약한 음의

-0.3 ~ 0.3

상관 없음

0.3 ~ 0.7

약한 양의

0.7 ~ 1.0

강한 양의

선형 회귀로 독립변수(X)가 종속변수(Y)에 미치는 영향을 모델링합니다. CSV 업로드 시 X를 여러 개 선택하면 다중 회귀로 자동 전환됩니다. R²(결정계수)가 1에 가까울수록 모델이 데이터를 잘 설명합니다.

📂

CSV / XLSX 파일을 클릭하거나 드래그

첫 행을 헤더로 인식 · CSV(쉼표/탭) 및 Excel(.xlsx) 지원

X — 독립변수 (여러 개 선택 시 다중 회귀)

Y — 종속변수 (1개만 선택)

산점도 + 회귀선

잔차 플롯 — 잔차가 수평 밴드 내 무작위 분포 → 선형 모델 적합

회귀 방정식

—

결정계수 R²

—

RMSE (오차)

—

예측 도구

X 입력

X 값을 입력하면 예측값이 나타납니다

종속변수가 이진(0 또는 1)일 때 사용하는 분류 모델입니다. 시그모이드 함수로 각 클래스에 속할 확률을 계산하고, P ≥ 0.5면 클래스 1로 분류합니다. 결정 경계와 혼동 행렬로 모델을 평가하세요.

📂

CSV / XLSX 파일을 클릭하거나 드래그

첫 행을 헤더로 인식 · 레이블 컬럼은 0과 1 두 값만 허용 · Excel(.xlsx) 지원

X1 (특성 1)

X2 (특성 2)

레이블 (0/1)

산점도 + 결정 경계

클래스 0 클래스 1 — — 결정 경계 (P=0.5)

시그모이드 함수 P(Y=1) = 1 / (1 + e^−z)

z = w₁x₁ + w₂x₂ + b · z < 0 → P < 0.5 → 클래스 0 · z > 0 → P > 0.5 → 클래스 1

성능 지표

혼동 행렬 (Confusion Matrix)

혼동 행렬 해석

■ TP True Positive — 실제 1, 예측 1 · 올바른 탐지

■ TN True Negative — 실제 0, 예측 0 · 올바른 제외

■ FP False Positive — 실제 0, 예측 1 · 과잉 탐지 (1종 오류)

■ FN False Negative — 실제 1, 예측 0 · 탐지 실패 (2종 오류)

Recall(재현율) = TP / (TP+FN) → 불량·이탈처럼 놓치면 안 되는 경우 최우선 지표
Precision(정밀도) = TP / (TP+FP) → 오탐 비용이 높을 때 중요

t-검정(t-test)은 두 집단의 평균이 통계적으로 유의하게 다른지 검증합니다. 독립표본은 서로 다른 두 그룹을, 대응표본은 동일 대상의 처치 전·후를 비교합니다. p < 0.05이면 귀무가설(두 평균이 같다)을 기각합니다.

t-분포 및 기각역 (α = 0.05, 양측 검정)

■ 기각역 (α/2 = 0.025) · — t-분포 곡선 · 수직선 = 관측된 t-통계량

검정 결과

그룹별 분포 (박스플롯 + 개별 데이터 포인트)

박스: Q1~Q3 (IQR) · 굵은 선: 중앙값 · ● 점: 평균 · 수염: 1.5×IQR 범위 내 극값

가설검정 시뮬레이션은 귀무가설(H₀) 하에서 반복 표본추출을 통해 1종 오류·2종 오류·검정력(Power)을 직접 체험합니다. 슬라이더로 표본 크기(n)·실제 효과(μ₁−μ₀)·유의수준(α)을 조정하며 검정력이 어떻게 달라지는지 확인하세요. p<α이면 귀무가설을 기각하고, 그렇지 않으면 2종 오류(β)가 발생합니다.

귀무가설 μ₀

실제 효과 μ₁ − μ₀

μ₁ − μ₀ = +5.0

모표준편차 σ

표본 크기 n

n = 30

유의수준 α

시뮬레이션 횟수

표집분포 및 기각역 (z-점수 공간)

— H₀ 분포 (μ₀) · — H₁ 분포 (μ₁) · ■ 기각역 α · ■ 2종 오류 β · ■ 검정력

이론적 검정력 (1−β)

—

효과 크기 (Cohen's d)

—

표준오차 (SE)

—

σ / √n

80% 검정력 필요 n

—

α=0.05, 양측 검정