상관관계분석 (Correlation Analysis)
1. 개요
“이 항목들, 서로 얼마나 연관돼 있을까요?”
상관관계분석은 여러 설문 문항(변수) 사이에
함께 움직이는 경향이 있는지를 확인하는 분석입니다.
즉,
한 항목의 점수가 높아질 때,
다른 항목도 같이 높아지거나(+) 낮아지는지(-)
를 숫자로 보여줍니다.
- 핵심 개념: 변수 간 연관성(상관계수)
- 주요 지표: 상관계수(r)
- 언제 사용하나요?:
- 만족도 구성 요소 간 관계 파악
- 요인분석 / 회귀분석 전 사전 점검
- 중복 문항 또는 다중공선성 여부 확인
2. 비즈니스 활용 예시
상관관계분석은
**“무엇이 무엇과 함께 움직이는가?”**를 빠르게 파악하는 데 강력합니다.
| 분야 | 활용 시나리오 | 기대 효과 |
|---|---|---|
| 민원·행정 서비스 | 친절성 ↔ 전문성 상관 확인 | 서비스 개선 우선순위 도출 |
| 고객 경험(CX) | 만족도 구성요소 간 관계 분석 | 핵심 영향 요인 파악 |
| 설문 설계 개선 | 유사 문항 간 상관 확인 | 중복 문항 제거 근거 확보 |
| 사전 분석 단계 | 회귀·요인분석 전 점검 | 다중공선성 리스크 사전 차단 |
3. 필요한 옵션 가이드
① 상관계수 선택
UI에서 선택 가능한 옵션은 다음과 같습니다.
- Pearson (피어슨 상관계수) [기본값 / 추천]
- 연속형 점수(5점·7점·10점 척도)에 적합
- 가장 일반적으로 사용되는 방식
- 변수 간 선형 관계 측정
- Spearman (스피어만 상관계수)
- 순위 기반 상관관계
- 응답 분포가 치우쳐 있거나 비정규일 때 사용
- Kendall (켄달 상관계수)
- 표본 수가 적거나 순위 신뢰도가 중요할 때 사용
📌 일반적인 만족도 설문 → Pearson 사용 권장
② 평균 / 표준편차 표시 옵션
- 표시함
- 각 변수의 평균과 표준편차를 함께 제공
- 변수 수준 비교에 유용
- 표시안함
- 순수 상관계수만 보고 싶을 때 선택
실무 보고서에서는 ‘표시함’ 권장
4. 분석 단계 (Step-by-step)
-
분석 변수 선택
상관관계를 확인할 문항들을 오른쪽 선택 영역으로 이동합니다.
(예: 친절성, 전문성, 정확성, 환경쾌적성 등)
-
상관계수 선택
기본값인 Pearson이 선택되어 있는지 확인합니다.
-
표시 옵션 확인
평균·표준편차 표시 여부를 선택합니다.
-
분석 실행
[분석하기] 버튼을 클릭합니다.
5. 결과 해석 (Interpretation)
상관관계분석 결과는 딱 3가지만 보면 됩니다.
✔ 1) 상관계수 값(r)
- 값의 범위: 1 ~ +1
- + : 한 변수가 증가하면 다른 변수도 증가
- : 한 변수가 증가하면 다른 변수는 감소
- 0에 가까울수록 관계가 약함
| 상관계수 절대값(|r|) | 해석 |
| --- | --- |
| 0.1 미만 | 거의 관계 없음 |
| 0.1 ~ 0.3 | 약한 상관 |
| 0.3 ~ 0.5 | 중간 상관 |
| 0.5 이상 | 강한 상관 |
예:
친절성 ↔ 전문성 = 0.52
→ 친절하다고 느낄수록 전문성도 높게 평가됨
✔ 2) 유의확률(p-value)
- p < 0.05
- 통계적으로 의미 있는 상관관계
- p ≥ 0.05
- 우연일 가능성 있음 → 해석 주의
📌 주요 결과 보고서에서는
유의한 상관관계만 해석 문장으로 요약됩니다.
✔ 3) 다중공선성 여부 (중요)
상세 결과 보고서에서 확인할 포인트:
- 상관계수 0.85 이상인 쌍이 있는지?
- 👉 회귀분석 시 문제 발생 가능
- 현재 결과처럼
- 최대 상관계수 ≈ 0.6 수준
- → 다중공선성 우려 없음
6. 주요 결과 vs 상세 결과 차이
📌 주요 결과 보고서
- 평균 / 표준편차
- 상관계수 요약
- 유의한 관계 중심 해석 문장
👉 의사결정용 / 보고용
📌 상세 결과 보고서
- 전체 상관행렬
- 모든 변수 간 수치 제공
- 다중공선성 판단 근거
👉 분석 검증 / 내부 참고용
7. 자주 묻는 질문 (FAQ)
Q. 상관관계가 높으면 원인이라고 봐도 되나요?
A. ❌ 아닙니다.
상관관계는 함께 움직이는 경향일 뿐,
원인–결과 관계를 의미하지는 않습니다.
Q. 상관계수가 낮으면 의미 없는 건가요?
A. 아닙니다.
실제 사회·행정·고객 데이터에서는
0.2~0.3 수준도 충분히 의미 있는 결과입니다.
Q. 요인분석 전에 꼭 해야 하나요?
A. ✔ 권장합니다.
상관관계가 거의 없는 변수들로는
요인분석이 성립하기 어렵습니다.