세상의 모든 통계 이야기
  • 기초수학·수리통계
  • 기초통계·조사방법
  • 회귀·다변량
  • MLDL개념
  • MLDL예측
  • MLDL분류
  • 카드뉴스
  • 통계상담
  1. 【조사방법론】
  • 【기초통계】
  • 📄 통계학의 개념
  • 📄 데이터와 통계
  • 📄 일변량 분석
  • 📄 교차표 분석
  • 📄 적합성 검정
  • 📄 정규성 검정
  • 📄 상관분석
  • 📄 분산분석(ANOVA)
  • 📄 시계열 분석
  • 【조사방법론】
  • 📄 조사방법 기초
  • 📄 표본설계
  • 📄 설문지
  • 📄 무응답 대체
  • 📄 데이터 처리
  • 📄 조사지 척도
  • 📄 델파이·AHP·컨조인트
  • 📄 PSM 성향점수매칭

기초통계 & 조사방법론

[기초통계] 섹션 메인(기초통계)

기초통계는 데이터를 요약·시각화·해석하는 통계의 기초를 다룬다. 이 섹션에서는 기술통계, 분포의 특성, 변수 간 관계, 기본 검정 절차를 정리하여 이후의 추론통계와 모형 분석을 이해하기 위한 기반을 마련한다.

⸻

[기초통계] 통계학의 개념

통계학은 불확실한 현실에서 데이터를 근거로 현상을 이해하고 의사결정하는 학문이다. 모집단–표본, 모수–통계량, 기술통계–추론통계의 구분을 통해 통계적 사고의 틀을 정리한다. 또한 상관과 인과의 차이, 분석 목적에 따른 방법 선택의 원리를 소개한다.

⸻

[기초통계] 데이터와 통계

데이터는 변수(특성)와 관측치(사례)로 구성되며, 변수의 측정 수준에 따라 분석 방법이 달라진다. 질적/양적 변수, 척도(명목·서열·등간·비율), 자료 형태(단면·시계열·패널)를 구분한다. 기초적인 데이터 품질 점검(결측·이상치·입력 오류)도 함께 다룬다.

⸻

[기초통계] 일변량 분석

하나의 변수를 대상으로 분포의 형태와 중심·산포를 요약한다. 평균·중앙값·분산·표준편차·사분위수 등 요약 통계량과 히스토그램·박스플롯 등을 통해 데이터의 특성을 해석한다.

⸻

[기초통계] 교차표 분석

두 범주형 변수의 관계를 교차표로 정리하고 연관성(의존성)을 파악한다. 행/열 비율을 비교하여 패턴을 읽고, 기대도수 기반 해석으로 관계의 방향과 크기를 직관적으로 설명하는 방법을 학습한다.

⸻

[기초통계] 적합성 검정

관측된 범주 빈도가 특정 이론 분포(또는 기대 비율)와 일치하는지 검정한다. 카이제곱 통계량의 원리와 검정 절차(가설 설정–유의수준–기각/채택)를 정리한다. 적용 조건(기대도수 크기 등)과 해석상의 주의점도 함께 다룬다.

⸻

[기초통계] 정규성 검정

정규성은 t-검정, ANOVA, 회귀 등 많은 방법의 기본 가정으로 사용된다. Q-Q plot 등 시각적 진단과 함께 Shapiro–Wilk 등 대표 검정의 의미를 소개한다. 표본 크기에 따른 해석(“통계적으로 유의”와 “실질적 차이”의 구분)도 강조한다.

⸻

[기초통계] 상관분석

두 연속형 변수 사이의 선형적 관련성을 상관계수로 요약한다. 피어슨/스피어만 상관의 차이와 산점도 기반 해석을 통해 관계의 형태를 점검한다. 상관이 인과를 의미하지 않는다는 점과 교란변수 가능성을 함께 설명한다.

⸻

[기초통계] 분산분석(ANOVA)

여러 집단의 평균 차이를 한 번에 비교하는 방법으로, “집단 간 변동 vs 집단 내 변동”의 비율을 이용한다. 일원분산분석의 가정(정규성·등분산성·독립성)과 F-검정의 해석을 정리한다. 유의할 때는 사후검정으로 어떤 집단 간 차이가 있는지 추가 확인한다.

⸻

[기초통계] 시계열 분석

시간 순서로 관측된 데이터의 추세·계절성·변동성을 파악한다. 이동평균 등 기초적 평활화와 자기상관 개념을 소개하고, 예측을 위한 기본 접근을 정리한다. 단면자료와 달리 “시간 의존성”을 고려해야 하는 이유를 강조한다.

⸻

[조사방법론] 섹션 메인(조사방법론)

조사방법론은 설문·관측·실험 등을 통해 데이터를 수집할 때 필요한 설계 원리와 품질 관리를 다룬다. 표본설계, 설문지 구성, 무응답 처리, 척도 설계 등 실무적 절차를 체계화하여 신뢰할 수 있는 데이터 기반 분석이 가능하도록 한다.

⸻

[조사방법론] 조사방법 기초

조사는 연구문제에 맞게 자료를 수집하는 체계적 절차이며, 대표성·정확성이 핵심이다. 조사의 유형(전수/표본, 단면/종단, 면접/전화/온라인 등)을 구분하고 오차(표본오차·비표본오차)의 개념을 정리한다.

⸻

[조사방법론] 표본설계

표본설계는 모집단을 대표하는 표본을 뽑기 위한 규칙을 정하는 과정이다. 단순임의·층화·집락·다단계 표본추출의 특징과 장단점을 비교한다. 표본크기 결정의 기본 원리와 가중치(추정에서의 반영)도 함께 다룬다.

⸻

[조사방법론] 설문지

설문지는 측정 도구이며, 문항 설계가 데이터 품질을 좌우한다. 문항 유형(개방형/폐쇄형), 질문 순서, 응답 범주 설계, 문항 편향(유도·이중질문 등)을 점검한다. 사전조사(파일럿)와 신뢰도·타당도 관점의 개선 방법도 소개한다.

⸻

[조사방법론] 무응답 대체

무응답은 표본의 대표성과 추정의 편의를 훼손할 수 있는 중요한 문제다. 결측 메커니즘(MCAR/MAR/MNAR) 개념을 바탕으로 평균대체·회귀대체·다중대체 등 대표적 대체 방법과 해석상의 주의점을 정리한다.

⸻

[조사방법론] 데이터 처리

수집된 데이터는 분석 전에 정제·코딩·검증 과정을 거쳐야 한다. 코드북 작성, 범주 통합, 이상치/논리 오류 점검, 가중치 적용, 데이터 문서화를 다룬다. 재현 가능한 분석을 위해 처리 단계의 기록과 버전 관리를 강조한다.

⸻

[조사방법론] 조사척도

측정 척도는 “무엇을 어떤 수준으로 재는가”를 결정하며 분석 가능 범위를 좌우한다. 명목·서열·등간·비율 척도와 리커트 척도의 설계 원리를 정리한다. 신뢰도(예: Cronbach’s alpha)와 타당도의 개념을 함께 연결한다.

⸻

[조사방법론] 델파이·AHP·컨조인트

전문가 판단과 선호를 구조화해 의사결정을 지원하는 대표 기법들을 다룬다. 델파이는 반복적 합의를 통해 예측·정책 우선순위를 도출하고, AHP는 계층구조와 쌍대비교로 가중치를 산출하며, 컨조인트는 속성 조합에 대한 선택을 통해 선호 구조를 추정한다.

⸻

[조사방법론] PSM 성향점수매칭

관찰자료에서 처치(정책/프로그램) 효과를 추정할 때, 집단 간 차이를 보정하는 방법이다. 성향점수(처치 확률)를 추정한 뒤 유사한 관측치를 매칭하여 비교 가능성을 높인다. 매칭 품질 진단(균형성 점검)과 결과 해석의 한계를 함께 설명한다.