1. 서론
연구방법론은 왜 필요한가?
- 연구방법론은 선배 연구자들에 의해 오랜 시간 동안 검증된 방법. 이를 활용하면 연구가 잘못된 결과로 나아가는 것을 최소화할 수 있음. (가이드)
- 그 결과 유효한 사회 과학 연구, 타당성 있는 연구를 진행하기 위해 (타당성)
- 연구자와 연구 소비자 간의 의사소통 수단. 예를 들어 t값, p값을 제시하는 것만으로 이 연구가 가지는 의미를 간결하고 쉽게 표현할 수 있음(의사소통)
우리는 어떻게 알게 되는가?
- 개인적 경험: 소수에게만 적용 가능, 제한적, 주관적
- 전통이나 관습, 주변인 (미신, 속설 등): 축적된 지혜, 문화적 편견 개입 가능성, 근거가 제한적
- 전문가: 신용과 자격, 기록으로 남는 성과, 물리적인 실체가 있는 경우 많음(이론, 논문, 자격증 등)
알기 위한 방법으로써의 연구
- 근거에 의지
- 오류를 통제, 방법론을 통해 오류가 개입될 수 있는 여지를 최소화
- 객관적이고 투명한 방법론
Disciplined Inquiry
- 문제 제기는 독창적이어야 함
- 체계적인 방법론
- 정립된 근거들에 바탕
- 합리적인 주장
- 예상되는 오류 가능성을 예측, 통제, 표본 오차에 대한 논의
과학적 방법론의 특징
- 경험적, 실증적
- 검증 가능성, 반복 가능성
- 축적성
- 결정을 내림 (보편성을 보거나 특수성을 보거나)
- 윤리, 사상적 중립
- 확률에 기반한 일반화
오류의 발생원인
- 관측 과정(샘플링 과정): 일반화할 수 없게 하는 부분적인 관측, 선택적 편향
- 의사소통 과정: 자신의 의도와 상대방이 이해한 의도가 다른 경우(파일럿 실험 등을 통해 최소화 가능)
- 해석 과정: 과도한 일반화
describe: 데이터의 패턴을 묘사하는 것
explain: 추리, 추론을 통해 패턴들 간의 관계를 보는 것
2. 연구 설계의 기본 개념
연구의 과정
- 문제 정의 / 연구 디자인 / 측정 변수 개발 / 분석 방법 선정
- 자료 수집
- 분석 / 해석
연구 설계
- 왜 이 연구를 하는가 / 누구를 위한 연구인가 / 목표와 목적은 무엇인가
연구의 목적, 목표
- 목적은 연구의 궁극적인 지향. 직접 측정될 수 없음
- 목표는 목적을 측정하기 위한 여러가지 지표
연구 문제: 기술적/설명적
가설: 인과/상관
인과 설명
- 개별 사례 설명(Idiographic)
- 법칙 정립적 설명(Nomothetic)
* ceteris paribus
* nonspuriousness
3. 연구 설계의 기본 개념
연구 설계: 기술적/설명적, 탐험적/통제적, 질적/양적
가설의 종류
working(research) hypothesis: 연구가 시작되는 가설. 연구의 방향과 범위를 설정
final hypothesis: 초기 가설의 채택 유무를 반영한 최종 가설. 결론
particular hypothesis: 특정 사실이나 상황을 설명하는 가설
causal hypothesis: 둘 이상의 인과 관계를 진술하는 가설
alternative hypothesis: 대립 가설. 문제를 설명하는 가능성이 있는 또 다른 가설
null hypothesis: 귀무가설. 관계가 없음을 가정하는 가설. 통계적 검정을 위해 사용
inductive hypothesis: 귀납적. 개별 사실에서 일반적 사실로 일반화
deductive hypothesis: 연역적. 일반적 사실에서 개별 사실로 특정화
nondirectional hypothesis: 비방향성. 관계나 차이를 보는 것
directional hypothesis: 방향성. 방향성이 있는 관계를 보는 것
multivariate hypothesis: 다변수
bivariate hypothesis: 이변수
univariate hypothesis: 일변수. 관계가 포함되지 않음. 단순 연구 질문으로 봐도 무방
가설
- 일반성(generalizability, universality)
- 호환성(compatibility)
- 검증성(testability)
- 불변성(invariability)
- 인과성(causality)
연구 설계의 선택
- 사례 연구(case study): 한 시점에서 한 대상에 대한 정보를 수집
- 종단 연구(longitudinal study): 여러 시점(interventional)에서 한 대상에 대한 정보를 수집
- 비교(횡단) 연구(comparsion study): 한 시점에서 여러 대상에 대한 정보를 수집
- 종단 비교(longitudinal comparison study): quasi-panel, 여러 시점에서 여러 대상에 대한 정보를 수집. 서로 다른 시점에서의 샘플을 일치시키는 것이 어렵고, 이 때문에 인과 관계를 도출하는게 까다로움
- 실험(experiment): 관계를 보려는 변수를 제외한 나머지 차이들을 제거.
-- 실험의 설계
* 실험 집단 / 통제 집단
* random assignment
* 조치 이전 / 조치 이후
* double-blind: 참여자, 실험자 모두 실험 집단과 대조 집단이 무엇인지 모른 채로 진행
* with-in vs between-subject: 대상이 실험 집단과 대조 집단에 모두 포함되는 경우
연구 윤리
동의, 승낙
개인 정보
confidentiality: 연구 자료들은 안전한 장소에 보관. 연구목적으로만 사용. 연구 대상자가 철회할 시 파쇄할 준비가 되어 있어야함
anonymity: 특별한 이유가 있지 않으면 익명성을 유지해야함
ownership of data
reciprocity(beneficence): 상호호혜성
harm & risk
4. 기술 통계
모집단(population, universe)/표본(sample), 모수(parameter)/통계량(sample value), 중심경향성(central tendency)/산포도(dispersion)
평균(mean), 중앙값(mediam), 최빈값(mode)
범위(range), 표준편차(standard deviation)
통계적 유의성, 신뢰구간
5. 추론 통계
standard error of mean: sigma / sqrt(n)
신뢰구간(confidence interval): 대집단(31+)에서는 정규 분포, 소집단(~30)에서는 t분포
통계적 가설 검증: 귀무가설, 확률
- 1종오류(alpha): 귀무가설이 맞는데 기각한 경우. 더 중요한 오류이므로 신뢰수준(alpha)을 낮춰 이 오류를 줄여야함.
- 2종오류(beta): 귀무가설이 틀렸는데 수용한 경우. 1-beta를 늘리기 위해서는 샘플 크기를 늘리는 것이 효과적
6. 측정 수준
자료의 유형: 명목/순서/등간/비율, 리커트 스케일
연속변수의 오차의 한계
변수: 측정가능하고 가변적인 것. 특정한 방법으로 진술되는 특성이나 성격
구성 개념: 추상적이고 일반적으로 진술되는 특성이나 성격
변수의 유형:
- 독립변수(처치, 측정, 통제, 조절: 독립변수가 종속변수에 미치는 영향 크기를 조절)
- 매개변수: 독립 변수로부터 영향을 받아, 종속 변수에게 영향을 주는, 매개 역할
- 종속변수
- 혼동변수: 독립, 종속 변수 사이에서 영향을 미칠 수 있어 정확하게 측정이 불가하고 둘 사이를 분리할 수 없게 함
7. 표본추출
이점: 적은 비용과 빠른 속도로 모집단의 특성 파악 가능
표본 크기: 상대적 비율이 아니라 절대량이 중요. 신뢰구간과 정확도를 고려
확률적 샘플링
- 랜덤 샘플링
- 층화 표집: 특성에 따라 동질적인 하위 그룹을 나누고 각 그룹에서 일정 비율로 표집 이후 합쳐서 전체 표본 구성. 표본 오류를 측정하기 어려우며 작은 층에 대해 부정확
- 클러스터 샘플링: 여러 그룹 중 하나의 그룹을 임의로 선택하는 것. 간편하지만 표본 오류를 측정하기 어려우며, 뽑힌 그룹이 동질적일 경우 부정확
- 체계적 표집: 매 k번째 대상을 표집. 구현이 쉽고 목록에 따라 대표성 확보가 용이하나, 주기성이 있는 대상의 경우 위험
- 다단계 샘플링: 여러 수준으로 이뤄진 대상을 상위 대상부터 추출해 나가서 최종 표본을 구성하는 방식. 대규모 표본에 적합한 방식이지만, 여러 종류의 표본 목록이 필요하며 오류를 측정하기 어려움
- multiphase sampling
- area sampling
비확률적 샘플링
- 주관적 샘플링: 연구자의 지식과 판단에 의해 표본을 추출하는 것
- quota sampling: 층화 표집과 유사하게 세그먼트를 분할하나, 세그먼트 내에서 표본을 연구자 주관에 의해 추출함
- 편의 샘플링: 편의를 위해 추출하기 쉬운 표본을 선택하는 것(최악의 경우)
- snowball sampling: 연구 대상이 다음 표본을 제안하는 식으로 진행
8. 상관관계
피어슨 상관계수
스피어만 상관계수
9. t검정, 아노바
독립 t 검정
대응 t 검정
분산분석(아노바)
10. 카이제곱 검정
적합성 검정
11. 회귀 분석
예측
선형 회귀: 독립성, 정규성, 선형성 가정
- 단순: 독립변수 1 -> 종속변수 1
- 다중: 독립변수 n -> 종속변수 1
로지스틱 회귀: 독립변수(연속) -> 종속변수(이진)
요인 분석: 상관 행렬 -> 요인 추출 -> 회전 -> 최종 결정(해석)
12. 판별 분석, 군집 분석, 비모수 통계
판별분석
- 독립변수를 명목형/범주형 종속변수에 따라 구분하고자 할 때 사용
- 독립변수가 주어졌을 때 그것이 해당할 범주를 판별한다는 점에서 유용
군집분석
비모수 통계
- 모수 통계: 모수와 관련됨. 정규성과 같은 엄격한 가정이 필요
- 비모수 통계: 모수와 관련이 없음. 정규성과 같은 조건이 요구되지 않으므로 어떤 유형의 변수도 사용 가능
13. 질적 연구
양적 연구와의 공통적 기반
- 질적 자료는 양적 방법을 바탕으로 측정되고 부호화될 수 있음
- 질적 연구 주제로부터 양적 연구 결과가 생성될 수 있음
양적 연구와의 차이
- 연구 전략에서 차이가 있음. 양적 연구는 확인적 분석과 연역적 관점에서 연구 대상을 봄
- 질적 연구는 탐험적 분석과 귀납적 관점에서 연구 대상을 봄
Grounded Theory
- 자료로부터 이론을 생성하는 귀납적인 절차
- 연구자는 관찰로부터 패턴을 탐지하고 가설을 설립함
특성
- 객관성: 질적 연구에서 객관성 추구는 불가능. 주관적 해석과 디테일에 목표
- 신뢰성: 간과되기 쉽지만, 역시 중요한 개념으로, 관찰자 훈련, 객관적 체크리스트 등을 통해 향상시킬 수 있음
- 타당성
* Internal : Credibility(참여자의 시점에서)
* External: Transferability(다른 환경에도 적용 가능?)
* Reliability: Dependability(변화를 설명할 필요 있음?)
* Objectivity: Confirmability(다른 연구에 의해서도 확인됨?)
- 일반성: 표본 추출 방법에 따라 일반화의 범위가 결정됨. 할당표본추출법이나 purposive 샘플링 등을 이용해 일반성을 높일 수 있음
14. 연구 평가
신뢰성: 반복 가능성, 일관성, 종속성의 척도
- 그러나 이 값은 정확하게 계산하는게 불가. 대략적으로 추정할 수 있을뿐
- 관측자 간 신뢰성 / 테스트 간 신뢰성 / 양식간 신뢰성
- 내적 일관성: 아이템간 평균 상관, 아이템 전체의 평균 상관. 반분법. Cronbach's alpha
타당성: 연구의 진실성에 대한 척도
- 외적 타당성: 이 결과를 다른 대상, 장소, 시간에 적용가능한가
- 구성 타당성: 이 결과를 구성 개념에 적용가능한가?
- 내적 타당성: 이 개념 간의 관계가 인과관계가 맞나?
- 결론 타당성: 이 개념 간에 원인과 결과의 관계가 존재하나?
무응답자 문제
- 표본 재추출, 재시도
- 무응답자를 유사 연구의 결과로 대체
- 다른 샘플링 프레임을 데이터로 대입
- 주관적 추측
- 응답 트렌드를 바탕으로 비응답자의 특성을 추정
- 응답자들의 가중치를 조절하여 전체 응답의 숫자를 맞춤
- 통계적으로 다른 응답들을 분석하여 빈 응답의 결과를 추정
빠른 구문 검색을 위한 인덱싱 기법 (2) | 2018.10.14 |
---|---|
벡터 공간 모형에서의 효과적인 질의 평가 방법 - WAND를 활용한 2단계 검색 (0) | 2018.10.13 |
SentiWordNet과 감성분석 (10) | 2017.05.25 |
[고고학연구법] 고고학사, 발굴, 연대측정 (0) | 2016.10.20 |
[문헌정보학입문] 시각화자료 (0) | 2016.06.11 |
[문헌정보통계] 10. 카이제곱 검정 (2) | 2016.06.11 |
댓글 영역