제삼취미/통계

통계적 모델이란? [교육연구]

카리스χάρης 2022. 11. 18. 13:39

 

교육 연구를 하기로 마음 먹었다면,

우리는 현상에 대해서 무언가를 발견하고 싶거나 탐구하고 싶은게 있다는 뜻.

 

(예. 수학적 능력에 성별 차이가 나타나는가? )

 

그리고 연구자는 문헌을 읽는다던가, 경험을 통해서라던가

뭔가 믿고싶은 것이 생긴다.

 

예를들어

"수학적 능력에 성별 차이가 있는거 같아. 적어도 내가 가르치고 있는 중1한테는 있는거 같아. 이걸 좀 객관적 지식이나 이론으로 발전 시켜봐야겠어...."

 

요렇게 생각하게 되겠지...

그럼 사람들한테 말해 볼까?

"여러분, 제가 뭔가를 발견했습니다. "

"제가 한 이십년 중1만 가르친 사람인데 말입니다."

"중학교 남학생들의 수학적 능력이 여학생보다 뛰어나답니다."

"믿습니까? 믿으십시오. "

"중학교 남학생들의 수학적 능력이 더 뛰어나다아아아아아~~~"

 

 

일단,

나는 독단주의자가 아니고, 사이비 종교의 교주도 아니기 때문에

내가 믿는바를 따르시오. 라고 말함으로써 사람들을 설득할수는 없지.

(예전에는 이게 통했었다. 발언자의 권위가 먹혔었다. 요즘은 통계적 검증을 중요시 하는 시대)

 

나부터 내가 깨달은 사실을 정말 받아들여도 좋을지 검증하는

신중한 태도를 가져야 하는거지. 

신중하자. 

그래서 끓어오르는 말하고싶은 본능을 참고...

 

나의 가설을 믿어도 좋을지, 일반화 해도 좋을지 검증해보자.

 

 

어떻게?

통계적 모델을 사용해서... 

 

 

여튼...

이 과정에서 우리는 과학적 방법을 사용하고 싶고, 이에 맞게 모델을 구성하거나 할당하는데, 이것을 통계적 모델이라고 한다.

(선형 모형, ANOVA/ regression...,결과 = 모형 + 오차)

 

통계적 모델에서는

이용가능한 자료를 사용하고, 자료가 잘 설명되도록  구성한다. 

이를 통해서 정확한 예측을 하려는 것임.

 

 

자 그럼 중학생 남여의 수학적 능력의 차이를 검증하기 위해서

수학적 능력이 무엇인지 언급해야 한다. 

이때, 우리는 통계처리를 목적으로 하기 때문에,

측정가능한 형태로 정의해야 한다.

수학적 능력을 측정 가능한 형태로 정의 했다면, 이 기준에 따라 평가툴 만든다.

가령 수학적 능력을 정의하면서 세분영역을 언급하고,

(공간지각력, 논리능력, 대수적 사고등)

각 영역을 평가하기 위한 문항을 다양한 난이도로 구성하고,

각 영역과 난이도별로 변수처리한다. 

이 평가툴을 학생들에게 적용하는데, 이때 학생 집단이 대표성을 갖는 집단인지 집단 선정 및 적용과정에 연구 윤리가 지켜졌는지 언급한다. 

 

다시한번 강조!!!

통계적 방법이란?

혹은 과학적 방법이란?

연구 대상들을 측정가능하고 기술 가능한 형태로 만드는 것.  그리고 측정 기술하는 것.

 

 

한번더 강조할 개념은  

모형 적합도(model fit)이다. 

수집된 데이터를 나타내는 정도를 설명하기 위한 용어이다.

(매우중요!!)

 

 적합하지 않은 모델로 통계를 돌리는 것은 의미 없음.  

 

 

자 예를들어서

경기 지역 학교 세 곳의 학생 400명의 자료를 수집해서 분석을 하려고 한다. 

모델핏을 측정했더니 적합하지 않다고 나온다. 

그렇다면 자료를 버리느냐? 

그렇지 않다. 

어떻게든 자료를 활용할 수 있도록 삭제하거나 정리를 해본다. 

자료를 조작하라는 뜻이 아니다. 

 

예를들어서,

그래서 대수영역 문항을 삭제하고 다시 측정했더니 적합했다. 

혹은 세 학교 중 중상위권 학생을 대상으로 자료를 정리했더니 모델이 적합했다. 

라고 한다면, 

 

연구 제한점으로 위 사항을 언급하면서

자료에 대해서 설명하면 된다. 

 

 

- CFA(확인적 요인 분석) 결과 Model fit에서 ~FI 나 ~LI 가 0.9 넘으면 사용함.

- RMSEA가 0.08보다 낮거나, 남은 문항들끼리 신뢰도분석(크론바흐알파) 0.6 넘으면 사용함.